AIHOT

5月5日

07:16

Claude Code：GitHub Releases（RSS）

精选60

v2.1.128版本更新

本次更新包含多项功能优化与错误修复。主要功能上，`/color` 命令支持无参数随机选色，`/mcp` 命令显示已连接服务器的工具数量，`--plugin-dir` 参数新增支持 `.zip` 插件包。用户体验方面，优化了 `/model` 选择器的显示。关键问题修复包括：解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题，以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外，还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。

智能体Anthropic产品更新

推荐理由：Claude Code 的日常维护版本，修了一堆小 bug 并给了 /color 随机色、插件支持 zip 等细节提升，重度用户建议升，非用户不必关注。

06:57

xAI@xai

精选79

两种声音。一种来自人类。一种来自AI。你能猜出哪个是AI克隆的吗？👇 具备丰富自然情感的声音克隆功能，现已在Grok Voice API上线。 http：//x.ai/news/grok-custom-voices

xAI产品更新语音

关联讨论 1 条

推荐理由：Grok Voice API 终于支持声音克隆，关键是能带自然情感，做语音产品的开发者可以直接接入了，这是 xAI 在语音交互上的一次重要补齐。

06:56

Ethan Mollick@emollick

AI监管和审查面临的一个挑战是，我们对AI模型性能和风险的基准测试有多么糟糕。目前没有针对风险的基准测试，红队测试需要专门机构的实验，并且不容易量化指标。缺乏明确的客观数字

大佬观点安全/对齐

06:55

Luma@LumaLabsAI

精选66

定义概念。设定方向。让Luma Agents将你的想法转化为完整的广告系统。查看概念 → http：//lumalabs.ai/app

智能体产品更新视频

关联讨论 1 条

推荐理由：Luma把AI视频生成能力打包成做广告的Agent，从概念到成品一条龙，营销人省心但创意控制力可能打折，值得看看它具体怎么玩的。

06:55

Orange AI@oran_ge

最好的奴隶制就是你给他超额的工资

纳西姆·塔勒布在《skin in the game》中强调，风险共担是价值核心。现代大公司以超额工资制造员工依赖，形成新型“奴隶制”。真正有价值的产出需付出金钱、时间或思考，空谈和AI廉价产出则无意义。这揭示了OPC模式的盲区：解决能力问题，但缺信任与风险共担。雇佣本质是购买确定性，合伙则是共同押注命运。AI时代，每个人都需学会真实交易和共担风险，未来“当狗”机会减少，成为独立“狼群”才是出路。

智能体大佬观点现象/趋势

06:48

Chubby♨️@kimmonismus

Anthropic 正与 Blackstone、Hellman & Friedman 以及 Goldman Sachs 共同成立一家新的 AI 服务公司，旨在帮助中型企业将 Claude 整合到核心业务中

Anthropic行业动态部署/工程

06:45

Google AI Developers@googleaidevs

精选72

告别持续轮询！在构建复杂、长期运行的智能体应用时，使用 Gemini API 中的 Webhooks 来消除 API 流量的浪费，并简化编排逻辑。🙌

智能体Google产品更新部署/工程

推荐理由：长期轮询是agent开发的隐形税，Gemini API这次内置webhooks，把编排逻辑简化了一大截，做复杂agent的开发者今晚就能删掉一堆轮询代码。

05:56

Hacker News 热门（buzzing.cc 中文翻译）

OpenAI 如何实现大规模低延迟语音 AI

OpenAI通过优化推理堆栈，将其语音AI模型Whisper的实时转录延迟从2.8秒大幅降低至232毫秒。核心改进包括引入流式编码器、改进的解码策略与缓存机制，并采用分块处理技术。这些优化使系统能在用户说话结束后的极短时间内完成转录，为大规模部署低延迟语音交互应用提供了关键技术支撑。

OpenAI教程/实践语音

05:49

AK@_akhaliq

UniVidX 一个通过扩散先验实现多功能视频生成的统一多模态框架 paper： https：//huggingface.co/papers/2605.00658

Hugging Face多模态视频论文/研究

05:49

AK@_akhaliq

Web2BigTable 一个用于互联网规模信息搜索与提取的双层多智能体LLM系统论文： https：//huggingface.co/papers/2604.27221

智能体搜索论文/研究

05:48

Anthropic：Transformer Circuits（可解释性研究）

HeadVis

05:48

Google Blog：AI（RSS）

精选71

通过 Gemini API 中的 Webhooks 减少长时任务的摩擦与延迟

Gemini API 引入了事件驱动的 Webhook 功能，这是一种基于推送的通知系统。它旨在消除低效的轮询需求，为长时运行的任务（如文件处理或复杂推理）提供更优的解决方案。当任务完成时，系统会自动将结果推送到用户指定的端点，从而显著降低延迟并减少资源消耗，提升开发效率与响应速度。

Google产品更新部署/工程

推荐理由：Gemini API 终于补上 Webhooks 这块拼图，长任务不用再轮询等待，对做自动化流程和 Agent 的开发者是实打实的效率提升。

05:26

Hacker News 热门（buzzing.cc 中文翻译）

OpenAI、谷歌和微软支持一项旨在为学校"人工智能素养"教育提供资金的法案

OpenAI、谷歌和微软共同支持一项旨在为学校“人工智能素养”教育提供资金的法案。该法案计划通过专项拨款，推动美国K-12及高等教育机构将人工智能基础知识纳入课程体系，目标是提升学生对AI技术的理解与应用能力。此举标志着科技巨头正积极推动AI教育的普及化，以应对人工智能快速发展带来的技能需求变化。法案若通过，将为相关教育项目提供稳定的联邦资金支持。

GoogleMicrosoftOpenAI政策/监管

05:25

Replit ⠕@Replit

现在才是真正开始执行的时候。第二集即将上线。两位创业者，两种截然不同的赌注。一位在农场里开发AI语音工具。另一位将调酒兼职转变为职业引擎。谁将率先实现营收？《营收竞速》周三上线。敬请关注。

行业动态

05:25

elvis@omarsar0

我太想念4.6了。不过话说回来，你直接用5.5也行

Anthropic大佬观点

05:25

SemiAnalysis@SemiAnalysis_

精选71

GB300 NVL72实测性能达GB200的2.7倍，凸显端到端实测价值

在行业标准推理引擎vLLM上的测试显示，NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同，但在大多数服务商实际运行的中段负载区间，凭借全栈优化的复合增益，GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成，结果印证了端到端实测性能才是衡量硬件效能的黄金标准，而非单纯的纸面理论算力。

推理评测/基准部署/工程

推荐理由：纸面 FP4 算力只多 50% 的 GB300，实际推理却快了 2.7 倍，全栈优化的复合增益比参数表好看太多，做推理服务的该重新算算 TCO 了。

05:19

OpenAI Developers@OpenAIDevs

构建它。破坏它。修复它。从竞选追踪器到财务规划器，@CalStateEastBay 的学生们在 @joinHandshake 举办的 Codex Creator Challenge 中利用 Codex 构建了项目。

OpenAI教程/实践编码

04:57

swyx 🇸🇬@swyx

看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。离线和在线评估都指向明确的进步。那是什么没被捕捉到呢？"个性"吗？

Anthropic大佬观点评测/基准

04:25

Luma@LumaLabsAI

精选66

创意很强大。现在请确保提案同样出色。设定简报。定义美学。Luma Agents 构建制胜的客户提案板，让您专注于创意。赢得提案 → http：//lumalabs.ai/app

产品更新多模态

关联讨论 1 条

推荐理由：Luma 开始往商业提案场景走了, Agents 不是新模型而是帮你把视频素材拼成 pitch 板, 做广告创意的可以试试, 其他人扫一眼就行。

04:18

Chubby♨️@kimmonismus

报告揭示AI技术栈五层结构，能源与基建成新瓶颈并催生蓝领高薪岗位

Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却，美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低，但推理模型和智能体工作流消耗的token量激增，使效率提升被迅速抵消。报告指出，AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位，打破了AI仅影响白领的叙事。同时强调，缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济，仅是消费者。

推理现象/趋势部署/工程

04:15

ClaudeDevs@ClaudeDevs

精选76

管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。今天我们为Claude平台推出无密钥认证：通过CLI在浏览器中进行身份验证，或让工作负载使用其现有的云身份（AWS、GCP、Azure或任何OIDC令牌提供者）。

Anthropic产品更新安全/对齐

推荐理由：无密钥认证直接解决了 API 密钥泄露这个高频痛点，而且支持主流云身份，企业部署门槛降了一大截，做 AI 集成的团队明天就可以试。

04:02

OpenRouter：Announcements（RSS）

精选59

GPT-5.5 价格上涨：实际成本几何

OpenAI 将 GPT-5.5 的按 token 计价提高了一倍，但新模型在输出上更为简洁。通过实际使用测量发现，尽管单价上涨，由于模型响应更精炼、消耗的 token 数量减少，最终净成本影响可能低于预期。关键变化在于单位价格与模型效率之间的平衡，实际支出需结合具体使用场景和生成长度综合评估。

OpenAI现象/趋势

关联讨论 1 条

推荐理由：OpenAI 把 GPT-5.5 的单价翻倍让很多人心凉，但 OpenRouter 的实测显示净成本变化没那么大。如果你用 API 构建应用，这篇能帮你冷静算账。

03:48

PixVerse@PixVerse_

可爱的猫娘对镜瞬间 @Kawaiizice！分享你家宠物面对镜子的搞笑反应--一起传播这份可爱吧！🐱🪞

其他视频

03:28

Suno@suno

别再写优美的歌词了，开始创作令人难忘的歌词吧。

现象/趋势

03:25

Replit ⠕@Replit

精选70

你可以在 Replit 中构建完整的商业计划书演示文稿，无需触碰任何幻灯片。只需描述你想要的内容，在聊天中迭代修改，可视化编辑，然后导出为 PPTX、Google Slides 或 PDF（或发布实时链接）。以下是具体操作方式👇

产品更新多模态编码

关联讨论 1 条

推荐理由：Replit把做pitch deck变成聊天式操作，输描述、实时改、一键导出，比传统PPT工具快不少，但真正的故事还是得你自己想清楚。