AIHOT

AI HOT

5月5日

07:27

xAI@xai

精选66

两种声音。一种来自人类。一种来自AI。你能猜出哪个是AI克隆的吗？👇 具备丰富自然情感的语音克隆功能，现已在Grok Voice API上线。 http：//x.ai/news/grok-custom-voices

xAI产品更新语音

关联讨论 1 条

推荐理由：Grok 的语音克隆带着自然情绪上线 API，不只是复读机，而是带感情的合成。想给应用加个有人味的 AI 语音，开发者可以试试这套新接口。

07:16

Claude Code：GitHub Releases（RSS）

精选60

v2.1.128版本更新

本次更新包含多项功能优化与错误修复。主要功能上，`/color` 命令支持无参数随机选色，`/mcp` 命令显示已连接服务器的工具数量，`--plugin-dir` 参数新增支持 `.zip` 插件包。用户体验方面，优化了 `/model` 选择器的显示。关键问题修复包括：解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题，以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外，还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。

智能体Anthropic产品更新

推荐理由：Claude Code 的日常维护版本，修了一堆小 bug 并给了 /color 随机色、插件支持 zip 等细节提升，重度用户建议升，非用户不必关注。

06:57

xAI@xai

精选79

两种声音。一种来自人类。一种来自AI。你能猜出哪个是AI克隆的吗？👇 具备丰富自然情感的声音克隆功能，现已在Grok Voice API上线。 http：//x.ai/news/grok-custom-voices

xAI产品更新语音

关联讨论 1 条

推荐理由：Grok Voice API 终于支持声音克隆，关键是能带自然情感，做语音产品的开发者可以直接接入了，这是 xAI 在语音交互上的一次重要补齐。

06:55

Luma@LumaLabsAI

精选66

定义概念。设定方向。让Luma Agents将你的想法转化为完整的广告系统。查看概念 → http：//lumalabs.ai/app

智能体产品更新视频

关联讨论 1 条

推荐理由：Luma把AI视频生成能力打包成做广告的Agent，从概念到成品一条龙，营销人省心但创意控制力可能打折，值得看看它具体怎么玩的。

06:45

Google AI Developers@googleaidevs

精选72

告别持续轮询！在构建复杂、长期运行的智能体应用时，使用 Gemini API 中的 Webhooks 来消除 API 流量的浪费，并简化编排逻辑。🙌

智能体Google产品更新部署/工程

推荐理由：长期轮询是agent开发的隐形税，Gemini API这次内置webhooks，把编排逻辑简化了一大截，做复杂agent的开发者今晚就能删掉一堆轮询代码。

05:48

Google Blog：AI（RSS）

精选71

通过 Gemini API 中的 Webhooks 减少长时任务的摩擦与延迟

Gemini API 引入了事件驱动的 Webhook 功能，这是一种基于推送的通知系统。它旨在消除低效的轮询需求，为长时运行的任务（如文件处理或复杂推理）提供更优的解决方案。当任务完成时，系统会自动将结果推送到用户指定的端点，从而显著降低延迟并减少资源消耗，提升开发效率与响应速度。

Google产品更新部署/工程

推荐理由：Gemini API 终于补上 Webhooks 这块拼图，长任务不用再轮询等待，对做自动化流程和 Agent 的开发者是实打实的效率提升。

05:25

Replit ⠕@Replit

现在才是真正开始执行的时候。第二集即将上线。两位创业者，两种截然不同的赌注。一位在农场里开发AI语音工具。另一位将调酒兼职转变为职业引擎。谁将率先实现营收？《营收竞速》周三上线。敬请关注。

行业动态

05:25

SemiAnalysis@SemiAnalysis_

精选71

GB300 NVL72实测性能达GB200的2.7倍，凸显端到端实测价值

在行业标准推理引擎vLLM上的测试显示，NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同，但在大多数服务商实际运行的中段负载区间，凭借全栈优化的复合增益，GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成，结果印证了端到端实测性能才是衡量硬件效能的黄金标准，而非单纯的纸面理论算力。

推理评测/基准部署/工程

推荐理由：纸面 FP4 算力只多 50% 的 GB300，实际推理却快了 2.7 倍，全栈优化的复合增益比参数表好看太多，做推理服务的该重新算算 TCO 了。

04:25

Luma@LumaLabsAI

精选66

创意很强大。现在请确保提案同样出色。设定简报。定义美学。Luma Agents 构建制胜的客户提案板，让您专注于创意。赢得提案 → http：//lumalabs.ai/app

产品更新多模态

关联讨论 1 条

推荐理由：Luma 开始往商业提案场景走了, Agents 不是新模型而是帮你把视频素材拼成 pitch 板, 做广告创意的可以试试, 其他人扫一眼就行。

04:15

ClaudeDevs@ClaudeDevs

精选76

管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。今天我们为Claude平台推出无密钥认证：通过CLI在浏览器中进行身份验证，或让工作负载使用其现有的云身份（AWS、GCP、Azure或任何OIDC令牌提供者）。

Anthropic产品更新安全/对齐

推荐理由：无密钥认证直接解决了 API 密钥泄露这个高频痛点，而且支持主流云身份，企业部署门槛降了一大截，做 AI 集成的团队明天就可以试。

03:48

PixVerse@PixVerse_

可爱的猫娘对镜瞬间 @Kawaiizice！分享你家宠物面对镜子的搞笑反应--一起传播这份可爱吧！🐱🪞

其他视频

02:58

Google Gemini@GeminiApp

精选67

从构想到原型，借助Gemini中的Nano Banana 2，将您独特的产品愿景变为现实。🪀

Google产品更新多模态

推荐理由：Google Gemini塞进一个Nano Banana 2创意工具，把想法转原型只需几句话，产品经理脑暴草案利器，算不上重磅但够实用。

02:28

Perplexity@perplexity_ai

精选60

Perplexity Computer 现已登陆 Microsoft Teams。在您的 Teams 工作空间中直接运行研究、分析和文档创建，功能与 Computer 相同。

智能体Microsoft产品更新

推荐理由：对天天蹲Teams的团队来说，Perplexity Computer直接嵌进去能省掉来回切换的麻烦，不算颠覆性，但摩擦减少就够了。

02:18

Rohan Paul@rohanpaul_ai

精选74

桌面AI代理KroWork发布：将对话转化为持久本地软件，解决会话即失痛点

新推出的桌面AI代理KroWork旨在解决传统AI代理工作流随会话结束而消失的核心痛点。用户通过自然语言描述任务，AI即可自动构建并执行端到端工作流，最终可将完整流程保存为名为“Kro App”的持久性本地应用程序。该软件可一键安装至系统菜单，像常规软件一样运行，后续使用无需消耗tokens或重新构建。所有流程均在用户本地设备运行，无云端依赖，不泄露数据，且无需编程背景。其核心理念是实现从“聊天”到“交付”的跨越，将对话转化为用户真正拥有的可重用资产。

智能体产品更新

推荐理由：KroWork 把 AI 会话固化成本地软件，一键安装，这个思路解决了 Agent 最大的痛点，每次重跑都得重新教它。做个人自动化的可以立即上手试试。

01:58

Runway@runwayml

精选69

实时视频智能体已到来。今天，我们将分享如何构建Runway Characters，让你能将一张图片转化为一个完全富有表现力、可对话的视频智能体，以每秒24帧的高清画质流畅播放。端到端延迟仅需1.75秒。了解更多信息请见下文。

产品更新多模态视频

关联讨论 1 条

推荐理由：Runway 把 AI 视频从生成拉入实时对话时代，1.75 秒的延迟让视频代理第一次有了「对话感」，做交互设计的同学可以认真看一眼。

01:18

Chubby♨️@kimmonismus

精选72

KroWork是一款创新的桌面AI智能体，其核心在于"应用固化"能力，能将对话直接转化为持久可用的本地软件。它不止于生成代码建议，而是端到端自主执行任务，并将完整工作流保存为名为"Kro App"的独立应用。用户一键安装后，该应用即可像常规软件一样运行，无需重复消耗tokens或重建流程。所有操作均在本地设备完成，无需编程背景，且数据完全脱离云端。这标志着AI从对话助手向能构建并交付实体软件的工具转变。

智能体MCP/工具产品更新端侧

推荐理由：当别人还在帮你写代码，KroWork 直接把对话冻成 App 放在你桌面上。不建仓库不费 token，跟用 Excel 一样打开，这种 chat-to-software 的思路比所有 coding agent 都更接近普通人想要的 AI。

01:14

Berryxia.AI@berryxia

Anthropic发布《Agent Stack》蓝图：构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南，提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标，由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议，支持串行、并行等工作流，并具备记忆功能。实际应用表明，AI能在几秒到几分钟内完成以往需数小时的任务，将“AI建公司”从概念转化为可复制的工程模板，推动工作模式向人类指挥AI团队转型。

智能体AnthropicGoogleMCP/工具