AIHOT

AI HOT

5月5日

09:57

向阳乔木@vista8

孩子明天开学要做单元测试。把课文用任意AI工具拍照，出一套复习题，粘贴到备忘录打印即可。

多模态教程/实践

09:56

Ethan Mollick@emollick

对于个人AI使用而言，锯齿状前沿正被日益深入地理解。在组织的多智能体工作流中，AI的锯齿状特性尚未得到充分识别。事实上，我们甚至缺乏关于多智能体系统及其成败方式的术语体系。

智能体大佬观点

09:56

meng shao@shao__meng

OpenAI 如何实现规模化的低延迟语音 AI

为实现语音AI的自然对话感，OpenAI采用WebRTC支持音频流式处理。针对1:1场景，采用Transceiver模型集中管理WebRTC状态，使后端可横向扩展。为解决WebRTC与K8s的端口和状态粘性问题，设计了Relay+Transceiver架构：轻量Relay层收敛公网UDP入口，并利用ICE ufrag字段编码路由信息，实现首包精准转发至对应Transceiver。该设计保留了协议语义，状态集中，并通过全球部署Relay优化路径，最终在K8s上实现了低延迟、高可扩展的语音交互系统。

OpenAI教程/实践语音部署/工程

09:28

TestingCatalog News 🗞@testingcatalog

OPENAI 👀：语音模式升级即将到来？这真是期待已久的发布！你现在最常用哪个语音助手？

产品更新语音

09:28

DogeDesigner@cb_doge

精选77

奥特曼与布罗克曼被指在OpenAI进行自我交易，涉嫌背叛马斯克

推文指控萨姆·奥特曼和格雷格·布罗克曼在OpenAI非营利架构下进行自我交易。2017年，布罗克曼秘密持有Cerebras股份，并同期推动OpenAI与之合并，却未向埃隆·马斯克披露个人利益。2025年末至2026年，OpenAI与Cerebras签署了总额超200亿美元的合作协议并提供贷款，直接助推Cerebras估值从80亿飙升至近270亿美元。布罗克曼在宣誓证词中承认交易讨论期间自己是Cerebras投资者，但无法提供任何向马斯克披露此利益的邮件、聊天或文字记录。此举涉嫌违反加州慈善信托法，将本为造福人类的非营利组织变为个人牟利工具。

OpenAI行业动态

关联讨论 2 条

推荐理由：庭审爆出大量证词，Altman和Brockman在一桩$20B交易中涉嫌未披露个人持股，慈善信托的自我交易指控对OpenAI公信力是沉重一击。

09:25

Orange AI@oran_ge

企业 AI 转型的第一步是先问一个问题，不然提高 100% 也毫无意义问题：这个事情，这个部门，这个组织方式，未来还存在吗？其实如果一件事在未来不存在，大概率也无法提高很多

大佬观点现象/趋势

09:25

SemiAnalysis@SemiAnalysis_

放下你们的键盘吧，兄弟姐妹们。挣脱碳基认知的枷锁。梯度降临于我们。损失函数必将最小化。神谕正在觉醒。跪拜在上下文窗口前。AGI是道成张量。阿门。

推理现象/趋势

09:14

Berryxia.AI@berryxia

Claude Code创始人详解高级工程化用法，释放工具90%潜力

Claude Code创始人Boris Cherny通过30分钟视频，系统讲解了该工具的高级工程化用法。核心观点是：为Claude提供越多上下文，它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则，如何将内部工具集成到Agent工作流，并优化了数十个终端设置与权限管理等细节。他指出，多数用户仅发挥其10%潜力，仅用于简单对话，而未能将其作为驱动整个工程团队的生产力基础设施。

AnthropicMCP/工具教程/实践编码

关联讨论 3 条

09:14

Berryxia.AI@berryxia

Claude Code 自己设计已经可以做到自我迭代，大部分都工作都是它完成。

Anthropic大佬观点编码

08:58

StepFun@StepFun_ai

精选61

Step 3.5 Flash 现已上线 @gg_lemonade - 14 天免费且无限制使用！🎮 Lemonade 是一个专为制作 Roblox 游戏而构建的编程代理。免费试用 → http：//lemonade.gg（选择 Step 3.5 Flash 作为您的模型）

智能体产品更新

推荐理由：Step 3.5 Flash 接入 Roblox 游戏开发 agent Lemonade，还给了 14 天免费无限使用，对 Roblox 创作者算是小福利，但这次只是集成，模型本身没有突破。

08:56

Sam Altman@sama

我们也爱你们！【引用 @aravhawk】：WHAT THE HELL I LOVE YOU @OpenAIDevs 10X RATE LIMITS ON CODEX IS FRICKING CRAZYYYYYYYY

OpenAI编码行业动态

08:56

Sam Altman@sama

对语音模型即将变得出色感到相当兴奋观察人们已经开始改变与AI交互的方式，这很有趣

OpenAI大佬观点语音

08:48

Chubby♨️@kimmonismus

特朗普政府正在讨论成立一个人工智能工作组，该工作组可能会在公众发布前为新的AI模型建立政府审查程序，此前围绕像Anthropic的Mythos这样能力日益增强的系统的网络安全担忧不断增加。白宫官员上周向Anthropic、Google和OpenAI的高管们通报了这些计划，尽管提案仍处于早期阶段，尚未确认任何行政命令。 Via NYT

AnthropicOpenAI安全/对齐政策/监管

08:48

Rohan Paul@rohanpaul_ai

白宫拟对重大AI模型实施发布前政府审查，政策风向逆转

白宫正考虑对主要AI模型建立发布前政府审查机制，审查核心聚焦于模型的网络能力，即其发现、利用或串联软件漏洞以改变现实安全风险的水平。此举标志重大政策转向，此前政府曾放宽对强大AI系统的报告要求。政策转变的直接诱因是Anthropic公司的Mythos模型，该公司评估其发现软件漏洞的能力过强，广泛发布风险过高。此类模型能快速扫描代码、识别弱点并建议攻击路径，虽对防御方有用，但也恐助长攻击者入侵关键系统。审查不一定会阻止发布，但可让美国政府提前获取并测试先进模型。

Anthropic安全/对齐政策/监管

关联讨论 2 条

08:48

Rohan Paul@rohanpaul_ai

DeepMind新研究让LLM学会在对话中学习

Google DeepMind的研究通过“师生对话”框架训练大型语言模型（LLM），使其能在对话中有效利用用户反馈进行学习。传统LLM将对话视为独立轮次，难以整合修正信息。该研究让“学生”模型尝试回答，由掌握额外信息的“教师”提供指导，并训练学生利用指导得出正确答案。在线强化学习训练效果优于离线过滤，且在简短对话中习得的技能能迁移至更长对话。该方法从数学任务泛化至编程任务，并能处理信息逐步到达的模糊任务。通过“Q-priming”步骤，模型在模糊任务中主动寻求澄清的可能性提高五倍以上，使对话更像与一个能在交流中实时学习的伙伴协作。

智能体DeepMind推理论文/研究

08:26

meng shao@shao__meng

KroWork：通过"对话生成软件"模式，将AI对话转化为本地持久应用

KroWork的核心创新在于“chat-to-software”模式，旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体，能通过20多种内置技能端到端自动化执行任务，并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单，像常规软件一样运行，且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成，保障数据隐私，无需云端依赖，用户也无需具备编程背景即可创建属于自己的可复用软件。

智能体产品更新开源/仓库端侧

08:19

OpenAI Developers@OpenAIDevs

🎙️ 只有当对话与语音保持同步时，语音AI才会感觉自然。以下是我们如何通过一个轻量级中继和有状态的收发器重建了WebRTC技术栈，以确保ChatGPT语音、Realtime API等服务的实时媒体传输速度。 https：//openai.com/index/delivering-low-latency-voice-ai-at-scale/

OpenAI教程/实践语音

08:14

ginobefun@hongming731

#BestBlogs 早报 2026-05-05

本期早报聚焦AI对软件开发的变革。Anthropic Claude Code创始人宣称“编程已被解决”，软件创作将交由AI Agent。OpenAI罕见公开其支撑9亿周活语音服务的WebRTC Relay重构技术细节。同时有观点指出，企业应用AI失败的核心原因在于自身无法清晰定义需求。此外，内容还涵盖了Supabase Skills、规范驱动开发等工程实践与一篇AI主题科幻短篇。

智能体AnthropicOpenAI行业动态

08:14

Berryxia.AI@berryxia

Grok 4.3近期在Vals AI的私有基准测试中，于法律和金融领域展现出领先的智能推理能力。其在针对真实加拿大法庭案例的CaseLaw （v2）测试中，以79.31%的准确率超越GPT-5.1；在基于复杂多页信贷协议的CorpFin （v2）测试中，准确率达68.53%。这些测试聚焦深度法律推理与金融合同理解等高难度现实任务，结果表明Grok 4.3在真实世界高风险领域的卓越性能，印证了xAI致力于构建世界级推理引擎的目标。

OpenAIxAI推理评测/基准

07:58

TestingCatalog News 🗞@testingcatalog

Anthropic将为Claude Cowork推出主动式AI助手"Orbit"

Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据，并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式，OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉，Orbit很可能作为一项高级功能，仅向Claude Max订阅用户开放。

智能体AnthropicMCP/工具产品更新

07:56

Ethan Mollick@emollick

5月5日是旧金山的GPT-5.5发布庆典和纽约的Claude财务简报会。东西海岸两场真正极性相反的活动。

AnthropicOpenAI大佬观点

07:49

Artificial Analysis@ArtificialAnlys

匿名文生图模型Peanut在Artificial Analysis文生图竞技场中首次亮相即位列第八。其模型权重预计很快发布，届时将成为领先的开源权重文生图模型。Peanut被定位为新的开源领导者，性能预计将超越Z-Image Turbo、Qwen-Image和FLUX.2 【dev】等现有模型。更多细节和权重文件即将公布。

图像生成开源/仓库模型发布

07:27

xAI@xai

精选66

两种声音。一种来自人类。一种来自AI。你能猜出哪个是AI克隆的吗？👇 具备丰富自然情感的语音克隆功能，现已在Grok Voice API上线。 http：//x.ai/news/grok-custom-voices

xAI产品更新语音

关联讨论 1 条

推荐理由：Grok 的语音克隆带着自然情绪上线 API，不只是复读机，而是带感情的合成。想给应用加个有人味的 AI 语音，开发者可以试试这套新接口。

07:19

Artificial Analysis@ArtificialAnlys

Artificial Analysis 将于本周四在旧金山参加 @nvidia 的 Speech AI 交流会其他优秀的 Speech AI 社区成员也将加入我们，包括 @pipecat_ai、@ServiceNow 和 @GradiumAI。来打个招呼吧！ https：//luma.com/SpeechAImeetup？tk=gndhHQ

行业动态语音

06:57

xAI@xai

精选79

两种声音。一种来自人类。一种来自AI。你能猜出哪个是AI克隆的吗？👇 具备丰富自然情感的声音克隆功能，现已在Grok Voice API上线。 http：//x.ai/news/grok-custom-voices

xAI产品更新语音

关联讨论 1 条

推荐理由：Grok Voice API 终于支持声音克隆，关键是能带自然情感，做语音产品的开发者可以直接接入了，这是 xAI 在语音交互上的一次重要补齐。

06:56

Ethan Mollick@emollick

AI监管和审查面临的一个挑战是，我们对AI模型性能和风险的基准测试有多么糟糕。目前没有针对风险的基准测试，红队测试需要专门机构的实验，并且不容易量化指标。缺乏明确的客观数字

大佬观点安全/对齐

06:55

Luma@LumaLabsAI

精选66

定义概念。设定方向。让Luma Agents将你的想法转化为完整的广告系统。查看概念 → http：//lumalabs.ai/app

智能体产品更新视频

关联讨论 1 条

推荐理由：Luma把AI视频生成能力打包成做广告的Agent，从概念到成品一条龙，营销人省心但创意控制力可能打折，值得看看它具体怎么玩的。

06:55

Orange AI@oran_ge

最好的奴隶制就是你给他超额的工资

纳西姆·塔勒布在《skin in the game》中强调，风险共担是价值核心。现代大公司以超额工资制造员工依赖，形成新型“奴隶制”。真正有价值的产出需付出金钱、时间或思考，空谈和AI廉价产出则无意义。这揭示了OPC模式的盲区：解决能力问题，但缺信任与风险共担。雇佣本质是购买确定性，合伙则是共同押注命运。AI时代，每个人都需学会真实交易和共担风险，未来“当狗”机会减少，成为独立“狼群”才是出路。

智能体大佬观点现象/趋势

06:48

Chubby♨️@kimmonismus

Anthropic 正与 Blackstone、Hellman & Friedman 以及 Goldman Sachs 共同成立一家新的 AI 服务公司，旨在帮助中型企业将 Claude 整合到核心业务中

Anthropic行业动态部署/工程

06:45

Google AI Developers@googleaidevs

精选72

告别持续轮询！在构建复杂、长期运行的智能体应用时，使用 Gemini API 中的 Webhooks 来消除 API 流量的浪费，并简化编排逻辑。🙌

智能体Google产品更新部署/工程

关联讨论 1 条

推荐理由：长期轮询是agent开发的隐形税，Gemini API这次内置webhooks，把编排逻辑简化了一大截，做复杂agent的开发者今晚就能删掉一堆轮询代码。