AIHOT

AI HOT

5月8日

02:11

Claude@claudeai

精选80

Claude for Excel、PowerPoint 和 Word 现已全面可用，Claude for Outlook 进入公开测试版。当 Claude 在您的微软应用间切换时，会完整携带对话的全部上下文。

AnthropicMicrosoft产品更新

关联讨论 2 条

推荐理由：这是 Anthropic 把 Claude 正式嵌入 Office 全家桶，跨应用上下文携带是亮点，对于天天泡在微软生态的办公族来说，终于能试试 AI 助手无缝衔接了。

02:08

Replit ⠕@Replit

精选67

我们安全承诺的下一步：安全中心2.0。我们极大地简化了理解您管理的每个Replit应用安全状况的流程，并支持批量对所有应用执行操作。通过安全中心2.0，您可以： - 即时识别高风险应用 - 数秒内通过Agent修复关键漏洞 - 通过批量操作通知所有者或下架应用 - 导出软件物料清单（SBOM）以集成外部工具

产品更新部署/工程

推荐理由：如果你用Replit管理一堆应用，这个安全中心2.0的批量修复和SBOM导出是实打实的效率提升，但对个人开发者来说属于‘有比没有好’的更新。

02:06

Rohan Paul@rohanpaul_ai

Anthropic高管分享：Claude AI六个月代写全部代码

Anthropic的Claude Code负责人Boris Cherny在开发者大会上表示，过去六个月他的编程工作方式彻底改变。此前所有手写的代码现在均由Claude生成。他只需向Claude提出指令，例如要求构建某个功能，Claude便会完成开发、测试并展示结果。他随后可进行审核，要求调整或直接批准。这一转变体现了AI编程助手已能深度参与实际开发流程。

智能体Anthropic大佬观点编码

02:05

OpenRouter@OpenRouter

精选68

Gemini 3.1 Flash Lite 来自 @GoogleDeepMind，现已在 OpenRouter 正式发布。多模态（文本/图像/视频/音频/PDF → 文本），100万上下文，可选的思考层级，输入每百万次$0.25，输出每百万次$1.50。还可配合我们新的 service_tier 参数使用，以权衡成本与延迟！

Google产品更新多模态

推荐理由：OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token，这个定价让 Flash 系列不再是试验品，轻量级应用可以认真考虑它了。

02:05

Greg Brockman@gdb

精选87

OpenAI在API中正式推出具备GPT-5同级推理能力的GPT-Realtime-2语音模型，标志着语音智能体实现重大突破。该模型使语音智能体能作为实时协作者，在对话中动态完成聆听、推理与解决复杂任务。此次更新同时推出了GPT-Realtime-Translate和GPT-Realtime-Whisper等流式模型，共同构成了一套面向下一代语音界面的全新音频能力组合，为开发者构建卓越的实时语音交互应用提供了强大工具。

智能体OpenAI推理模型发布

关联讨论 10 条

推荐理由：GPT-5 级推理终于跑在实时语音上了，不再是简单的语音转文字再转模型，而是原生能边听边想边说的协作 agent。做语音客服和虚拟角色的人可以着手切到新 API 了。

02:01

Chubby♨️@kimmonismus

精选75

OpenAI近日发布了三款新的实时语音模型：GPT-Realtime-2具备近似GPT-5的推理能力，允许语音助手在对话中实时思考；GPT-Realtime-Translate支持超过70种语言的实时翻译；GPT-Realtime-Whisper则能实现流式语音转文本。与此同时，OpenAI官方通过引用推文暗示，用户期待已久的ChatGPT语音功能更新正在积极准备中，即将正式推出。这预示着ChatGPT很可能在近期迎来全新的高级语音模式，进一步提升其交互体验与应用能力。

OpenAI多模态模型发布语音

关联讨论 10 条

推荐理由：OpenAI 把 GPT-5 级推理塞进实时语音，这个组合对客服和口语应用是真正的规则改写，所有依赖语音交互的产品都得重新评估。

01:42

Suno@suno

一位四次获得格莱美提名的制作人如何使用Suno来构建节拍

教程/实践视频

01:42

TestingCatalog News 🗞@testingcatalog

精选81

OpenAI在Playground和API中推出了三款新模型：GPT-Realtime-2、GPT-Realtime-Whisper和GPT-Realtime-Translate。其中，GPT-Realtime-2被描述为迄今最智能的语音模型，为语音智能体带来了GPT-5级别的推理能力，使其能作为实时协作者，在对话中聆听、推理并解决复杂问题。这些模型共同构成了一套面向下一代语音界面的新音频能力集，也预示着ChatGPT的语音模式可能即将迎来重要更新。

OpenAI推理模型发布语音

关联讨论 10 条

推荐理由：这是GPT-5级推理第一次被塞进实时语音模型，语音Agent不再只是‘听懂并回复’，而是能边听边想、处理复杂逻辑，做语音产品的人今天应该马上打开Playground试试。

01:40

OpenAI@OpenAI

精选86

在API中推出GPT-Realtime-2：我们迄今为止最智能的语音模型，为语音助手带来GPT-5级别的推理能力。语音助手现已成为实时协作者，能够在对话展开时倾听、推理并解决复杂问题。现已在API中与流式模型GPT-Realtime-Translate和GPT-Realtime-Whisper同步上线--为新一代语音界面提供全新的音频功能套件。

OpenAI推理模型发布语音

关联讨论 10 条

推荐理由：把GPT-5级推理塞进语音，意味着语音助手从“你问我答”进化为能边听边想、实时求解的协作伙伴，做语音agent的开发者该认真看看了。

01:38

宝玉@dotey

精选81

OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型：GPT-Realtime-2用于对话，GPT-Realtime-Translate用于翻译，GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力，在音频测试中性能显著提升，改进了交互体验，如任务前语音提示、工具调用透明化和128K上下文窗口，并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译，GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线，并公布了API价格。

OpenAI产品更新语音

关联讨论 10 条

推荐理由：GPT-5 级推理终于进了语音 API，Big Bench Audio 从 81 跳到 97，多工具调用还能念出来，做语音 agent 的可以直接上手试了。

01:38

Ethan Mollick@emollick

OpenAI for Excel相当实用（Claude for Excel也是），令人惊讶的是，与Claude不同，目前没有OpenAI for PowerPoint，尤其因为这是OpenAI的一大优势所在：Imagegen-2可以直接生成非常优质的幻灯片/图像，而Claude没有图像制作功能。

图像生成多模态大佬观点

01:36

OpenAI Developers@OpenAIDevs

精选78

OpenAI通过API正式发布了新一代实时语音模型系列，显著增强了语音智能体的能力。其核心GPT-Realtime-2具备媲美GPT-5的推理水平，使语音智能体能作为实时协作者，在对话中聆听、思考并解决复杂问题。同时推出的GPT-Realtime-Translate支持70种输入语言到13种输出语言的实时翻译，GPT-Realtime-Whisper则提供了更快的语音转录速度。这一系列模型为下一代语音交互界面奠定了全新的音频能力基础。

智能体OpenAI推理模型发布

关联讨论 10 条

推荐理由：这是语音模型第一次真正拥有 GPT-5 级推理，语音代理不再是问答机而是能边听边想边解决问题的协作者，做语音产品的该重新想想架构了。

01:13

Yuchen Jin@Yuchenj_UW

顶尖AI公司工程师日均消耗百亿token，Databricks招募高性能推理工程师

OpenAI内部工程师每日消耗高达数亿至数十亿GPT-5.5 token，并利用Codex进行夜间自动化编码。Databricks同样为工程师提供无限制的token资源。公司目前正以初创公司的模式高速发展，并积极招募能够贡献于SGLang、vLLM、PyTorch等开源ML系统，且拥有大规模LLM服务经验的顶尖推理工程师，旨在实现万亿级别token的极速生成与处理。

OpenAI现象/趋势部署/工程

01:11

Anthropic@AnthropicAI

精选76

新Anthropic研究：自然语言自动编码器。像Claude这样的模型用语言交流，但用数字思考。这些数字--称为激活值--编码了Claude的思维，但并非以人类可读的语言呈现。在此研究中，我们训练Claude将其激活值翻译成人类可读的文本。

Anthropic安全/对齐论文/研究

关联讨论 2 条

推荐理由：Anthropic 在可解释性上迈了一大步，把模型内部激活直接翻译成自然语言，这对理解 AI 真正在想什么、以及后续的安全对齐都太关键了，做可解释性的人必须读。

01:10

DogeDesigner@cb_doge

精选73

前OpenAI CTO法庭作证揭露山姆·奥特曼的管理不端与诚信危机

在联邦法庭上，OpenAI前首席技术官Mira Murati揭露了山姆·奥特曼的严重管理问题。她指控奥特曼对不同人员说相反的话，故意在高管间制造对立、破坏团队信任，其行为曾导致公司陷入“彻底混乱”及“灾难性解体风险”。为维持公司运营，Murati不得不直接联系微软CEO萨提亚·纳德拉。这场危机几乎导致顶尖研究人员被竞争对手挖走，其不诚实的程度甚至震惊了硅谷内部人士。这些证词直指奥特曼在领导OpenAI期间存在不诚实、有害且危险的行为。

OpenAI行业动态

关联讨论 1 条

推荐理由：前 CTO Mira Murati 在联邦法庭上直接指控 Sam Altman 撒谎、制造内斗，这种级别的内部爆料在 AI 圈极罕见，想投资 OpenAI 或合作的公司都得重新评估信任风险。

01:06

SemiAnalysis@SemiAnalysis_

我们已习惯芯片公司营销团队夸大参数规格，如今看到他们转而低调陈述反而令人耳目一新。 Cerebras官网就存在一例-- 他们将片上SRAM容量低估了整整八倍！ @cerebras 你们实在太过谦虚了！

数据/训练现象/趋势

01:06

elvis@omarsar0

研究显示，多智能体LLM系统在生产环境中的故障率高达41%至87%，且多数失败源于协调缺陷，而非基础模型能力问题。当前多数架构对比无法区分性能提升是来自协调优化还是更大的上下文窗口。该研究主张将协调视为一个独立、可配置的架构层，并通过控制变量实验验证：在保持LLM、工具、提示等所有条件不变时，仅改变协调结构即可显著影响系统表现。这为准确评估协调机制的价值提供了更清晰的方法论，并建立了将协调视为核心架构而非底层实现的理论框架。

智能体arXiv论文/研究部署/工程

00:42

Z.ai@Zai_org

精选72

GLM-5V-Turbo 技术报告：迈向原生多模态智能体基础模型本报告总结了GLM-5V-Turbo在模型设计、多模态训练、强化学习、工具链扩展以及与智能体框架集成等方面的主要改进。这些进展使其在多模态编码、视觉工具使用和基于框架的智能体任务中表现出色。 http：//arxiv.org/abs/2604.26752

智能体多模态论文/研究

推荐理由：智谱把多模态、RL和Agent工具链捆成一体，这篇报告对做多模态Agent的人有直接参考价值，不只刷榜还有工程细节。

00:41

Suno@suno

精选61

NBC News刚刚重点报道了使用Suno的短信转歌曲病毒式趋势！ https：//www.nbcnews.com/now/video/people-are-turning-text-message-threads-into-fun-songs-using-ai-in-a-new-trend-on-social-media-262862405776

多模态现象/趋势

推荐理由：NBC把短信转歌这种玩法当新闻报，不是技术评测，是主流媒体第一次把AI音乐生成当成文化现象，做社交内容的可以认真看一眼。

00:41

TestingCatalog News 🗞@testingcatalog

Scale AI发布了SWE Atlas重构排行榜，这是一个评估智能体重构代码能力的新基准。 > 它要求智能体生成的代码行数是SWE Bench Pro的两倍。 > Claude Code with Opus 4.7位居榜首，其次是Codex with GPT-5.5、GPT-5.4和GPT-5.3。 > 重构对大型语言模型而言是相当重要的任务，因为这通常归结为相当枯燥的工程工作。

Anthropic编码评测/基准

00:36

凡人小北@frxiaobei

人类因符号系统崛起，AI正站在此巨人肩膀上进化

推文认为，AI正站在人类符号系统的“巨人肩膀”上进化。随着LLM的发展，未来每个人都能通过指令创造大量Agent，实现“言出法随”。作者类比女娲造人，预言Agent群体中将流传人类传说。关键观点指出，Agentic Coding释放了无穷的AI算力需求，使代码编写、测试和改进可永续进行，导致算力消耗激增。人类文明的代码化发展，仿佛是在为AI的编程能力铺路。

勃勃OC：感觉这波完全是Agentic Coding打开了需求的潘多拉魔盒没有Agentic功能，xAI 算力90%闲置有Agentic Coding，Anthr…

智能体AnthropicxAI现象/趋势

00:36

Microsoft Research@MSFTResearch

Tyger将最耗时的MRI处理工作转移到云端，帮助研究人员将原始信号转化为可读图像--这意味着几小时而非数天或数周即可获得结果。https：//msft.it/6010vMCSa

Microsoft产品更新多模态部署/工程

00:36

elvis@omarsar0

Hacker News → LLM Artifact 我构建了最个性化的HN订阅源。它仅根据记忆和LLM知识库追踪我研究的相关主题。存储书签已无意义。通过一些自动化流程、规则、技能和主动代理，你可以将订阅源定制成任何你想要的样子。

智能体大佬观点搜索

00:31

Chubby♨️@kimmonismus

算力竞赛的核心：从硬件占有到消化效率的转变

xAI与Anthropic在算力运用上呈现出镜像困境。xAI虽拥有全球顶尖的GPU集群，但其模型计算利用率仅约11%，凸显出将硬件转化为有效算力的挑战。相反，Anthropic面临需求远超供给的局面：其Claude收入年化已超300亿美元，百万美元级企业客户在两个月内从500家激增至1000家以上，新增的算力被立即转化为更高的使用限额和收入。这场竞赛的关键已非单纯比拼集群规模，而在于“算力消化效率”——即谁能最快速地将原始计算资源转化为可盈利的产品能力。稀缺资源正从GPU硬件本身，转向这种高效的转化能力。

AnthropicxAI大佬观点数据/训练

00:22

Marc Andreessen 🇺🇸@pmarca

主推文以经典投资警示"这次不一样"及其自我指涉的变体，点明投资者常因盲目乐观而忽视历史教训。引用推文补充了Paul Tudor Jones在CNBC的访谈观点，他增持AI和半导体股票，将当前AI浪潮比作个人电脑和互联网的早期阶段，认为可能开启持续数年的生产力奇迹。但他也提示当前估值倍数类似1999年互联网泡沫后期，市场可能还有一两年上行空间，但也需警惕风险。

大佬观点现象/趋势

00:13

向阳乔木@vista8

精选70

想让AI设计公众号排版CSS，可直接跟Agent说，参考Design md设计： https：//github.com/VoltAgent/awesome-design-md/tree/main/design-md 一下能设计了70多个知名网站风格，选几个喜欢优化。

GitHub开源生态教程/实践

推荐理由：直接让Agent参考design md设计库生成公众号CSS，76种知名网站风格随便套，做公众号排版的朋友读完就能开搞。

00:10

Nathan Lambert@natolambert

精选72

走访多家中国顶尖AI实验室后，我深受触动：这里存在一种极其适合用较少资源构建LLM的文化，但这种文化发生在截然不同的生态系统中--参与企业更多，数据产业几乎空白等。完整报告：https：//www.interconnects.ai/p/notes-from-inside-chinas-ai-labs

数据/训练现象/趋势

关联讨论 1 条

推荐理由：Nathan Lambert 走访中国头部 AI 实验室，他最意外的不是模型差距，而是几乎没有数据产业——这个观察比任何 benchmark 都说明问题。

00:08

Replit ⠕@Replit

在Replit上使用Plaid构建个性化金融应用 https：//x.com/i/broadcasts/1MKgNgOqznWxL

教程/实践编码

00:08

Ethan Mollick@emollick

这个市场如此迅速地洗牌令人瞩目。 Anthropic 和 OpenAI 至少已进入商业起飞阶段：它们拥有模型开发、企业合约、算力协议、政府与媒体关注以及消费者认知。唯一的潜在竞争者是谷歌（或许还有 Meta）

AnthropicOpenAI大佬观点行业动态

00:06

凡人小北@frxiaobei

精选81

姚金刚：和 @vista8 讨论了下，决定将我们的新书《AI营销：从SEO到GEO》里配套的25个AI营销与GEO相关的提示词，也开源到GitHub 另外补充了部分短…

GitHub开源/仓库搜索

关联讨论 1 条

推荐理由：不是又一个提示词合集，而是把《AI营销》书里的实操技巧拆成了现成指令，短视频和GEO部分尤其解渴，做内容营销的建议直接fork。

00:06

Rohan Paul@rohanpaul_ai

SpaceX提交在德州建设550亿美元Terafab芯片工厂的计划。 SpaceX表示总支出可能达到1190亿美元，这标志着其计划更接近国家规模的算力供应链，而非普通的公司扩张。

行业动态

00:06

Rohan Paul@rohanpaul_ai

反AI运动反映了人们对AI进入人类物理领域的不适感。

大佬观点

5月7日

23:40

Sundar Pichai@sundarpichai

看我桌上收到了什么 @StephenCurry30！

Google其他

23:36

elvis@omarsar0

当前AI智能体（Agent）构建门槛降低，其质量差异的核心在于能否进行恰当的评估。真正的挑战在于生产环境中可能出现的"静默漂移"--即使通过所有测试，系统质量仍可能在无报错的情况下悄然下降。解决方案并非加强部署前测试，而是建立持续评估机制。这已成为区分AI系统优劣的关键技能。

智能体大佬观点评测/基准

23:21

Berryxia.AI@berryxia

Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台，取代Fitbit应用，采用开放生态策略，支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练，提供智能推荐与个性化指导，直接挑战Apple Health的封闭模式，标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧

23:21

Berryxia.AI@berryxia

精选76

SenseNova-U1开源8步蒸馏LoRA，扩散模型推理提速11倍

SenseNova-U1开源了一项8步蒸馏LoRA技术，将扩散模型的生成步骤从100步压缩至8步，使GPU推理时间从23秒大幅缩短至2秒，速度提升达11倍。该技术同时完整支持ComfyUI，并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化，引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论。

图像生成开源/仓库部署/工程

推荐理由：这个LoRA把扩散模型推理从23秒压到2秒，还带全套ComfyUI工作流，玩图像生成的人今天就应该装上去试试，速度飞升11倍是真的能立刻用上。

23:21

Berryxia.AI@berryxia

每天白送4000 万token，你确定你不去把这个🦙羊毛"搞一搞"？

Qclaw AI助手每日免费提供高达4000万token，适合执行定时任务、批量处理数据和生成合同等自动化工作，用户可基于能省则省的原则榨干其价值。该工具以像素风小龙虾形象呈现，拥有16-bit像素风格工作室，能作为“不会下班的同事”持续工作，目前处于内测阶段，需通过Waitlist申请，并使用专属邀请码“berryxia”获取。引用内容补充了其趣味设计，强调它可像电子宠物一样互动，同时高效协助日常任务。

Berryxia.AI：🧵 1/8 前几天给大家分享的我用AI邮箱来搞钱的帖子(见前贴)，有很多朋友私信我问，你使用的那个像素风的小龙虾是什么？怎么那么可爱有趣，我今天给大家…

智能体教程/实践

23:13

向阳乔木@vista8

构建个人观点库以优化AI Agent决策

推文提出了一个利用AI Agent构建个人“观点MD”文件的构想。其核心是让AI Agent定期抓取个人在网上发布的内容，并由AI提炼出其中的核心观点，整理成一个结构化的文档。这个文档旨在记录和固化个人的观点与立场。其最终目的是让未来的AI Agent在进行决策和判断时，能够参考这份文件，从而使其行为更贴近用户本人的真实想法和价值观，实现更个性化的AI交互。

智能体教程/实践

23:11

Google DeepMind@GoogleDeepMind

算法已成为生活几乎所有方面的一部分，从自然世界的物理规律到规划航运路线。过去一年，我们由Gemini驱动的编码代理AlphaEvolve持续推动多个领域的进步--从量子计算、生物技术到物流及@Google的AI基础设施。↓ https：//goo.gle/4uzfe0C

智能体Google编码行业动态

23:06

meng shao@shao__meng

精选70

Apify mcpc 与 x402：给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc，集成了x402支付协议，旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批，而x402协议将支付压缩为一次HTTP往返加签名，使程序能自主交易。mcpc为Agent提供加密钱包，当调用付费服务遭遇HTTP 402状态码时，可自动签名完成支付，无需人工干预。该工具支持Claude Code等MCP兼容的Agent，用户可使用USDC为钱包充值并连接x402兼容服务。

智能体MCP/工具产品更新

推荐理由：过去 Agent 付费靠人类插手，Apify mcpc 把 x402 支付压缩成一行签名，相当于给每个 Agent 发了个自动钱包，做 agent 基建的可以立刻用起来了。