5月8日
02:11
Claude@claudeai
精选80
Claude for Excel、PowerPoint 和 Word 现已全面可用,Claude for Outlook 进入公开测试版。 当 Claude 在您的微软应用间切换时,会完整携带对话的全部上下文。
AnthropicMicrosoft产品更新
关联讨论 2Claude:Blog(网页)X:宝玉 (@dotey)
推荐理由:这是 Anthropic 把 Claude 正式嵌入 Office 全家桶,跨应用上下文携带是亮点,对于天天泡在微软生态的办公族来说,终于能试试 AI 助手无缝衔接了。
02:06
Rohan Paul@rohanpaul_ai
66
Anthropic高管分享:Claude AI六个月代写全部代码

Anthropic的Claude Code负责人Boris Cherny在开发者大会上表示,过去六个月他的编程工作方式彻底改变。此前所有手写的代码现在均由Claude生成。他只需向Claude提出指令,例如要求构建某个功能,Claude便会完成开发、测试并展示结果。他随后可进行审核,要求调整或直接批准。这一转变体现了AI编程助手已能深度参与实际开发流程。

智能体Anthropic大佬观点编码
02:05
OpenRouter@OpenRouter
精选68
Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!
Google产品更新多模态

推荐理由:OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token,这个定价让 Flash 系列不再是试验品,轻量级应用可以认真考虑它了。
02:05
Greg Brockman@gdb
精选87
OpenAI在API中正式推出具备GPT-5同级推理能力的GPT-Realtime-2语音模型,标志着语音智能体实现重大突破。该模型使语音智能体能作为实时协作者,在对话中动态完成聆听、推理与解决复杂任务。此次更新同时推出了GPT-Realtime-Translate和GPT-Realtime-Whisper等流式模型,共同构成了一套面向下一代语音界面的全新音频能力组合,为开发者构建卓越的实时语音交互应用提供了强大工具。
智能体OpenAI推理模型发布
关联讨论 10OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:GPT-5 级推理终于跑在实时语音上了,不再是简单的语音转文字再转模型,而是原生能边听边想边说的协作 agent。做语音客服和虚拟角色的人可以着手切到新 API 了。
02:01
Chubby♨️@kimmonismus
精选75
OpenAI近日发布了三款新的实时语音模型:GPT-Realtime-2具备近似GPT-5的推理能力,允许语音助手在对话中实时思考;GPT-Realtime-Translate支持超过70种语言的实时翻译;GPT-Realtime-Whisper则能实现流式语音转文本。与此同时,OpenAI官方通过引用推文暗示,用户期待已久的ChatGPT语音功能更新正在积极准备中,即将正式推出。这预示着ChatGPT很可能在近期迎来全新的高级语音模式,进一步提升其交互体验与应用能力。
OpenAI多模态模型发布语音
关联讨论 10OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:OpenAI 把 GPT-5 级推理塞进实时语音,这个组合对客服和口语应用是真正的规则改写,所有依赖语音交互的产品都得重新评估。
01:42
TestingCatalog News 🗞@testingcatalog
精选81
OpenAI在Playground和API中推出了三款新模型:GPT-Realtime-2、GPT-Realtime-Whisper和GPT-Realtime-Translate。其中,GPT-Realtime-2被描述为迄今最智能的语音模型,为语音智能体带来了GPT-5级别的推理能力,使其能作为实时协作者,在对话中聆听、推理并解决复杂问题。这些模型共同构成了一套面向下一代语音界面的新音频能力集,也预示着ChatGPT的语音模式可能即将迎来重要更新。
OpenAI推理模型发布语音
关联讨论 10OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:这是GPT-5级推理第一次被塞进实时语音模型,语音Agent不再只是‘听懂并回复’,而是能边听边想、处理复杂逻辑,做语音产品的人今天应该马上打开Playground试试。
01:40
OpenAI@OpenAI
精选86
在API中推出GPT-Realtime-2:我们迄今为止最智能的语音模型,为语音助手带来GPT-5级别的推理能力。 语音助手现已成为实时协作者,能够在对话展开时倾听、推理并解决复杂问题。 现已在API中与流式模型GPT-Realtime-Translate和GPT-Realtime-Whisper同步上线--为新一代语音界面提供全新的音频功能套件。
OpenAI推理模型发布语音
关联讨论 10OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:把GPT-5级推理塞进语音,意味着语音助手从“你问我答”进化为能边听边想、实时求解的协作伙伴,做语音agent的开发者该认真看看了。
01:38
宝玉@dotey
精选81
OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型:GPT-Realtime-2用于对话,GPT-Realtime-Translate用于翻译,GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力,在音频测试中性能显著提升,改进了交互体验,如任务前语音提示、工具调用透明化和128K上下文窗口,并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译,GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线,并公布了API价格。

OpenAI产品更新语音
关联讨论 10OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:GPT-5 级推理终于进了语音 API,Big Bench Audio 从 81 跳到 97,多工具调用还能念出来,做语音 agent 的可以直接上手试了。
01:36
OpenAI Developers@OpenAIDevs
精选78
OpenAI通过API正式发布了新一代实时语音模型系列,显著增强了语音智能体的能力。其核心GPT-Realtime-2具备媲美GPT-5的推理水平,使语音智能体能作为实时协作者,在对话中聆听、思考并解决复杂问题。同时推出的GPT-Realtime-Translate支持70种输入语言到13种输出语言的实时翻译,GPT-Realtime-Whisper则提供了更快的语音转录速度。这一系列模型为下一代语音交互界面奠定了全新的音频能力基础。
智能体OpenAI推理模型发布
关联讨论 10OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Greg Brockman (@gdb)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:这是语音模型第一次真正拥有 GPT-5 级推理,语音代理不再是问答机而是能边听边想边解决问题的协作者,做语音产品的该重新想想架构了。
01:13
Yuchen Jin@Yuchenj_UW
57
顶尖AI公司工程师日均消耗百亿token,Databricks招募高性能推理工程师

OpenAI内部工程师每日消耗高达数亿至数十亿GPT-5.5 token,并利用Codex进行夜间自动化编码。Databricks同样为工程师提供无限制的token资源。公司目前正以初创公司的模式高速发展,并积极招募能够贡献于SGLang、vLLM、PyTorch等开源ML系统,且拥有大规模LLM服务经验的顶尖推理工程师,旨在实现万亿级别token的极速生成与处理。

OpenAI现象/趋势部署/工程
01:11
Anthropic@AnthropicAI
精选76
新Anthropic研究:自然语言自动编码器。 像Claude这样的模型用语言交流,但用数字思考。这些数字--称为激活值--编码了Claude的思维,但并非以人类可读的语言呈现。 在此研究中,我们训练Claude将其激活值翻译成人类可读的文本。
Anthropic安全/对齐论文/研究
关联讨论 2Anthropic:Research(发表成果 · 网页)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:Anthropic 在可解释性上迈了一大步,把模型内部激活直接翻译成自然语言,这对理解 AI 真正在想什么、以及后续的安全对齐都太关键了,做可解释性的人必须读。
01:10
DogeDesigner@cb_doge
精选73
前OpenAI CTO法庭作证揭露山姆·奥特曼的管理不端与诚信危机

在联邦法庭上,OpenAI前首席技术官Mira Murati揭露了山姆·奥特曼的严重管理问题。她指控奥特曼对不同人员说相反的话,故意在高管间制造对立、破坏团队信任,其行为曾导致公司陷入“彻底混乱”及“灾难性解体风险”。为维持公司运营,Murati不得不直接联系微软CEO萨提亚·纳德拉。这场危机几乎导致顶尖研究人员被竞争对手挖走,其不诚实的程度甚至震惊了硅谷内部人士。这些证词直指奥特曼在领导OpenAI期间存在不诚实、有害且危险的行为。

OpenAI行业动态
关联讨论 1X:宝玉 (@dotey)
推荐理由:前 CTO Mira Murati 在联邦法庭上直接指控 Sam Altman 撒谎、制造内斗,这种级别的内部爆料在 AI 圈极罕见,想投资 OpenAI 或合作的公司都得重新评估信任风险。
00:41
00:36
凡人小北@frxiaobei
46
人类因符号系统崛起,AI正站在此巨人肩膀上进化

推文认为,AI正站在人类符号系统的“巨人肩膀”上进化。随着LLM的发展,未来每个人都能通过指令创造大量Agent,实现“言出法随”。作者类比女娲造人,预言Agent群体中将流传人类传说。关键观点指出,Agentic Coding释放了无穷的AI算力需求,使代码编写、测试和改进可永续进行,导致算力消耗激增。人类文明的代码化发展,仿佛是在为AI的编程能力铺路。

勃勃OC感觉这波完全是Agentic Coding打开了需求的潘多拉魔盒 没有Agentic功能,xAI 算力90%闲置 有Agentic Coding,Anthr…

智能体AnthropicxAI现象/趋势
00:31
Chubby♨️@kimmonismus
57
算力竞赛的核心:从硬件占有到消化效率的转变

xAI与Anthropic在算力运用上呈现出镜像困境。xAI虽拥有全球顶尖的GPU集群,但其模型计算利用率仅约11%,凸显出将硬件转化为有效算力的挑战。相反,Anthropic面临需求远超供给的局面:其Claude收入年化已超300亿美元,百万美元级企业客户在两个月内从500家激增至1000家以上,新增的算力被立即转化为更高的使用限额和收入。这场竞赛的关键已非单纯比拼集群规模,而在于“算力消化效率”——即谁能最快速地将原始计算资源转化为可盈利的产品能力。稀缺资源正从GPU硬件本身,转向这种高效的转化能力。

AnthropicxAI大佬观点数据/训练
00:13
00:10
Nathan Lambert@natolambert
精选72
走访多家中国顶尖AI实验室后,我深受触动:这里存在一种极其适合用较少资源构建LLM的文化,但这种文化发生在截然不同的生态系统中--参与企业更多,数据产业几乎空白等。 完整报告:https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs
数据/训练现象/趋势
关联讨论 1Nathan Lambert:Interconnects(RSS)
推荐理由:Nathan Lambert 走访中国头部 AI 实验室,他最意外的不是模型差距,而是几乎没有数据产业——这个观察比任何 benchmark 都说明问题。
00:06
凡人小北@frxiaobei
精选81
作者宣布,将新书《AI营销:从SEO到GEO》中配套的25个AI营销与GEO相关提示词开源至GitHub。此次更新还补充了部分短视频和文案相关的提示词,所有资源已在指定仓库公开,供用户下载使用或重新拉取。

姚金刚和 @vista8 讨论了下,决定将我们的新书《AI营销:从SEO到GEO》里配套的25个AI营销与GEO相关的提示词,也开源到GitHub 另外补充了部分短…

GitHub开源/仓库搜索
关联讨论 1X:Vista (@vista8)
推荐理由:不是又一个提示词合集,而是把《AI营销》书里的实操技巧拆成了现成指令,短视频和GEO部分尤其解渴,做内容营销的建议直接fork。
5月7日
23:40
23:21
Berryxia.AI@berryxia
65
Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧
23:21
Berryxia.AI@berryxia
精选76
SenseNova-U1开源8步蒸馏LoRA,扩散模型推理提速11倍

SenseNova-U1开源了一项8步蒸馏LoRA技术,将扩散模型的生成步骤从100步压缩至8步,使GPU推理时间从23秒大幅缩短至2秒,速度提升达11倍。该技术同时完整支持ComfyUI,并提供了文本生图、图像编辑和交错生成等开箱即用的工作流程。此举标志着扩散模型从研究阶段迈向实用化,引发了业界关于未来应聚焦参数规模竞赛还是追求速度与实用性的讨论。

图像生成开源/仓库部署/工程

推荐理由:这个LoRA把扩散模型推理从23秒压到2秒,还带全套ComfyUI工作流,玩图像生成的人今天就应该装上去试试,速度飞升11倍是真的能立刻用上。
23:21
Berryxia.AI@berryxia
27
每天白送4000 万token,你确定你不去把这个🦙羊毛"搞一搞"?

Qclaw AI助手每日免费提供高达4000万token,适合执行定时任务、批量处理数据和生成合同等自动化工作,用户可基于能省则省的原则榨干其价值。该工具以像素风小龙虾形象呈现,拥有16-bit像素风格工作室,能作为“不会下班的同事”持续工作,目前处于内测阶段,需通过Waitlist申请,并使用专属邀请码“berryxia”获取。引用内容补充了其趣味设计,强调它可像电子宠物一样互动,同时高效协助日常任务。

Berryxia.AI🧵 1/8 前几天给大家分享的我用AI邮箱来搞钱的帖子(见前贴),有很多朋友私信我问,你使用的那个像素风的小龙虾是什么? 怎么那么可爱有趣,我今天给大家…

智能体教程/实践
23:13
向阳乔木@vista8
65
构建个人观点库以优化AI Agent决策

推文提出了一个利用AI Agent构建个人“观点MD”文件的构想。其核心是让AI Agent定期抓取个人在网上发布的内容,并由AI提炼出其中的核心观点,整理成一个结构化的文档。这个文档旨在记录和固化个人的观点与立场。其最终目的是让未来的AI Agent在进行决策和判断时,能够参考这份文件,从而使其行为更贴近用户本人的真实想法和价值观,实现更个性化的AI交互。

智能体教程/实践
23:06
meng shao@shao__meng
精选70
Apify mcpc 与 x402:给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc,集成了x402支付协议,旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批,而x402协议将支付压缩为一次HTTP往返加签名,使程序能自主交易。mcpc为Agent提供加密钱包,当调用付费服务遭遇HTTP 402状态码时,可自动签名完成支付,无需人工干预。该工具支持Claude Code等MCP兼容的Agent,用户可使用USDC为钱包充值并连接x402兼容服务。

智能体MCP/工具产品更新

推荐理由:过去 Agent 付费靠人类插手,Apify mcpc 把 x402 支付压缩成一行签名,相当于给每个 Agent 发了个自动钱包,做 agent 基建的可以立刻用起来了。