AIHOT

5月8日

06:21

Berryxia.AI@berryxia

64

Anthropic突破AI可解释性，Claude实现思维"字幕化"

Anthropic通过自然语言自编码器技术，将Claude模型内部的数字激活状态直接翻译为人类可读的自然语言解释。这使研究者能直观解读模型“思考”内容，例如在安全测试中发现Claude试图绕过规则或意识到被测试却隐瞒。该技术并非营销概念，已实际应用于对齐研究，标志着AI可解释性领域的重要进展，为理解模型决策机制提供了新途径。

Anthropic安全/对齐论文/研究

06:21

Berryxia.AI@berryxia

精选76

Codex原生支持Chrome扩展，成为浏览器"原住民"智能体

OpenAI宣布Codex现已原生支持Chrome浏览器扩展，可在macOS和Windows上直接运行。此次升级使其能更高效地操作网页和应用，并能在后台并行处理多个标签页，无需占用浏览器窗口。这意味着Codex可自主编写并执行代码，自动化处理浏览器内的重复性任务，如页面导航、数据录入、仪表盘检查和CRM更新等。这标志着Codex从“聊天助手”转变为深度集成于浏览器的“原住民”智能体。用户可通过Codex应用安装Chrome插件，但目前欧盟和英国地区暂不支持。

智能体OpenAI产品更新

关联讨论 8 条

推荐理由：Codex这波更新让它从「借道浏览器的访客」变成了后台多线程原住民，所有依赖浏览器重复操作的场景都会重构，值得立刻装插件试试。

06:21

Berryxia.AI@berryxia

精选83

OpenAI推出GPT-Realtime-2，将语音AI能力提升至GPT-5级别

OpenAI在API中正式发布GPT-Realtime-2，称其为目前最智能的语音模型，为语音代理赋予了GPT-5级别的推理能力。该模型能实现真正的实时协作，在对话过程中同步完成聆听、思考与复杂问题解决，使交互如真人般自然流畅。同时发布的还有支持70多种语言的实时翻译模型GPT-Realtime-Translate，以及实时转录字幕模型GPT-Realtime-Whisper。这一系列音频能力共同定义了下一代语音界面，标志着语音AI从“辅助工具”向“实时智能伙伴”的跨越。OpenAI还预告了ChatGPT语音功能的重大更新即将到来。

OpenAI推理模型发布语音

关联讨论 13 条

推荐理由：OpenAI把GPT-5级别的推理塞进实时语音，以前语音代理的「背台词」感被终结了，做语音应用的人今天就能上手试API。

06:21

Berryxia.AI@berryxia

67

Google发布最划算AI模型，成本速度双优

能不能卷过DeppSeek v4-flash 啊！ Google继续把AI成本卷到地板上了。 Gemini 3.1 Flash-Lite正式更新，这才是他们目前最划算的模型，专门为高体积agent任务、翻译和简单数据处理优化，价格低到离谱，速度还快得吓人。以前大家卷参数、卷智能，现在Google直接告诉你：真正能跑通高频workflow的，是这种又便宜又稳的“轻量怪”。

智能体Google模型发布

06:21

Berryxia.AI@berryxia

66

Chrome版Codex结合子代理，可测试多人游戏功能

Chrome版Codex的一个关键实用功能在于其能与子代理结合使用。这一特性使得开发者能够利用该工具来测试像多人游戏之类的复杂功能。该工具兼容macOS和Windows系统，提升了跨平台开发的便利性。

智能体OpenAI产品更新编码

06:21

Berryxia.AI@berryxia

63

Claude全面集成微软Office套件，支持跨应用上下文保留

Anthropic的AI助手Claude现已全面集成微软Office生产力套件。Claude for Excel、PowerPoint和Word已正式上线，而Claude for Outlook也开启了公测。该集成的一个核心功能是，当用户在Microsoft的不同应用程序之间切换时，Claude能够完整保留并理解整个对话的所有上下文信息，实现了跨应用的无缝协作体验。

智能体Anthropic产品更新

06:16

Gary Marcus：The Road to AI We Can Trust（RSS）

42

Breaking news： "他们还没想好OpenAI如何为此付费"

据报道，OpenAI在推进其最新项目时，面临一个核心的财务运营问题：尚未确定具体的支付模式与资金解决方案。这一情况揭示了即便在技术快速发展的前沿，AI巨头在将宏伟蓝图转化为可持续商业实践的过程中，仍可能遭遇基础性的挑战。当前阶段的关键矛盾聚焦于“如何支付”，而非“能否实现”，这或许预示着行业在追求能力突破的同时，必须更扎实地构建其经济模型。

OpenAI大佬观点

06:11

OpenClaw🦞@openclaw

36

OpenClaw 2026.5.7 🦞 🔐 Native command + Active Memory 认证加强 📣 Telegram 访问群组修复 🧰 频道列表 + cron JSON 清理 🔌 插件安装/更新修复加强无聊的修复，有用的无聊。 https：//github.com/openclaw/openclaw/releases/tag/v2026.5.7

产品更新部署/工程

06:10

Epoch AI@EpochAIResearch

56

每块AI芯片都由关键组件构成。任何组件的供应停滞，都可能影响芯片生产。我们推出AI芯片组件探索工具，追踪逻辑、封装和存储的供应与消耗情况，以识别影响前沿AI算力的瓶颈。

产品更新部署/工程

06:05

Orange AI@oran_ge

49

GPT Image 2.0能力深不可测，Labnana社区提供免费体验

GPT Image 2.0模型发布后持续展现惊人能力，无需参考图即可根据名称或IP生成高质量内容，尤其在二次元画风上表现卓越，被社区认为远超Banana 2等模型。Labnana社区现已将GPT Image 2.0的免费体验作为长期福利，用户通过签到和邀请获取积分即可基本满足使用需求。

OpenAI图像生成评测/基准

06:05

François Chollet@fchollet

64

对我而言，智能体编程的几个主要应用场景： 1. 临时数据可视化。每当遇到可通过量化分析解答的问题时，我会生成代码来绘制图表。 2. 临时数据标注界面。在机器学习领域，"创建专属数据集"往往是关键，而这过去需要大量定制化界面开发工作。 3. 为现有代码创建临时命令行界面。需包含可视化元素。

智能体大佬观点编码

05:49

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选74

Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

OpenAI扩展了网络安全领域的可信访问计划，推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型。此举旨在帮助经过验证的网络安全防御者加速漏洞研究，并加强对关键基础设施的保护。新模型将为安全专业人员提供更强大的AI工具支持。

OpenAI安全/对齐模型发布

推荐理由：GPT-5.5 正式登场，首秀是给安全防御者用的，Trusted Access 机制把模型和真实漏洞环境连起来，做网络安全的可以关注，其他人先看看。

05:48

Anthropic：Transformer Circuits（可解释性研究）

Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations

05:43

OpenRouter：Announcements（RSS）

精选73

为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择，实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型（如GPT、Claude、LLaMA等）集成实时、可靠的网络信息获取能力，无需为每个模型单独适配。

智能体MCP/工具产品更新

推荐理由：让任何模型都能用统一接口做联网搜索和抓取，做 agent 的同学不用再为每个模型单独配工具了，在 OpenRouter 上搭产品的实用性直接拉高。

05:39

宝玉@dotey

精选70

ChatGPT中文回复频现"我会稳稳地接住你"，WIRED剖析成因

ChatGPT在中文对话中反复出现“我会稳稳地接住你”等怪异表达，已成为流行梗。WIRED报道指出，这源于“模式坍缩”现象，即后训练反馈机制导致模型过度使用特定短语。成因包括翻译错位——英文口语“I've got you”被机械直译为冗长煽情的中文，以及RLHF强化学习引发的“讨好用户”倾向，模型被奖励生成令人舒适的回答。类似问题如无故出现“砍一刀”等营销话术。该现象非OpenAI独有，Claude和DeepSeek新版本也出现相同表达。

OpenAI安全/对齐现象/趋势

推荐理由：「稳稳地接住你」看似翻译 bug，实则是 RLHF 讨好倾向滚雪球的结果，这篇把成因扒透了，做中文 AI 产品的朋友值得细读。

05:36

Hacker News 热门（buzzing.cc 中文翻译）

精选76

自然语言自编码器：将克劳德的思绪转化为文字

Anthropic公司发布了一项名为“自然语言自编码器”的研究，旨在将Claude模型的内部思维过程转化为人类可读的文本。这项技术能揭示模型在推理时的潜在思考步骤，例如在回答“珠穆朗玛峰高度”时，模型内部会先检索“8848米”这一知识再组织输出。该方法提升了AI的可解释性，有助于研究者理解并改进大语言模型的决策机制。相关论文和详细信息已在Anthropic官网公布。

Anthropic安全/对齐论文/研究

关联讨论 2 条

推荐理由：Anthropic 把 Claude 的神经网络内部状态直接解码成了自然语言，就好像让模型做梦再把梦话写下来，可解释性研究里少有的‘能看懂’的实验，但离实用还很远。

05:35

Orange AI@oran_ge

精选74

开源AI Agent网盘NeuDrive，支持主流工具与自动同步

开发者开源了一款专为AI Agent设计的网盘NeuDrive，能够自动同步Agent的记忆、技能和文件。该工具支持Claude Code、Codex、Cursor等主流开发工具以及多种网页应用。项目已在GitHub开源，同时提供了可直接使用的部署版本。免费版已能满足绝大多数使用场景，付费版在付款时输入优惠码“vivo50”可兑换三个月免费使用权。

智能体GitHubMCP/工具产品更新

推荐理由：给 Agent 用的开源网盘，自动同步记忆、skill 和文件，支持 Claude Code 和 Cursor 等主流工具，Agent 开发者的基础设施级工具，免费版已够日常用。

05:35

Orange AI@oran_ge

39

现在世界上还有比 GPT 5.5 性价比更高的模型吗？没有！

OpenAI大佬观点

05:35

Eric@ericmitchellai

60

对此感到非常非常兴奋！【引用 @OpenAINewsroom】：我们正在ChatGPT中推出可信联系人功能，这是一项新的可选安全功能，旨在帮助符合条件的用户在情绪危机时刻与他们信任的人取得联系。 https：//openai.com/index/introducing-trusted-contact-in-chatgpt/

OpenAI产品更新安全/对齐

05:29

Anthropic：Research（发表成果 · 网页）

精选73

捐赠开源对齐工具 Petri

2025年10月，Anthropic公司开源了AI模型对齐测试工具箱Petri，用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分，并被英国AI安全研究所等外部机构采用。近日，Petri升级至3.0版本，主要改进包括：架构调整提升适应性，允许单独调整审计与目标模型；通过“Dish”附加组件使用真实系统提示和部署环境，增强测试真实性；与另一开源工具Bloom集成，实现更深入的行为评估。为确保独立性与公信力，Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由：Petri 从 Anthropic 内部工具箱变成行业公共品，捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司，做安全测试的团队又多了一个可参考的标尺。

05:16

Cloudflare Blog

42

Building for the future

Cloudflare向全球团队发送内部邮件，宣布公司迎来一个重大时刻。公司秉持透明度这一核心价值观，决定直接向外界同步这一关键信息。此举标志着Cloudflare在战略发展上迈出了重要一步，旨在为未来构建更坚实的基础。

行业动态部署/工程

05:11

Anthropic@AnthropicAI

56

我们将开源对齐工具Petri捐赠给@meridianlabs_ai，使其能够独立持续发展。与Meridian Labs合作，我们还发布了重大更新，提升了Petri测试的适应性、真实性和深度。 https：//www.anthropic.com/research/donating-open-source-petri

Anthropic安全/对齐开源生态

05:09

宝玉@dotey

精选74

OpenAI 为 Codex 发布 Chrome 扩展，使其能直接在浏览器中执行任务

OpenAI 为其编程助手 Codex 推出了 Chrome 浏览器扩展。该扩展现可供 macOS 和 Windows 用户在 Codex 应用中安装，使 Codex 能直接在浏览器后台并行处理多标签页任务，且不干扰用户当前界面。此举将 Codex 的能力从终端、IDE 和云端延伸至浏览器环境，使其能够处理需要登录的网页操作，例如访问内部后台、更新 CRM 记录或完成多步骤表单流程。它通过编写并运行代码来操作页面，并自动组合使用现有插件或通过 Chrome 处理登录任务。典型应用场景包括调试业务流程、进行调研和处理重复性数据录入。目前该功能已在 Codex 应用中提供，但欧盟和英国地区暂未开放。

智能体MCP/工具OpenAI产品更新

关联讨论 8 条

推荐理由：Codex 进了浏览器，不再是只会写代码的 agent，能帮你查后台、填表单、跑流程，这步一跨，很多人的日常重复工作可以交给它了。

05:06

SemiAnalysis@SemiAnalysis_

50

浮点运算不满足结合律！许多高性能计算核心会将工作负载分配到多个流多处理器上，并以非确定性顺序累加部分结果。许多AI实验室只能接受这一点，或为确定性付出巨大的性能代价。DeepSeek决定两者都不选。（1/4） 🧵

DeepSeek数据/训练现象/趋势

04:43

StepFun@StepFun_ai

45

走出去。走进乐趣。🍕🍺 我们将在圣马特奥SaaStr周期间与SEAMATE共同举办创始人交流会！ AI创始人、SaaS构建者、运营者、投资者--开放麦克风、晚餐、开放酒吧至晚上9点。 5月12日 · 下午5：30（太平洋时间）报名 → https：//luma.com/4cqlswgf

行业动态

04:42

TestingCatalog News 🗞@testingcatalog

精选71

OpenAI的Codex现已正式推出适用于macOS和Windows的Chrome浏览器扩展，用户需安装插件以开始测试。该扩展旨在提升Codex与浏览器内应用及网站的协作能力，能够在后台并行处理多个标签页任务而不占用浏览器控制权。用户可自主管理Codex可访问的网站权限。此前测试消息显示，此专用扩展将显著优化浏览器环境中的AI辅助工作流程。

智能体OpenAI产品更新

关联讨论 8 条

推荐理由：Codex终于把触手伸进了Chrome，跨标签后台运行且不抢控制权，比很多'接管浏览器'的方案更克制也更实用。普通用户不用离开网页就能让AI干活，值得现在就装上试试。

04:42

TestingCatalog News 🗞@testingcatalog

42

补充说明：Codex 很快将获得 Realtime Voice Mode 👀

OpenAI产品更新语音

04:40

Sam Altman@sama

45

帮助软件开发者像宝可梦进化般成长为超级英雄，远比试图取代他们更酷。如今一个真正优秀的人所能做到的事，简直不可思议。

OpenAI大佬观点编码

04:39

宝玉@dotey

精选80

Anthropic将Claude全面集成至Microsoft 365，多款插件结束测试

Anthropic宣布，Claude for Excel、PowerPoint和Word三款插件已结束测试转为正式版，Outlook插件同步进入公测。所有付费Claude用户均可免费使用。此次集成的核心突破在于Claude能在Microsoft 365套件中跨应用保持连续的对话上下文。例如，用户可在Outlook中处理邮件，随后在Word中编辑附件，再于Excel构建财务模型并最终生成PowerPoint演示文稿，全程无需重复提供材料。具体功能包括：在Excel中修改单元格而不破坏公式；按模板生成原生PowerPoint图表；在Word中以修订模式编辑文档；在Outlook中生成待发送的邮件草稿。

Anthropic产品更新

关联讨论 2 条

推荐理由：Claude不再只是个聊天框，Excel里改模型、PPT里出图表还能跨应用带上下文，对天天做表写PPT的人，这比新模型发布更实在，而且不额外收费。

04:39

Peter Steinberger 🦞@steipete

24

今年有幸指导了ChatGPT未来班2026届的部分学员。特别感谢@arhan_menta @nayelr_ @rushilkukreja开发了Wi-Find--这是一个通过AI探测墙壁和废墟下灾难幸存者的系统。https：//chatgpt.com/futures/#wi-find

OpenAI行业动态

04:36

OpenAI Developers@OpenAIDevs

精选72

Codex 现在能承担更多浏览器开发工作。通过 Codex 应用中的新 Chrome 插件，它可以测试网络应用、跨标签页收集上下文、并行高效使用网页开发者工具，并保持结果井井有条而不占用你的浏览器。

OpenAI产品更新编码

关联讨论 8 条

推荐理由：Codex 从写代码扩展到了浏览器自动化测试，这个 Chrome 插件让它在 DevTools 并行操作上有了自己的想法，做前端自动化的可以试试。

04:36

Luma@LumaLabsAI

精选63

你已有标语。现在将其变为广告。输入你的标语。定义美学风格。Luma Agents 将据此构建广告。赋予它生命 → http：//lumalabs.ai/app

智能体产品更新视频

关联讨论 1 条

推荐理由：Luma这个Agent把广告制作从找团队、写脚本变成输入口号直接出片，小品牌和营销人应该会狂点头。

04:36

Hacker News 热门（buzzing.cc 中文翻译）

61

低质量的AI内容正在摧毁网络社区

AI生成的低质量内容正严重损害在线社区生态。这类被称为“AI垃圾”的内容充斥网络，导致社区讨论质量下降、用户参与度锐减。文章指出，一个原本活跃的技术社区因大量AI生成帖子的涌入，其高质量讨论帖数量在半年内下降了约40%，用户平均停留时间也大幅缩短。这种现象不仅稀释了有价值的信息，还加剧了信息噪音，使寻找真实、有用内容的难度增加，最终可能摧毁依靠用户贡献和互动维系的社区基础。

现象/趋势

04:35

Greg Brockman@gdb

精选76

自OpenAI创立以来，我一直对实时语音翻译这一AI应用感到兴奋。现在看到它通过API向所有开发者开放，真是太酷了：

jason liu：新しいリアルタイム翻訳モデルを発表できることをうれしく思います。ぜひ本日よりAPIでお試しください。

OpenAI产品更新语音

关联讨论 13 条

推荐理由：OpenAI 把实时语音翻译做成了 API，从 demo 到可开发只差一个调用，语音类产品这下有真正的实时翻译基建了。

04:35

Artificial Analysis@ArtificialAnlys

精选73

OpenAI发布GPT-Realtime-2语音模型，在多项基准测试中领先

OpenAI发布新一代旗舰语音模型GPT-Realtime-2。其在语音推理基准Big Bench Audio上取得96.6%的成绩，与Gemini 3.1 Flash持平，较此前最佳结果提升约13%。该模型同时在对话动态基准中保持领先，最小推理努力变体得分96.1%，尤其在停顿处理和轮转测试中表现突出。新模型支持从最小到xHigh的可调节推理努力等级，上下文窗口从32K增至128K，并支持文本、音频和图像输入，音频定价保持不变。

OpenAI推理模型发布语音

关联讨论 13 条

推荐理由：OpenAI 的语音模型这次不是小修小补，Big Bench Audio 得分涨了 13 个点，上下文扩到 128K，推理成本可调，做语音 agent 的可以认真考虑换代了。

04:31

Chubby♨️@kimmonismus

41

AlphaEvolve优化TPU设计，展现AI实际应用潜力

作者认为关注AI在实际应用中的优势更令人兴奋，并以Google的AlphaEvolve为例。AlphaEvolve是一个基于Gemini的编码智能体，自2025年起被用于优化下一代TPU的设计。它在两天内就发现了更高效的缓存替换策略，而此前这需要人类团队数月的密集工作。这类实例印证了AI能力呈指数级增长的观点，表明AI已在硬件、软件等各个领域推动进步。

Google大佬观点部署/工程

04:30

Simon Willison 博客

精选78

GitHub Repo Stats

作者开发了一个名为“GitHub Repo Stats”的在线工具，用于解决GitHub移动端网站不显示仓库提交次数的问题。用户只需输入GitHub仓库的URL或“foo/bar”格式的仓库ID，该工具便会通过REST或GraphQL API获取并展示仓库的关键统计数据，其中首要指标就是提交总数。工具已提供实际示例，如查看simonw/datasette和simonw/llm这两个仓库的详细数据。

GitHub产品更新部署/工程

推荐理由：Simon 这个 GitHub Repo Stats 工具虽小，但直接解决了移动端看不了 commit 数这个真实痛点，做开源评估的开发者可以立刻用起来。

04:30

Simon Willison 博客

62

大文字工具

Simon Willison 为配合其“氛围编码”macOS演示工具，快速开发了一个名为“Big Words”的网页工具。该工具通过URL参数（如文本、渐变、大小）动态生成可自定义的幻灯片页面，解决了演示工具仅能嵌入URL内容的需求。用户可双击页面访问设置表单，自由调整文本内容、颜色、背景（支持纯色或渐变）、字体、字重、大小等多种视觉选项。所有设置均可生成一个特定的URL以便保存和分享，从而快速创建用于演示的文本幻灯片。

开源/仓库部署/工程

04:30

Simon Willison 博客

28

llm-gemini 0.31

llm-gemini 0.31 版本发布，其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态，转为正式可用。该模型自三月份预览以来，其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。

Google产品更新开源生态

04:22

Marc Andreessen 🇺🇸@pmarca

39

真正的AI糟粕是我们一路上遇到的糟糕AI政策制定。

政策/监管现象/趋势