AIHOT

5月8日

11:22

歸藏(guizang.ai)@op7418

精选73

Codex 越来越猛了，昨天更新增加了内置的谷歌浏览器插件，可以直接控制你的谷歌浏览器执行任务。

Codex最新更新引入了内置谷歌浏览器插件，能直接控制基于Chromium的浏览器（如Chrome或Dia）执行任务。该插件支持后台跨浏览器页面并行工作，不干扰正常浏览；用户可启动多个SubAgent同时操作多个网页，实现高效并发。根据OpenAI官方信息，Codex现直接在macOS和Windows的Chrome中运行，能更好地与应用和网站交互，并在后台跨标签页并行处理任务，不接管浏览器。安装方法简单：在Codex插件库找到Chrome插件，点击添加并安装即可。安装后，用户可无缝下达指令，享受流畅的多任务操作体验。

智能体OpenAI产品更新编码

关联讨论 9 条

推荐理由：Codex 这次更新的精髓是并行控制浏览器 Tab，不抢鼠标不弹窗，后台就能帮你填表、搜信息，自动化体验又拉高了一截。

11:06

SemiAnalysis@SemiAnalysis_

@vllm_project 维护者在第0天优化DeepSeekv4性能并在周末合并了他们的初始模型支持PR。速度就是护城河

DeepSeek开源/仓库推理部署/工程

11:05

Greg Brockman@gdb

GPT-5.5-Cyber现已面向关键基础设施防护人员开放有限预览。这是一个非常强大的模型。

OpenAI安全/对齐模型发布

11:05

Eric@ericmitchellai

精选85

OpenAI在API中正式推出GPT-Realtime-2，这是其迄今为止最智能的语音模型，为语音智能体引入了GPT-5级别的推理能力。该模型使语音智能体能够成为实时协作者，在对话展开过程中聆听、推理并解决复杂问题。同时发布的还有流式模型GPT-Realtime-Translate和GPT-Realtime-Whisper，共同构成了一套面向下一代语音界面的全新音频能力组合。

OpenAI推理模型发布语音

关联讨论 12 条

推荐理由：OpenAI首次把GPT-5级推理塞进实时语音模型，音频原生智能不再是demo玩具，做语音agent的团队今天就可以在API里调用。

10:40

swyx 🌉@swyx

AI工程师大会的新加坡站活动门票已提前售罄，成为继迈阿密和巴黎后的第三个成功案例，证明了其合作伙伴计划的可行性。组织者透露，在大会开幕前将有来自@Gavriel_Cohen的重大消息公布。对于未购票者，会议期间将有一系列由参会者主办的周边活动可供参与。

其他行业动态

10:21

Berryxia.AI@berryxia

Grok 支持Apple CarPlay，可惜国内的特斯拉都已经要介入的是豆包了哈哈哈

xAI产品更新语音

10:21

Berryxia.AI@berryxia

我想用这个做个Voice Agent 能行吗？直接给我进行问答和做一些定向的检测和人物啊！有没有玩过的朋友？

智能体其他端侧语音

10:09

meng shao@shao__meng

精选71

Codex现可直接在Chrome中运行 Codex Chrome插件 + Chrome Codex扩展程序 https：//developers.openai.com/codex/app/chrome-extension

智能体OpenAI产品更新

关联讨论 9 条

推荐理由：Codex 终于能在 Chrome 后台悄悄干活了，不用再占着整个浏览器，对用 Codex 的开发者是实用更新，刚好可以试试。

10:01

Alibaba Cloud@alibaba_cloud

5月26日Qwen大会2026，亲历向智能体原生基础设施的转型。我们将深入探讨大规模自主规划、协调与推理。超越代币，迈向实际生产力。见证AI如何重塑您的增长。 https：//click.qwencloud.com/m/20000000142/

智能体推理行业动态

09:44

小互@xiaohu

精选73

OpenAI发布Codex for Chrome扩展，可操作已登录网站

OpenAI推出Chrome浏览器扩展“Codex for Chrome”，该工具能利用用户当前的浏览器登录状态，直接操作需账号访问的后台、CRM等受保护页面执行任务，无需额外提供密码。扩展在独立标签组中运行，不影响用户当前浏览，并在执行提交、下载等敏感操作前请求用户确认。典型应用包括跨网站查询信息、预填表单、读取仪表板并生成摘要等。

智能体MCP/工具OpenAI产品更新

关联讨论 9 条

推荐理由：Codex这个扩展把AI从‘给你代码’推进到‘替你操作网页’，关键是用你已登录的Chrome，内部系统、后台都能直接干，Agent落地的最后一公里被踩平了一大截。

09:43

Tibo@thsottiaux

精选83

我们正在众目睽睽之下构建通用人工智能【引用 @OpenAI】：在API中推出GPT-Realtime-2：这是我们迄今为止最智能的语音模型，为语音代理带来GPT-5级别的推理能力。语音代理现已成为实时协作者，能够在对话展开时倾听、推理并解决复杂问题。现已与流式模型GPT-Realtime-Translate和GPT-Realtime-Whisper一同在API中提供--为新一代语音界面带来全新的音频能力。

智能体OpenAI推理模型发布

关联讨论 12 条

推荐理由：GPT-5 级推理放到实时语音里，语音代理从听懂话到真正协作的分水岭，做语音产品的都该立刻试一下。

09:40

Sam Altman@sama

我们希望能帮助企业加强安全防护，并认为尽快开展这项工作至关重要

OpenAI安全/对齐模型发布

09:39

meng shao@shao__meng

Claude Code 开发者谈AI时代技术写作的核心：深耕经验，善用工具

Claude Code开发者Thariq认为，高质量技术文章的基础在于深入具体的工作经验，而非写作技巧。他提出“先深耕，后叙事”的两步法：长期研究积累独特细节，再将经验转化为对读者有用的故事。有效方法包括注重长期积累、分享经验而非单纯描述项目、披露失败尝试的价值、使用简洁语言及提供真正有价值的实施细节。对于AI写作，他肯定其在研究、图表生成等方面的辅助作用，但强调人的叙事判断不可替代——AI能整理信息，却难以决定“读者此刻最需要理解什么”，这使得在AI辅助下人的判断反而更加关键。

Anthropic大佬观点教程/实践编码