5月8日
05:09
宝玉@dotey
精选74
OpenAI 为 Codex 发布 Chrome 扩展,使其能直接在浏览器中执行任务

OpenAI 为其编程助手 Codex 推出了 Chrome 浏览器扩展。该扩展现可供 macOS 和 Windows 用户在 Codex 应用中安装,使 Codex 能直接在浏览器后台并行处理多标签页任务,且不干扰用户当前界面。此举将 Codex 的能力从终端、IDE 和云端延伸至浏览器环境,使其能够处理需要登录的网页操作,例如访问内部后台、更新 CRM 记录或完成多步骤表单流程。它通过编写并运行代码来操作页面,并自动组合使用现有插件或通过 Chrome 处理登录任务。典型应用场景包括调试业务流程、进行调研和处理重复性数据录入。目前该功能已在 Codex 应用中提供,但欧盟和英国地区暂未开放。

智能体MCP/工具OpenAI产品更新
关联讨论 8X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 进了浏览器,不再是只会写代码的 agent,能帮你查后台、填表单、跑流程,这步一跨,很多人的日常重复工作可以交给它了。
04:42
TestingCatalog News 🗞@testingcatalog
精选71
OpenAI的Codex现已正式推出适用于macOS和Windows的Chrome浏览器扩展,用户需安装插件以开始测试。该扩展旨在提升Codex与浏览器内应用及网站的协作能力,能够在后台并行处理多个标签页任务而不占用浏览器控制权。用户可自主管理Codex可访问的网站权限。此前测试消息显示,此专用扩展将显著优化浏览器环境中的AI辅助工作流程。
智能体OpenAI产品更新
关联讨论 8X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex终于把触手伸进了Chrome,跨标签后台运行且不抢控制权,比很多'接管浏览器'的方案更克制也更实用。普通用户不用离开网页就能让AI干活,值得现在就装上试试。
04:42
04:39
宝玉@dotey
精选80
Anthropic将Claude全面集成至Microsoft 365,多款插件结束测试

Anthropic宣布,Claude for Excel、PowerPoint和Word三款插件已结束测试转为正式版,Outlook插件同步进入公测。所有付费Claude用户均可免费使用。此次集成的核心突破在于Claude能在Microsoft 365套件中跨应用保持连续的对话上下文。例如,用户可在Outlook中处理邮件,随后在Word中编辑附件,再于Excel构建财务模型并最终生成PowerPoint演示文稿,全程无需重复提供材料。具体功能包括:在Excel中修改单元格而不破坏公式;按模板生成原生PowerPoint图表;在Word中以修订模式编辑文档;在Outlook中生成待发送的邮件草稿。

Anthropic产品更新
关联讨论 1Claude:Blog(网页)
推荐理由:Claude不再只是个聊天框,Excel里改模型、PPT里出图表还能跨应用带上下文,对天天做表写PPT的人,这比新模型发布更实在,而且不额外收费。
04:36
OpenAI Developers@OpenAIDevs
精选72
Codex 现在能承担更多浏览器开发工作。 通过 Codex 应用中的新 Chrome 插件,它可以测试网络应用、跨标签页收集上下文、并行高效使用网页开发者工具,并保持结果井井有条而不占用你的浏览器。
OpenAI产品更新编码
关联讨论 8X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 从写代码扩展到了浏览器自动化测试,这个 Chrome 插件让它在 DevTools 并行操作上有了自己的想法,做前端自动化的可以试试。
04:36
04:35
Greg Brockman@gdb
精选76
自OpenAI创立以来,我一直对实时语音翻译这一AI应用感到兴奋。 现在看到它通过API向所有开发者开放,真是太酷了:

jason liu新しいリアルタイム翻訳モデルを発表できることをうれしく思います。ぜひ本日よりAPIでお試しください。

OpenAI产品更新语音
关联讨论 14OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:OpenAI 把实时语音翻译做成了 API,从 demo 到可开发只差一个调用,语音类产品这下有真正的实时翻译基建了。
04:10
OpenAI@OpenAI
精选75
Codex现可直接在macOS和Windows的Chrome中运行。 它在处理Chrome中的应用和网站时表现更佳,并能在后台跨标签页并行工作,而不会占用浏览器控制权。 要开始使用,请在Codex应用中安装Chrome插件。
智能体OpenAI产品更新编码
关联讨论 8X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)IT之家(RSS)X:Vista (@vista8)
推荐理由:Codex 从终端跑进 Chrome,最大的变化不是平台迁移,而是能跨标签并行在后台干活不接管浏览器,这对前端开发和依赖网页工具的流程是实打实的效率提升。
02:11
Perplexity@perplexity_ai
精选68
Personal Computer现已通过全新的Perplexity Mac应用向所有用户开放。 Personal Computer是Perplexity Computer的进阶版本。 它可在任何Mac设备上运行,能跨本地文件、原生Mac应用、网络以及Perplexity安全服务器执行任务。
智能体产品更新

推荐理由:Perplexity 把计算机使用能力做进了 Mac 原生应用,能跨本地文件、桌面程序和网络运行任务,对 Mac 用户而言 AI 助手真正开始接管操作系统层级的工作。
02:11
02:05
OpenRouter@OpenRouter
精选68
Gemini 3.1 Flash Lite 来自 @GoogleDeepMind,现已在 OpenRouter 正式发布。 多模态(文本/图像/视频/音频/PDF → 文本),100万上下文,可选的思考层级,输入每百万次$0.25,输出每百万次$1.50。 还可配合我们新的 service_tier 参数使用,以权衡成本与延迟!
Google产品更新多模态

推荐理由:OpenRouter 把 Gemini 3.1 Flash Lite 的多模态 1M 上下文压到 $0.25/M token,这个定价让 Flash 系列不再是试验品,轻量级应用可以认真考虑它了。
01:38
宝玉@dotey
精选81
OpenAI在Realtime API上线三款新语音模型

OpenAI在Realtime API中推出了三款新语音模型:GPT-Realtime-2用于对话,GPT-Realtime-Translate用于翻译,GPT-Realtime-Whisper用于实时转录。GPT-Realtime-2具备GPT-5级别推理能力,在音频测试中性能显著提升,改进了交互体验,如任务前语音提示、工具调用透明化和128K上下文窗口,并支持调节推理强度以平衡延迟。GPT-Realtime-Translate支持70多种输入和13种输出语言的实时翻译,GPT-Realtime-Whisper提供流式转录功能。三款模型均已上线,并公布了API价格。

OpenAI产品更新语音
关联讨论 14OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)IT之家(RSS)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)
推荐理由:GPT-5 级推理终于进了语音 API,Big Bench Audio 从 81 跳到 97,多工具调用还能念出来,做语音 agent 的可以直接上手试了。
5月7日
23:21
Berryxia.AI@berryxia
65
Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧
23:06
meng shao@shao__meng
精选70
Apify mcpc 与 x402:给 AI Agent 装上"自动付款的钱包"

Apify发布的通用MCP客户端CLI工具mcpc,集成了x402支付协议,旨在解决AI Agent调用付费API时的手动计费瓶颈。传统SaaS计费流程依赖人工注册、绑卡和审批,而x402协议将支付压缩为一次HTTP往返加签名,使程序能自主交易。mcpc为Agent提供加密钱包,当调用付费服务遭遇HTTP 402状态码时,可自动签名完成支付,无需人工干预。该工具支持Claude Code等MCP兼容的Agent,用户可使用USDC为钱包充值并连接x402兼容服务。

智能体MCP/工具产品更新

推荐理由:过去 Agent 付费靠人类插手,Apify mcpc 把 x402 支付压缩成一行签名,相当于给每个 Agent 发了个自动钱包,做 agent 基建的可以立刻用起来了。
23:04
OpenRouter@OpenRouter
精选72
1/ 音频现已成为OpenRouter的一等公民。 今日上线两个新端点: 📢 /api/v1/audio/speech - 文本转语音(TTS) 🎤 /api/v1/audio/transcriptions - 语音转文本(SST) 沿用您已在文本、图像和视频中使用的相同路由、计费和密钥。
产品更新语音部署/工程

推荐理由:OpenRouter 突然把 TTS 和 STT 拉进了统一路由,用同一把 Key 和账单,做多模态 App 的人可以少调一个 API。更新不大,但省事。
23:01
Chubby♨️@kimmonismus
53
谷歌推出AI健康教练,整合多维度健康数据

谷歌在新健康应用中发布了由Gemini驱动的AI健康教练,能整合用户的健身、睡眠、营养、周期追踪、天气乃至美国医疗记录等全方位健康数据。此举被视为迈向个人AI医生和个性化AI医疗的第一步。谷歌将Fitbit应用升级为Google Health,使其成为集健身、睡眠、体征监测、设备连接及未来Google Fit数据迁移于一体的中心平台。Fitbit继续作为硬件核心,而应用则成为Gemini驱动教练、Google Health Premium及新Fitbit Air生态的基地。这一发布领先于苹果即将推出的由Gemini赋能的新Siri及类似健康概念。

Google产品更新
22:41
TestingCatalog News 🗞@testingcatalog
55
Meta即将推出常驻AI智能体"Hatch",基于社交数据训练

Meta即将推出名为“Hatch”的常驻AI智能体,目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露,内部测试计划于6月底启动,Meta为此构建了模拟Reddit、Etsy和DoorDash的环境,以训练其工具使用行为。技术架构方面,最终将由Meta自家的Muse Spark模型系列作为核心支撑,而在过渡阶段,将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

智能体AnthropicMCP/工具Meta
22:31
Chubby♨️@kimmonismus
48
Superintelligence升级为AI与未来科技对话媒体平台

Superintelligence宣布提升至新水平,从新闻通讯和播客转型为媒体平台,专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持,优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue,探讨AI生成代码如何改变软件安全,以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中,旨在追踪AI的实际发展方向。

产品更新安全/对齐
20:33
20:11
TestingCatalog News 🗞@testingcatalog
57
Anthropic测试Claude Console托管代理的Insights功能

Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话,将每个会话记录与代理系统提示并行发送给模型,以生成包含任务、行动、问题和评估的摘要,并给出0-100的质量评分。同时,直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后,另一个模型调用会读取所有摘要和统计信息,生成跨会话洞察,包括重复错误、使用模式、效率异常点和成功案例,并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载,所有数值均基于原始事件数据计算,仅文本描述和分类来自模型生成。

智能体Anthropic产品更新部署/工程
17:59
Alibaba Cloud@alibaba_cloud
34
阿里云ClawTalks EP3直播:从本地自动化到团队协作的AI工作流

阿里云ClawTalks第三期将于2026年5月8日进行YouTube直播,重点介绍其开源AI智能体工具如何提升工作流。核心产品包括QwenPaw和HiClaw:QwenPaw支持在设备本地运行轻量级、低内存的AI自动化任务;HiClaw则致力于实现透明、人机协同的多智能体团队协作,旨在变革AI智能体的构建与应用方式。

智能体产品更新
12:20
Berryxia.AI@berryxia
52
马斯克给其打Call的Neuralink 这次直接把"脑机接口"从"局部修复"升级成了"全脑通用解决方案"

Neuralink研发手术机器人,可精准抵达大脑任意区域,将脑机接口从局部修复升级为全脑通用解决方案,旨在治疗瘫痪、癫痫等大脑疾病。机器人演示了在血管网络中穿行和微米级植入能力,使脑外科手术从高风险艺术变为可重复工程,拆除普惠化门槛,迈向人类大脑操作系统。

产品更新其他
11:16
阿绎 AYi@AYi_AInotes
63
AI在专业命理大赛接近人类顶尖水平,技术路径可迁移至垂直领域

Tianfu Agent在第十六届全球算命师大赛中取得50%的截尾均值准确率,接近人类顶尖选手的53.5%,显著超越通用大模型40%的基线。其突破在于采用工程化方案:开发200多个专用原子工具处理精确计算,将流派技法封装为可调用函数,并通过量化工具模拟人类直觉。该Agent范式为法律、中医等规则密集型领域的AI化提供了可迁移的新路径,相关评测基准已开源。

DestinyLinkerTianfu Agent 在全球算命师大赛上跑到 50% 截尾准确率(人类 Top-20 选手平均 53.5%) 比赛 3069 名参赛者 人类 Top-20 …

智能体产品更新开源生态推理
10:36
meng shao@shao__meng
精选77
Amp发布新版CLI工具Neo,引领Coding Agent向长链路转型

Amp发布CLI工具Neo,标志着Coding Agent从“陪伴式”转向“长链路”新方向,核心是减少人工介入、支持随处运行与触发。关键更新包括:实现本地线程的远程控制与编排;引入自动上下文压缩,淘汰手动管理;正式发布Plugin API,支持扩展工具与交互;采用队列与引导机制优化工作流;权限模型彻底反转,默认允许所有操作,将安全控制权移交插件系统;性能大幅提升,CPU与内存占用显著下降。此次更新旨在构建更自主、高效且可扩展的智能编程代理架构。

智能体MCP/工具产品更新编码

推荐理由:Amp 这次重写把 Coding Agent 从「陪你写代码」变成了「替你干完活」,默认不询问权限这步走得够狠,但也确实是大模型能力上来的必然。
10:12
向阳乔木@vista8
67
Refero Styles:给AI Agent用的前端设计参考网站。

Refero Styles是一个为AI Agent设计的前端参考网站,允许输入网站名或URL自动提取设计风格并生成DESIGN.md文件。它收录了ElevenLabs、Apple等优质网站的Design文档,并提供Refero MCP,包含真实产品截图和用户流程,让AI Agent在编码前参考以提升效率。

智能体MCP/工具产品更新编码
09:12
向阳乔木@vista8
59
字节TRAE SOLO移动端打通IDE,支持第三方模型与飞书集成

TRAE SOLO推出移动端应用,可与电脑端IDE打通,实现远程控制与任务下发。该应用支持用户配置第三方模型并使用自己的API密钥,增强了灵活性与自主性。尤其在与飞书绑定后,其实用性显著提升,使得用户能够在手机端处理一些相对复杂的任务,扩展了移动办公与开发的场景。

产品更新编码
09:09
xAI@xai
精选76
图像生成质量模式现已在xAI API上线。 该模型已为Grok平台生成超过3亿张图像。 它为商业用户带来更高真实感、更强文本渲染能力和更优创意控制。 https://x.ai/news/grok-imagine-quality-mode
xAI产品更新图像生成多模态
关联讨论 1xAI:News(网页)
推荐理由:xAI 把 Grok 的图像生成质量模式开放了 API,背后是 300 亿张图的积累,做商业视觉的现在可以直接接入,高真实感和强文字渲染这两个点非常实用。
08:20
Berryxia.AI@berryxia
精选72
Google翻译推出实时耳机传译,支持70多种语言

Google Translate的Live translate功能通过耳机提供70多种语言的实时同声传译。用户只需佩戴耳机并启动应用,即可在耳中直接听到翻译。该功能基于Gemini高级语音模型,不仅能准确翻译语义,还能保留说话人的语气、重音和节奏等细微特征,使交流体验更接近真人对话。这项技术旨在消除跨语言沟通的障碍,让用户在海外能进行更自然的交流。

Google产品更新语音

推荐理由:Google 把实时同传塞进耳机,关键不是翻译而是 Gemini 保留了语气和节奏,听到的是人不是机器,出国党必存。