5月6日
16:37
小互@xiaohu
63
Runway推出可实时对话的视频角色生成功能

Runway推出Runway Characters功能,用户上传参考图即可生成能实时对话的视频角色。该角色支持高清视频流,可注视摄像头或屏幕共享内容,并允许配置声音、性格与知识库。其核心突破在于将视频生成从预渲染推进至实时交互,使角色能理解对话、依据资料回答问题,并能调用工具执行网页操作或数据查询,支持通过API等方式集成至自有产品。

智能体产品更新视频
11:29
Greg Brockman@gdb
精选92
ChatGPT for Excel and Google Sheets: 它可以帮助分析杂乱数据、编写公式、更新电子表格,并在此过程中解释其操作--无需离开你的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/
OpenAI产品更新

推荐理由:ChatGPT 刚刚以插件形式进入 Excel 和 Google Sheets,背后是 GPT-5.5,能直接处理脏数据、写公式——这比任何通用聊天更新都更接地气,普通打工人明天就能用上。
11:06
小互@xiaohu
69
OpenAI推出Migrate to Codex功能,一键迁移编程工具配置

OpenAI发布“Migrate to Codex”功能,允许用户将其他编程工具(如Claude Code、Cursor)的配置一键导入到Codex。该功能会扫描用户级和项目级配置,自动映射并迁移编程Agent的配置、规则、技能、MCP、hooks、子代理以及最近30天的所有会话等内容。对于无法自动迁移的部分,Codex会启动一个新线程,让Agent继续协助处理剩余迁移任务。

智能体MCP/工具OpenAI产品更新
09:17
Berryxia.AI@berryxia
67
Anthropic推出金融服务Claude Agent模板,AI直接接管核心金融流程

Anthropic正式发布面向金融服务的Claude Agent模板,将AI在金融领域的角色从“辅助”升级为“直接执行”。该模板针对融资演示、估值审查、月末结账等高频率、耗时的核心流程,提供开箱即用的解决方案。它集成了完整的连接器、技能和子代理,可直接适配公司内部标准,并支持在Claude协作与开发环境中安装插件,或通过官方指南一键部署为生产级托管Agent。此举意味着AI开始直接接管以往需金融人员耗费数十小时完成的任务,标志着金融行业Agent时代的实质性开启。

智能体Anthropic产品更新
09:17
08:17
Berryxia.AI@berryxia
64
Google NotebookLM思维导图新增自定义、组织与导航功能

Google NotebookLM的思维导图功能正进行重大升级,新功能从今天起推出。核心更新包括自定义功能,用户可通过特定提示词引导MindMap的生成方向;组织功能支持立即重命名和分享MindMap,提升管理效率;导航功能优化了节点之间的过渡,实现更丝滑的交互体验。此次升级旨在增强工具的灵活性和用户体验,并邀请用户反馈意见。

Google产品更新搜索
08:17
Berryxia.AI@berryxia
精选72
OpenAI将Agent控制权交予开发者,SDK升级赋能长时运行

OpenAI对其Agents SDK进行重大升级,旨在为构建长时运行Agent提供更强的执行控制能力。核心在于将控制权交给开发者,打破黑盒状态。新功能包括:在受控沙箱环境中运行Agent,支持多家云服务商;允许完全检查和自定义开源harness;以及精准控制记忆的创建时机与存储位置。所有文件、凭证和执行状态均保留在开发者自有环境中,模型仅能访问经批准的上下文。此举解决了Agent易“失控”或“失忆”的问题,显著降低了工程化门槛,推动其从演示原型迈向生产级基础设施。

智能体OpenAI产品更新开源/仓库

推荐理由:OpenAI这次把Agent的长时运行、记忆和沙箱控制真正开放给开发者,SDK从玩具跨到生产级基础设施,做Agent的同行该仔细看一遍。
08:01
Luma@LumaLabsAI
精选70
推出Uni-1.1 API。 它通过简报进行推理,而不仅仅是处理标记。首次生成的结果即可实际交付。 无需中间件,无需提示工程。时尚工具。建筑渲染器。漫画制作流程。每个垂直领域都具备电影级品质。 可指挥的智能。可交付的审美。→ http://lumalabs.ai/api
产品更新图像生成视频
关联讨论 1X:Luma AI (@LumaLabsAI)
推荐理由:Luma 的 API 把视频生成的门槛压到「写需求就出片」,不用调 prompt 也不用搭中间件,做短视频和概念设计的可以直接拿去试。
05:34
ChatGPT@ChatGPTapp
精选83
ChatGPT 现已作为插件在 Excel 和 Google Sheets 中使用。 它可以帮助分析杂乱的数据、编写公式、更新电子表格,并在此过程中解释其操作--无需离开您的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/
OpenAI产品更新

推荐理由:直接在 Excel 里用 GPT-5.5 分析数据、写公式,不是新模型,但对每天和表格打交道的普通人来说比任何 benchmark 都实在。装个插件就能用。
05:31
Luma@LumaLabsAI
精选64
向Uni-1.1 API打个招呼。 足够智能,能够推理简报。足够有文化,能理解每种视觉传统中的美学语境。足够可控,能精准到达您指定的方向。 真正反映您品牌愿景的定制流程。现在对所有使用图像生成的团队开放。 停止生成。开始交付 → http://lumalabs.ai/api
产品更新图像生成
关联讨论 1X:Luma AI (@LumaLabsAI)
推荐理由:Luma把Uni-1.1的智能推理和美学理解打包成API,对于想用AI视觉能力直接嵌入产品的团队是个不错的信号,但算不上行业节点,做图像应用的可以看一眼。
05:28
Rohan Paul@rohanpaul_ai
69
AI工作范式转变:从聊天框到可操作计算机的智能体

AI工作正从聊天交互转向能直接操作计算机的智能体。Sai推出的新产品提供了一个由AI代理控制的远程计算机(通常是虚拟机),用户可通过手机或电脑与之交互。AI在私有远程桌面中自主操作真实应用程序,执行完整工作流。其核心突破在于手机成为真实软件工作的“遥控器”,繁重任务由后台持续运行的计算机完成。实际用例中,团队成员通过iMessage报告问题,Sai能在其虚拟机中复现问题、截图并交由Claude Code修改代码和提交PR,全程无需打开笔记本电脑,实现了在移动端发起并完成复杂工作。

智能体MCP/工具产品更新
04:26
NotebookLM@NotebookLM
精选61
Source organization 已正式面向 💯% 用户全面升级! 【引用 @NotebookLM】:资料越多越麻烦?现在不再如此: NotebookLM 现已推出自动标记与分类资料功能(当您拥有 5 个以上资料时),助您减少滚动时间,增加思考/学习/哲思等时间。 重命名、重组、个性化(表情符号!)随您心意定制。
Google产品更新
关联讨论 1X:NotebookLM (@NotebookLM)
推荐理由:NotebookLM 的来源自动标签功能,对于用笔记本来管理资料的学者和思考者来说,是个小而精的好优化,终于不用在列表里翻来翻去。
03:57
Rohan Paul@rohanpaul_ai
49
NVIDIA与Span合作将住宅变为小型AI数据中心,利用家庭富余电力

NVIDIA与Span计划利用家庭未充分利用的电力容量,将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点,并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证,目标是从2027年起实现年容量超过1吉瓦的分布式算力网络,同时为参与家庭降低电费成本。

产品更新端侧部署/工程
02:58
OpenAI Developers@OpenAIDevs
56
OpenAI四月开发者更新概览

OpenAI在四月份为开发者推出多项重要更新。核心是GPT-5.5的发布和广泛应用,社区已积极采用。Codex获得增强,支持更多插件集成、Chronicle上下文记忆功能以及团队协作。Agents SDK增加了对长时间运行智能体的控制,并新增TypeScript支持。API方面,Responses API引入WebSockets支持,Symphony功能可将问题队列转化为智能体工作流。图像创建与编辑功能已集成至Codex和API,同时支持构建交互式语音应用,推动开发者工具生态发展。

智能体OpenAI产品更新多模态
02:56
Google AI Developers@googleaidevs
精选68
Gemini API 文件搜索工具推出三项新更新,助力多模态 RAG 系统开发

Gemini API 文件搜索工具近日扩展三项功能更新,旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括:多模态支持,通过Gemini Embedding 2模型实现对图像和文本的同步推理;自定义元数据过滤,允许为文件添加键值标签以结构化非结构化数据,从而提升搜索速度;精确引用功能,能够捕获并返回每条索引信息的精确来源,如页码。开发者可通过Google AI Studio的示例应用体验这些功能,与图像和文档库交互,提问并追溯答案来源。

GoogleMCP/工具检索增强产品更新

推荐理由:如果你在用 Gemini 搭 RAG 系统,这三项更新能直接改善搜索精度和可解释性,多模态搜索终于把图片和文档打通了,值得马上试试。
02:27
02:27
Rohan Paul@rohanpaul_ai
精选73
Luma发布Uni-1.1 API,主打意图优先图像生成

Luma的Uni-1.1模型现已作为API开放。这是一个用于图像生成和自然语言编辑的统一智能模型,其核心特点是“意图优先”的图像生成。模型在生成前会进行思考,能补全场景缺失部分,理解空间上下文而非仅像素,并能基于参考图像保持一致性。该API内置提示词增强、研究和参考收集功能,专为生产环境打造。据称,其成本和延迟仅为同类模型的一半以下,且在图像生成与编辑的综合评测中位列前三。

产品更新图像生成多模态
关联讨论 1X:Luma AI (@LumaLabsAI)
推荐理由:Luma 把「意图优先」的图像生成从研究变成了 API,先推理再出图,还不到同类一半价格。做创意工具或广告管线的团队可以立刻接进去试试。
02:00
Sam Altman@sama
69
5.5 instant 今日登陆 ChatGPT! 在我看来这是一个相当大的升级,我真的很喜欢使用它。 【引用 @ericmitchellai】:Excited that we're updating the default model in ChatGPT today! 5.5 instant 在智能、图像感知和事实准确性方面都有显著提升。 它还更新了写作风格,使其更平实、更直接。 你的愿望清单上有什么?
OpenAI多模态模型发布
关联讨论 14X:Greg Brockman (@gdb)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)The Decoder:AI News(RSS)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:ChatGPT (@ChatGPTapp)OpenAI:官网动态(RSS · 排除企业/客户案例)X:歸藏 (@op7418)X:OpenAI Developers (@OpenAIDevs)IT之家(RSS)X:OpenAI (@OpenAI)
01:31
01:30
Satya Nadella@satyanadella
精选82
Copilot Cowork 新增功能:移动端、技能与插件。 现已在 iOS 和 Android 平台推出,您可通过手机委派工作,在桌面端继续处理,保持任务流畅推进。 借助全新连接器,Cowork 可跨业务系统与数据运作。
智能体Microsoft产品更新

推荐理由:Copilot Cowork 把委托工作从桌面延伸到了手机,加上 skills 和插件,办公自动化终于能随时丢任务随时捡起来,这是微软把 agent 落地的关键一步。
01:26
Rohan Paul@rohanpaul_ai
精选70
Anthropic发布10款金融智能体模板,将Claude转化为标准化工作流

Anthropic发布了10款面向金融服务的Claude智能体模板,使其从聊天助手转变为可执行募资书制作、KYC审查、月度结算、估值分析等标准化任务的工作流。其核心是通过预置“技能”规范操作,利用“连接器”安全访问数据,并通过“子智能体”拆分任务步骤。该功能支持在Microsoft 365应用间保持上下文连贯,无需重复输入。同时提供具备权限控制与审计日志的托管代理模式。据称,Claude Opus 4.7在Vals AI金融智能体基准测试中以64.37%领先。模板可安装于Cowork和Claude Code,或部署为生产级托管代理。

智能体Anthropic产品更新
关联讨论 4X:Testing Catalog (@testingcatalog)X:Claude (@claudeai)Anthropic:Newsroom(网页)Claude:Blog(网页)
推荐理由:金融从业者能直接把Claude当成一个能跑pitchbook和月底结账的同事了,不再是聊天助手。Anthropic给的性能基准也说明他们这次认真在解决金融合规和工具链的实际问题,值得关注
01:15
阿绎 AYi@AYi_AInotes
精选71
Anthropic发布10个开源金融AI Agent,重塑华尔街工作流程

Anthropic发布了10个开箱即用的金融专用AI Agent,将估值复核、制作pitchbook、月末结账等核心工作产品化。这些Agent能自动连接顶级金融数据库,原生支持Office,并可通过插件或托管模式使用,全链路审计确保合规。所有代码均已开源,企业可快速部署内部AI团队。此举直接替代初级分析师大量重复劳动,将AI Agent从实验工具转化为企业级生产力,并精准切入金融行业对安全合规的刚性需求,可能引发行业工作流程重构。

智能体Anthropic产品更新开源生态
关联讨论 4X:Testing Catalog (@testingcatalog)X:Claude (@claudeai)Anthropic:Newsroom(网页)Claude:Blog(网页)
推荐理由:Anthropic一口气发布10个金融Agent,从估值复核到生成PPT全包,连顶级数据库都接好了,还全部开源,这不是演示而是能直接用的生产力工具,金融从业者值得立刻装上试试。
5月5日
23:59
23:57