本次更新包含多项功能优化与错误修复。主要功能上,`/color` 命令支持无参数随机选色,`/mcp` 命令显示已连接服务器的工具数量,`--plugin-dir` 参数新增支持 `.zip` 插件包。用户体验方面,优化了 `/model` 选择器的显示。关键问题修复包括:解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题,以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外,还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。
Gemini API 引入了事件驱动的 Webhook 功能,这是一种基于推送的通知系统。它旨在消除低效的轮询需求,为长时运行的任务(如文件处理或复杂推理)提供更优的解决方案。当任务完成时,系统会自动将结果推送到用户指定的端点,从而显著降低延迟并减少资源消耗,提升开发效率与响应速度。
在行业标准推理引擎vLLM上的测试显示,NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同,但在大多数服务商实际运行的中段负载区间,凭借全栈优化的复合增益,GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成,结果印证了端到端实测性能才是衡量硬件效能的黄金标准,而非单纯的纸面理论算力。
新推出的桌面AI代理KroWork旨在解决传统AI代理工作流随会话结束而消失的核心痛点。用户通过自然语言描述任务,AI即可自动构建并执行端到端工作流,最终可将完整流程保存为名为“Kro App”的持久性本地应用程序。该软件可一键安装至系统菜单,像常规软件一样运行,后续使用无需消耗tokens或重新构建。所有流程均在用户本地设备运行,无云端依赖,不泄露数据,且无需编程背景。其核心理念是实现从“聊天”到“交付”的跨越,将对话转化为用户真正拥有的可重用资产。
Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。
Cursor官方团队将其内部使用的开发工作流打包成名为“cursor-team-kit”的插件。该插件集成了17个核心Skills、1个Agent和2条Rules,旨在提升团队协作与代码质量。核心Skills涵盖五大领域:CI/合并循环自动化、PR全流程管理、验证与测试、总结复盘以及代码治理。其中,ci-watcher Agent可后台监听CI状态,而两条Rules则强制规定了TypeScript的代码风格。该插件是团队用于构建Cursor产品自身经验的封装,专注于验证变更、驱动本地工具和交付可评审的PR。
红帽公司近日公布了名为 Tank OS 的开源项目,旨在通过容器化技术提升 OpenClaw 运行环境的安全性。该项目将 OpenClaw 封装在专用容器中,采用无 root 权限架构,以防止宿主系统权限被滥用。Tank OS 基于 Fedora Linux 和 fedora-bootc 技术构建,支持在同一设备上运行多个相互隔离的 AI 智能体实例,各实例间不共享凭据和系统资源。此外,系统采用不可变操作系统设计,内核、运行环境及服务均预定义在镜像中,文件系统大部分为只读,从而进一步增强安全防护。
RingConn将于5月5日发布第三代智能戒指Gen 3,提供金、银两种配色。新品主打血管健康管理与血压监测功能,宣称能通过日常佩戴实现动态、无感的长期血压追踪,无需用户刻意测量。作为对比,前代产品Gen 2主要聚焦睡眠呼吸暂停监测、睡眠分期及夜间心率血氧追踪,目前在京东售价为2099元。
OpenAI 发布名为 Symphony 的新规范,旨在彻底改变人工智能编码工作流程。该系统允许智能体直接从 Linear 等项目管理平台自主领取任务并独立运行直至完成,无需开发者持续监控多个 Codex 会话。其核心目标是突破人类注意力瓶颈,实现开发过程中智能体的自我管理。
三星为其新一代AI家电推出多项智能功能。冰箱搭载Vision AI技术,可自动识别内部食材、推荐菜谱,并将缺少的食材加入Instacart购物清单,用户还能通过手机远程查看库存。AI烤箱能识别菜品并推荐烹饪时间,支持录制烹饪过程。部分功能由谷歌Gemini支持,高级食物识别等更新计划于5月推送。同时,Bixby助手升级为个性化家庭助手,可通过Voice ID识别不同用户。不过,相关产品售价较高,AI冰箱起售价为2799美元。
豆包在免费模式外新增付费订阅服务,推出三档价格:标准版连续包月68元、包年688元;加强版连续包月200元、包年2048元;专业版连续包月500元、包年5088元。付费功能专注于复杂任务和生产力场景,如PPT生成、数据分析和影视制作,以满足专业用户对高价值任务的需求。免费版本将继续服务日常使用,官方表示相关方案仍在测试阶段,正式上线时会公布完整信息。
open-slide是一款专为AI agent设计的幻灯片框架,能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件,并在固定画布上工作,而非简单生成Markdown。框架内置多项agent技能:通过/create-slide指令一句话生成整套幻灯片;支持在浏览器中对元素添加评论,并由agent通过/apply-comments一键应用所有修改;同时集成演示模式、演讲者笔记和定时器,并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent,其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”,填补了AI代理与真实生产应用之间的关键空白。
OpenAI Codex推出Auto-review新模式,解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时,由独立AI代理审批,评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由,超一半情况主智能体能自行找到更安全替代方案。效果上,自动批准率达99.1%,将打扰人类频率降低约200倍,有效拦截多数攻击。但团队坦承局限:非确定性安全保证,不能防御策略性欺骗,是安全与速度的折中。
关联讨论 2 条OpenAI:Alignment 研究博客(RSS)X:Tibo (@thsottiaux)