OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。
Google 为其 Gemma 4 开源模型家族发布了多令牌预测模块,可将文本生成速度提升高达三倍。该技术通过一个小型辅助模型一次性预测多个令牌,再由主模型单次检查完成验证,从而显著提高了推理效率。
Anthropic为其Claude托管智能体平台推出三项核心更新。“梦想”功能通过回顾会话历史提取模式,使智能体能够自我改进。“成果”功能允许开发者设定成功标准,智能体据此进行自我评估与修正,内部测试显示其显著提升了任务成功率和输出质量。“多智能体编排”功能支持主智能体将复杂任务分解,并分配给配备专用工具的子智能体并行处理。这些更新旨在以最小人工干预,增强智能体处理复杂任务的能力。
关联讨论 3 条X:Claude Devs (@ClaudeDevs)Claude:Blog(网页)X:Claude (@claudeai)Anthropic与SpaceX达成合作,获得其Colossus 1数据中心超300兆瓦(含逾22万块NVIDIA GPU)的算力。此举使Claude Code的Pro、Max等多档计划的五小时速率限制立即翻倍,并取消了高峰时段限流;Claude Opus的API速率也大幅提升。公司还公布了与亚马逊、谷歌、微软等科技巨头的一系列大规模算力协议,总投资额巨大。为满足企业客户的合规需求,算力扩张计划也将覆盖亚洲和欧洲地区。
关联讨论 15 条Simon Willison 博客Hacker News 热门(buzzing.cc 中文翻译)X:Testing Catalog (@testingcatalog)X:小互 (@xiaohu)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:歸藏 (@op7418)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:Berry Xia (@berryxia)让你搭一个多 agent 团队,每个 agent 有自己的性格和技能,随便哪个设备都能用。 自托管的多 agent 协作平台,跑在 Cloudflare Du…
Xbox CEO 阿莎·夏尔马宣布,将于5月13日为Xbox主机上线新的开机动画和音效。新动画将展示此前已公布的玻璃质感新版Xbox标志,音效也将进行微调。此次更新紧随夏尔马上任后的首次重大组织调整,包括人员变动、引入技术专长新成员及从微软CoreAI部门调入前同事。此外,她还通过推进玩家期待的功能、下调Xbox Game Pass价格及将Microsoft Gaming改回Xbox等举措,积极塑造其领导下的Xbox新方向。
NVIDIA宣布其Spectrum-X以太网扩展架构现已支持多资源容器(MRC)。这一AI原生的开放以太网架构旨在为构建千兆级AI工厂提供网络标准,以满足大规模AI训练与推理对高性能、可扩展网络的需求。MRC的加入增强了资源隔离与管理能力,使Spectrum-X能够更好地支持多租户、多工作负载的复杂AI环境,确保AI计算集群的性能与效率。
OpenAI正式向美国广告主全面开放ChatGPT自助广告投放平台,取消了此前5万美元的最低预算门槛,小型企业现可自主在ChatGPT内投放广告。该公司正加速构建完整的广告生态系统,目标是在今年实现25亿美元的广告营收。这一举措标志着ChatGPT商业化进程的重要扩张,降低了企业参与AI对话广告的门槛。
NVIDIA通过OCP开源了MRC协议,这是一种专为大规模AI训练集群设计的新型RDMA传输协议。其核心创新在于将单一连接分散到多条网络路径上,当某条路径出现故障或拥塞时,能在微秒级时间内通过硬件重路由流量,以解决前沿AI训练中日益严峻的网络瓶颈问题。该协议已应用于OpenAI的Blackwell集群,微软和Oracle也是其主要部署方。NVIDIA此举在表面推动更开放标准的同时,优先为自家Spectrum-X平台优化,实则强化了其全栈竞争优势,并将以太网技术推向传统上由InfiniBand主导的高性能计算领域。
OpenAI 发布了名为 MRC 的新型超级计算机网络协议,旨在提升大规模 AI 训练集群的韧性与性能。该协议通过开放计算项目公开,支持在数千个 GPU 间建立高效、可靠的多路径连接,能自动绕过故障链路,将网络有效带宽提升最高达 30%,同时显著降低训练作业因网络问题中断的概率。MRC 的设计目标是应对万卡级集群的复杂网络挑战,为下一代大模型训练提供基础设施支持。
关联讨论 1 条X:OpenAI (@OpenAI)微软正式推出 Microsoft 365 E7 企业版订阅,该版本在 E5 基础上整合了 Microsoft 365 Copilot、Microsoft Entra 套件及 Agent 365 服务等多项 AI 功能。新方案采用基于用户席位的收费模式,超出基础额度后按词元使用量和资源消耗额外计费。价格方面,含 Teams 版本为每用户每月 99 美元,不含 Teams 版本为 90.45 美元。此外,Agent 365 服务也可单独订阅,价格为每用户每月 15 美元。
Mininglamp-AI开源了两个核心项目,旨在将Mac打造为本地AI工作站。Cider是一个端侧推理加速框架,通过更充分利用M系列芯片的INT8 TensorOps,显著提升LLM/VLM等模型在Mac上的运行速度并降低内存占用。Mano-P则是一个端侧GUI-VLA Agent模型,采用纯视觉方式理解屏幕,能在本地操作各类桌面软件、网页、专业工具及复杂图形化工作流,实现自动化任务执行与数据整合。两者结合,为私有AI提供了高效的本地基础设施。
AI API中转站并非依靠API调用差价盈利。核心在于官方API成本极高,迫使企业寻求廉价替代。WorldRouter以低于官方约30%的价格提供访问,但其根本目标是成为统一的AI Agent运行与支付平台(Token Hub),致力于提供云端Agent环境、应用商店等基础设施,旨在成为Agent时代的“水电煤”底座。该项目提供从9.9到9999美元的多档入场方案,低价旨在吸引用户体验其未来的Agent服务生态。
阿里云新加坡推出“被发掘的故事:WAN AI视频挑战赛”,邀请参与者使用其WAN模型创作AI视频,重新构想新加坡文化遗产。活动注册期已延长,参与者需选择主题、讲述故事并制作视频,优胜者有机会赢取奖品。为激发创意,可参考ArCH Square的遗产展览获取灵感。该活动旨在推动AI技术与文化遗产的创新结合,涉及技术包括人工智能、大语言模型和通义千问等。立即报名,用科技重现历史。
Hugging Face 团队宣布为其开源自动语音识别(ASR)评测平台 Open ASR Leaderboard 引入名为“Benchmaxxer Repellant”的新防护机制。该机制旨在检测并抑制旨在人为操纵排行榜结果的基准测试投机行为,确保评测结果更公平、更具代表性。这一更新是平台持续维护的一部分,以应对社区中出现的非常规优化策略,维护开源 AI 研究与评估的诚信度。
Runway推出Runway Characters功能,用户上传参考图即可生成能实时对话的视频角色。该角色支持高清视频流,可注视摄像头或屏幕共享内容,并允许配置声音、性格与知识库。其核心突破在于将视频生成从预渲染推进至实时交互,使角色能理解对话、依据资料回答问题,并能调用工具执行网页操作或数据查询,支持通过API等方式集成至自有产品。
该版本修复了两个关键问题。一是解决了 VS Code 扩展在 Windows 系统上因捆绑 SDK 中硬编码的构建路径而无法激活的故障,涉及 `createRequire` 的 polyfill 错误。二是修正了 Mantle 端点认证因缺少 `x-api-key` 请求头而失败的问题。两项修复均针对特定错误,未涉及功能新增或性能指标变更。
映泰将在COMPUTEX 2026台北电脑展上推出新一代AMD与英特尔800系列主板,展位位于南港展览馆二馆P0914。消费级产品线包括旗舰VALKYRIE电竞系列、主流AI PC平台、AMD Radeon RX显卡及完整存储方案。工业领域将展示基于英特尔W880平台的工业主板,支持英特尔Panther Lake和英伟达Jetson Thor的次世代解决方案,以及EdgeComp系列边缘AI系统。
光子跃迁 LEAPTIC Cube 拇指运动相机已开启预售,起售价2599元。该相机采用磁吸分体设计,重56克,具备IPX8防水能力。其核心搭载1/1.3英寸5000万像素传感器,支持拍摄8K@30fps和4K@120fps视频,并集成AI美颜、场景识别与主角跟随功能。单机续航为110分钟,可通过连接磁吸配件“灵动拓展屏”或外挂电池,将续航分别提升至240分钟和210分钟。
华为鸿蒙HarmonyOS 6系统负一屏的“Today-Task Skill”功能正式上线,AI Claw任务动态已实时接入。用户桌面右滑进入负一屏后,可在顶部服务动态提醒处直接查看任务进度与结果,无需打开电脑即可实现同频追踪与重要进展展示。该功能基于此前内测的智慧助手·今天15.0.22.210版本,进一步整合了Claw智能体关联服务,提供AI任务完成提醒。
前沃尔玛电商业务CEO马克·劳尔在其餐饮平台Wonder中推出AI工具“Wonder Create”,用户可在不到一分钟内生成完整的虚拟餐厅品牌,包括名称、描述、图片及菜谱。Wonder平台采用“可编程烹饪平台”模式,配备机器人厨房与700种食材库,能灵活切换25种菜系。该创新旨在大幅降低餐饮创业门槛,让用户快速测试新菜品与品牌概念。
小米米家扫拖机器人6推出限时优惠。该机器人具备28000Pa吸力和40mm越障高度。原价水箱版2699元、上下水版3099元,现叠加PLUS立减和10%政府补贴后,水箱版到手价1899.21元,上下水版2206.93元。此外,以旧换新可享额外补贴,水箱版补贴100元,上下水版补贴200元。
谷歌正在内部测试一款名为“Remy”的全新AI个人智能体,旨在对标此前走红的OpenClaw。该智能体基于仅供员工使用的Gemini专属版本开发,被定位为工作、学业和生活中的全天候助理。其核心在于能代表用户自主执行实际任务,而不仅仅是回答问题。Remy深度集成Gmail、Chrome、Calendar等谷歌服务,可主动监控事项、处理复杂任务并学习用户偏好。目前项目处于内部测试阶段,尚未公布公开上线时间,其进展有望在即将到来的谷歌I/O大会上披露。
据科技媒体9to5Google报道,谷歌正开发代号“Neon”的Gemini AI新订阅层级,暂定名为“Google AI Ultra Lite”,预计定价约每月100美元。该层级旨在填补现有20美元的AI Pro与250美元的AI Ultra之间的市场空白,面向需要比Pro更多资源、又无需承担Ultra企业级溢价的高级用户,将与Anthropic和OpenAI展开竞争。同时,谷歌计划推出专属仪表板,帮助用户通过“5小时限制”、“每周预算”和“超额积分”三项核心数据,精确追踪和规划AI使用配额与Token消耗。
Astera Labs 发布了拥有320条可配置通道的Scorpio X-Series PCIe交换芯片,号称业界规模最大的开放式内存语义互连交换芯片。该产品可用单颗芯片替代多颗传统低通道数量交换芯片,从而简化AI系统互联拓扑,实现更低延迟、更大规模的集群扩展。其硬件加速的Hypercast和网内计算引擎可将集体运算性能提升高达2倍,提高每瓦特的词元处理能力。同时,公司公布了2026年第一季度创纪录的财务数据,营业收入达3.084亿美元,环比增长14%,同比增长93%。