多路径可靠连接(MRC)是一种新型RDMA传输协议,由NVIDIA、微软和OpenAI联合推出,并与AMD、博通和英特尔合作。该协议首先在NVIDIA Spectrum-X以太网硬件上得到验证和优化。MRC的核心创新是改变连接方式,允许单个RDMA数据流利用多条网络路径传输AI训练流量,而非强制每个GPU连接走单一固定路由。RDMA技术使GPU能以极少CPU帮助移动数据,这对于数千GPU在训练中不断交换模型更新至关重要。当网络出现拥塞、链路故障或交换机过载时,流量可自动绕行,无需软件层面修复,从而避免单一不良路径拖慢整个计算集群,保障大规模AI训练任务的高效进行。
本研究提出OpenClaw-RL系统,使语言模型能通过日常对话进行持续训练,无需人工标注数据。其核心是利用用户互动中产生的自然反馈(如纠正或重复提问)作为实时学习信号。系统从每次交互中提取两种信号:评估信号(判断行动成败,转化为数值奖励)和指导信号(获取具体改进方向,转化为词级监督)。该方法将标准部署环境转化为持续学习场景,使模型在后台运行中不断自我更新,自适应不同用户偏好,从而摆脱对大规模人工标注数据集的依赖。
OpenAI 与 AMD、Broadcom、英特尔、微软和英伟达共同开发了开源网络协议 MRC。该协议能在 GPU 间通过数百条路径同时传输数据,仅需两层交换机即可连接超过 10 万个 GPU,相比传统方案减少了交换机层级,从而降低了功耗与成本。MRC 协议目前已应用于 OpenAI 的 Stargate 超级计算机上运行。
为确保 vLLM 从 0.8.5 到 0.18.1 的重大重写后,在线强化学习训练结果与 V0 参考运行一致,团队优先修复后端行为而非调整 RL 目标。关键修复包括:将日志概率模式设为 `processed_logprobs` 以匹配采样器分布;禁用 V1 特有的前缀缓存和异步调度等运行时默认值;调整权重更新路径以匹配 V0 的缓存保留行为;并确保 rollout 后端使用 fp32 精度的 `lm_head` 进行最终投影。这些措施消除了策略比率均值偏差,使 V1 在 KL 散度、熵等指标上与 V0 达成一致。
Anthropic与SpaceX达成协议,将全面接管原为Grok建造的Colossus 1超算集群。该集群拥有300兆瓦算力和超过22万张顶级NVIDIA GPU。此举使Claude立即获得巨大算力,用户已享受到速率限制提升等服务红利。对马斯克而言,闲置算力得以变现并为SpaceX IPO增添收入;对Anthropic而言,这使其无需等待其他公司的新集群,直接提升了竞争力。双方还计划共同开发太空数据中心,以突破地球的电价、散热等物理限制。此次交易加剧了AI算力竞争,同时降低了企业部署门槛,使普通开发者受益。
关联讨论 9 条Simon Willison 博客X:小互 (@xiaohu)Anthropic:Newsroom(网页)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)Anthropic 将全面接管 SpaceX 的 Colossus-1 数据中心全部算力,该设施提供超过 300 兆瓦电力并配备超过 22 万块 NVIDIA GPU,预计在一个月内上线。同时,公司已将 Claude Code 的速率限制提升一倍,并大幅提高了 Opus 模型的 API 调用上限。
关联讨论 9 条Simon Willison 博客X:小互 (@xiaohu)Anthropic:Newsroom(网页)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)Anthropic宣布与SpaceX建立合作伙伴关系,以显著提升其计算能力。公司将获得Colossus 1的全部容量,并在一个月内增加超过300兆瓦的电力及22万块以上NVIDIA GPU。此举直接导致Claude各项服务的用量上限大幅提高:Claude Code的5小时限制翻倍,Pro和Max版本取消高峰时段限制,Opus API的速率限制也急剧提升。其中,Opus API第四层级现已支持每分钟1000万输入令牌和80万输出令牌,表明其目标已转向处理大型智能体工作负载。Anthropic正在构建一个跨NVIDIA、AWS Trainium和Google TPU的多供应商计算堆栈。
关联讨论 9 条Simon Willison 博客X:小互 (@xiaohu)Anthropic:Newsroom(网页)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)开源测试套件iFixAi通过模拟真实产品场景的测试夹具,为AI代理在部署前提供可重复、标准化的可靠性评估。它在五大风险类别下运行32项检查,评估模型是否捏造事实、遵循不安全指令、无故更改答案、隐藏不确定性或在措辞微调时行为不一致。其核心价值在于可重复性,能完整保存模型、提示词、评判标准和输入,确保不同工程师可复现相同结果。该工具主要目标并非证明AI绝对安全,而是用于捕捉性能退化、公平比较不同供应商模型,并为合规团队提供基于证据的客观报告。
OpenAI公布了“ChatGPT Futures: 2026届”的26名学生创新者名单。这些学生正利用以ChatGPT为代表的AI技术进行构建、研究,并推动产生现实世界的影响力。他们的项目正在重新定义学习、创造力和机遇,展示了新一代如何将AI工具应用于具体实践以解决实际问题。
Anthropic宣布与SpaceX达成合作,获得原属xAI的超级计算机Colossus 1全部算力(规模超300兆瓦、22万张GPU),并因此同步调高了Claude Code和Claude API的使用限制。Claude Code用户滚动限额翻倍,高峰时段限速取消,Opus系列API速率限制也大幅上调。此次合作源于SpaceX收购xAI后,其训练重心已转向新一代Colossus 2。Anthropic还提及有意与SpaceX共同开发轨道AI算力。这是其近期系列千兆瓦级算力协议的一环,解决了此前瓶颈,故能放开使用限制。
关联讨论 9 条Simon Willison 博客X:小互 (@xiaohu)Anthropic:Newsroom(网页)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)开发者西蒙·威利森指出,“氛围编码”和“能动性工程”两大趋势正以超预期的速度发展。“氛围编码”指开发者依赖AI生成代码但未必完全理解其逻辑,“能动性工程”则强调构建能自主执行复杂任务的AI代理。这两种方式正日益融合,引发对代码质量、开发者技能以及系统可靠性的担忧。相关讨论在Hacker News上获得107点关注,反映出业界对此趋势的高度关注与争议。
Anthropic公司宣布提高其AI助手Claude的使用限额,允许用户更频繁地访问服务,同时与SpaceX达成计算合作协议,将利用SpaceX的计算资源支持Claude的性能扩展。这一举措旨在增强用户体验和模型能力,消息在技术社区引发关注,在Hacker News上获得125点投票。
关联讨论 9 条Simon Willison 博客X:小互 (@xiaohu)Anthropic:Newsroom(网页)X:xAI (@xai)X:Thariq (@trq212)X:Claude Devs (@ClaudeDevs)xAI:News(网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)