OpenAI 联合 AMD、博通、英特尔、微软和英伟达,通过 OCP 开源了新型网络协议 MRC。该协议旨在解决大规模 AI 训练集群中因网络延迟或故障导致的 GPU 闲置问题。MRC 将数据包拆分并通过数百条路径并行传输,实现微秒级故障绕行,无需交换机重算路由。这简化了网络架构,将连接十几万 GPU 所需的交换机层级从 3-4 层减至 2 层,降低了功耗、成本和故障点。该协议已部署于 OpenAI 最大的 GB200 超算,并成功用于训练多个模型,显著提升了训练任务的鲁棒性。
作者通过自动化流程每日筛选arXiv论文,并利用智能体将其转化为可交互的“LLM Artifacts”。这一系统基于LLM Wikis概念演进,使论文知识可操作化:Artifacts支持动态注入见解、组件及实验建议,并能通过智能体协调器直接提问或自动化执行实验。其核心在于通过多智能体主动协作,持续挖掘可行动的知识,帮助研究者高效学习与跟进前沿。
Stanford CS336 上,Tatsu 讲了一节 LLM 架构课,把过去 3 年所有主流 LLM 拆开,看它们的共通模板 结论挺爆:90% 的架构选择已…
开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方…
关联讨论 1 条X:小互 (@xiaohu)让你搭一个多 agent 团队,每个 agent 有自己的性格和技能,随便哪个设备都能用。 自托管的多 agent 协作平台,跑在 Cloudflare Du…
2018年F1中国站,AMD CEO苏姿丰曾遭遇记者带有种族微歧视的提问。八年间,她将公司市值从濒临破产的30亿美元提升至6500亿美元。最新财报显示,其数据中心营收同比暴涨57%,股价大涨。她预判AI Agent的兴起将使CPU与GPU需求比例从1:8转向1:1,这为AMD的混合方案开辟道路,并挑战NVIDIA的垄断。凭借Zen架构与MI300系列,AMD在数据中心市场份额已从近乎为零升至40%,完成了最有力的反击。
作者宣布其创立的“Solo π LAB”社区已初具雏形,核心目标是分享个人已验证的独立项目,旨在帮助每个成员成为“超级个体”或“OPC”,并成功运营“一人公司”。为此,社区正在整理并推出“Solo π 计划”,旨在系统性地带领成员实践。作者强调,在AI时代,个人拥有无限可能,并希望陪伴所有热爱AI、积极探索一人公司模式的伙伴共同成长。
作者利用豆包Seed2.0-lite全模态理解模型,重新实践了将长视频自动转换为图文博客的工作流。传统ASR+LLM方案因信息丢失严重而效果不佳,新方案的核心在于模型能同时理解视频的音频、画面和屏幕文字,进行联合推理,从而保留技术视频中的关键视觉信息(如代码、图表)。通过将多模态能力封装为可复用的Agent Skill,并采用四步最佳实践——视频切片、生成结构化素材、反查关键帧配图、生成终稿——解决了传统流程的上下文割裂问题,使输出更接近人类技术编辑的整理成果。
作者在其著作中补充了关于策略蒸馏如何成为核心后训练优化技术的历史回顾。其数学原理相对简单,其发展得益于分布式训练系统的进步。关键转折在于强化学习设置中采用蒸馏目标,这启发了丰富的奖励塑造思路。策略蒸馏的普及也源于近年来强化学习算法工程的大规模投入。技术演进从学习教师示范转向学生自我推演,回顾看似明显,实则经历了大量工作。相关研究如MiniLLM率先提出了类似策略梯度的在策略推演蒸馏方法。
这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash
关联讨论 1 条X:Berry Xia (@berryxia)Warp 团队将其内部用于大幅提升工作流效率的“Skills”工具集完全开源。用户通过一条命令 `npx skills add warpdotdev/oz-skills` 即可安装包含 SEO 与无障碍审计、文档自动写作、Terraform/DevOps 配置、GitHub Issue 处理等在内的15个高质量生产级技能。团队此举旨在将其实用工具开放给整个社区,而非私有化,体现了开放精神。项目 GitHub 仓库已开放,并鼓励社区贡献。
关联讨论 1 条X:邵猛 (@shao__meng)一篇关于Claude Mythos和GPT-5.5的分析文章指出,两者在网络安全能力上基本持平,GPT-5.5可能更具成本效益。Mythos在部分通用基准和SWE-bench Pro上略微领先,但并未形成显著的能力突破。分析认为Mythos的性能符合既往趋势,并非偏离趋势的巨大飞跃。与此同时,OpenAI近期发布了多项出色产品,这反衬出Claude Mythos为何仍保持高度保密状态。
洛小山发布了一篇关于如何创建具有“活人感”AI助理的长文,内容包含大量实用干货与实战经验。文章指出,在该领域表现出色的实践者或项目,大多具有游戏开发背景或是资深游戏玩家。这一关联性提示,游戏行业在角色塑造、交互设计和叙事构建方面的经验,可能为开发更自然、拟人化的AI助理提供了关键的方法论借鉴。
开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方…
关联讨论 1 条X:小互 (@xiaohu)Petdex是一个专为Codex设计的宠物商店项目,允许用户更换终端小宠物。用户可预览、下载和提交各种动态宠物,通过命令行工具如'npx petdex install <宠物名>'快速安装。在Codex中,可通过Settings → Appearance → Pets界面选择宠物,或使用/pet命令唤出或收起宠物,实现个性化终端体验。
QClaw海外版通过调用本机Claude Code技能,实现了从任务发起到内容产出的全自动化写作流程。用户仅需在移动端发送一条包含多步骤指令(如筛选主题、撰写推文串、生成公众号初稿、进行去AI化处理及发布前检查)的文本任务,系统即可自动完成全部工作,并将最终文件输出至Obsidian知识库中。该工具的核心在于无缝衔接了自然语言指令与本地AI代码执行能力,显著提升了内容创作效率。
NVIDIA通过OCP开源了MRC协议,这是一种专为大规模AI训练集群设计的新型RDMA传输协议。其核心创新在于将单一连接分散到多条网络路径上,当某条路径出现故障或拥塞时,能在微秒级时间内通过硬件重路由流量,以解决前沿AI训练中日益严峻的网络瓶颈问题。该协议已应用于OpenAI的Blackwell集群,微软和Oracle也是其主要部署方。NVIDIA此举在表面推动更开放标准的同时,优先为自家Spectrum-X平台优化,实则强化了其全栈竞争优势,并将以太网技术推向传统上由InfiniBand主导的高性能计算领域。
Doubao-Seed-2.0-lite 0428 内测版本升级,新增音频理解功能,能同时支持图片、视频、音频和文本四种输入,成为豆包大模型家族首款全模态理解模型。该版本在 Agent、Coding 和 GUI 能力上也有明显提升。通过 API 测试,验证了其在前端动效复刻、视频Hooks建议和字幕识别等场景的应用潜力,具体案例详见后续推文线程。
Elon Musk指出,大公司创新停滞的核心原因是对失败的惩罚过于严厉,导致员工因害怕被开除而只敢进行保守的渐进式改进。他强调,风险回报必须明显向大胆行动倾斜,真正的突破才可能发生。SpaceX和xAI能快速迭代,正是因为他们将失败视为必要的学习成本。相反,多数公司一次失败就秋后算账,致使团队形成“安全第一”的保守文化,创新沦为表面表演。真正的创新需要容忍失败、奖励大胆尝试的文化,而非依赖KPI和零容错的管理压力。