AIHOT

4月28日

12:34

Anthropic：Newsroom（网页）

Anthropic 正式任命 Theo Hourmouzis 为澳大利亚和新西兰总经理，并同步开设悉尼办公室。Hourmouzis 拥有超过20年的亚太科技行业领导经验，将负责制定本地战略，推动 Claude 人工智能进入客户核心业务。公司正深化与联邦银行等企业的合作，并与澳大利亚国立大学等研究机构推进 AI for Science 项目。同时，Anthropic 近期与 Canva、Xero 建立了深度平台合作。悉尼办公室是其在亚太地区的最新布局，旨在贴近当地客户与市场。

Anthropic行业动态

12:33

Runway：News（网页）

精选58

无闲置GPU：Runway的研究计算管理

Runway通过采用Kueue作为Kubernetes准入控制器，将GPU利用率提升超过20%，同时保障团队容量。其核心机制是为关键工作预留配额，并设立共享队列借用闲置容量，当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群，支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中，团队拥有专用预留队列，而默认队列作为共享机会池，可借用闲置配额运行可中断工作负载。当预留队列需资源时，Kueue基于优先级和运行时间抢占默认队列中的任务，实现资源高效管理。

教程/实践部署/工程

推荐理由：Runway 把 Kueue + Kubernetes 的 GPU 调度实战写成了保姆级工程笔记，利用率翻倍的方案和踩坑细节都有，做大规模训练集群调度的团队可以直接抄作业。

12:33

OpenAI：官网动态（RSS · 排除企业/客户案例）

Choco 利用 AI 智能体实现食品分销自动化

Choco 通过集成 OpenAI API 构建了 AI 智能体系统，以自动化餐饮行业的食品采购与分销流程。该系统能自动处理订单、协调物流并优化库存，将人工操作时间减少了 70%，订单处理效率提升 50%。这一变革显著降低了供应链中的食物浪费，并帮助公司实现了业务规模化增长，展示了 AI 在传统产业中的实际应用价值。

智能体行业动态

12:33

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选70

一个用于编排的开源规范：Symphony

Symphony 是一个用于 Codex 编排的开源规范，能够将问题跟踪器转化为持续运行的智能体系统。该系统通过自动化任务协调与执行，显著提升工程团队的产出效率，同时减少开发者在不同任务间频繁切换带来的认知负担。其核心在于以标准化、可扩展的方式，将日常开发流程转化为由智能体持续驱动的工作流。

智能体OpenAI产品更新开源/仓库

关联讨论 3 条

推荐理由：OpenAI 把 Codex 的编排层抽成开源规范，等于告诉所有做 coding agent 的团队，底层调度逻辑不用自己造轮子了。做 AI 编程工具的值得花半小时看架构思路。

11:50

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.6-flash-fp8

inclusionAI 团队发布了 Ling-2.6-flash-fp8 模型，致力于通过开源与开放科学推动人工智能的发展与普及。该版本采用 FP8 精度优化，显著提升了推理效率并降低了计算资源消耗，是其在推进技术民主化进程中的最新实践。

开源/仓库模型发布端侧

11:27

蚂蚁 inclusionAI：HuggingFace 新模型

精选55

inclusionAI/Ling-2.6-flash

inclusionAI发布了Ling-2.6-flash模型。该模型是其开源语言模型系列的最新成员，旨在通过开源与开放科学推动人工智能的进步与民主化。此次发布延续了团队降低AI技术使用门槛、促进更广泛社区参与开发的使命。

开源/仓库模型发布端侧

推荐理由：蚂蚁 inclusionAI 的 Ling-2.6-flash 上线 HuggingFace，名字带 flash 大概率是轻量推理模型，但官方描述几乎空白，没有 benchmark 也没有用例，建议等社区实测再决定是否投入精力。

08:31

Claude Code：GitHub Releases（RSS）

精选60

Claude Code v2.1.121 更新：新增功能、体验优化与内存泄漏修复

本次更新为 Claude Code 带来多项增强与修复。新增功能包括 MCP 服务器的 `alwaysLoad` 配置、`claude plugin prune` 命令以及 `/skills` 界面搜索框。用户体验方面，优化了全屏模式滚动、对话框键盘滚动和长 URL 点击体验。重点修复了处理多张图片或使用 `/usage` 命令时可能出现的数 GB 内存泄漏问题，并解决了 Bash 工具在工作目录被删除后失效等稳定性缺陷。此外，还改进了 MCP 服务器的错误重试机制和终端会话标题的本地化显示。

智能体Anthropic产品更新编码

推荐理由：Claude Code 这版修了一堆让人抓狂的内存泄漏和崩溃问题，加上 alwaysLoad 和 plugin prune 两个实用功能，重度用户值得立刻升级，但对非用户来说只是例行迭代。

08:28

Hugging Face：Blog（RSS）

精选60

Adaptive Ultrasound Imaging with Physics-Informed NV-Raw2Insights-US AI

NVIDIA 在 Hugging Face 上发布了一款名为 NV-Raw2Insights-US 的物理信息人工智能模型，专门用于自适应超声成像。该模型能够直接处理原始超声射频数据，实时生成高质量的诊断图像。它通过结合物理定律与深度学习，显著提升了图像分辨率和对比度，同时将传统处理流程中的多个步骤整合为单一前向传播，大幅提高了计算效率。这一进展有望推动超声设备向更便携、智能和精准的方向发展。

具身智能论文/研究部署/工程

推荐理由：NVIDIA 把物理先验塞进超声成像管线，从原始射频数据直接出诊断结果，跳过传统重建步骤。做医疗 AI 的值得拆一下这个端到端思路，但离通用场景太远。

08:00

Apple Machine Learning Research（RSS）

精选64

LaDiR：潜在扩散模型增强 LLM 的文本推理能力

研究团队提出LaDiR推理框架，将连续潜在表征的表达能力与潜在扩散模型的迭代优化能力相结合，以增强现有大语言模型的推理性能。该框架首先构建一个结构化的潜在推理空间，通过扩散过程对潜在状态进行迭代细化，使模型能够全局性地重新审视和修正推理路径中的早期内容。这种方法突破了传统自回归解码在整体优化和多样化解决方案探索方面的限制，提升了链式思维生成的质量与效率。

推理数据/训练论文/研究

推荐理由：Apple 把扩散模型塞进 LLM 推理链，思路很野，用连续潜空间替代自回归 token 生成来解决「写到一半没法回头改」的老毛病。做推理优化或 diffusion 架构的值得细看，但离工程落地还远。

08:00

Apple Machine Learning Research（RSS）

StereoFoley：从视频生成具有对象感知能力的立体声音频

StereoFoley是一个视频到音频的生成框架，能生成48kHz、语义对齐、时间同步且空间准确的立体声。现有视频生成音频模型大多局限于单声道或无法实现对象感知的立体声成像，主要受限于缺乏专业混音、空间准确的视频-音频数据集。该研究首先开发了一个从视频生成立体声的基础模型，在语义准确性上达到了与当前最先进V2A模型相当的性能。

多模态论文/研究

08:00

Apple Machine Learning Research（RSS）

条件扩散模型中组合泛化的局部机制

条件扩散模型展现出组合泛化能力，能生成超出训练分布的条件组合样本，但其机制尚不明确。研究聚焦于长度泛化，即生成比训练所见更多数量物体的图像。在受控的CLEVR场景中发现，模型仅在某些情况下能实现长度泛化，表明其并非总能掌握底层组合结构。通过分析扩散过程的局部动态，研究揭示了泛化成功与失败案例中条件交互模式的系统性差异，为理解生成式模型的组合推理边界提供了新视角。

图像生成论文/研究

03:02

Midjourney：Updates（RSS）

High-res rating

Midjourney团队正为v8.1/8.2版本筹备重大美学更新，并公开征集用户协助进行图像排序以改进模型。此次工作的核心在于，团队将首次在完整的2K分辨率下进行图像排序活动，旨在为模型获取最优的高清像素数据，以提升图像生成质量。

产品更新图像生成

00:46

CMU：Machine Learning Blog

精选60

介绍ARFBench：基于真实事件的时间序列问答基准

每年系统故障导致损失超万亿美元，工程师需通过分析时间序列数据快速定位问题。时间序列问答（TSQA）是关键运维任务，对AI模型构成挑战。为此，研究团队推出ARFBench基准，基于Datadog真实内部事件及遥测数据构建。测试显示，当前领先的大型语言模型、视觉语言模型和时间序列基础模型在ARFBench上表现均有较大改进空间。团队提出混合TSFM-VLM模型，其整体性能接近前沿水平，为TSQA任务提供了新评估框架和改进方向。

论文/研究评测/基准部署/工程

推荐理由：CMU 和 Datadog 联手搞了个基于真实事故的时序问答基准，结论很诚实，现有模型全拉胯。做 SRE Agent 的团队该看看，这比合成数据的 benchmark 有说服力得多。

00:16

Gary Marcus：The Road to AI We Can Trust（RSS）

达里奥·阿莫代伊、炒作、AI安全与氛围编码AI灾难的爆发

AI领域的鼓吹者往往回避讨论关键风险。随着GPT、Claude、LLaMA等大型语言模型的快速迭代，行业在竞相追求参数规模与商业落地的同时，AI安全问题正以“氛围编码”的形式被系统性低估——即通过模糊的修辞淡化潜在危害。 Anthropic联合创始人达里奥·阿莫代伊等研究者多次警示，缺乏严格安全框架的AI发展可能引发连锁性灾难，包括恶意使用、社会分化与失控性风险。当前行业亟需将安全指标从抽象讨论转化为可量化的技术约束。

大佬观点安全/对齐现象/趋势

4月27日

23:58

GitHub Blog

精选79

GitHub Copilot 将转向基于使用量的计费模式

自6月1日起，GitHub Copilot 的使用将开始消耗 GitHub AI Credits，计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩，而非统一的月费或年费。

编码行业动态部署/工程

关联讨论 3 条

推荐理由：GitHub Copilot 从订阅制转向按量计费，这是 AI 编程工具定价范式的标志性拐点，所有重度用户和竞品都得重新算账。