AIHOT

4月24日

09:08

IT之家（RSS）

豆包App上线“帮你选”功能，内嵌于导航栏。该功能以对话式交互为核心，用户通过语音或文字提出购物需求，豆包会快速梳理并列出选项的优缺点、价格对比，提供个性化建议。关键进展在于该功能已与抖音电商深度打通，构建交易闭环，用户可在豆包App内直接下单支付，无需跳转至抖音。此前，豆包已于3月开始内测“购物下单”功能。字节跳动CEO梁汝波曾表示，豆包用户规模增长较快，但与国际头部竞品仍有差距。

智能体产品更新搜索

08:13

Claude Code：GitHub Releases（RSS）

精选56

Claude 代码工具 v2.1.119 版本更新

Claude 代码工具发布 v2.1.119 版本，带来多项功能优化与问题修复。主要更新包括：用户配置现持久化至本地文件；新增 `prUrlTemplate` 设置以自定义 PR 徽章链接；`--from-pr` 命令扩展支持 GitLab、Bitbucket 等多个平台。工具权限与交互行为在多处实现统一，例如 `--print` 模式现在遵从代理的前置元数据定义。界面体验获得改进，如斜杠命令建议会高亮匹配字符，长描述自动换行。此外，本次更新修复了大量已知问题，涉及粘贴格式错乱、工具意外隐藏、MCP 服务器连接失败、权限模式行为异常及界面显示错误等。

Anthropic产品更新编码

推荐理由：Claude Code 这次更新全是打磨细节，没有大功能但修了一堆让人骂娘的 bug，重度用户值得升级，其他人等下一个大版本也行。

4月23日

08:00

Google Developers Blog（RSS）

精选59

使用 LiteRT 与 NPU 构建现实世界中的设备端人工智能

LiteRT 是一个生产就绪的框架，旨在帮助移动开发者充分发挥神经处理单元（NPU）的效能，以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性，已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型，实现实时视频处理、动画生成与语音识别等高级功能。此外，平台还提供基准测试工具并具备跨平台兼容性，能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。

Google产品更新端侧部署/工程

推荐理由：Google 把 LiteRT 从实验品推到生产级，统一 NPU 调用 API，做端侧 AI 的开发者终于不用逐家适配芯片了。虽然不是新概念，但 Google Meet 和 Epic Games 已经在用，说明不是 PPT。

4月22日

20:00

OpenRouter：Announcements（RSS）

工作空间简介

OpenRouter 推出工作空间功能，支持用户将项目组织到相互独立的环境中。每个工作空间可配置专属的 API 密钥、自定义路由默认设置、防护规则以及观测性选项。这一功能有助于实现项目间的资源隔离与管理分离，提升多项目协作与安全管控的灵活性。

产品更新部署/工程

17:08

IT之家（RSS）

澎湃 OS 3 Beta 版向小米 17 系列手机推送"龙虾"智能体 Xiaomi miclaw

小米澎湃OS 3 Beta版已向小米17系列、Redmi K90 Pro Max等机型推送“龙虾”智能体Xiaomi miclaw。该智能体基于小米MiMo大模型，能让手机成为AI工具，理解用户意图后调用应用与系统工具完成任务。主要更新包括新增人格与技能体系、支持自然语言创建定时任务、可使用80多项系统工具，并预置了日程、沟通、办公等多场景一方助手。它还支持跨设备同步记忆和文件搜索传输，并可通过助手商店扩展能力。目前该产品仍属前沿探索，在稳定性与复杂场景处理方面持续优化。

智能体MCP/工具产品更新

4月15日

08:00

Cursor Blog

精选69

在画布中与智能体创建的可视化界面交互

Cursor新增画布功能，可将信息转化为可视化、可交互的界面，替代难以阅读的长篇文本。智能体能利用画布为真实数据创建仪表盘，或定制带逻辑的交互界面，应用于代码审查、学习库文档乃至管理其他智能体。该功能基于React组件库构建，包含表格、图表等原生组件。在数据密集型任务中尤为高效，例如聚合多源数据生成统一分析图表，或在代码审查中智能分组并优先展示关键变更。Cursor团队已借此显著提升了模型评估分析和复杂问题研究的效率，成为扩展人机协作信息带宽的关键工具。

智能体产品更新编码

推荐理由：Cursor 把 agent 输出从纯文本拉到可交互的可视化画布，PR review、eval 分析这些高频场景立刻能用上。做 coding agent 的同行该想想自己的 agent 输出形态是不是该升级了。

08:00

OpenRouter：Announcements（RSS）

精选57

宣布推出视频生成功能

OpenRouter平台现已上线视频生成服务。用户可通过单一API接口，直接调用顶级的视频生成模型。这一集成简化了开发流程，使开发者无需分别对接不同厂商，即可便捷地访问和使用当前领先的视频AI模型能力。

产品更新视频部署/工程

推荐理由：OpenRouter 把视频生成塞进统一 API，对已经在用它做多模型路由的开发者来说是零成本扩展，但对大多数人只是又一个聚合入口，不算必须关注的节点。

4月8日

20:00

Cursor Blog

精选66

Bugbot 现可通过学习规则实现自我改进

Bugbot 的 bug 解决率已从 2025 年 7 月正式推出时的 52% 提升至近 80%，领先其他 AI 代码审查产品。其核心改进在于引入了规则学习机制，能够从实时代码审查反馈（如开发者反应、回复和人工评审意见）中自主学习，取代了原先依赖离线实验的更新模式。自测试版推出以来，已有超过 11 万个仓库启用该功能，生成了逾 4.4 万条规则。这些规则可根据信号积累被激活或禁用，帮助 Bugbot 更精准地识别问题。用户可在 Cursor Dashboard 中管理学习规则，以优化审查效果。

智能体产品更新编码

推荐理由：AI code review 赛道卷了两年，Bugbot 78% 的解决率终于把第二名甩开 15 个点，关键不是分数而是它开始从真实 PR 反馈里自动学规则，做 code review 工具的该认真看看这套闭环逻辑。

3月25日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选77

Claude Code 自动模式：在安全与效率间取得平衡

Anthropic 为 Claude Code 推出“自动模式”，旨在解决用户因频繁手动批准而产生的“批准疲劳”。该模式介于完全手动审批和危险的无权限跳过之间，采用两层防御机制：输入层通过服务器端提示注入探测器扫描工具输出；输出层则利用基于 Sonnet 4.6 模型的转录分类器，在执行前评估操作风险。分类器采用高效的两阶段设计，先快速过滤，必要时才启动思维链推理。其目标是拦截危险操作（如过度积极行为、无心之失、提示注入等），同时让大部分安全操作无需确认即可运行，内部测试显示用户原本会批准约93%的手动提示。

Anthropic产品更新安全/对齐编码

推荐理由：这是 Claude Code 从「手动审批」跳到「AI 自审」的关键一步，双层防御设计坦诚到连 17% 漏检率都公开讲，做 coding agent 的团队该把这篇当安全设计参考。

3月12日

08:00

OpenRouter：Announcements（RSS）

Auto Exacto：自适应质量路由，现已默认开启

Auto Exacto 功能现已默认开启，尤其适用于包含工具调用的请求。该系统每 5 分钟对服务提供商进行一次全面重评估，评估维度包括吞吐量、工具调用遥测数据和基准测试分数。这一自适应路由机制旨在根据实时性能数据，自动将请求导向当前最优的模型提供商。

MCP/工具产品更新部署/工程

2月23日

08:00

OpenRouter：Announcements（RSS）

February Release Spotlight

本次发布在模型页面新增了基准测试功能，并推出了一款全新的免费模型路由工具。同时，平台提升了不同服务提供商之间的成本透明度，使用户能更清晰地比较和选择。这些更新旨在帮助开发者更高效地评估模型性能、优化调用路径并管理使用成本。

产品更新部署/工程

2月11日

18:55

蚂蚁 inclusionAI：GitHub 新仓库

精选61

inclusionAI 发布高性能量化推理 GEMM 内核库 Humming

inclusionAI 开源了 Humming，这是一个专为量化推理设计的高性能、轻量级即时编译 GEMM 内核库。它支持在 FP16、BF16、FP8 等多种激活数据类型下进行 8 比特以下任意权重类型的推理，兼容多种量化策略与缩放类型，并同时支持稠密 GEMM 和混合专家 GEMM 运算。该库兼容 SM75+ 及以上的所有 NVIDIA GPU，在多种计算场景下能提供业界领先的吞吐量和效率。其依赖极简，仅需 PyTorch 和 NVCC，软件包大小仅约 100 KB，便于超轻量化部署。

开源/仓库推理部署/工程

推荐理由：蚂蚁 inclusionAI 开源了一个 100KB 级的量化 GEMM 库，支持从 INT1 到 FP8 全家桶，SM75+ 全覆盖，做推理部署的工程师值得花半小时跑一下 benchmark，看看能不能替换掉现有的 Marlin 方案。

2月5日

11:24

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/Ling 项目官网

inclusionAI 正式推出 Ling 项目的官方网站，该网站约 95% 的内容和功能由人工智能技术构建完成。这一举措展示了 AI 在网站开发与内容生成领域的高度参与度，标志着项目在技术整合与应用层面的重要进展。

开源/仓库行业动态

1月30日

15:55

蚂蚁 inclusionAI：GitHub 新仓库

精选61

高效离线推理框架 Flood：吞吐量显著领先，支持多模态与量化

Flood 是一款面向离线应用的高效大语言模型推理框架。它采用流水线并行降低通信开销，并通过分段式KV缓存管理提升连续性。框架支持连续批处理、分块预填充、FP8/INT8量化及多模态模型推理。性能测试表明，其在多种模型和硬件上的吞吐量最高可达 vLLM 的 2.4 倍。其专用内核 SegmentAttention 在处理长序列时，解码速度较 FlashAttention 最高提升 3.16 倍。该项目于 2025 年 3 月开源并快速迭代，已支持前瞻解码等新特性。

开源/仓库推理部署/工程

推荐理由：蚂蚁的 FLOOD 框架用流水线并行替代张量并行来压通信开销，实测吞吐比 vLLM 高 1.4 到 2.4 倍，做离线推理部署的团队值得花半小时跑一下 benchmark 看看自家场景能不能吃这个红利。

1月9日

08:00

OpenRouter：Announcements（RSS）

January Release Spotlight

本次发布聚焦于提升大型语言模型（LLM）的速度与性能。核心更新包括优先支持快速LLM、探索更多模型提供商选项，以及允许用户自定义自动路由。软件开发工具包（SDK）现已支持加载技能，同时系统实现了显著的性能改进。这些更新旨在优化开发者的使用体验与模型运行效率。

MCP/工具产品更新部署/工程

12月24日

08:00

OpenRouter：Announcements（RSS）

利用NeMo Data Designer构建可蒸馏模型与合成数据管道

NVIDIA推出NeMo Data Designer工具，帮助企业生成合规的合成数据工作流，用于定制化大模型训练。该工具通过创建“许可证安全”的合成数据，规避版权风险，并支持构建可蒸馏的轻量级模型。它为在特定领域数据受限的企业提供了端到端的合成数据生成与管理解决方案，助力模型高效微调与优化。

产品更新数据/训练部署/工程

12月18日

08:00

OpenRouter：Announcements（RSS）

十二月发布亮点

Anthropic 在十二月多项更新中重点推出结构化输出的 Response Healing 功能，可自动修复格式错误。平台新增聊天室通知系统，并发布长上下文模型性能排行榜，Claude 3.5 Sonnet 在 200K 上下文评测中领先。公司同时宣布其 AI 基础设施在 Brex 年度榜单中位列增长最快首位。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

精选61

Response Healing：将 JSON 缺陷减少 80% 以上

OpenRouter 推出新功能 Response Healing，可在 LLM 生成的畸形 JSON 响应抵达用户应用前自动修复。该功能旨在将 JSON 格式错误减少超过 80%，直接提升 API 响应的结构完整性与可靠性，减少下游应用的处理负担。

智能体产品更新部署/工程

推荐理由：做 Agent 的人最怕 JSON 解析炸掉整个 pipeline，OpenRouter 这个 Response Healing 相当于在网关层加了自动纠错，接入成本几乎为零，值得试试。

12月16日

16:55

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/AEnvironment

inclusionAI 发布了 AEnvironment，这是一个用于智能体 AI 开发的标准化环境基础设施。该平台旨在为 AI 智能体的构建、测试和部署提供统一、可复现的环境，解决开发过程中因环境差异导致的兼容性与一致性问题。它通过预配置的标准化设置，简化了开发流程，提升了协作效率与系统可靠性。

智能体开源/仓库部署/工程

12月3日

21:45

蚂蚁 inclusionAI：GitHub 新仓库

精选63

蚂蚁集团开源AState：面向强化学习的高性能状态管理系统

蚂蚁集团开源了AState，这是一个专为强化学习设计的高性能通用状态数据管理系统。它旨在解决RL训练与推理中的I/O效率低下、权重同步性能不足及状态恢复不鲁棒等核心挑战。系统采用三层架构：提供张量原生接口的API层、支持多种部署模式的服务层以及具备高效可扩展传输能力的基础层。其关键特性包括统一的张量级API、高性能权重同步和拓扑感知设计。在万亿参数规模下，AState能在约6秒内完成权重同步，远低于业界常见的分钟级延迟，目前已作为ASystem的关键组件在蚂蚁内部生产环境部署。

智能体开源/仓库部署/工程

推荐理由：蚂蚁把万亿参数 RL 训练的权重同步从分钟级压到 6 秒，这套 AState 系统是真刀真枪的工程解法，做大规模 RL infra 的团队值得拆一拆它的 RDMA P2P 架构。

11月26日

17:00

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/asystem-amem

该项目是一个针对NCCL通信库的扩展库，核心功能是高效卸载NCCL所分配的GPU内存。它通过将NCCL占用的显存资源进行智能释放与转移，旨在缓解大规模分布式训练中的显存压力，从而提升整体系统效率与资源利用率。

开源/仓库部署/工程

11月24日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选77

Claude开发者平台推出高级工具使用功能，提升AI代理效率

Anthropic在Claude开发者平台发布三项新功能，以解决传统工具调用消耗大量上下文、易出错的问题。工具搜索工具允许按需加载工具，内部测试中将上下文消耗从约7.7万令牌降至8700令牌，降幅达85%，并将准确率从49%提升至74%。程序化工具调用支持在代码环境中调用工具，减少对上下文窗口的影响，例如Claude for Excel可借此处理数千行数据。工具使用示例则提供了展示工具有效使用方法的通用标准。这些功能共同提升了AI代理处理大规模工具库的能力。

智能体AnthropicMCP/工具产品更新

推荐理由：做 Agent 的人都卡在工具一多上下文就爆、调用就错这两个坑上，Anthropic 这三个功能直接把工具管理从「全塞进去」变成「按需加载+代码编排+示例纠错」，是目前最工程化的解法。

11月17日

10:43

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/asystem-awex

inclusionAI 发布了 asystem-awex，这是一个专为强化学习工作流设计的高性能训练-推理权重同步框架。该框架的核心目标是实现从训练到推理的秒级参数更新，从而显著提升强化学习模型的迭代效率与部署实时性。它解决了传统流程中参数同步延迟高的问题，为需要快速在线学习和决策的应用场景提供了关键技术支撑。

开源/仓库数据/训练部署/工程

11月5日

17:54

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/dFactory：轻松高效的 dLLM 微调

inclusionAI 发布了 dFactory 平台，旨在简化去中心化大语言模型的微调过程。该平台通过自动化工作流和优化的资源调度，显著降低了技术门槛与计算成本。用户无需深厚专业知识，即可利用分布式计算资源对如 LLaMA 等模型进行高效定制。关键改进包括将典型微调任务时间缩短约 40%，并支持多节点协作训练，提升了模型迭代效率。

开源/仓库数据/训练部署/工程

10月21日

08:00

OpenRouter：Announcements（RSS）

精选68

Provider Variance： Introducing Exacto

同一AI模型在不同服务提供商上的性能表现可能存在显著差异。为了量化这种“提供商方差”，研究团队推出了Exacto评估平台。该平台通过标准化测试揭示，即使是相同的模型（如GPT-4、Claude或LLaMA），在不同云服务或API提供商处运行时，其输出质量、响应速度和稳定性都可能产生高达30%的波动。这一发现对企业和开发者的模型部署策略具有直接影响，强调在选择服务商时需进行针对性性能基准测试。

产品更新部署/工程

推荐理由：OpenRouter 推出 Exacto，直接回答了开发者最头疼的问题：同一个模型换家供应商跑出来的结果到底差多少。做 Agent 或多模型路由的产品人，这个工具能帮你少踩很多坑。

10月20日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

超越权限提示：让Claude Code更安全、更自主

Claude Code引入沙盒化技术，通过文件系统与网络双重隔离来增强安全性，并大幅减少权限提示。内部测试显示，该技术将权限提示安全地降低了84%。新推出的沙盒运行时（作为开源研究预览版）允许开发者自定义目录和网络访问权限，使Claude能在限定范围内自主运行命令。同时，网页版Claude Code在云端隔离沙盒中运行，即使遭遇提示注入或代码入侵，也能有效保护Git密钥等敏感凭证不被泄露，从而提升开发安全性与效率。

Anthropic产品更新安全/对齐编码

关联讨论 4 条

推荐理由：Claude Code 的沙箱方案把安全和自主性这对矛盾解开了，权限提示减少 84% 不是数字游戏，是真把 agent 从「每步都要你点确认」变成「在笼子里自己跑」，做 coding agent 的团队该认真看看这套 OS 级隔离思路。

10月16日

20:50

Hacker News：AI 热帖

Inkeep发布AI智能体构建平台：支持代码与可视化两种创建方式

Inkeep推出AI智能体构建平台，提供无代码可视化构建器与TypeScript SDK两种创建方式，两者支持完全双向同步，便于技术与非技术团队在同一平台协作。智能体可作为实时聊天助手用于客户体验或内部协同，也能实现知识库更新、CRM处理等工作流自动化。平台开源部分包含构建器、SDK、多智能体架构及UI组件库，支持通过API触发智能体并提供可观测性。该框架采用Elastic License 2.0许可，用户可自选LLM提供商并自行部署。

智能体MCP/工具产品更新

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

为智能体配备现实世界技能：Agent Skills 开放标准

Anthropic 推出了“Agent Skills”开放标准，旨在为通用智能体（如Claude）提供可组合、可扩展且可移植的领域专业知识。一个Skill是一个包含指令、脚本和资源的文件夹，其核心SKILL.md文件采用渐进式披露设计，智能体可根据任务动态加载所需信息，从而最小化上下文占用。例如，PDF技能赋予了Claude直接操作PDF表单的新能力。该框架允许用户通过封装和共享程序性知识来定制智能体，无需为每个用例构建碎片化的定制代理。

智能体AnthropicMCP/工具产品更新

推荐理由：Agent Skills 把「给 Agent 喂知识」从手写 prompt 变成了可复用的文件夹协议，做 Claude Code 或 Agent 产品的人现在就该动手试，这比 MCP 更轻量也更贴近日常开发。

10月14日

17:50

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/linghe

inclusionAI 开源了专为大语言模型训练设计的高性能内核库 Linghe。该库旨在优化 LLM 训练过程中的计算效率，通过底层内核创新提升训练速度并降低资源消耗。Linghe 支持当前主流的 Transformer 架构模型，为开发者和研究者提供了更高效的训练工具，有望加速 LLM 的开发与迭代进程。

开源/仓库数据/训练部署/工程

10月1日

08:00

OpenRouter：Announcements（RSS）

精选60

每月 100 万次免费 BYOK 请求

所有客户每月可免费获得 100 万次“自带密钥”（BYOK）请求。这一政策将 BYOK 功能从付费服务转变为免费提供的基础配额，大幅降低了企业使用自有密钥管理数据安全的技术与成本门槛。免费额度覆盖了绝大多数中小规模企业的典型月请求量。

产品更新部署/工程

推荐理由：OpenRouter 给 BYOK 用户每月免 100 万次请求，对用自己 API key 跑 Agent 的开发者来说是实打实的成本减免，值得顺手薅。

9月29日

16:07

蚂蚁 inclusionAI：GitHub 新仓库

精选58

inclusionAI/dInfer

inclusionAI团队发布了dInfer，一个专为扩散语言模型设计的高效推理框架。该框架旨在解决扩散模型在文本生成领域推理速度慢、资源消耗大的核心挑战。dInfer通过一系列底层优化技术，显著提升了推理效率，能够更快地生成文本，同时降低计算成本，为扩散模型在更广泛的实际应用场景中部署提供了关键技术支持。

开源/仓库推理部署/工程

推荐理由：蚂蚁把扩散语言模型的推理框架开源了，这类模型的推理效率一直是落地瓶颈，做端侧或低成本部署的团队值得看看能不能接上。

8月26日

08:00

OpenRouter：Announcements（RSS）

首个图像模型在 OpenRouter 上线

Gemini 2.5 Flash Image Preview 模型已在 OpenRouter 平台正式发布。该模型是首个在该平台上线的图像生成模型，具备当前最优的图像生成能力。其核心特性包括出色的角色一致性和支持多图像输出功能，为开发者与用户提供了新的图像生成工具选项。

产品更新图像生成部署/工程

8月7日

08:00

OpenRouter：Announcements（RSS）

精选66

GPT-5 现已上线

GPT-5 已在 OpenRouter 平台正式推出。该模型具备长上下文处理能力，专门针对复杂推理任务与代码工作流进行了优化。此次发布标志着新一代大语言模型开始接入开放路由网络，为开发者与用户提供更强大的多步骤逻辑处理和编程辅助功能。

产品更新推理编码

推荐理由：OpenRouter 上架 GPT-5 本身不算新闻，但对用 OpenRouter 做多模型路由的开发者来说，这是终于能切到最新旗舰的信号，值得第一时间跑一遍自己的 benchmark。

8月4日