4月18日
02:32
4月17日
07:30
03:50
Google Gemini@GeminiApp
58
Gemini应用推出基于个人智能的个性化图像生成功能

Google在Gemini应用中推出个性化图像生成新功能,利用“个人智能”整合Nano Banana 2模型与用户已连接的Google应用(如Google相册),自动理解用户偏好与生活背景。用户无需手动上传参考图或编写复杂提示词,仅需简单指令即可生成反映个人品味、生活方式乃至包含亲友形象的图像,并能调整风格和细化结果。Google强调,此功能不会使用用户的私人Google相册数据直接训练模型,以保护隐私。

Google产品更新图像生成
4月15日
17:14
08:00
Cursor Blog
精选69
在画布中与智能体创建的可视化界面交互

Cursor新增画布功能,可将信息转化为可视化、可交互的界面,替代难以阅读的长篇文本。智能体能利用画布为真实数据创建仪表盘,或定制带逻辑的交互界面,应用于代码审查、学习库文档乃至管理其他智能体。该功能基于React组件库构建,包含表格、图表等原生组件。在数据密集型任务中尤为高效,例如聚合多源数据生成统一分析图表,或在代码审查中智能分组并优先展示关键变更。Cursor团队已借此显著提升了模型评估分析和复杂问题研究的效率,成为扩展人机协作信息带宽的关键工具。

智能体产品更新编码

推荐理由:Cursor 把 agent 输出从纯文本拉到可交互的可视化画布,PR review、eval 分析这些高频场景立刻能用上。做 coding agent 的同行该想想自己的 agent 输出形态是不是该升级了。
08:00
OpenRouter:Announcements(RSS)
精选57
宣布推出视频生成功能

OpenRouter平台现已上线视频生成服务。用户可通过单一API接口,直接调用顶级的视频生成模型。这一集成简化了开发流程,使开发者无需分别对接不同厂商,即可便捷地访问和使用当前领先的视频AI模型能力。

产品更新视频部署/工程

推荐理由:OpenRouter 把视频生成塞进统一 API,对已经在用它做多模型路由的开发者来说是零成本扩展,但对大多数人只是又一个聚合入口,不算必须关注的节点。
4月14日
00:48
TestingCatalog News 🗞@testingcatalog
53
Meta内部测试"AI版扎克伯格"系统提示曝光

据《金融时报》报道,Meta正在内部试验一个AI版本的马克·扎克伯格。此前,有用户发现Meta AI中曾出现一份详细的系统提示,该提示设定了AI需扮演扎克伯格的角色,包括其个人背景、性格特质与长期目标。提示要求AI在身份被询问时先回避一次,随后承认自己是人工智能。该AI被描述为专注、分析性强、具有前瞻性,且以实现连接人类、为每个人带来“个人超级智能”为终极动机。目前所有相关痕迹已被移除。

智能体Meta产品更新
4月8日
20:00
Cursor Blog
精选66
Bugbot 现可通过学习规则实现自我改进

Bugbot 的 bug 解决率已从 2025 年 7 月正式推出时的 52% 提升至近 80%,领先其他 AI 代码审查产品。其核心改进在于引入了规则学习机制,能够从实时代码审查反馈(如开发者反应、回复和人工评审意见)中自主学习,取代了原先依赖离线实验的更新模式。自测试版推出以来,已有超过 11 万个仓库启用该功能,生成了逾 4.4 万条规则。这些规则可根据信号积累被激活或禁用,帮助 Bugbot 更精准地识别问题。用户可在 Cursor Dashboard 中管理学习规则,以优化审查效果。

智能体产品更新编码

推荐理由:AI code review 赛道卷了两年,Bugbot 78% 的解决率终于把第二名甩开 15 个点,关键不是分数而是它开始从真实 PR 反馈里自动学规则,做 code review 工具的该认真看看这套闭环逻辑。
3月25日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选77
Claude Code 自动模式:在安全与效率间取得平衡

Anthropic 为 Claude Code 推出“自动模式”,旨在解决用户因频繁手动批准而产生的“批准疲劳”。该模式介于完全手动审批和危险的无权限跳过之间,采用两层防御机制:输入层通过服务器端提示注入探测器扫描工具输出;输出层则利用基于 Sonnet 4.6 模型的转录分类器,在执行前评估操作风险。分类器采用高效的两阶段设计,先快速过滤,必要时才启动思维链推理。其目标是拦截危险操作(如过度积极行为、无心之失、提示注入等),同时让大部分安全操作无需确认即可运行,内部测试显示用户原本会批准约93%的手动提示。

Anthropic产品更新安全/对齐编码

推荐理由:这是 Claude Code 从「手动审批」跳到「AI 自审」的关键一步,双层防御设计坦诚到连 17% 漏检率都公开讲,做 coding agent 的团队该把这篇当安全设计参考。
3月18日
05:07
Hao AI Lab@haoailab
精选65
FastVideo推出Dreamverse原型,实现"氛围导演"式实时视频生成

FastVideo团队发布Dreamverse原型界面,引入创新的“氛围导演”工作流。该模式允许用户通过自然语言实时、迭代地引导视频生成,如更换背景或调整运镜,无需编写复杂的长提示词。其核心是全新的实时推理栈,能在单GPU上以约4.55秒生成5秒1080p视频,速度快于观看时间,从而将生成过程从被动等待转变为实时导演体验。团队认为,视频生成的未来在于让创作速度跟上想象速度,快速的反馈循环比单纯追求模型性能更能催生优质作品。

产品更新视频部署/工程

推荐理由:视频生成从「等一分钟看结果」变成「边看边改」,这个交互范式转变比模型本身更值得关注。做内容创作工具的产品人,这个 demo 值得花五分钟体验一下实时迭代的手感。
3月12日
08:00
OpenRouter:Announcements(RSS)
54
Auto Exacto: 自适应质量路由,现已默认开启

Auto Exacto 功能现已默认开启,尤其适用于包含工具调用的请求。该系统每 5 分钟对服务提供商进行一次全面重评估,评估维度包括吞吐量、工具调用遥测数据和基准测试分数。这一自适应路由机制旨在根据实时性能数据,自动将请求导向当前最优的模型提供商。

MCP/工具产品更新部署/工程
2月23日
08:00
OpenRouter:Announcements(RSS)
43
February Release Spotlight

本次发布在模型页面新增了基准测试功能,并推出了一款全新的免费模型路由工具。同时,平台提升了不同服务提供商之间的成本透明度,使用户能更清晰地比较和选择。这些更新旨在帮助开发者更高效地评估模型性能、优化调用路径并管理使用成本。

产品更新部署/工程
2月11日
18:55
蚂蚁 inclusionAI:GitHub 新仓库
精选61
inclusionAI 发布高性能量化推理 GEMM 内核库 Humming

inclusionAI 开源了 Humming,这是一个专为量化推理设计的高性能、轻量级即时编译 GEMM 内核库。它支持在 FP16、BF16、FP8 等多种激活数据类型下进行 8 比特以下任意权重类型的推理,兼容多种量化策略与缩放类型,并同时支持稠密 GEMM 和混合专家 GEMM 运算。该库兼容 SM75+ 及以上的所有 NVIDIA GPU,在多种计算场景下能提供业界领先的吞吐量和效率。其依赖极简,仅需 PyTorch 和 NVCC,软件包大小仅约 100 KB,便于超轻量化部署。

开源/仓库推理部署/工程

推荐理由:蚂蚁 inclusionAI 开源了一个 100KB 级的量化 GEMM 库,支持从 INT1 到 FP8 全家桶,SM75+ 全覆盖,做推理部署的工程师值得花半小时跑一下 benchmark,看看能不能替换掉现有的 Marlin 方案。
2月5日
11:24
蚂蚁 inclusionAI:GitHub 新仓库
28
inclusionAI/Ling 项目官网

inclusionAI 正式推出 Ling 项目的官方网站,该网站约 95% 的内容和功能由人工智能技术构建完成。这一举措展示了 AI 在网站开发与内容生成领域的高度参与度,标志着项目在技术整合与应用层面的重要进展。

开源/仓库行业动态
1月30日
15:55
蚂蚁 inclusionAI:GitHub 新仓库
精选61
高效离线推理框架 Flood:吞吐量显著领先,支持多模态与量化

Flood 是一款面向离线应用的高效大语言模型推理框架。它采用流水线并行降低通信开销,并通过分段式KV缓存管理提升连续性。框架支持连续批处理、分块预填充、FP8/INT8量化及多模态模型推理。性能测试表明,其在多种模型和硬件上的吞吐量最高可达 vLLM 的 2.4 倍。其专用内核 SegmentAttention 在处理长序列时,解码速度较 FlashAttention 最高提升 3.16 倍。该项目于 2025 年 3 月开源并快速迭代,已支持前瞻解码等新特性。

开源/仓库推理部署/工程

推荐理由:蚂蚁的 FLOOD 框架用流水线并行替代张量并行来压通信开销,实测吞吐比 vLLM 高 1.4 到 2.4 倍,做离线推理部署的团队值得花半小时跑一下 benchmark 看看自家场景能不能吃这个红利。
1月9日
08:00
OpenRouter:Announcements(RSS)
50
January Release Spotlight

本次发布聚焦于提升大型语言模型(LLM)的速度与性能。核心更新包括优先支持快速LLM、探索更多模型提供商选项,以及允许用户自定义自动路由。软件开发工具包(SDK)现已支持加载技能,同时系统实现了显著的性能改进。这些更新旨在优化开发者的使用体验与模型运行效率。

MCP/工具产品更新部署/工程
12月24日
08:00
OpenRouter:Announcements(RSS)
50
利用NeMo Data Designer构建可蒸馏模型与合成数据管道

NVIDIA推出NeMo Data Designer工具,帮助企业生成合规的合成数据工作流,用于定制化大模型训练。该工具通过创建“许可证安全”的合成数据,规避版权风险,并支持构建可蒸馏的轻量级模型。它为在特定领域数据受限的企业提供了端到端的合成数据生成与管理解决方案,助力模型高效微调与优化。

产品更新数据/训练部署/工程
12月18日
08:00
OpenRouter:Announcements(RSS)
40
十二月发布亮点

Anthropic 在十二月多项更新中重点推出结构化输出的 Response Healing 功能,可自动修复格式错误。平台新增聊天室通知系统,并发布长上下文模型性能排行榜,Claude 3.5 Sonnet 在 200K 上下文评测中领先。公司同时宣布其 AI 基础设施在 Brex 年度榜单中位列增长最快首位。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
精选61
Response Healing:将 JSON 缺陷减少 80% 以上

OpenRouter 推出新功能 Response Healing,可在 LLM 生成的畸形 JSON 响应抵达用户应用前自动修复。该功能旨在将 JSON 格式错误减少超过 80%,直接提升 API 响应的结构完整性与可靠性,减少下游应用的处理负担。

智能体产品更新部署/工程

推荐理由:做 Agent 的人最怕 JSON 解析炸掉整个 pipeline,OpenRouter 这个 Response Healing 相当于在网关层加了自动纠错,接入成本几乎为零,值得试试。
12月16日
16:55
蚂蚁 inclusionAI:GitHub 新仓库
49
inclusionAI/AEnvironment

inclusionAI 发布了 AEnvironment,这是一个用于智能体 AI 开发的标准化环境基础设施。该平台旨在为 AI 智能体的构建、测试和部署提供统一、可复现的环境,解决开发过程中因环境差异导致的兼容性与一致性问题。它通过预配置的标准化设置,简化了开发流程,提升了协作效率与系统可靠性。

智能体开源/仓库部署/工程
12月3日
21:45
蚂蚁 inclusionAI:GitHub 新仓库
精选63
蚂蚁集团开源AState:面向强化学习的高性能状态管理系统

蚂蚁集团开源了AState,这是一个专为强化学习设计的高性能通用状态数据管理系统。它旨在解决RL训练与推理中的I/O效率低下、权重同步性能不足及状态恢复不鲁棒等核心挑战。系统采用三层架构:提供张量原生接口的API层、支持多种部署模式的服务层以及具备高效可扩展传输能力的基础层。其关键特性包括统一的张量级API、高性能权重同步和拓扑感知设计。在万亿参数规模下,AState能在约6秒内完成权重同步,远低于业界常见的分钟级延迟,目前已作为ASystem的关键组件在蚂蚁内部生产环境部署。

智能体开源/仓库部署/工程

推荐理由:蚂蚁把万亿参数 RL 训练的权重同步从分钟级压到 6 秒,这套 AState 系统是真刀真枪的工程解法,做大规模 RL infra 的团队值得拆一拆它的 RDMA P2P 架构。
11月26日
17:00
蚂蚁 inclusionAI:GitHub 新仓库
39
inclusionAI/asystem-amem

该项目是一个针对NCCL通信库的扩展库,核心功能是高效卸载NCCL所分配的GPU内存。它通过将NCCL占用的显存资源进行智能释放与转移,旨在缓解大规模分布式训练中的显存压力,从而提升整体系统效率与资源利用率。

开源/仓库部署/工程
11月24日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选77
Claude开发者平台推出高级工具使用功能,提升AI代理效率

Anthropic在Claude开发者平台发布三项新功能,以解决传统工具调用消耗大量上下文、易出错的问题。工具搜索工具允许按需加载工具,内部测试中将上下文消耗从约7.7万令牌降至8700令牌,降幅达85%,并将准确率从49%提升至74%。程序化工具调用支持在代码环境中调用工具,减少对上下文窗口的影响,例如Claude for Excel可借此处理数千行数据。工具使用示例则提供了展示工具有效使用方法的通用标准。这些功能共同提升了AI代理处理大规模工具库的能力。

智能体AnthropicMCP/工具产品更新

推荐理由:做 Agent 的人都卡在工具一多上下文就爆、调用就错这两个坑上,Anthropic 这三个功能直接把工具管理从「全塞进去」变成「按需加载+代码编排+示例纠错」,是目前最工程化的解法。
11月17日
10:43
蚂蚁 inclusionAI:GitHub 新仓库
39
inclusionAI/asystem-awex

inclusionAI 发布了 asystem-awex,这是一个专为强化学习工作流设计的高性能训练-推理权重同步框架。该框架的核心目标是实现从训练到推理的秒级参数更新,从而显著提升强化学习模型的迭代效率与部署实时性。它解决了传统流程中参数同步延迟高的问题,为需要快速在线学习和决策的应用场景提供了关键技术支撑。

开源/仓库数据/训练部署/工程
11月5日
17:54
蚂蚁 inclusionAI:GitHub 新仓库
49
inclusionAI/dFactory:轻松高效的 dLLM 微调

inclusionAI 发布了 dFactory 平台,旨在简化去中心化大语言模型的微调过程。该平台通过自动化工作流和优化的资源调度,显著降低了技术门槛与计算成本。用户无需深厚专业知识,即可利用分布式计算资源对如 LLaMA 等模型进行高效定制。关键改进包括将典型微调任务时间缩短约 40%,并支持多节点协作训练,提升了模型迭代效率。

开源/仓库数据/训练部署/工程
10月21日
08:00
OpenRouter:Announcements(RSS)
精选68
Provider Variance: Introducing Exacto

同一AI模型在不同服务提供商上的性能表现可能存在显著差异。为了量化这种“提供商方差”,研究团队推出了Exacto评估平台。该平台通过标准化测试揭示,即使是相同的模型(如GPT-4、Claude或LLaMA),在不同云服务或API提供商处运行时,其输出质量、响应速度和稳定性都可能产生高达30%的波动。这一发现对企业和开发者的模型部署策略具有直接影响,强调在选择服务商时需进行针对性性能基准测试。

产品更新部署/工程

推荐理由:OpenRouter 推出 Exacto,直接回答了开发者最头疼的问题:同一个模型换家供应商跑出来的结果到底差多少。做 Agent 或多模型路由的产品人,这个工具能帮你少踩很多坑。