AIHOT

4月23日

08:00

HuggingFace Daily Papers（社区热门论文）

神经表示在计算机断层扫描中能有效建模三维体数据，但在稀疏视图条件下会产生严重伪影。DiffNR 提出一种融合扩散先验增强神经表示优化的新框架，其核心是用于修正退化切片伪影的单步扩散模型 SliceFixer。该框架引入了专用条件层与数据策展策略以支持模型微调，并在重建过程中周期性地生成伪参考体数据，为欠约束区域提供辅助的三维感知监督。相比以往将 CT 求解器嵌入耗时迭代去噪过程的方法，DiffNR 采用的修复‑增强策略避免了频繁查询扩散模型，从而提升了运行效率。大量实验表明，DiffNR 平均将 PSNR 提升 3.99 dB，具有良好的跨领域泛化能力，并保持了高效的优化过程。

图像生成论文/研究部署/工程

08:00

Google Developers Blog（RSS）

精选59

使用 LiteRT 与 NPU 构建现实世界中的设备端人工智能

LiteRT 是一个生产就绪的框架，旨在帮助移动开发者充分发挥神经处理单元（NPU）的效能，以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性，已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型，实现实时视频处理、动画生成与语音识别等高级功能。此外，平台还提供基准测试工具并具备跨平台兼容性，能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。

Google产品更新端侧部署/工程

推荐理由：Google 把 LiteRT 从实验品推到生产级，统一 NPU 调用 API，做端侧 AI 的开发者终于不用逐家适配芯片了。虽然不是新概念，但 Google Meet 和 Epic Games 已经在用，说明不是 PPT。

08:00

Hugging Face：Blog（RSS）

精选57

如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法，涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理，同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案，并提供了性能优化建议，帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由：Hugging Face 官方出的 Transformers.js 浏览器插件教程，想在 Chrome 里跑端侧推理的前端开发者可以直接抄，省掉自己踩坑的时间。

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

关联讨论 2 条

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。