4月23日
08:00
HuggingFace Daily Papers(社区热门论文)
47
DiffNR:面向稀疏视图三维断层扫描重建的扩散增强神经表示优化

神经表示在计算机断层扫描中能有效建模三维体数据,但在稀疏视图条件下会产生严重伪影。DiffNR 提出一种融合扩散先验增强神经表示优化的新框架,其核心是用于修正退化切片伪影的单步扩散模型 SliceFixer。该框架引入了专用条件层与数据策展策略以支持模型微调,并在重建过程中周期性地生成伪参考体数据,为欠约束区域提供辅助的三维感知监督。相比以往将 CT 求解器嵌入耗时迭代去噪过程的方法,DiffNR 采用的修复‑增强策略避免了频繁查询扩散模型,从而提升了运行效率。大量实验表明,DiffNR 平均将 PSNR 提升 3.99 dB,具有良好的跨领域泛化能力,并保持了高效的优化过程。

图像生成论文/研究部署/工程
08:00
Google Developers Blog(RSS)
精选59
使用 LiteRT 与 NPU 构建现实世界中的设备端人工智能

LiteRT 是一个生产就绪的框架,旨在帮助移动开发者充分发挥神经处理单元(NPU)的效能,以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性,已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型,实现实时视频处理、动画生成与语音识别等高级功能。此外,平台还提供基准测试工具并具备跨平台兼容性,能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。

Google产品更新端侧部署/工程

推荐理由:Google 把 LiteRT 从实验品推到生产级,统一 NPU 调用 API,做端侧 AI 的开发者终于不用逐家适配芯片了。虽然不是新概念,但 Google Meet 和 Epic Games 已经在用,说明不是 PPT。
08:00
Hugging Face:Blog(RSS)
精选57
如何在 Chrome 扩展中使用 Transformers.js

本文介绍在 Chrome 扩展中集成 Transformers.js 库的具体方法,涵盖从环境配置、模型加载到前后端通信的关键步骤。通过示例代码演示了如何利用该库在扩展中实现本地机器学习推理,同时处理扩展权限限制与安全策略。文中还对比了 Web Worker 与 Service Worker 两种部署方案,并提供了性能优化建议,帮助开发者在浏览器扩展环境中高效运行 Transformer 模型。

开源生态教程/实践端侧

推荐理由:Hugging Face 官方出的 Transformers.js 浏览器插件教程,想在 Chrome 里跑端侧推理的前端开发者可以直接抄,省掉自己踩坑的时间。
08:00
蚂蚁百灵:Developer Blog(网页)
精选67
Ling-2.6-flash 发布:更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题,Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化,旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s,在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平,保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程
关联讨论 2X:阿易 AI Notes (@AYi_AInotes)X:Artificial Analysis (@ArtificialAnlys)
推荐理由:蚂蚁百灵这次打的是「省 token」这张牌,104B 总参但只激活 7.4B,Agent 场景评测对齐同尺寸 SOTA,输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。
08:00
Tomer Tunguz 博客(VC 分析)
49
商业智能的未来:从仪表盘到AI驱动的深度分析

Omni公司CEO指出,商业智能正从静态仪表盘重新扩展为AI驱动的深度分析。AI能融合结构化和非结构化数据,例如分析75页支持对话以识别代表错误并提供具体改进建议。其平台具备自动处理问题报告的能力,客户案例显示BambooHR在四个月内向三万人推出分析服务,Cribl则在三个月内整合遗留系统并快速迁移上百个仪表盘。底层统一的语义模型存储定义、逻辑与权限,支持多种分析界面。Omni近期以150亿美元估值完成1.2亿美元融资,由ICONIQ领投。

智能体现象/趋势行业动态
01:10
蚂蚁 inclusionAI:HuggingFace 新模型
51
inclusionAI/LLaDA2.0-Uni

inclusionAI团队发布了LLaDA2.0-Uni模型。该版本在统一的多模态理解与生成能力上取得显著进展,支持图像、文本、音频等多种输入与输出模态。模型参数量达到约70B,在多项基准测试中,其综合性能较前代提升超过15%。此次发布延续了通过开源与开放科学来推动人工智能民主化的核心使命。

开源/仓库模型发布端侧
01:08
IT之家(RSS)
真我手机 realme UI 系统 4 月升级计划公布,大量 AI 功能上线、车机投屏将支持微信 App

真我手机realme UI系统4月体验升级计划已于4月20日起陆续推送,覆盖GT8 Pro、GT7 Pro等13款realme UI 7.0及以上机型。此次升级重点包括小布记忆新增账单导入及聊天转账信息识别功能,车机投屏首次支持微信应用并实现手机接续导航,同时新增桌面空气质量卡片(2×1和2×2尺寸)及极客性能面板温控调节功能。

产品更新端侧
00:16
Gary Marcus:The Road to AI We Can Trust(RSS)
ChatGPT 连胡须与肘部都分不清

(注:提供的正文内容仅有一句话,缺乏必要的具体信息,如研究数据、性能指标、模型版本或测试结果等,无法撰写符合 100-200 字要求且包含关键数字/指标的摘要。请提供完整正文以便提取关键信息点。)

OpenAI多模态大佬观点
00:13
Hacker News 热门(buzzing.cc 中文翻译)
Show HN 的投稿数量翻了三倍,如今大多采用了风格统一的视觉设计

Show HN 板块投稿量在过去时期内增长三倍,但新项目在视觉呈现上呈现出显著的同质化趋势。分析指出,当前绝大多数展示页面采用了相似的"vibe-coded"设计风格,反映出AI辅助设计工具普及背景下的审美趋同现象。该观察来自2026年4月22日发布的分析文章,目前在Hacker News上获得109个点赞。

智能体现象/趋势编码
00:08
IT之家(RSS)
戴汝为院士逝世享年94岁,曾开创中国模式识别研究

中国科学院院士、著名控制论与模式识别专家戴汝为因病于2026年4月19日在北京逝世,享年94岁。作为钱学森归国后指导的首位学生,他于20世纪70年代率先将模式识别理论引入中国,开创性提出"语义-句法模式识别"方法,为汉字识别与信息化奠定基础,主持的手写数字识别系统获国家科技进步一等奖。他与钱学森共同构建"开放的复杂巨系统及其方法论",应用于国家宏观决策。戴汝为培养研究生80余名,曾获中国模式识别科技终身成就奖。

行业动态
4月22日
23:43
Hacker News 热门(buzzing.cc 中文翻译)
Meta的员工们对一项强制性的AI培训计划感到愤怒,该计划要求他们

Meta员工正强烈抵制公司强制推行的AI数据收集计划,该计划要求员工将工作数据用于AI模型训练,并涉及新的员工活动追踪工具。此举引发员工对隐私侵犯的广泛担忧,反映出科技巨头在推进AI技术与员工权益保护之间的紧张关系。该事件在Hacker News获得超百点关注,凸显业界对职场AI监控和数据使用政策的敏感态度。

Meta行业动态
23:16
Gary Marcus:The Road to AI We Can Trust(RSS)
ChatGPT 的"强大新图像引擎"

正文内容仅包含"Regurgitating ≠ understanding"(反刍不等于理解),缺乏撰写摘要所需的完整信息,如具体发布细节、功能变化或性能指标。请提供完整文章内容以便提取关键信息并撰写符合要求的摘要。

OpenAI图像生成大佬观点
23:13
HuggingFace Daily Papers(社区热门论文)
RDP LoRA:大语言模型参数高效适应的几何驱动识别方法

研究团队提出RDP LoRA方法,将大语言模型隐藏状态演化建模为高维几何轨迹,利用Ramer-Douglas-Peucker算法无训练地识别表征路径关键断点,并直接作为层选择信号。在Qwen3-8B-Base的LoRA微调实验中,仅需适配13个RDP选择的层,便在MMLU-Math上达到81.67%准确率,显著优于全层适配的79.32%和随机选择的75.56%,证明几何轨迹分析可优化参数高效微调中的层选择决策。

Hugging Face数据/训练论文/研究
23:08
IT之家(RSS)
鸿蒙智行春季新品发布会谢幕视频曝光,四款新车同台后一起离场

鸿蒙智行春季新品发布会推出尚界Z7/Z7T、问界M6、智界V9及问界M9五款新车。尚界Z7全系标配华为ADS 4.1智驾、896线激光雷达及800V高压平台;问界M6搭载36个传感器与途灵底盘;智界V9作为首款旗舰MPV,转弯半径5.35米,配备13个安全气囊;全新问界M9提供加长版,首发ADS 5与6激光雷达矩阵,电驱效率达93.5%。四款实车同台展示后一同离场。

具身智能行业动态
23:08
IT之家(RSS)
多邻国向免费用户开放高级语言学习内容:涵盖中英日韩等九种语言

多邻国向免费用户开放此前仅限付费订阅的高级语言学习内容,涵盖中英日韩等九种语言。该内容对应CEFR B2水平(Duolingo Score约129分),包含"高级故事"和播客式音频DuoRadio模块,帮助用户在真实语境中训练复杂情境表达,支持网页及移动端访问。用户可借此提升求职面试、海外留学等场景的语言能力,分数还可直接添加至LinkedIn档案。

产品更新语音
23:08
IT之家(RSS)
消息称腾讯、阿里正洽谈投资 DeepSeek,有望推动后者估值超 200 亿美元

腾讯控股与阿里巴巴集团正洽谈投资AI初创公司DeepSeek,若交易达成,后者估值将突破200亿美元(约合1367亿元人民币),这也是DeepSeek成立以来的首次对外融资。该公司由幻方量化联合创始人梁文锋于2023年创办,凭借低成本、开源路线与OpenAI等美国公司形成差异。受该消息影响,阿里巴巴美股周三盘前上涨1.6%。

DeepSeek行业动态
23:08
IT之家(RSS)
华为余承东回应鸿蒙智行 3 月销量:升级 896 线激光雷达属于切换期,影响了当月销售订单

华为余承东在鸿蒙智行春季新品发布会上公布,全系累计交付突破135万辆,2026年第一季度交付11.27万辆,同比增长41.9%。针对3月销量情况,他解释称正值升级896线激光雷达的切换期,影响了当月销售订单,否则一季度增速将更高。乘联分会数据显示,鸿蒙智行3月零售销量为26582辆。

具身智能行业动态
23:08
IT之家(RSS)
华为余承东:鸿蒙智行全新一代问界 M9 系列汽车 1 小时预订量突破 11500 台

华为全新一代问界M9系列开启预订,1小时订单突破11500台。新车预售价49.98万元起,搭载超140项创新技术,全系标配800V高压平台、6激光雷达及首发ADS 5系统,配备双腔双阀空气悬架和后轮转向。同期推出的Ultimate领世加长版预售价66.98万元起,采用2.0T增程器、三电机及线控转向技术。余承东称此次为"重构"而非简单升级。

具身智能行业动态
23:07
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI 推出 Privacy Filter

OpenAI 发布 Privacy Filter,一款用于检测和脱敏文本中个人身份信息(PII)的开源权重模型。该模型在 PII 识别任务上达到业界领先的准确率,支持开发者本地部署和定制。作为开放权重模型,它可自动识别并编辑敏感个人信息,为企业数据隐私保护和合规处理提供高效的技术解决方案。

OpenAI开源/仓库数据/训练部署/工程
22:42
Hacker News 热门(buzzing.cc 中文翻译)
我们的第八代 TPU:两款芯片,迎接自主时代

Google发布第八代TPU,推出两款专为自主智能体(Agentic)时代设计的AI芯片。新一代TPU针对复杂AI工作负载和自主代理应用优化,旨在为下一代人工智能基础设施提供算力支撑。作为Google Cloud AI基础设施的核心组件,新芯片延续专用架构优势,进一步巩固其在云端AI训练与推理市场的竞争力,标志着AI计算进入自主代理新阶段。

智能体Google产品更新部署/工程
22:12
HuggingFace Daily Papers(社区热门论文)
CityRAG:通过空间锚定视频生成步入城市

CityRAG 是一种新型视频生成模型,通过利用大规模地理注册数据作为上下文,将生成内容锚定到真实物理场景。该模型采用时间未对齐的训练数据,学会从瞬态属性中语义解耦底层场景,从而在保持复杂运动和外观变化先验的同时,实现真实世界重建。实验表明,该系统可生成数分钟长的连贯视频序列,在数千帧内保持天气和光照条件的一致性,支持闭环导航和复杂轨迹重建真实地理环境。

arXiv具身智能视频论文/研究
22:08
IT之家(RSS)
谷歌推出 TPU 8t / 8i,两款 AI 芯片分别面向训练和智能体推理

谷歌在 Google Cloud Next 大会发布两款 AI 芯片 TPU 8t 与 TPU 8i,分别面向大规模训练与智能体推理。TPU 8t 的 Pod 规模扩至 9600 颗,FP4 算力提升近 2 倍,单芯片横向扩展带宽达 400Gbps;TPU 8i 配备 384MB 片上 SRAM 与 288GB 片外 HBM,Pod 规模增至 1152 颗,FP8 算力提升 8.67 倍。两款芯片能效均为上一代 TPU Ironwood 的两倍。

智能体Google产品更新部署/工程
22:08
IT之家(RSS)
新模型 Kimi K2.6 上线期间功能异常,月之暗面宣布全员额度重置作为补偿

月之暗面新模型 Kimi K2.6 于 4 月 20 日发布并开源,上线期间因访问量激增导致部分用户遭遇会员排队、功能异常及 Agent 额度误扣。官方宣布于 4 月 22 日 20:30 将所有用户当月额度恢复至 100% 并重置已使用量为零作为补偿。该模型在代码编写、长程任务及 Agent 集群能力方面全面升级,在 Humanity's Last Exam、SWE-Bench Pro 等基准测试中表现持平或优于 GPT-5.4 等闭源模型。

智能体编码行业动态
22:08
IT之家(RSS)
消息称三星电子减产 GDDR6 同时提升对特斯拉供应量,恐影响显卡市场

三星电子在削减GDDR6显存产能以提升盈利的同时,正大幅增加对特斯拉的供应规模。特斯拉今年1月要求三星将GDDR6供应量提升至原定水平的5倍以上,三星本月起扩大向特斯拉分配的8Gb GDDR6 Die产能,当前出货速度已达第一季度的4倍。这一变动可能挤占显卡市场的GDDR6供应,进一步加剧显存短缺态势。

行业动态部署/工程
22:08
IT之家(RSS)
力积电与美光合作开发1P制程DRAM,预计2028年下半年量产

力积电宣布与美光联合研发1P制程DRAM,预计2028年下半年量产,该制程单位晶圆产出可达现有工艺的2.5倍。双方合作的PWF后端晶圆制造业务预计2027年第四季度量产,目标月产能2万片。力积电高密度电容IPD 2.5D中介层已通过国际大厂认证即将量产,WoW四层晶圆堆叠有望2027年小规模量产。此外,该企业今年已上调12英寸DDI、图像传感器代工价格超10%,并提升NAND闪存晶圆代工投片价格,年内有望完成MLC NAND工艺开发。

行业动态部署/工程
21:53
NVIDIA AI Blog
NVIDIA 与 Google Cloud 合作推进 Agentic 与 Physical AI

NVIDIA 与 Google Cloud 宣布深化战略合作,双方已联合工程化逾十年,共同构建跨越每一技术层的全栈 AI 平台。此次合作聚焦 Agentic AI 与 Physical AI 领域,通过从性能优化库到完整技术栈的协同设计,加速下一代人工智能能力的开发与部署。

智能体Google具身智能行业动态
21:44
The Decoder:AI News(RSS)
Anthropic 高管暗示 Pro 和 Max 订阅已无法满足当前 Claude 工作负载需求

Anthropic 增长负责人 Amol Avasare 表示,现有 Pro 和 Max 订阅计划已无法匹配当前 Claude 的实际工作负载。该公司此前曾短暂将 Claude Code 从新用户的 Pro 订阅中移除,在遭遇强烈反对后撤销了这一变更。此举暴露出 Anthropic 现有付费方案与用户使用强度之间的矛盾,暗示公司可能需要调整订阅策略或推出更高级别服务以满足重度使用需求。

智能体Anthropic编码行业动态
21:14
The Decoder:AI News(RSS)
未授权用户入侵 Anthropic 受限模型 Mythos

据彭博社报道,一小群未授权用户成功突破安全机制,获取了 Anthropic 最新限制级 AI 模型 Claude Mythos 的访问权限。此次安全漏洞使得未经授权的第三方得以接触该本应对外封闭的模型,具体入侵规模及潜在影响目前尚不明确,Anthropic 尚未就事件细节发布正式回应。

Anthropic安全/对齐
21:08
IT之家(RSS)
鸿蒙智行全新一代问界 M9 开启预订:标准版 49.98 万元起,Ultimate 领世加长版 66.98 万元起

鸿蒙智行全新一代问界M9正式开启预订,推出标准版与Ultimate领世加长版,预售价分别为49.98万元起和66.98万元起。标准版车身尺寸为5285/2026/1845mm,轴距3125mm;加长版车长增至5402mm,轴距达3236mm。新车搭载华为智擎双碳化硅电驱系统,拥有93.5%工况效率和超900马力,配备6激光雷达立体矩阵及全新一代ADS 5智驾系统,提供4/5/6座多种布局。

产品更新具身智能
21:08
IT之家(RSS)
华为余承东:鸿蒙智行全新一代问界 M9 系列新车首发乾崑智驾 HUAWEI ADS 5

华为在鸿蒙智行春季新品发布会上宣布,全新一代问界M9系列新车将首发搭载乾崑智驾HUAWEI ADS 5。新车配备独创的6激光雷达立体矩阵及迄今最强大的融合感知与控制系统,采用WEWA 2.0架构实现城区、高速及园区等多场景通行效率升级,城区辅助驾驶里程占比预计大幅提升。外观同步焕新,搭载智慧投影大灯、一体贯穿灯、半隐藏式门把手及悬浮LOGO轮毂。

产品更新具身智能端侧
21:00
20:44
20:44
The Decoder:AI News(RSS)
Meta 追踪美国员工点击与按键操作以训练 AI agents

Meta 正在为其美国员工的电脑安装新型监控软件,实时捕捉鼠标移动、点击和按键操作。这些详细的交互数据将直接用于训练 AI agents,使其学习并模仿人类计算机操作行为。此举标志着该公司在 AI 训练数据获取策略上的重大转变,通过收集内部员工的真实工作流数据来构建能够执行复杂任务的自动化系统。

智能体Meta数据/训练行业动态
20:12
Google Blog:AI(RSS)
Google 推出两款面向智能体时代的专用 TPU

Google 发布第八代 TPU,内含两款面向智能体时代的专用芯片。新处理器专为 AI 未来发展设计,针对智能体工作负载进行专门优化,提供更强算力支持。作为 Google AI 基础设施的最新升级,该系列芯片将助力下一代智能体应用的开发与部署。

智能体Google产品更新部署/工程
20:12
Google DeepMind:Blog(RSS)
与行业领导者合作加速 AI 转型

Google DeepMind 正与全球咨询公司建立战略合作,将前沿 AI 技术能力引入企业组织,加速全球范围内的 AI 转型进程。该合作旨在弥合尖端 AI 技术与企业应用之间的鸿沟,使各行业组织能够直接获取和应用最新的 AI 能力,推动业务创新与数字化变革。

DeepMind行业动态
20:12
HuggingFace Daily Papers(社区热门论文)
LLM何以成为优秀优化器?基于轨迹分析的LLM引导进化搜索研究

一项针对15个LLM在8个任务上的大规模轨迹分析表明,零样本问题解决能力仅能部分解释优化效果差异。研究发现,优秀的LLM优化器表现为局部优化器,能在语义空间中持续产生渐进式改进并保持搜索局部化;而较弱模型则呈现大幅语义漂移,虽有偶发突破但易陷入停滞。解决方案的新颖性并非性能预测指标,仅当搜索围绕高性能区域充分局部化时才具价值。该研究为LLM优化系统的设计与训练提供了基于轨迹分析的实践指导。

智能体arXiv推理论文/研究
20:08
IT之家(RSS)
鸿蒙智行五大核心技术矩阵亮相,含乾崑智驾、鸿蒙座舱、途灵平台、华为智擎与巨鲸电池

鸿蒙智行春季新品发布会上,余承东正式发布华为智擎(HUAWEI DriveONE),并同步亮相五大核心技术矩阵,包括乾崑智驾、鸿蒙座舱、途灵平台、智擎与巨鲸电池平台,另有第六大技术华为智能网联未现场展示。根据规划,鸿蒙智行2026年底将布局超2459家销售门店、1459家服务门店,覆盖全国超94%城市,充电网络接入超200万充电枪。

具身智能行业动态
20:08
IT之家(RSS)
赵明车圈首秀:明哥的下一个 10 年因 AI 与千里科技相遇,目标未来三年成为全球最大智驾方案供应商

千里科技在北京举办AI战略暨产品发布会,联席董事长赵明完成车圈首秀,宣布"AI+车"战略最新成果。公司智驾业务已实现毛利及正向利润,截至3月31日已有46万辆汽车搭载其技术,辅助驾驶激活率达92%。赵明提出未来三年目标:2026年底搭载千里ASD的车辆达100万至130万辆,三年累计上车量突破800万辆,致力成为全球最大智驾方案供应商。

具身智能行业动态
20:08
IT之家(RSS)
京东物流发布"独狼"第六代智能配送车 Plus 版:货箱扩容至 5.5 立方米、感知范围扩展至 100 米

京东物流在第十六届中国国际道路交通安全产品博览会上发布"独狼"第六代智能配送车Plus版。这款L4级自动驾驶无人车货箱容积从4立方米扩容至5.5立方米,最大载重1吨,满载续航180公里。智能化方面,感知范围扩展至100米,并采用轻地图技术替代传统高精地图以降低部署成本。京东物流计划未来5年引入100万台无人车投入供应链全链路场景。

具身智能行业动态
20:08
IT之家(RSS)
46.88 万元起,凯迪拉克 VISTIQ 凯威德旗舰 SUV 上市

凯迪拉克VISTIQ凯威德全尺寸纯电旗舰SUV正式上市,推出长续航四驱Pro版与高性能四驱Ultra版,售价分别为46.88万元和50.88万元,5月31日前可享4万元增换购补贴。新车首创舱内隐藏式激光雷达,搭载33英寸9K环幕屏与L2++级Momenta智驾系统,双电机版综合功率达443千瓦,支持10分钟快充补能127公里。

具身智能行业动态