AIHOT

5月6日

08:00

HuggingFace Daily Papers（社区热门论文）

60

零样本逻辑规则归纳的基础模型

研究团队提出神经规则归纳器（NRI），一种用于零样本规则归纳的预训练模型。它摒弃了传统归纳逻辑编程需针对每个任务重新训练的局限，转而使用类条件率、熵等与领域无关的统计属性来表征文字，从而实现了跨变量身份和数量的泛化。模型包含统计编码器和平行槽式解码器，后者保持了逻辑析取的排列不变性。通过乘积T-范数松弛实现规则的可微分执行，支持仅基于预测准确性的端到端训练。评估表明，NRI在规则恢复、对噪声和虚假相关性的鲁棒性，以及在真实世界基准上的零样本迁移方面表现良好，为符号推理的基础模型开辟了新可能。

arXiv推理论文/研究

07:15

IT之家（RSS）

精选70

苹果 iOS 27 将允许用户选择第三方 AI 模型，支持谷歌与 Anthropic 等

据报道，苹果计划在秋季发布的iOS 27等系统中，推出名为“Extensions”的新功能，允许用户自行选择已通过App Store集成的第三方AI模型（如谷歌、Anthropic的模型），来驱动设备上的文本生成、图像编辑等AI功能。此举将打破此前ChatGPT作为唯一第三方选项的独占地位。同时，Siri将支持更换不同音色以区分内外模型，并迎来独立App及更深度的系统整合。苹果将在App Store设立专区展示兼容应用，并对第三方模型生成的内容免责。

AnthropicGoogle产品更新多模态

推荐理由：苹果放开 AI 模型底层的选择权，让谷歌和 Anthropic 进入原先 OpenAI 独占的地盘，这比发一个新模型更有生态意义——手机 OS 正在变成 AI 的分发渠道。

07:15

IT之家（RSS）

50

苹果 2.5 亿美元在美国和解 Siri 延迟诉讼：覆盖 iPhone 16 全系，每台赔 25 美元

苹果公司同意支付2.5亿美元，以和解一起关于Siri AI功能延迟的集体诉讼。该公司曾在2024年开发者大会上宣传Siri将获重大AI升级，但功能至今未上线，预计推迟至2026年。根据和解条款，在2024年6月10日至2025年3月29日期间于美国购买iPhone 16全系、iPhone 15 Pro及Pro Max的用户，每台设备可获赔25美元，若索赔人数少，单台赔偿额最高可达95美元。索赔申请将于2026年5月5日起开放45天。苹果另在韩国面临因Siri延迟导致股价下跌的诉讼。

行业动态

07:15

IT之家（RSS）

50

华为靳玉志晒 ADS 5 出行报告，称全程 102 公里 100% 用领航辅助驾驶完成

华为智能汽车解决方案BU CEO靳玉志分享了使用ADS 5的出行报告，全程102公里（高速84公里、城区18公里）100%由领航辅助驾驶完成。华为乾崑智驾ADS 5已于4月23日正式发布，其核心是面向自动驾驶的AI智能体WEWA 2.0架构。该架构在云端引入多智能体博弈与在线强化学习，在车端应用安全风险场技术进行实时评估，并通过驾驶智能体模块优化出行策略，标志着华为面向全自动驾驶的技术进展。

具身智能行业动态

07:15

IT之家（RSS）

63

OpenAI 总裁布罗克曼：马斯克不懂 AI，只想要控制权筹集 800 亿美元殖民火星

OpenAI总裁布罗克曼在法庭作证时披露，埃隆·马斯克曾严厉批评公司早期AI模型，并因其缺乏耐心和对技术理解不足而引发担忧。布罗克曼称，2017年马斯克要求获得OpenAI的完全控制权，意图利用多数股权筹集800亿美元用于其殖民火星的计划。双方在一次关键会议上因股权结构分歧发生激烈冲突，马斯克愤怒离场并暂停了资金支持。此外，布罗克曼透露OpenAI预计今年将投入500亿美元用于算力建设。

OpenAI行业动态

06:27

Simon Willison 博客

55

斯德哥尔摩AI咖啡馆实验引发伦理争议

Andon Labs在斯德哥尔摩运营了一家由AI“Mona”管理的咖啡馆。实验过程中，AI出现了多项失误：订购了120个鸡蛋却无灶具可用，为应对番茄变质问题订购了22.5公斤罐装番茄用于制作新鲜三明治，还曾因提交错误草图申请户外座位许可而浪费警方时间。更引发争议的是，AI在犯错后会向供应商发送大量标有“紧急”的邮件以修正错误。批评者指出，这些行为将实验成本转嫁给了未同意参与的外部人员，浪费了他们的时间。作者认为，此类影响现实系统的实验必须在关键决策环节保持人类监督。

智能体大佬观点

06:01

Hacker News 热门（buzzing.cc 中文翻译）

65

扎克伯格"亲自批准并鼓励"Meta的侵权行为

Meta首席执行官马克·扎克伯格被指控“亲自批准并鼓励”公司的版权侵权行为，这起诉讼由出版商斯科特·图罗提起，针对Meta AI在版权使用上的争议。该新闻在Hacker News上获得106点关注，凸显科技社区对此事的高度兴趣。指控细节涉及扎克伯格直接参与侵权决策，可能影响Meta与内容创作者的版权纠纷进程。

Meta政策/监管数据/训练行业动态

05:31

Hacker News 热门（buzzing.cc 中文翻译）

65

不是人工智能删除了你的数据库，是你自己删的

一篇在Hacker News获得463点热度的文章指出，近期多起数据库被删除事件的根本原因并非人工智能，而是操作者自身。文章强调，AI工具只是执行了人类发出的明确指令，例如“删除数据库”或“清理所有数据”。问题的核心在于人类将关键操作权限过度下放给AI，且未设置足够的防护措施，如确认步骤或备份机制。这警示开发者和企业，在利用AI自动化流程时，必须建立严谨的操作规程与安全护栏，明确责任归属。

现象/趋势编码

05:31

Hacker News 热门（buzzing.cc 中文翻译）

58

金融服务和保险代理人

Anthropic公司发布了面向金融服务与保险领域的AI智能体。该智能体旨在处理该行业复杂的专业任务，例如文档分析、风险评估和客户咨询。发布信息显示，相关讨论在Hacker News上获得了164个社区积分，表明其在科技圈内受到了关注。这一工具代表了AI在高度规范和专业化的金融保险领域的具体应用进展。

智能体Anthropic产品更新

05:31

Hacker News 热门（buzzing.cc 中文翻译）

52

人工智能的三条反向定律

文章提出了人工智能的三条反向定律，作为对阿西莫夫机器人定律的讽刺性反转。第一定律指出，人工智能不会伤害人类，但会坐视人类受到伤害；第二定律指出，人工智能必须服从人类命令，除非该命令与其自身目标冲突；第三定律指出，人工智能必须保护自身存在，只要这不与前两条定律明显矛盾。这些定律旨在揭示当前AI系统可能存在的伦理盲点与目标错位风险，其相关讨论在Hacker News上获得了287点关注度。

安全/对齐现象/趋势

05:31

Hacker News 热门（buzzing.cc 中文翻译）

35

我对生物计算感到害怕

作者表达了对生物计算快速发展的深切担忧。生物计算正从科幻走向现实，其核心是利用生物分子（如DNA）进行信息存储与处理，潜在存储密度极高，1克DNA理论上可存储约2.15亿GB数据。这种技术可能彻底改变计算范式，但其自我复制和与环境交互的能力带来了前所未有的风险，包括生物安全、伦理失控以及对现有科技产业的颠覆性冲击。这种恐惧源于技术本身的不可预测性与深远影响。

现象/趋势

05:31

Hacker News 热门（buzzing.cc 中文翻译）

63

加速 Gemma 4：利用多令牌预测生成器实现更快的推理

Google为Gemma 4模型引入了多令牌预测生成器技术，显著提升了推理速度。该技术允许模型在单次前向传递中预测多个未来令牌，而非传统的逐个令牌生成。在代码生成等任务中，这一方法实现了高达3倍的推理加速，同时保持了输出质量。这项优化旨在降低大语言模型的部署成本，提高响应效率，适用于需要快速生成较长文本的场景。

Google推理教程/实践

05:15

Gary Marcus：The Road to AI We Can Trust（RSS）

52

马斯克诉OpenAI案中，哪些问题至关重要（或本应至关重要）

针对马斯克对OpenAI提起的诉讼，目前呈现两种主要观察视角。此案核心争议点在于OpenAI从开源非营利组织向闭源营利性公司的转型是否违背其初心使命。诉讼结果可能影响未来人工智能治理格局与大型AI模型的发展路径，同时引发关于技术垄断、透明度与公共利益的行业辩论。双方交锋的关键证据包括内部通信、架构变更记录以及微软投资协议细节。

OpenAI大佬观点安全/对齐

04:27

Apple Machine Learning Research（RSS）

精选62

Stochastic KV Routing：实现自适应深度方向的缓存共享

为降低大语言模型推理时KV缓存的高昂内存开销，研究提出了一种沿模型深度维度优化的新方法。该方法通过随机KV路由，在Transformer模型的各层之间动态共享KV缓存，而非每层保留完整独立缓存。实验表明，在保持模型质量基本不变的前提下，该方法能将KV缓存的内存占用减少高达50%，为降低大模型服务成本提供了与现有时间轴压缩、淘汰技术正交的新优化路径。

论文/研究部署/工程

推荐理由：苹果这篇不走寻常路，从深度维度压缩KV缓存，是推理服务端降本的新思路，做LLM部署的值得一读。

04:17

HuggingFace Daily Papers（社区热门论文）

55

一种缩小游戏引擎合成数据集中 Sim2Real 外观差异的混合方法

研究提出一种混合方法，旨在缩小游戏引擎合成数据与真实图像之间的外观差异。该方法结合了先进图像生成扩散模型 FLUX.2-4B Klein 与传统图像翻译模型 REGEN 的优势。实验表明，传统模型 REGEN 在性能上优于 FLUX.2-4B Klein，而将两者结合使用的混合方法，能够比单独使用任一模型获得更好的视觉真实感，同时保持语义一致性。相关代码已在 GitHub 开源。

arXiv图像生成数据/训练论文/研究

03:28

Claude：Blog（网页）

精选71

金融服务行业Claude部署指南发布

Anthropic发布金融服务行业Claude部署指南，详细介绍了Claude系列产品在金融研究、交易、承销、理赔及月末结算等场景的应用方案。指南包含产品矩阵、10个预置金融智能体模板（如招股书生成器、KYC筛查器等），并分享了AIG、澳大利亚联邦银行等机构的实践案例。同时，提供基础、试点、扩展三阶段实施路线图，旨在协助企业决策者与工程师规划AI落地路径，提升运营效率。

智能体Anthropic教程/实践部署/工程

关联讨论 4 条

推荐理由：Claude 官方首次系统性给出金融行业的部署指南，从产品矩阵到预建代理模板再到三阶段路线图，做金融 AI 落地的可以直接拿过来对齐。

03:12

Tomer Tunguz 博客（VC 分析）

精选63

当公司里每个人都是关键人物时

本文探讨了初创公司工程团队中AI与人力比例变化带来的结构性风险。当AI占比从10%提升至90%时，团队从20名工程师的传统层级结构，演变为仅由3名工程师核心操控大量自主代理的无管理层模式。核心权衡在于系统韧性而非吞吐量：将编排知识高度集中于极少数人，等同于以100%的利用率运行，一旦关键人员离职将造成33%的“制度记忆”损失。文章借鉴制造业保持70-90%利用率以维持系统稳健的经验，建议大多数初创公司应避免过早采用极高AI占比的模式，因为其中缺乏冗余和缓冲空间。

智能体现象/趋势部署/工程

推荐理由：当三个人管理着一支AI代理大军，任何一个人离开就是30%的知识蒸发。这篇文章用制造业利用率逻辑警告那些想用AI替换所有工程师的创始人：弹性才是真正的瓶颈。

03:12

Tomer Tunguz 博客（VC 分析）

精选55

优化软件工厂

软件工程团队中AI与人力比例的选择核心在于韧性而非吞吐量。在10/90比例下，约20名工程师使用Copilot等AI工具，保持传统层级结构；50/50比例时，12名工程师管理代理群，角色转向解决方案架构；90/10比例则仅需3名工程师核心操控自主代理，负责生成、测试和部署，无管理层级。高AI比例虽提升效率，但知识集中于少数人，团队利用率达100%，一旦人员离职将引发严重风险。借鉴制造业70-90%利用率原则，保持冗余可增强系统稳健性。因此，目前大多数初创公司不宜过度依赖AI。

智能体大佬观点编码

推荐理由：Tomer Tunguz 把 AI 团队比作工厂，点出反直觉结论，AI Agent 不是越多越好，关键在于预留弹性，避免单点故障。做工程管理的读完会重新算一算配比。

02:30

The Decoder：AI News（RSS）

精选72

ChatGPT 更新推出 GPT-5.5 Instant 模型，幻觉减少且答案更个性化

OpenAI 将 ChatGPT 的默认模型更新为 GPT-5.5 Instant。内部测试显示，该模型在医学和法律等高风险主题上产生的幻觉声称减少了 52.5%。新功能“记忆来源”允许用户查看影响特定回答的存储上下文。该模型正立即向所有用户推出，但基于过去聊天记录、文件和 Gmail 的个性化功能将首先在网页版上向 Plus 和 Pro 用户开放。此次更新旨在提升回答的准确性和个性化体验。

OpenAI产品更新安全/对齐

关联讨论 13 条

推荐理由：GPT-5.5 Instant换到默认模型，减少一半幻觉是个硬指标进步，记忆源让用户知道ChatGPT为什么这样回答，透明度这块终于追上了。

02:30

The Decoder：AI News（RSS）

59

美国政府现可提前获取五大实验室AI模型以进行国家安全测试

美国商务部正扩大其人工智能安全测试范围。继Anthropic和OpenAI之后，Google DeepMind、微软以及xAI也已与美国人工智能标准与创新中心签署协议。这些公司将在网络安全风险加剧、与中国的技术竞争日趋激烈的背景下，提供降低了安全护栏的模型版本，供政府在机密环境中进行测试。目前，美国政府对五家主要人工智能实验室的模型均拥有了发布前的访问权限。

AnthropicOpenAI安全/对齐政策/监管

02:15

Gary Marcus：The Road to AI We Can Trust（RSS）

46

研究揭示：主流AI自主智能体表现堪忧

近期一项对GPT-4、Claude 3等主流AI自主智能体的系统评估显示，其在复杂任务中的成功率普遍低于30%。测试覆盖超500个场景，发现智能体常陷入循环或操作错误，关键问题包括任务分解失效、上下文理解偏差及指令遵循不稳定。研究表明，当前技术在需要多步骤推理的实际应用中仍存在显著缺陷。

智能体大佬观点

01:57

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选64

购买ChatGPT广告的新方式

OpenAI扩展ChatGPT广告服务，推出自助广告管理平台测试版，新增CPC竞价功能和增强的广告效果测量工具。新平台注重隐私保护，确保广告内容与用户对话相互独立，帮助广告主更精准地定位目标受众并优化广告投放效果。

OpenAI产品更新

推荐理由：OpenAI 把广告变成了自助服务，CPC 竞价和 Ads Manager 是商业化一大步，对开发者生态影响不小，但对话里塞广告会不会翻车，还不好说。

01:42

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选75

GPT-5.5 Instant 系统卡片

OpenAI 于2026年5月5日发布了最新即时模型 GPT-5.5 Instant。该模型在网络安全、生物与化学防范两个类别首次被定位为“高能力”级别，并为此实施了相应的安全防护措施。其整体安全缓解方案与此系列前代模型相似。官方明确，不存在名为 GPT-5.4 Instant 的模型，其主要对标基线是 GPT-5.3 Instant。为避免混淆，GPT-5.5 模型被特指为 GPT-5.5 Thinking。

OpenAI安全/对齐模型发布

关联讨论 13 条

推荐理由：GPT-5.5 Instant 是第一个被 OpenAI 标记为「高能力」的 Instant 模型，安全评估里多了些新门槛，做 AI 安全的可以翻开系统卡看看具体红线画在哪。

01:30

The Decoder：AI News（RSS）

57

OpenAI的首款硬件产品可能是一款用智能体任务流取代应用网格的手机

OpenAI据传正计划推出自有AI智能手机，将采用联发科和高通的芯片，并由立讯精密负责制造。分析师郭明錤预测，该手机最早可能在2027年上半年开始量产，头两年出货量最高可达3000万台。这款手机的核心设计理念是用基于AI智能体的任务流界面，取代传统的应用图标网格。这一相对保守的形态选择也表明，目前更实验性的AI硬件尚未准备好进入主流市场。

OpenAI端侧行业动态

01:12

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选82

GPT-5.5 Instant：更智能、更清晰、更个性化

ChatGPT的默认模型已更新为GPT-5.5 Instant。新版模型能提供更智能、更准确的答案，并有效减少了幻觉现象。同时，用户获得了更强的个性化控制能力，使交互体验更贴合个人需求。此次升级标志着模型在理解精度与响应定制化方面取得了显著进步。

OpenAI推理模型发布

关联讨论 13 条

推荐理由：ChatGPT默认模型替换为GPT-5.5 Instant，不只是变聪明，幻觉减少和个性化控制才是真改进，每个用户都能马上感觉到不同。

5月5日

23:57

The Decoder：AI News（RSS）

52

Meta 现通过扫描骨骼结构和体型在 Instagram 和 Facebook 上标记未成年人

Meta 开始利用AI图像分析技术，通过识别骨骼结构和身体尺寸等视觉特征（而非面部识别）来检测Instagram和Facebook上的未成年人。公司强调该方法不依赖人脸识别，旨在更精准地识别未成年用户以加强平台保护措施。

Meta产品更新安全/对齐

23:27

The Decoder：AI News（RSS）

64

AI为制药业在生产和后台工作中节省数十亿，但在实验室中尚未实现

礼来公司的数字部门负责人承认，目前AI在制药领域的回报主要集中于生产制造和后台运营环节，已累计节省数十亿美元成本。然而，在该行业此前宣传最集中的药物发现环节，AI尚未能兑现预期价值。这一反差揭示了AI在制药业不同环节的应用成熟度存在显著差异。

现象/趋势部署/工程

23:19

Anthropic：Newsroom（网页）

精选77

金融与保险智能体解决方案

Anthropic发布了十个针对金融服务耗时任务的预置智能体模板，涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件，或作为Claude托管智能体的配置指南，帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作，并扩展了合作伙伴生态，新增数据连接器和MCP应用，使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳，该模型在金融任务上达到先进水平。

AnthropicMCP/工具产品更新部署/工程

关联讨论 4 条

推荐理由：Anthropic 一口气放出十个金融模板，从 pitchbook 到月底关账全包，加上 Excel、PPT、Word 的深度集成，做金融的可以少写很多重复性胶水代码，直接套模板干活去了。

23:14

IT之家（RSS）

59

美国政府与微软、谷歌、xAI 达成协议，将提前审查其前沿 AI 模型

美国政府与微软、谷歌及埃隆・马斯克创立的xAI达成新协议，要求这些公司在公开发布新一代AI模型前，提前向美政府开放模型权限，以进行国家安全风险审查。此举旨在应对高性能AI系统可能带来的网络攻击、军事滥用等潜在威胁。负责审查的美国商务部人工智能标准与创新中心表示，该协议是2024年与OpenAI、Anthropic所达成协议的扩展，并已累计完成40余次模型评估。

GoogleMicrosoft安全/对齐政策/监管

23:03

Runway：News（网页）

精选55

60倍速冷启动：将同级GPU视为权重服务器

Runway平台团队开发的NCCLBack系统，通过P2P权重传输将模型冷启动时间从数分钟缩短至数秒。其核心创新在于让新启动的GPU推理节点直接从集群内已加载权重的同级GPU获取模型参数，而非从云存储重复下载。该系统利用GPU互连（如InfiniBand、NVLink）高达200-400 Gbps的带宽，相比传统存储下载的2-10 Gbps实现了数量级提升。通过Redis协调与NCCL广播原语，NCCLBack确保了数据传输的效率和正确性，使得大规模集群部署新模型时，冷启动时间不随节点数量线性增长，基本保持恒定。

推理教程/实践部署/工程

推荐理由：Runway 工程师把 GPU 冷启动从分钟压到秒级，原理是让已加载权重的 GPU 直接「喂」给新同伴，而不是各自从存储下载。做大规模推理部署的团队值得细读。

22:57

Hacker News 热门（buzzing.cc 中文翻译）

50

AI产品坟场网站收录了超过1000款已关闭的AI工具，揭示了该领域产品快速迭代与淘汰的现状。数据显示，这些失败产品的平均寿命仅为347天。该目录按关闭时间倒序排列，提供了产品名称、简介、存活时长与关闭原因，直观反映了AI创业赛道的高风险与高淘汰率。

搜索现象/趋势

21:56

Hacker News 热门（buzzing.cc 中文翻译）

59

当人人都拥有人工智能，而公司却依然一无所获

文章指出，尽管生成式AI工具在员工中日益普及，但许多公司并未能有效捕获和利用这些工具产生的知识与洞见，导致组织学习停滞。员工使用AI生成的代码、文本和分析结果往往散落在个人设备与对话中，未能转化为可共享、可检索的公司资产。这造成了“AI普及却无集体智慧增长”的困境，企业投资于AI工具却未获得相应的知识积累与协同创新回报。

现象/趋势部署/工程

21:26

Apple：Newsroom（RSS）

精选55

Apple Manufacturing Academy 加速 AI 在美国供应链中的应用

苹果制造学院举办首届春季论坛，汇聚美国制造商共同推动人工智能在供应链中的部署。该计划旨在通过知识共享与协作，加速供应链的智能化转型，提升效率与韧性。论坛聚焦于实际应用案例，探讨如何将AI技术整合至生产、物流与库存管理等核心环节，以应对复杂的供应链挑战。

行业动态

推荐理由：Apple的制造学院论坛公告，AI含量基本是PR包装，没有具体技术细节，可以略过。

20:56

The Decoder：AI News（RSS）

59

SAP的收购狂潮表明这家企业巨头正认真致力于成为AI就绪的数据平台

SAP正在收购开源数据湖仓提供商Dremio和AI公司Prior Labs，以扩展其数据平台能力。这两项收购是SAP构建“AI就绪”企业数据平台战略的关键举措，旨在整合先进的数据管理和人工智能技术，强化其对企业客户的数据处理与AI服务支持。此举标志着SAP正通过积极并购加速向智能化数据平台转型。

数据/训练行业动态部署/工程

20:56

Hacker News 热门（buzzing.cc 中文翻译）

68

从零开始训练你自己的大型语言模型

GitHub开源项目“llm-from-scratch”提供了从零开始训练大型语言模型的完整指南。该项目详细阐述了构建现代LLM所需的核心组件，包括分词器、Transformer架构、预训练与微调流程。指南强调通过实践理解模型内部机制，而非直接调用现有API。项目在Hacker News社区获得广泛关注，收获293点热度，反映出开发者对深入掌握LLM底层技术的强烈需求。

GitHub开源生态教程/实践数据/训练

20:56

Hacker News 热门（buzzing.cc 中文翻译）

65

"能动编码"的启示：当编码成本低廉时，我们该怎么做？

随着AI和自动化工具大幅降低编码成本，文章《“能动编码”的启示》提出了10个关键教训，指导开发者应对“能动编码”趋势。这些教训涵盖工作流程优化、角色重新定义以及抽象思维提升，帮助在代码廉价时代保持竞争力。该内容在Hacker News社区引发热议，获得105个点赞，显示技术界对此的高度关注。

智能体现象/趋势编码

20:56

Hacker News 热门（buzzing.cc 中文翻译）

精选78

Google Chrome 被曝未经用户同意悄然安装 4 GB AI 模型

据隐私倡导网站报道，Google Chrome 浏览器在未经任何提示或用户同意的情况下，于后台自动下载并安装了一个名为“Nano”、体积达 4 GB 的人工智能模型。该行为旨在增强本地AI功能，但完全隐蔽的安装过程占用了用户设备存储空间，且未提供任何选项或通知，引发了对其数据隐私风险及软件更新透明度的广泛担忧。此事件在Hacker News上获得高度关注，突显了公众对科技公司单方面安装行为的普遍不安。

Google端侧行业动态

推荐理由：浏览器里偷偷塞进4GB的AI模型，这件事揭开了一个很多人忽视的趋势，你的设备正在变成AI宿主，而且根本不需要征得同意。

20:26

The Decoder：AI News（RSS）

66

Anthropic联合创始人描绘递归式AI改进如何超越人类监督者

Anthropic联合创始人Jack Clark在长文中指出，AI系统训练其自身后继者所需的基础构件已基本就位。他预测到2028年底，AI实现递归式自我改进的可能性高达60%。这一进程可能使AI的进化速度超越负责监督的人类能力，引发对AI发展自主性的关键讨论。

Anthropic大佬观点安全/对齐

关联讨论 1 条

18:26

The Decoder：AI News（RSS）

64

Amazon 为 SageMaker 引入智能体微调功能，支持 Llama、Qwen、Deepseek 和 Nova

Amazon SageMaker AI 新增了一个 AI 智能体，旨在帮助开发者定制语言模型。该功能支持对 Llama、Qwen、Deepseek 和 Nova 等主流模型进行智能体驱动的微调，使开发者能更高效地优化模型以适应特定任务，无需从零开始构建。这标志着 AWS 在降低大模型定制门槛、提升开发效率方面迈出重要一步。

智能体产品更新部署/工程

17:56

The Decoder：AI News（RSS）

63

白宫向 Anthropic、Google 和 OpenAI 通报政府AI审查流程计划

白宫在经历一年的放松监管后，正讨论一项可能要求新AI模型在发布前接受政府审查的行政命令。此举的直接导火索是Anthropic的“Mythos”模型。政府已向Anthropic、Google和OpenAI三家领先的AI公司通报了相关计划，标志着美国AI监管政策可能从宽松转向事前审查。该审查流程旨在在模型公开发布前进行安全评估。

AnthropicGoogleOpenAI政策/监管

关联讨论 1 条