AIHOT

5月8日

09:16

IT之家（RSS）

48

AMD 时隔四年重推 PCIe AIC 形态 Instinct 显卡：MI350P 规模砍半

AMD近日发布了四年来首款采用PCIe AIC形态的Instinct MI350P加速卡，主要面向现有数据中心基础设施升级。该卡采用新封装，规格相较MI350X大幅缩减：XCD芯片数量减半至4个，HBM3E内存降至4堆栈144GB，性能下降约50%，晶体管数量减少约60%。产品采用双槽全高全长设计，最大功耗600W，支持无风扇被动散热。

产品更新部署/工程

09:16

IT之家（RSS）

44

瑞莎预热高通平台飞牛 NAS：6 盘位全闪高性能 / 4 盘位主流双选择

瑞莎在2026高通AI开发者日前夕，预热了两款基于高通硬件平台的飞牛fnOS NAS新品。其中，DragonStation定位高性能全闪存产品，搭载具备“超大核”CPU的Arm SoC，提供6个M.2 SSD盘位，支持10Gb网络，并能通过内置加速卡本地运行120B参数的AI模型。另一款DragonBay面向主流用户，提供4个存储位，其内部结构设计留有后续扩展空间。两款新品将在本月末于深圳举行的活动中正式亮相。

产品更新推理端侧

09:16

IT之家（RSS）

精选70

OpenAI 最智能 AI 语音模型：GPT-Realtime-2 登场，GPT-5 级推理能力

OpenAI 发布三款集成于Realtime API的实时语音模型，旨在解决语音交互中的延迟、打断处理和多语言支持难题。其中，GPT-Realtime-2具备GPT-5级推理能力，可在对话中进行推理、调用工具并处理打断，音频输入输出分别按每百万Token 32美元和64美元计费。GPT-Realtime-Translate支持70种输入语言同步翻译为13种输出语言，每分钟0.034美元。GPT-Realtime-Whisper提供低延迟流式转录，每分钟0.017美元。这些模型为开发复杂语音助手、实时翻译和转录应用提供了底层技术支持。

OpenAI推理模型发布语音

关联讨论 13 条

推荐理由：GPT-Realtime-2 把 GPT-5 级的推理塞进了实时语音里，不是简单的语音转文字，是能打断、能纠错、能执行多步任务的真·语音助手能力。做语音产品的人现在就该去读接口文档。

09:16

IT之家（RSS）

53

消息称软银与英伟达、富士康磋商，拟开发"日本制造"AI 服务器

软银正与英伟达和富士康磋商，评估在日本本土制造AI服务器的可行性。该计划首先通过组装外购组件建立生产系统，目标是在2029年前逐步掌握完整的AI服务器制造流程。软银将打造配备高级GPU的高性能服务器，此蓝图已纳入公司中期经营计划，预计最快将于下周正式公布。软银CEO孙正义已向OpenAI投资超过300亿美元，显示出其在大型语言模型竞争中的全力投入。

行业动态部署/工程

09:16

IT之家（RSS）

51

昆仑芯启动科创板 IPO 上市辅导，百度持股 57.67%

昆仑芯（北京）科技股份有限公司已于2026年5月7日启动科创板上市辅导，辅导机构为中金公司。该公司前身为百度智能芯片及架构部，百度目前持股57.67%为控股股东。此前，昆仑芯已于2026年1月向港交所提交上市申请。中银国际报告评估其估值应处于300亿至1000亿港元区间的头部，对百度估值贡献约500亿港元。受分拆消息影响，百度港股曾单日上涨约9.35%。昆仑芯专注于AI芯片研发，产品主要面向数据中心与云计算场景。

行业动态

09:16

IT之家（RSS）

52

候任 CEO 特努斯定调苹果 AI 战略：不追求营销噱头，专注用户体验

苹果候任CEO约翰·特努斯明确公司AI战略核心：不追求技术营销噱头，专注以技术提升实际用户体验。在iOS 27预计带来重大AI更新的背景下，特努斯强调苹果不会单纯“发布技术”，而是确保AI功能切实改善产品体验，用户无需知晓功能是否由AI驱动，只需感受产品是否好用。这一立场直指当前科技行业为追赶浪潮而匆忙发布未经验证技术的痛点。

行业动态

09:16

IT之家（RSS）

61

向 AI 优先运营模式转型，Cloudflare 裁员超 1100 人

美国科技企业Cloudflare宣布裁员20%，涉及超过1100名员工，以推动公司向AI优先运营模式转型。公司CEO表示，此举并非仅为降本增效，而是为适应智能体时代重构公司架构。数据显示，Cloudflare的AI使用量在三个月内激增超过600%，公司内部日常运营已广泛依赖AI智能体对话。截至去年底，公司全职员工数为5156人，预计此次裁员将产生1.4亿至1.5亿美元的相关费用。

行业动态部署/工程

08:30

Claude Code：GitHub Releases（RSS）

精选69

Claude v2.1.133 版本更新

Claude 发布 v2.1.133 版本，新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础，引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径，并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上，钩子现在可接收活动努力级别信息，Bash 工具命令可读取相应环境变量。此外，改进了焦点模式行为，并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题，包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。`claude --help` 现已列出远程控制选项，VSCode 扩展也修复了相关错误。

智能体AnthropicMCP/工具产品更新

推荐理由：Claude Code 这个版本修了一堆让人抓狂的 bug，并行会话掉认证、网络驱动器权限、子代理找不到 skill 都解决了，重度用户应该尽快升级。

08:16

IT之家（RSS）

31

IT早报 0508：央视曝光"电动自行车增程器"；比亚迪、吉利、奇瑞加速布局加拿大市场；理想设计团队否认 MEGA 设计失败；鸿蒙智行智界 V9 本月 15 日上市…

央视曝光宣称能“边行驶边充电”的电动自行车增程器存在安全隐患且无效。中国车企正加速布局加拿大电动汽车市场，比亚迪、吉利、奇瑞等瞄准每年4.9万辆的进口配额。鸿蒙智行智界V9将于5月15日上市，预售价39.98万元起。比亚迪大唐EV预售订单已突破10万台。理想设计团队否认MEGA设计失败，其CEO李想呼吁行业共同推广5C增程技术以缓解充电压力。此外，消息称苹果本月或将完成iPhone 18 Pro系列的OLED面板审批。

OpenAIxAI行业动态

08:16

IT之家（RSS）

60

OpenAI 自研芯片项目遇阻：博通要求微软采购首批四成产能才愿出资

OpenAI与博通联合研发AI芯片项目“Nexus”陷入僵局。博通要求微软承诺采购首批芯片约40%的产能，才愿为首期建设出资。项目首期需1.3吉瓦算力，成本约180亿美元；总规模达10吉瓦，旨在2030年前上线以减少对英伟达依赖。OpenAI视自研芯片为降低运营成本关键，但微软尚未同意采购。若微软采购未达标，OpenAI需自行寻找其他买家。此前OpenAI与英伟达的类似千亿美元合作也已无果。

MicrosoftOpenAI数据/训练行业动态

08:16

IT之家（RSS）

50

iOS 27 版苹果备忘录 App 前瞻：接入 AI 版 Siri 简化内容收集、高效梳理信息

据报道，iOS 27系统将对Siri进行彻底重构，其底层将基于谷歌Gemini构建，交互模式将从指令式转变为类似ChatGPT的对话模式。新版Siri将与备忘录应用深度整合，用户可通过“把这个加到新备忘录”等语音指令，直接将AI生成的内容自动、完整地保存至备忘录，解决手动复制粘贴导致的流程繁琐和格式错乱问题。此外，Siri还能利用大语言模型能力，高效梳理信息并创建特定主题的备忘录。

产品更新语音

08:04

OpenAI：官网动态（RSS · 排除企业/客户案例）

24

Simplex 借力 Codex 重新思考软件开发

Simplex 通过整合 ChatGPT Enterprise 和 Codex 来提升软件开发效率。该方案显著缩短了软件设计、构建和测试所需的时间，同时实现了 AI 驱动工作流程的规模化应用。这一变革旨在优化开发周期，利用先进的语言模型技术加速产品交付。

OpenAI行业动态

07:30

GitHub Blog

精选72

提升 GitHub Agentic Workflows 的 Token 使用效率

GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流，定位了效率低下的环节，并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用，直接提升了工作流的经济性与运行效率。

智能体GitHubMCP/工具教程/实践

推荐理由：GitHub 把自己生产环境的 agentic workflow 扒了一遍，从 token 消耗里找浪费，再让 agent 自动修。不是 paper，是真踩过的坑，做 Copilot 集成的团队可以抄作业。

07:16

IT之家（RSS）

47

OpenAI 为 ChatGPT 推出"可信联系人"，应对 AI 对话中的自残风险

OpenAI为ChatGPT推出“可信联系人”功能，以应对对话中的自残风险。当系统检测到成年用户对话涉及相关内容时，会鼓励用户联系他人，并自动向其预设的联系人发送简短的电子邮件、短信或推送通知提醒，以促进沟通。通知不包含具体对话细节以保护隐私。该功能采用自动审核与人工复核结合，触发提醒的对话会交由人工安全团队处理，官方承诺对此类通知进行人工审核并力求在一小时内完成。此前，OpenAI曾因被指控鼓励用户自杀而面临诉讼。

OpenAI产品更新安全/对齐

07:16

IT之家（RSS）

精选70

苹果首款 AI 可穿戴设备：内置摄像头的 AirPods 已进入 DVT 阶段，预计最快 9 月搭载新 Siri 亮相

据报道，苹果内置摄像头的AirPods已进入设计验证测试（DVT）阶段，最快有望于今年9月作为其首款AI可穿戴设备发布。该产品左右耳机配备低分辨率摄像头，用于捕捉环境视觉信息，以支持升级版Siri实现视觉问答等功能。其整体外观类似AirPods Pro 3，但耳机柄因容纳摄像头而加长。产品原计划2026年发布，因Siri升级延迟而推迟，此次升级得益于与谷歌Gemini的技术合作。苹果还在探索其导航提醒等用途，并为缓解隐私担忧内置了数据上传指示灯。

Google多模态端侧行业动态

推荐理由：苹果把摄像头塞进 AirPods 做 Siri 的眼睛，这比智能眼镜更务实，但隐私指示灯能有多显眼是个疑问，做 AI 硬件的该看看苹果怎么绕开 Meta 的坑。

07:16

IT之家（RSS）

53

尺寸类似 AirTag：古尔曼称苹果正开发 AI 可穿戴设备，能和 iOS 27 版 Siri 语音交互

据彭博社记者马克·古尔曼爆料，苹果正在开发两款智能穿戴设备。一款是尺寸类似AirTag的吊坠配件，可夹在衣物或作为项链佩戴，配备常开摄像头和麦克风，依赖连接iPhone及iOS 27版Siri进行语音交互与数据处理，无屏幕和投影仪，项目仍处早期，可能于2027年发布。另一款是计划在2026年底或2027年初推出的智能眼镜，内置摄像头、扬声器和麦克风，支持拍照、通话及Siri通知，并与Apple Intelligence整合优化导航等功能，采用自主设计的塑料镜框，但第一代不配备AR显示功能。

端侧行业动态语音

06:16

Gary Marcus：The Road to AI We Can Trust（RSS）

42

Breaking news： "他们还没想好OpenAI如何为此付费"

据报道，OpenAI在推进其最新项目时，面临一个核心的财务运营问题：尚未确定具体的支付模式与资金解决方案。这一情况揭示了即便在技术快速发展的前沿，AI巨头在将宏伟蓝图转化为可持续商业实践的过程中，仍可能遭遇基础性的挑战。当前阶段的关键矛盾聚焦于“如何支付”，而非“能否实现”，这或许预示着行业在追求能力突破的同时，必须更扎实地构建其经济模型。

OpenAI大佬观点

05:49

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选74

Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

OpenAI扩展了网络安全领域的可信访问计划，推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型。此举旨在帮助经过验证的网络安全防御者加速漏洞研究，并加强对关键基础设施的保护。新模型将为安全专业人员提供更强大的AI工具支持。

OpenAI安全/对齐模型发布

推荐理由：GPT-5.5 正式登场，首秀是给安全防御者用的，Trusted Access 机制把模型和真实漏洞环境连起来，做网络安全的可以关注，其他人先看看。

05:48

Anthropic：Transformer Circuits（可解释性研究）

Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations

05:43

OpenRouter：Announcements（RSS）

精选73

为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择，实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型（如GPT、Claude、LLaMA等）集成实时、可靠的网络信息获取能力，无需为每个模型单独适配。

智能体MCP/工具产品更新

推荐理由：让任何模型都能用统一接口做联网搜索和抓取，做 agent 的同学不用再为每个模型单独配工具了，在 OpenRouter 上搭产品的实用性直接拉高。

05:36

Hacker News 热门（buzzing.cc 中文翻译）

精选76

自然语言自编码器：将克劳德的思绪转化为文字

Anthropic公司发布了一项名为“自然语言自编码器”的研究，旨在将Claude模型的内部思维过程转化为人类可读的文本。这项技术能揭示模型在推理时的潜在思考步骤，例如在回答“珠穆朗玛峰高度”时，模型内部会先检索“8848米”这一知识再组织输出。该方法提升了AI的可解释性，有助于研究者理解并改进大语言模型的决策机制。相关论文和详细信息已在Anthropic官网公布。

Anthropic安全/对齐论文/研究

关联讨论 2 条

推荐理由：Anthropic 把 Claude 的神经网络内部状态直接解码成了自然语言，就好像让模型做梦再把梦话写下来，可解释性研究里少有的‘能看懂’的实验，但离实用还很远。

05:29

Anthropic：Research（发表成果 · 网页）

精选73

捐赠开源对齐工具 Petri

2025年10月，Anthropic公司开源了AI模型对齐测试工具箱Petri，用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分，并被英国AI安全研究所等外部机构采用。近日，Petri升级至3.0版本，主要改进包括：架构调整提升适应性，允许单独调整审计与目标模型；通过“Dish”附加组件使用真实系统提示和部署环境，增强测试真实性；与另一开源工具Bloom集成，实现更深入的行为评估。为确保独立性与公信力，Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由：Petri 从 Anthropic 内部工具箱变成行业公共品，捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司，做安全测试的团队又多了一个可参考的标尺。

05:16

Cloudflare Blog

42

Building for the future

Cloudflare向全球团队发送内部邮件，宣布公司迎来一个重大时刻。公司秉持透明度这一核心价值观，决定直接向外界同步这一关键信息。此举标志着Cloudflare在战略发展上迈出了重要一步，旨在为未来构建更坚实的基础。

行业动态部署/工程

04:36

Hacker News 热门（buzzing.cc 中文翻译）

61

低质量的AI内容正在摧毁网络社区

AI生成的低质量内容正严重损害在线社区生态。这类被称为“AI垃圾”的内容充斥网络，导致社区讨论质量下降、用户参与度锐减。文章指出，一个原本活跃的技术社区因大量AI生成帖子的涌入，其高质量讨论帖数量在半年内下降了约40%，用户平均停留时间也大幅缩短。这种现象不仅稀释了有价值的信息，还加剧了信息噪音，使寻找真实、有用内容的难度增加，最终可能摧毁依靠用户贡献和互动维系的社区基础。

现象/趋势

04:30

Simon Willison 博客

精选78

GitHub Repo Stats

作者开发了一个名为“GitHub Repo Stats”的在线工具，用于解决GitHub移动端网站不显示仓库提交次数的问题。用户只需输入GitHub仓库的URL或“foo/bar”格式的仓库ID，该工具便会通过REST或GraphQL API获取并展示仓库的关键统计数据，其中首要指标就是提交总数。工具已提供实际示例，如查看simonw/datasette和simonw/llm这两个仓库的详细数据。

GitHub产品更新部署/工程

推荐理由：Simon 这个 GitHub Repo Stats 工具虽小，但直接解决了移动端看不了 commit 数这个真实痛点，做开源评估的开发者可以立刻用起来。

04:30

Simon Willison 博客

62

大文字工具

Simon Willison 为配合其“氛围编码”macOS演示工具，快速开发了一个名为“Big Words”的网页工具。该工具通过URL参数（如文本、渐变、大小）动态生成可自定义的幻灯片页面，解决了演示工具仅能嵌入URL内容的需求。用户可双击页面访问设置表单，自由调整文本内容、颜色、背景（支持纯色或渐变）、字体、字重、大小等多种视觉选项。所有设置均可生成一个特定的URL以便保存和分享，从而快速创建用于演示的文本幻灯片。

开源/仓库部署/工程

04:30

Simon Willison 博客

28

llm-gemini 0.31

llm-gemini 0.31 版本发布，其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态，转为正式可用。该模型自三月份预览以来，其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。

Google产品更新开源生态

03:36

Hacker News 热门（buzzing.cc 中文翻译）

61

智能体需要控制流，而不是更多的提示

当前AI智能体的开发过度依赖提示工程，导致系统复杂且脆弱。文章主张智能体应转向采用编程中的控制流结构，如条件判断、循环和函数调用，以实现更可靠、可维护的决策与行动序列。这一转变能减少提示长度和调试负担，提升智能体处理复杂、多步骤任务的能力，是构建下一代实用AI助手的关键。

智能体现象/趋势

03:30

GitHub Blog

精选79

Agent pull requests 无处不在：如何审查它们

这份指南提供了审查由AI代理生成的pull requests的实用方法，重点包括审查时应关注的代码变更点、问题常见隐藏位置（如逻辑错误或安全漏洞），以及如何在代码合并前捕捉技术债务。它通过具体步骤帮助开发者系统评估自动化提交，确保代码质量，避免缺陷流入生产环境。指南强调主动审查策略，以应对AI代理在软件开发中日益普及的趋势。

智能体GitHub教程/实践编码

推荐理由：AI代理生成的PR越来越多，审查它们不再是可选项。这篇官方指南从发现隐患到控制技术债务，给出了马上能用的检查清单，每个用Copilot的开发者都该看。

03:13

Tomer Tunguz 博客（VC 分析）

精选57

估值折价：Anthropic高增长背后的市场疑虑

Anthropic在15个月内估值从10亿飙升至300亿美元，但其企业价值与未来收入之比仅为17倍，远低于增长更慢的Palantir（49倍）。这一估值折扣主要源于四大因素：极高的资本密集度（如年成本达62亿美元的GPU协议）、未来盈利能力不明（可能成为软件公司或资本密集型公共事业）、收入增长的波动性，以及外生的政治与监管风险。市场正通过折扣来反映这个高速变化领域的不确定性。

Anthropic现象/趋势

推荐理由：Tomer用资本密集度、盈利不确定性、增长波动和政治风险四把尺子量了Anthropic的估值折价，看完你会理解为什么市场给AI增长打了个问号。

03:10

The Decoder：AI News（RSS）

精选70

OpenAI发布新语音模型，为实时对话带来GPT-5级推理能力

OpenAI发布了三款新型语音模型：GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。其中，GPT-Realtime-2具备与GPT-5相匹配的实时推理能力，旨在实现更流畅、智能的实时对话交互。GPT-Realtime-Translate支持超过70种语言的实时翻译，而GPT-Realtime-Whisper则专注于实时语音转写功能。这一系列模型标志着OpenAI在实时音频处理和交互领域的重要进展，有望显著提升跨语言沟通和语音应用的体验。

OpenAI推理模型发布语音

关联讨论 13 条

推荐理由：语音助手终于从「能听会说」变成了「能想会说」，GPT-5 推理进实时通道，所有语音交互产品的天花板被抬升了一个量级。

03:06

Hacker News 热门（buzzing.cc 中文翻译）

精选74

DeepSeek 4：适用于 Metal 的 Flash 本地推理引擎

DeepSeek 4 Flash 本地推理引擎正式发布，这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型，实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能，降低了延迟与内存占用。该项目已在 GitHub 开源，并在 Hacker News 上获得了关注。

DeepSeek开源/仓库推理端侧

推荐理由：antirez 写的引擎让 DeepSeek 4 在 Mac 本地跑出近乎 Flash 的速度，而且代码极其精简，做本地推理的开发者应该立刻克隆下来跑一下。

03:04

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选71

在ChatGPT中测试广告

OpenAI开始在ChatGPT中测试广告功能，旨在支持其免费服务的持续运营。测试强调广告会带有明确标识，且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施，并确保用户对广告体验拥有控制权。

OpenAI产品更新

推荐理由：ChatGPT免费版要开始看广告了，虽然官方承诺回答不受影响且隐私保护，但这是AI商业化的大实验，所有免费用户都会盯着会不会掺水。

02:41

Claude：Blog（网页）

精选85

在Excel、PowerPoint、Word和Outlook中与Claude协同工作

Claude for Excel、PowerPoint和Word现已全面上市，Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文，实现跨文件智能协作。例如，在Outlook中分类邮件并起草回复，在Excel中调整数据后，PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署，并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问，Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。

Anthropic产品更新

关联讨论 2 条

推荐理由：Claude 这次 Office 集成不是普通插件，它让 Excel、PPT、Word、Outlook 共享同一对话上下文，改一个数其余自动更新，生产力提升是实打实的，企业用户值得立即部署。

02:30

Apple Machine Learning Research（RSS）

精选68

用于学习语义丰富视觉表征的文本条件JEPA

研究人员提出文本条件联合嵌入预测架构（TC-JEPA），通过引入图像描述文本作为条件信息来降低掩码特征预测中的视觉不确定性。该方法采用细粒度文本调节器，对输入文本标记计算稀疏交叉注意力，从而调制预测的图像补丁特征。与基于掩码特征预测的I-JEPA相比，TC-JEPA能够学习到语义更丰富的视觉表征，解决了原有方法因视觉不确定性导致的语义学习不足问题。

多模态数据/训练论文/研究

推荐理由：Apple 这篇 TC-JEPA 把文本融入自监督视觉预训练，用稀疏交叉注意力减少预测不确定性，对多模态表征学习是个不错的思路补充，做视觉模型的值得一看。

02:30

Simon Willison 博客

67

借助Claude Mythos Preview，Mozilla在幕后强化Firefox安全

Mozilla利用Claude Mythos Preview模型，成功定位并修复了Firefox中的数百个安全漏洞。此前AI生成的漏洞报告多为低质量信息，但随着模型能力提升及技术方法改进，报告质量发生显著变化。修复的漏洞包括一个存在20年的XSLT漏洞和一个长达15年的`<legend>`元素漏洞。值得注意的是，许多自动化攻击尝试已被Firefox现有的深度防御机制拦截。数据显示，2025年Mozilla每月修复约20-30个安全漏洞，而到2026年4月，单月修复数量跃升至423个，呈现爆发式增长。

Anthropic安全/对齐开源生态

02:30

OpenAI：Alignment 研究博客（RSS）

精选71

研究强化学习中意外对思维链（CoT）评分的影响

研究发现，部分已发布的模型存在有限的意外对思维链（CoT）进行评分的情况。团队已修复受影响的奖励通路，并确认没有明确证据表明模型的可监控性因此下降。这表明当前强化学习训练中对CoT的意外评分影响有限，且修复后未对监控能力产生负面影响。

OpenAI安全/对齐推理论文/研究

推荐理由：OpenAI 对齐团队发现部分模型 CoT 意外被奖励信号污染，已修复且确认没有引发监控降级。这件事不大，但对研究 RLHF 可扩展监督的人来说值得一瞥，提醒奖励模型工程比想象中更易出错。

02:06

Hacker News 热门（buzzing.cc 中文翻译）

57

受人工智能推动导致的前所未有的短缺影响，主板销量目前正急剧下滑

受人工智能芯片需求激增影响，主板市场正经历严重供应短缺，导致销量急剧下滑。行业数据显示，主板销量已下降超过25%，主要因芯片制造商将产能优先转向利润更高的AI芯片，限制了消费级主板核心组件的供应。华硕预计2025年将少售出500万块主板，技嘉、微星和华擎等其他主要厂商的销量也预计将显著减少。这一趋势反映出AI产业对传统PC硬件供应链造成的挤压效应。

现象/趋势端侧

02:06

Hacker News 热门（buzzing.cc 中文翻译）

57

Chrome 撤回了关于"设备端 AI 不会将数据发送至 Google 服务器"的声明

Chrome浏览器近日从其帮助文档中撤回了关于“设备端AI不会将数据发送至Google服务器”的声明。这一修改表明，谷歌可能调整了其设备端AI功能的隐私数据处理政策，相关AI功能在本地处理数据时，或许仍存在将某些数据发送至服务器的可能性。该变动引发了技术社区的关注，在Hacker News上获得了超过100的讨论热度。

Google产品更新端侧

02:03

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

Introducing Trusted Contact in ChatGPT

ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时，该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预，为面临心理健康危机的用户提供额外安全保障。

OpenAI产品更新安全/对齐

推荐理由：ChatGPT 这次更新的不是模型能力，而是安全机制，引入可信联系人针对严重自残风险，对部分用户是真正的底线保障。