5月9日
10:29
IT之家(RSS)
34
华为 Sound X5 智能音箱开售:全新悦彰音质、升级 AI 大模型,2199~2499 元

华为Sound X5智能音箱正式开售,定价2199至2499元。新品主打全新“悦彰音质”,采用八单元三分频设计,支持36Hz低音。其核心升级在于搭载鸿蒙AI大模型,具备模糊语义理解和拟人连续对话能力。音箱支持鸿蒙智联全场景互联,提供智慧助眠、一碰传音、挥手控全屋等功能,并升级了可随声变化的幻彩灯效。共有鎏金、玄黑、云白三款配色。

产品更新语音
10:29
IT之家(RSS)
49
OpenAI 将补齐 Codex 跨端连接拼图,安卓版 ChatGPT 酝酿远程接管功能

科技媒体通过挖掘安卓版ChatGPT代码,发现OpenAI正为Codex开发远程控制功能。用户未来可在手机端连接同一账号的桌面版Codex,恢复或重连远程会话,实现离开工位后仍能查看任务状态、继续下达指令或处理卡住的开发流程。代码显示该功能包含设备发现、会话恢复、异常重连及版本校验,远程界面保留了完整的指令体系。此举旨在补齐Codex此前相比已具备跨设备接入能力的Claude的短板。

智能体OpenAI产品更新编码
10:29
IT之家(RSS)
23
微星神影 16 Max 2026 16 英寸游戏本开启预约:12999 元起,Ultra 9 290HX Plus/285HX 处理器

微星神影16 Max 2026游戏本已开启预约,起售价12999元。新品提供英特尔酷睿Ultra 9 290HX Plus和285HX两款处理器选项,分别搭配RTX 5060或RTX 5070显卡。其中,Ultra 9 290HX Plus版本拥有24核心24线程,睿频可达5.5GHz,CPU功耗85W,开启超增压模式后整机性能释放可达200W。笔记本配备16英寸QHD+屏幕,支持240Hz刷新率、500nits峰值亮度和100% DCI-P3色域。其他配置包括16GB DDR5内存、1TB PCIe Gen4 SSD、双显三模切换、4出风口散热设计、80Whr电池以及140W PD快充功能。

其他
09:29
IT之家(RSS)
19
追觅 Aurora Lux 系列手机展示:29 种奢华设计

追觅在旧金山举办的Dreame Next 2026活动上,展示了多款概念产品,包括模块化手机、奢华设计手机、智能穿戴设备及概念电动车。其中,Aurora Nex LS1模块化手机可外接115mm长焦镜头、运动相机、卫星通信等专用模块。另一款Aurora Nex手机主打奢华,共提供29种不同设计,如蛇纹机身、镶宝石相机装饰环以及模拟时钟镜头区域等独特款式。苹果联合创始人史蒂夫·沃兹尼亚克等名人出席了此次活动。

行业动态
09:29
IT之家(RSS)
66
DeepSeek 大范围开放"识图模式",正式跨入图文交互时代

DeepSeek已广泛开放其“识图模式”供用户体验。该功能具备深度图片理解能力,不仅能识别文物、解答空间推理题、理解网络梗图,还能将截图中的代码或UI界面还原为可交互的HTML代码。其核心技术“以视觉原语思考”框架,通过融入点、边界框等视觉元素提升逻辑准确性,且处理效率高,单图token消耗远低于主流模型。目前该模式仍处内测,存在知识库更新滞后、处理反直觉图形不稳定等不足,且暂不支持图像生成或视频理解。

DeepSeek产品更新多模态
08:47
Claude Code:GitHub Releases(RSS)
35
v2.1.137

本次发布的 v2.1.137 版本主要包含一项错误修复。该版本解决了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题。此次更新专注于提升特定平台下的扩展兼容性与稳定性。

Anthropic产品更新部署/工程
08:29
IT之家(RSS)
45
微软 Edge 浏览器 148 稳定版发布:工作区迁移 V2,推进 Copilot 新标签页

微软发布 Edge 148 稳定版,核心更新是将工作区迁移至 V2 架构,数据从 OneDrive 转移至 Edge Sync 服务,并移除了协作功能,新建工作区仅本地保存。AI 方面,上线了整合搜索、聊天与个性化内容的 Copilot 新标签页,并更新了侧边栏 Copilot Chat 容器页。此外,密码自动填充功能得到改进,新增对护照、驾照等证件类型的支持。

Microsoft产品更新搜索
07:29
IT之家(RSS)
53
新紫光发布"紫弦"三维化近存计算架构:存储带宽可达 30TB/s

新紫光集团在2026创新峰会上发布了“紫弦”三维化近存计算架构。该架构以3D DRAM为核心,采用首创的3.5D异质异构集成方案,存储带宽高达30TB/s,相比行业最新的HBM4在带宽与容量上具有优势,并可基于国内供应链量产。在PNM近存计算模式下,访存延迟最多可降低至1/18,模拟仿真显示其词元吞吐率较英伟达B200系列高出1.5至2倍以上。峰会上,其旗下公司还分别发布了商业航天高可靠集成电路解决方案、国产算力互联方案以及能将芯片设计效率大幅提升的“紫灵”智能体。

产品更新推理
07:29
IT之家(RSS)
50
苹果 CarPlay 接入马斯克的 Grok 模型,在车内和 AI 自然聊天

苹果 CarPlay 在 iOS 26.4 系统更新中接入了马斯克旗下的 Grok AI 模型,用户通过 iPhone 连接车辆即可在车机中控屏进行语音对话。继 ChatGPT 和 Perplexity 之后,Grok 成为 CarPlay 生态的新成员,交互以语音为核心,支持查看最近对话、新建会话,并新增临时静音和切换语音功能,提升驾驶中的使用便利性。

xAI产品更新语音
03:40
Cursor Blog
精选67
Bugbot团队与个人计划更新

Bugbot宣布将团队与个人计划从每月每席位40美元的订阅制改为按使用量计费。现有用户的变化将于2026年6月5日后的下一个账单周期开始生效,例如2026年5月购买的年订阅将在2027年5月切换。团队按需消费计费,个人按包含使用量计费,平均每次运行成本约为1.00-1.50美元,具体取决于PR大小和复杂度。同时,用户现在可配置Bugbot审查PR的工作强度:默认强度下80%被识别的问题在合并时得到解决;高强度模式下可多发现35%的问题,解决率仍保持在80%。现有客户可在Cursor面板中提前切换至用量计费。

智能体产品更新编码

推荐理由:Cursor Bugbot 这次改用量计费对个人和小团队更友好,一次审查平均只要 1-1.5 美元,而且高努力模式能多抓 35% 的 bug,代码审查工具可能要变天了。
02:47
Claude Code:GitHub Releases(RSS)
50
v2.1.136

Claude发布了v2.1.136版本更新,主要包含一系列错误修复与功能改进。新增了`CLAUDE_CODE_ENABLE_FEEDBACK_SURVEY_FOR_OTEL`配置以重新启用企业质量调查,并引入了`settings.autoMode.hard_deny`规则用于无条件阻止操作。关键修复包括:解决了MCP服务器在VS Code等扩展中执行`/clear`后静默消失的问题;修复了罕见的并发写入导致OAuth令牌覆盖并引发重复登录的故障;修正了多个远程MCP服务器并发刷新时令牌丢失,导致需要每日重新认证的问题;修复了扩展思考后因工具调用产生编辑块而导致的API 400错误。此外,还针对WSL2图像粘贴、计划模式文件写入、插件管理、界面显示一致性、终端输出、文件选择器等超过40项问题进行了修复和优化,提升了整体稳定性和用户体验。

Anthropic产品更新编码
5月8日
20:22
IT之家(RSS)
5
华硕推出天选 TX75 磁轴游戏键盘:8KHz 回报率、TTC 烈焰黄万磁王轴,899 元

华硕发布天选TX75磁轴游戏键盘,售价899元。键盘主打8KHz高回报率,采用TTC烈焰黄万磁王轴,并具备0.01mm RT精度。采用75%紧凑配列,配备“天选战斗旋钮”用于快捷调节音量与模式切换,外观为魔幻青配色并带有灯带。键盘采用Gasket结构、PBT双色键帽,内置10000mAh电池,续航最高可达10天。

其他
20:22
IT之家(RSS)
27
上汽奥迪 AUDI E7X 车型开启预售:宁德时代 109 度大电池,28.98 万元起

上汽奥迪AUDI E7X车型正式开启预售,起售价28.98万元。新车搭载宁德时代109度大电池,CLTC续航里程达751公里,并标配900V高压平台,充电10分钟可补能429公里。车身尺寸为5049/1997/1710毫米,轴距3060毫米。性能上,quattro版零百加速为3.90秒。智能配置方面,将搭载Momenta R7强化学习世界模型辅助驾驶系统,并首次应用行业超拟人生成式全情感化语音“奥迪助手2.0”。内饰配备59英寸中控屏、21.4英寸后排屏及“智慧客厅”等豪华科技功能。

其他
19:20
IT之家(RSS)
11
影石 Insta360 无线麦克风 Mic Pro 更多谍照曝光,配彩色墨水屏面板支持展示自定义内容

影石Insta360 Mic Pro无线麦克风谍照曝光,其最大亮点在于麦克风单元配备了彩色墨水屏,支持创作者自定义显示数字Logo、表情符号或图像,便于视频拍摄时进行品牌展示与个性化表达。音频方面,该产品内置三麦克风阵列和专用AI处理器,能有效降噪并提升复杂环境下的录音质量,确保人声清晰。连接上延续直连Insta360相机的功能,无需接收器即可传输音频,同时发射器支持机内录音,可作为独立录音设备使用。

产品更新
16:16
IT之家(RSS)
27
海信 Vidda G11 智能音频眼镜发布:6mic 空间拾音、待机 12 天,首发价 1299 元起

海信Vidda G11智能音频眼镜正式发布,首发价1299元起。产品主打轻量化设计,提供行业最轻的26.5克钛镜框和最细5.3毫米镜腿。音频方面首发搭载6麦克风空间拾音系统,配合自研AI算法,支持5米/秒抗风噪。续航表现突出,标称待机时间长达12天,实用续航47.2小时,并支持10分钟充电50%的快充功能。

产品更新语音
16:16
IT之家(RSS)
42
铭凡 M2 迷你主机实物厦门现身:Ultra 7 356H + DDR5

铭凡在厦门发布会上展示了新款迷你主机M2。该机型属于Elite Mini系列,搭载英特尔酷睿Ultra 7 356H处理器,配备2个DDR5 SO-DIMM插槽,最高支持128GB系统内存,并具备2个M.2 2280 NVMe SSD盘位。其支持Wi-Fi 7,外部接口丰富,包括正面2个USB-A 10Gbps和1个USB-C 40Gbps,背面另有多个USB、HDMI 2.1、DisplayPort 1.4以及2个2.5GbE网口。该设备宣称支持Qwen-35B-A3B、GPT-OSS 20B等大模型的本地运行。

产品更新推理端侧
16:16
IT之家(RSS)
54
阿里千问 AI 眼镜 S1 获升级:引入主动服务能力、新增支持信息空间 3D 显示

阿里千问AI眼镜S1迎来重要升级,核心是引入主动服务能力。眼镜能结合时间、地点和环境,主动提供如“出门带伞”、“抬头活动”等提醒。本月将上线打车、闪购、规划行程、购票等生活AI服务,减少对手机的依赖。同时,产品新增“空间3D显示”能力,通过双光机与双目立体成像技术,使信息通知、导航等内容呈现具有纵深感的立体视觉效果,显示更自然真实。

产品更新多模态端侧
16:16
IT之家(RSS)
48
瑞芯微推出 8nm 中阶 AIoT 芯片 RK3572:性能翻倍、功耗减半

瑞芯微正式发布面向中阶AIoT市场的8nm处理器RK3572。相比上一代同定位平台,其性能提升超过100%(性能翻倍),典型场景功耗降低50%以上(功耗减半),大部分应用场景的最小系统功耗低于1W。芯片采用2×Cortex-A73 + 6×Cortex-A53的CPU架构,集成Mali-G310 GPU和算力达4TOPS的NPU。它支持LPDDR4(x)/5(x)内存及多种存储接口,搭载12M ISP,支持4K@60fps+2K@60fps双屏异显,并提供了丰富的工业控制接口。

产品更新端侧
15:16
IT之家(RSS)
26
迎广科梵特 covalent 工作站全塔台式机箱开启预约:支持 EEB / EATX 主板,999 元

迎广科梵特 covalent 工作站全塔台式机箱已在京东开启预约,售价999元。这款机箱专为AI与高性能计算设计,采用全塔结构,提供钢板或强化玻璃侧板选项。它支持EEB和EATX主板,可容纳多张大型显卡,兼容420mm一体式水冷,预装4颗CV140风扇。存储方面支持安装3颗3.5英寸或6颗2.5英寸硬盘,并内置风扇集线器、快拆侧板等模块化设计,满足高扩充与散热需求。

其他部署/工程
15:16
IT之家(RSS)
53
铭凡发布 S5:全球首款无风扇 5 盘位全闪 AI NAS

铭凡发布了全球首款无风扇5盘位全闪AI NAS产品S5。该产品采用第三代英特尔酷睿处理器,通过CNC铝合金机身、处理器热管及厚实的散热鳍片实现完全被动散热。其最高配备16GB LPDDR5X-7200内存,提供5个PCIe Gen4 M.2 SSD盘位,最大并发速度达10.8GB/s。外部接口丰富,包括10GbE和2.5GbE网口、USB-A、HDMI 2.1、双雷电4接口,并集成了Wi-Fi 7无线模块。

产品更新端侧
15:16
IT之家(RSS)
55
铭凡推出全闪 AI NAS S7:可容纳 7 块 PCIe 4.0 SSD、双雷电 4 接口

铭凡发布了面向极客的高端全闪AI NAS S7。该产品基于MS-03迷你主机工作站打造,搭载第三代英特尔酷睿Ultra 386H处理器,最大亮点是可容纳7块PCIe 4.0 NVMe SSD(包括4块x2和3块x4规格),并配备NAS状态副屏。接口配置豪华,提供2个40Gbps USB4(雷电4)、2个10Gbps SFP+光口、1个10Gbps RJ45和1个2.5Gbps vPro RJ45网络接口。设备运行铭凡自有操作系统MinisCloud。

产品更新端侧
15:16
IT之家(RSS)
29
荣耀MagicOS五月更新上线:新增支持 AirPods 互联、文件夹自动命名等

荣耀MagicOS五月更新正式推送,覆盖多款机型。核心更新包括:新增对AirPods的互联支持,可实现快速连接与电量查看;新增文件夹自动命名、动态壁纸通透模式及AI记账功能。YOYO助手升级AI情报官、过敏提醒等功能。系统层面优化了多音量面板动效,新增充电分离、截屏纯净模式、AI变声及游戏脚步声增强。互联生态扩展至长城魏牌V9X车机一碰投屏及荣耀视频一碰传。此外,相机构图引导、图库AI电影追色等多项体验也得到更新。

产品更新其他端侧
14:16
IT之家(RSS)
60
Anthropic 发布 Claude for Microsoft 365,可跨 Office 文档工作与同步

Anthropic正式推出适用于Excel、PowerPoint和Word的Claude,并面向所有付费用户公测Outlook版。该AI助手能跨Microsoft 365应用协同工作,如在Outlook中分类邮件并起草回复,在Word处理附件,在Excel分析数据,再于PowerPoint生成演示文稿。所有操作无需用户重复解释上下文,更改可在并排打开的文档间自动同步,对话记录随文件持久保存。付费用户现可通过Microsoft管理中心部署使用。

智能体Anthropic产品更新
14:16
IT之家(RSS)
精选72
400 万周活的 Codex 推出 Chrome 扩展,OpenAI 把 AI 带进浏览器工作流

OpenAI为Chrome浏览器推出Codex扩展,将AI深度集成至浏览器工作流。该扩展允许Codex在浏览器内直接执行任务,如测试Web应用、读取多标签页上下文及调用开发者工具,旨在处理依赖实时页面状态和多标签信息的复杂连续工作。OpenAI强调扩展不会接管浏览器控制权,用户保有完全控制。目前Codex周活用户已超400万,较年初增长8倍,其应用正从代码辅助扩展至更广泛的日常浏览器任务。

智能体OpenAI产品更新编码
关联讨论 11X:OpenAI (@OpenAI)X:OpenAI Developers (@OpenAIDevs)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)X:Vista (@vista8)
推荐理由:Codex把AI编程能力直接塞进Chrome,不是小步更新,是把浏览器变成了你的开发环境。400万周活证明需求真实存在,做前端和测试的可以立刻用起来。
14:16
IT之家(RSS)
48
新华三发布面向万亿级大模型的全系列超节点 UniPoD S80000

在NAVIGATE 2026峰会上,新华三发布了面向万亿级大模型的全系列超节点UniPoD S80000,覆盖32卡至1024卡,最高可扩展至16384卡,提供一站式智算解决方案。同时,围绕“AI in ALL”战略,推出了一系列全栈新品,包括:高密全液冷整机S90000,实现1U 6CPU业界最高密度;单芯片102.4T智算交换机,大幅提升带宽与利用率;AI原生存储X20000系列,单节点带宽达200GB/s;新一代AI智能云,支持超大规模纳管;业界最高性能AI防火墙M9000-X;以及凝聚了23年运维经验的灵犀运维智能体。

产品更新部署/工程
13:16
IT之家(RSS)
58
中国移动发布 MoMA 平台:单位 Token 成本压降 30%,接入超 300 款 AI 模型

中国移动发布移动模型服务平台MoMA,接入超过300款业界主流AI模型,包括自研“九天”及DeepSeek、通义千问等。平台基于国产算力部署自研推理引擎,通过智能路由与资源调度,实现单位Token成本降低约30%,资源占用率下降50%以上。其智能路由引擎支持成本、效果、均衡三种优先策略,并能实现故障秒级切换。平台还提供“机密模型”服务,通过硬件隔离技术保障政务、金融等高安全需求场景的数据安全。

产品更新推理部署/工程
12:16
IT之家(RSS)
50
三星被曝开发 AI 驾驶助手:精准追踪刹车 / 转弯等,周报推送个性化建议

据科技媒体挖掘三星One UI 9早期固件代码,发现其正在开发一款名为Driving Insights的AI驾驶助手应用。该应用利用手机传感器和AI算法,精准追踪用户的加速、转弯、刹车等驾驶行为数据,旨在帮助用户了解并改善驾驶习惯。应用支持连接车载蓝牙后自动记录行程,并可生成个性化驾驶周报,通过三星Now Brief推送。周报会基于数据分析提供反馈,如评价驾驶风格保守或动态,并在长途驾驶后提醒用户注意休息,防止疲劳驾驶。

产品更新多模态端侧
12:16
IT之家(RSS)
9
索尼 Xperia 1 VIII 手机再曝:4 种颜色,有望 5 月 20 日发布

索尼Xperia 1 VIII手机最新渲染图曝光,确认将采用全新方形相机模组,并提供黑曜石、董青石、石榴红及天然金四种配色。新机预计于2026年5月20日发布。核心配置包括6.5英寸120Hz OLED屏幕、高通第五代骁龙8至尊版芯片及12GB内存,并保留3.5mm耳机孔与双卡支持。影像系统方面,长焦镜头可能从上一代的连续光学变焦改为传统的4800万像素潜望式镜头,支持固定的3倍光学变焦。

其他
11:16
IT之家(RSS)
48
电动车室内充电风险智能识别系统上线:零硬件改造,依托现有电表

在市场监管总局指导下,云南电网成功研发“电动车室内充电风险智能识别系统”。该系统无需硬件改造,依托现有智能电表的15分钟负荷曲线数据,通过人工智能算法识别电动自行车充电的独特“电化学指纹”,实现对高层建筑内违规入户充电行为的精准识别与预警。系统构建了大数据驱动的“技术+管理”协同治理模式,可将预警信息推送至电网、物业、社区等多方,形成闭环管理。目前已在50余个居民区试运行,识别准确率达88%。

产品更新部署/工程
09:16
IT之家(RSS)
48
AMD 时隔四年重推 PCIe AIC 形态 Instinct 显卡:MI350P 规模砍半

AMD近日发布了四年来首款采用PCIe AIC形态的Instinct MI350P加速卡,主要面向现有数据中心基础设施升级。该卡采用新封装,规格相较MI350X大幅缩减:XCD芯片数量减半至4个,HBM3E内存降至4堆栈144GB,性能下降约50%,晶体管数量减少约60%。产品采用双槽全高全长设计,最大功耗600W,支持无风扇被动散热。

产品更新部署/工程
09:16
IT之家(RSS)
44
瑞莎预热高通平台飞牛 NAS:6 盘位全闪高性能 / 4 盘位主流双选择

瑞莎在2026高通AI开发者日前夕,预热了两款基于高通硬件平台的飞牛fnOS NAS新品。其中,DragonStation定位高性能全闪存产品,搭载具备“超大核”CPU的Arm SoC,提供6个M.2 SSD盘位,支持10Gb网络,并能通过内置加速卡本地运行120B参数的AI模型。另一款DragonBay面向主流用户,提供4个存储位,其内部结构设计留有后续扩展空间。两款新品将在本月末于深圳举行的活动中正式亮相。

产品更新推理端侧
08:30
Claude Code:GitHub Releases(RSS)
精选69
Claude v2.1.133 版本更新

Claude 发布 v2.1.133 版本,新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础,引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径,并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上,钩子现在可接收活动努力级别信息,Bash 工具命令可读取相应环境变量。此外,改进了焦点模式行为,并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题,包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。`claude --help` 现已列出远程控制选项,VSCode 扩展也修复了相关错误。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 这个版本修了一堆让人抓狂的 bug,并行会话掉认证、网络驱动器权限、子代理找不到 skill 都解决了,重度用户应该尽快升级。
08:16
IT之家(RSS)
50
iOS 27 版苹果备忘录 App 前瞻:接入 AI 版 Siri 简化内容收集、高效梳理信息

据报道,iOS 27系统将对Siri进行彻底重构,其底层将基于谷歌Gemini构建,交互模式将从指令式转变为类似ChatGPT的对话模式。新版Siri将与备忘录应用深度整合,用户可通过“把这个加到新备忘录”等语音指令,直接将AI生成的内容自动、完整地保存至备忘录,解决手动复制粘贴导致的流程繁琐和格式错乱问题。此外,Siri还能利用大语言模型能力,高效梳理信息并创建特定主题的备忘录。

产品更新语音
07:16
IT之家(RSS)
47
OpenAI 为 ChatGPT 推出"可信联系人",应对 AI 对话中的自残风险

OpenAI为ChatGPT推出“可信联系人”功能,以应对对话中的自残风险。当系统检测到成年用户对话涉及相关内容时,会鼓励用户联系他人,并自动向其预设的联系人发送简短的电子邮件、短信或推送通知提醒,以促进沟通。通知不包含具体对话细节以保护隐私。该功能采用自动审核与人工复核结合,触发提醒的对话会交由人工安全团队处理,官方承诺对此类通知进行人工审核并力求在一小时内完成。此前,OpenAI曾因被指控鼓励用户自杀而面临诉讼。

OpenAI产品更新安全/对齐
05:43
OpenRouter:Announcements(RSS)
精选73
为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。

智能体MCP/工具产品更新

推荐理由:让任何模型都能用统一接口做联网搜索和抓取,做 agent 的同学不用再为每个模型单独配工具了,在 OpenRouter 上搭产品的实用性直接拉高。
05:29
Anthropic:Research(发表成果 · 网页)
精选73
捐赠开源对齐工具 Petri

2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。

Anthropic安全/对齐开源生态

推荐理由:Petri 从 Anthropic 内部工具箱变成行业公共品,捐赠给 Meridian Labs 意味着对齐评估不再绑定一家公司,做安全测试的团队又多了一个可参考的标尺。
04:30
Simon Willison 博客
28
llm-gemini 0.31

llm-gemini 0.31 版本发布,其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态,转为正式可用。该模型自三月份预览以来,其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。

Google产品更新开源生态
03:06
Hacker News 热门(buzzing.cc 中文翻译)
精选74
DeepSeek 4:适用于 Metal 的 Flash 本地推理引擎

DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型,实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能,降低了延迟与内存占用。该项目已在 GitHub 开源,并在 Hacker News 上获得了关注。

DeepSeek开源/仓库推理端侧

推荐理由:antirez 写的引擎让 DeepSeek 4 在 Mac 本地跑出近乎 Flash 的速度,而且代码极其精简,做本地推理的开发者应该立刻克隆下来跑一下。
03:04
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选71
在ChatGPT中测试广告

OpenAI开始在ChatGPT中测试广告功能,旨在支持其免费服务的持续运营。测试强调广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施,并确保用户对广告体验拥有控制权。

OpenAI产品更新

推荐理由:ChatGPT免费版要开始看广告了,虽然官方承诺回答不受影响且隐私保护,但这是AI商业化的大实验,所有免费用户都会盯着会不会掺水。
02:41
Claude:Blog(网页)
精选85
在Excel、PowerPoint、Word和Outlook中与Claude协同工作

Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文,实现跨文件智能协作。例如,在Outlook中分类邮件并起草回复,在Excel中调整数据后,PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署,并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问,Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。

Anthropic产品更新
关联讨论 2X:Claude (@claudeai)X:宝玉 (@dotey)
推荐理由:Claude 这次 Office 集成不是普通插件,它让 Excel、PPT、Word、Outlook 共享同一对话上下文,改一个数其余自动更新,生产力提升是实打实的,企业用户值得立即部署。