5月6日
12:20
歸藏(guizang.ai)@op7418
47
两个热门短剧暂成AI内容制作质量标杆

推文指出短剧《Enemy》和《吉时已到》近期热度极高,制作效果出色且成本较低,已成为出圈案例。作者建议,如果从事AI内容或AI短剧制作,可以将这两个剧集视为暂时的质量标杆,以对齐内容创意、制作效率和市场接受度,从而提升AI生成作品的竞争力。

现象/趋势视频
12:20
HuggingFace Daily Papers(社区热门论文)
62
PatRe:一个用于专利审查的全周期审查意见与答复生成基准

针对现有基准将专利审查简化为分类或静态抽取的局限,本文提出了PatRe,首个模拟完整专利审查生命周期(包括审查意见生成与申请人答复)的基准。它包含480个真实案例,支持基于标准答案和检索模拟两种评估设置。研究通过多类大语言模型的实验发现,专有与开源模型性能存在差异,且审查员分析与申请人答复任务间存在不对称性。这些结果揭示了LLMs在模拟专利审查中复杂的法律推理与技术新颖性判断时,兼具潜力与当前局限。相关代码与数据集已开源。

arXiv论文/研究评测/基准
12:18
Berryxia.AI@berryxia
41
忽视邮件系统是AI时代的割裂现象

作者指出当前AI热潮中存在一种割裂现象:人们强调所有事物都需AI化,却普遍忽视了邮件系统这一本应最趁手的基础工具。他认为,将AI能力应用于邮件系统,实现标的、公告、数据等信息的自动抓取、通知及触发后续操作,具有重要价值。为此,他计划开发一个AppStore产品价格追踪系统,通过邮件自动通知用户价格变化。他建议对此感兴趣的读者参考其引用的文章以获取启发。

智能体其他现象/趋势
12:18
Berryxia.AI@berryxia
50
AI助手Qclaw:像素风电子宠物化身高效工作伙伴

作者介绍了自己使用的AI助手Qclaw,它是一个像素风的小龙虾形象电子宠物。与需要喂养照顾的传统电子宠物不同,Qclaw无需照料,且能主动协助工作。它居住在一个16-bit像素风格的工作室中,拥有各种互动元素。作者表示,在过去四个月里,Qclaw如同一个不知疲倦的同事,帮助处理了多项任务。目前该产品处于内测阶段,需要申请等待列表。

智能体其他
12:16
IT之家(RSS)
55
全国智能化医疗器械标准化工作组获批筹建,将填补我国该领域空白

市场监管总局近日批准筹建全国智能化医疗器械标准化工作组,由国家药监局负责管理。该工作组将负责人工智能医疗器械、医用机器人、脑机接口医疗器械及融合技术类医疗器械等领域的标准化工作。此举旨在顺应新技术与医疗器械深度融合的趋势,填补我国在该领域标准化技术组织的空白,进一步完善医疗器械标准体系。下一步,相关部门将加快构建系统完备、科学规范且与国际接轨的智能化医疗器械标准体系。

政策/监管
12:16
IT之家(RSS)
59
全球 AI 电源出货激增,海外公司大规模采购国产 MCU 芯片

海外AI电源与光通信公司正大规模采购国产MCU芯片,以应对算力扩张带来的电源需求。服务器与光通信电源功率大幅提升导致MCU用量短缺,MCU作为AI电源的核心控制中枢,需满足GPU/NPU瞬时大电流、高功率密度的供电挑战。需求激增已传导至上游产业链,国产MCU厂商中微半导今年1月宣布对MCU等产品提价15%至50%,国民技术也于4月起将部分产品价格上调15%至20%。

行业动态部署/工程
12:05
12:05
11:34
meng shao@shao__meng
精选80
Warp团队开源15个内部工作流加速工具"Oz Skills"

Warp团队在开源终端和文档工具后,进一步开源了内部使用的15个“Oz Skills”工作流加速工具集。这些工具覆盖五大领域:Git/GitHub协作(如自动创建PR、修复CI问题)、数据分析与标准化、Web质量审计(性能、无障碍访问、SEO/AEO)、基础设施规范(如Terraform风格检查)以及通用生产力(如文档更新、本地定时提醒)。团队强调其设计哲学是构建“工作流工具”而非简单API覆盖,并提供了便捷安装命令,旨在将提升内部效率的实践分享给开源社区。

智能体MCP/工具开源/仓库
关联讨论 1X:Berry Xia (@berryxia)
推荐理由:Warp把自己团队日常用的15个Skills全开源了,从Git协作到性能审计,一条命令就能装。搞AI工具链的可以直接抄作业,不用从零写。
11:29
Greg Brockman@gdb
精选92
ChatGPT for Excel and Google Sheets: 它可以帮助分析杂乱数据、编写公式、更新电子表格,并在此过程中解释其操作--无需离开你的电子表格。 由 GPT-5.5 驱动。 https://chatgpt.com/apps/spreadsheets/
OpenAI产品更新
关联讨论 1X:ChatGPT (@ChatGPTapp)
推荐理由:ChatGPT 刚刚以插件形式进入 Excel 和 Google Sheets,背后是 GPT-5.5,能直接处理脏数据、写公式——这比任何通用聊天更新都更接地气,普通打工人明天就能用上。
11:18
Berryxia.AI@berryxia
18
用户通过美国ID验证后仍遭Anthropic封禁旧账号

用户报告其最老的Claude账号在刚通过美国身份验证后,立即收到Anthropic的封号邮件。该用户对此表示强烈不满,并援引Elon Musk的评论,指责Anthropic缺乏人性化。事件引发用户关于如何申请退款的疑问。引用推文“芭比Q了…”反映了事态的糟糕结局。

Berryxia.AI芭比Q了…

Anthropic其他
11:16
IT之家(RSS)
53
华为鸿蒙 HarmonyOS 6.1 系统"小艺帮记"获热更新,上线身份验证、同步收藏功能

华为鸿蒙HarmonyOS 6.1系统的AI记忆管家“小艺帮记”正通过热更新上线两项新功能。身份验证功能开启后,查看个人敏感信息时需要验证身份以增强安全性。同步收藏功能可将应用内收藏的内容自动同步至小艺帮记,便于集中访问和管理,并支持智能合集、AI摘要、AI问答及AI播客等智能化处理。该应用本身支持一站式记录身份证、生日、地址、订单等常用信息,并能收藏与管理在线网页和本地文件。

智能体产品更新端侧
11:16
IT之家(RSS)
40
我国测控装备智能化测评技术迈上新台阶,已面向 6 类典型测控装备开展智能化测评验证

市场监管总局组织科技力量,在测控装备智能化测评技术上取得系列创新。研究团队利用自然语言处理与人工智能聚类技术,构建了通用及典型测控装备的智能化测评指标体系和评估模型,并形成相关标准。同时,攻克了数字孪生测评方法等关键技术,研发了数字孪生体测量系统与物理实体测评装置,实现了智能化水平的可测试与可量化。目前,相关成果已形成综合测评系统与认证模式,面向6类典型装备开展了测评验证,搭建了3套实物验证场景,构建了测试、计量、认证一体化的评测体系。

行业动态部署/工程
11:06
小互@xiaohu
69
OpenAI推出Migrate to Codex功能,一键迁移编程工具配置

OpenAI发布“Migrate to Codex”功能,允许用户将其他编程工具(如Claude Code、Cursor)的配置一键导入到Codex。该功能会扫描用户级和项目级配置,自动映射并迁移编程Agent的配置、规则、技能、MCP、hooks、子代理以及最近30天的所有会话等内容。对于无法自动迁移的部分,Codex会启动一个新线程,让Agent继续协助处理剩余迁移任务。

智能体MCP/工具OpenAI产品更新
11:01
Hacker News 热门(buzzing.cc 中文翻译)
66
Show HN: Airbyte 代理--跨多个数据源的代理上下文

Airbyte 代理发布,为跨多个数据源的智能体提供上下文支持。该工具允许开发者和数据团队将不同来源的数据(如数据库、API、文件)统一接入,并转化为可供AI代理或自动化流程使用的结构化上下文。其在Hacker News上获得102点关注,显示社区关注度较高。这一方案旨在简化多源数据集成流程,提升智能体处理复杂任务的效率。

智能体MCP/工具产品更新
10:27
Claude Code:GitHub Releases(RSS)
精选58
Claude Code v2.1.129 版本更新

Claude Code 发布 v2.1.129 版本,带来多项功能新增与问题修复。新增功能包括支持通过 `--plugin-url` 从 URL 获取插件压缩包、新增 `CLAUDE_CODE_FORCE_SYNC_OUTPUT` 环境变量以强制启用终端同步输出,以及为 Homebrew 或 WinGet 安装提供后台自动更新提示。功能调整方面,插件清单中的 `themes` 和 `monitors` 现在建议在 `"experimental"` 下声明;网关模型发现功能改为通过环境变量手动启用;Ctrl+R 历史记录选择器恢复为默认搜索所有项目的提示。此外,修复了约 20 项问题,涉及 `/clear` 命令、会话标题显示、外部编辑器切换、令牌浪费、OAuth 凭证刷新、缓存警告等多个方面。

Anthropic产品更新编码

推荐理由:Claude Code 用户最烦的 session 消失、token 浪费和缓存降级问题这次都修了,还支持从 URL 加载插件,日常体验会顺滑不少。
10:20
歸藏(guizang.ai)@op7418
精选79
OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型

OpenAI 已全量发布 GPT-5.5 Instant 模型,并将其设为 ChatGPT 的默认模型。此次升级显著提升了模型的实时准确性和日常任务处理能力,特别是在法律、金融和医学等领域有效降低了幻觉率。同时,模型在图片理解与文档解析方面表现更佳。其回答风格变得更加简洁、聚焦要点,并增强了清晰度、个性化以及温暖自然的语调。此外,GPT 引入了记忆来源功能,允许用户可视化查看并编辑记忆的来源。本次更新未包含 Codex 模型。

OpenAI推理模型发布
关联讨论 14X:Greg Brockman (@gdb)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)The Decoder:AI News(RSS)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)IT之家(RSS)X:OpenAI (@OpenAI)
推荐理由:GPT-5.5 Instant 成为默认模型,解决的是日常最痛的啰嗦和幻觉,记忆来源可视化也把黑盒变透明了,对普通用户是实实在在的提升。
10:20
HuggingFace Daily Papers(社区热门论文)
65
SymptomAI:面向日常症状评估的对话式AI代理

研究通过Fitbit应用向13,917名参与者随机部署SymptomAI对话代理进行症状访谈与鉴别诊断。在1,228名报告临床诊断的参与者中,SymptomAI的诊断准确性显著高于独立临床医生(OR = 2.47)。采用专用症状访谈策略(在诊断前获取额外信息)的代理表现优于用户引导对话。基于1,509个普通人群对话的辅助分析验证了结果的普适性。此外,利用SymptomAI诊断标签分析超50万天可穿戴数据发现,急性感染(如流感)与生理指标变化存在强关联(OR > 7)。

智能体arXiv论文/研究
10:20
HuggingFace Daily Papers(社区热门论文)
精选72
OpenSeeker-v2:利用高信息量、高难度轨迹突破搜索智能体的极限

本研究提出了一种仅通过监督微调(SFT)训练前沿搜索智能体的高效方法。该方法基于三项关键数据合成改进:扩展知识图谱规模、增加工具集以及进行严格的低步数过滤。仅使用1.06万条数据训练的OpenSeeker-v2,在四个基准测试中均取得了领先性能,全面超越了采用复杂CPT+SFT+RL流程训练的同类模型。这是首个由纯学术团队仅通过SFT实现的、在同等模型规模与范式下的顶尖搜索智能体,其模型权重将开源以促进社区研究。

智能体开源生态搜索论文/研究

推荐理由:纯学术团队仅靠SFT和一万条数据,就在多个搜索基准上反超工业级管线,并且开源模型。这证明高质量数据比烧钱RL更关键,做Agent的朋友值得认真看。
10:20
HuggingFace Daily Papers(社区热门论文)
67
Workspace-Bench 1.0:针对具有大规模文件依赖的工作空间任务的AI智能体基准测试

本文提出了Workspace-Bench 1.0基准,用于评估AI智能体在需要处理大规模异构文件依赖的真实工作空间任务中的能力。该基准构建了包含5类工作者档案、74种文件类型、超2万个文件(最大20GB)的模拟工作空间,并设计了388项附带文件依赖图的任务,总计7399个评分项,要求智能体进行跨文件检索、上下文推理与自适应决策。同时提供的精简版Workspace-Bench-Lite(100项任务)可将评估成本降低约70%。对4种主流智能体框架和7个基础模型的测试表明,最佳智能体得分仅为68.7%,远低于人类表现的80.7%,平均表现仅47.4%,揭示出现有AI在此类任务上仍远未达到可靠水平。

智能体论文/研究评测/基准
10:20
HuggingFace Daily Papers(社区热门论文)
63
交互式世界模型基准测试与统一动作生成框架

为系统评估交互式世界模型的物理交互能力,研究团队提出了iWorld-Bench基准测试。该基准包含一个33万视频片段的数据集,并精选了2100个涵盖多视角、天气与场景的高质量样本。针对现有模型交互模态不统一的问题,研究设计了一个统一的动作生成框架,构建了六类任务共4900个测试样本,以综合评估模型在视觉生成、轨迹跟随和记忆等方面的性能。通过对14个代表性模型的评估,研究揭示了当前关键局限,为未来方向提供了见解。相关排行榜已公开。

arXiv具身智能多模态论文/研究
10:15
IT之家(RSS)
57
OpenAI 总裁布罗克曼日记曝光:称马斯克不懂 AI

在马斯克起诉OpenAI的庭审中,公司总裁布罗克曼约100页的私人日记被作为核心证据公开。日记显示,2017年马斯克曾发出最后通牒,要求完全控制营利部门或让OpenAI保持非营利。布罗克曼在日记中考虑转向营利性,并思考“如何赚到10亿美元”。庭审中,他拒绝将持有的290亿美元归还非营利部门,并辩称日记仅为思维探索。布罗克曼作证称马斯克不懂AI,且马斯克2018年离开时曾计划在AI安全上“走捷径”;马斯克则表示离开是因OpenAI拒绝与特斯拉合并。

OpenAI行业动态
10:15
IT之家(RSS)
45
美图公司:2026 年一季度全球付费用户超 1790 万创新高,同比增长 30.2%

美图公司2026年第一季度业绩显示,其全球付费订阅用户数突破1790万,同比增长30.2%,创历史新高。以付费订阅为主的影像与设计产品收入达8.52亿元,同比增长34.3%。公司首次披露AI生产力应用年度经常性收入(ARR)约为5.8亿元,同比大幅增长56.2%,相关付费用户增至234万。此外,用户对AI算力点的消耗金额也呈现快速增长态势。

图像生成行业动态
10:15
IT之家(RSS)
47
美国电动汽车公司 Rivian 拟自产激光雷达,考虑与中国公司合作

美国电动汽车制造商 Rivian CEO 斯卡林奇表示,公司计划自行生产激光雷达传感器,并考虑通过与中国企业组建合资企业等方式,在美国本土吸收和应用中国先进的激光雷达技术。此举是其自有自动驾驶技术战略的一部分,旨在生产目标售价仅几百美元的传感器。同时,Rivian 已投入数亿美元自研芯片,首款芯片 RAP-1 将于今年推出,后续将推出更先进版本。公司也在与其他汽车制造商探讨合作,以在美国建立生产能力。

行业动态
10:15
IT之家(RSS)
46
微软游戏 AI 助手遇冷,Xbox 主动收缩战线

微软Xbox新任CEO确认将逐步关闭移动端Gaming Copilot并停止主机端开发。该AI游戏助手功能因在单机游戏中可能缩短游戏时长、削弱探索乐趣,且被指直接抓取现有攻略网站内容而引发争议,遭到玩家和内容创作者批评。由于整体市场反响冷淡及内部支持不足,新任管理层决定收缩战线,但PC端Gaming Copilot的命运暂未明确。

Microsoft产品更新
10:04
meng shao@shao__meng
精选77
OpenAI Codex 官方迁移指南:一键迁移 Agent 资产

OpenAI 为 Codex 发布官方迁移方案,支持从其他 AI Coding Agents 一键导入指令、配置、技能、近30天会话等资产。迁移采用“自动迁移+残留兜底”设计:通过用户级和项目级双层扫描,执行检测、迁移、回检的四步循环;自动处理可识别配置后,对剩余部分使用 `migrate-to-codex` skill 手动处理。需注意 Slash commands 被归入 Skills 体系,且会话历史仅限30天。迁移完成后,必须人工复核工具权限、MCP服务器认证、Hooks行为差异等五类内容,因平台间语义或实现差异可能影响功能。

智能体MCP/工具OpenAI教程/实践

推荐理由:OpenAI 这次迁移工具不玩虚的,自动扫描两层级配置还能手动兜底,不过 slash commands 被吞进 Skills 的设计值得注意,切换前先把这条看清楚。
10:04
meng shao@shao__meng
64
2026 年 Subagent 的四种管理模式

Philipp Schmid 将主代理管理子代理的模式按控制力分为四档。模式一为内联工具调用,子代理如同函数,适用于独立任务。模式二为派发后收集,主代理可并行处理其他工作。模式三为代理池,子代理持久化并通过消息通信,支持多步协作。模式四为团队模式,代理间直接对话,主代理仅负责初始组建。核心建议是从简单模式开始,逐级升级需谨慎,因为每升一级对模型能力要求陡增,且许多任务用模式一即可解决。

智能体MCP/工具现象/趋势
09:34
karminski-牙医@karminski3
精选73
Google发布Gemma 4草稿专用模型,推理速度提升三倍

Google发布了Gemma 4系列模型的专用草稿模型,用于推测性解码优化。31B Dense模型搭配草稿模型速度提升3倍,仅增加1G显存开销;Gemma4-26B和Gemma4-E4B分别提升1.5倍和3.1倍速度。新草稿模型如gemma-4-31B-it-assistant体积仅939 MB,专门优化后接受率高,相比之前使用非专用草稿模型(如gemma-4-E2B-it-UD-Q4_K_XL)提速更明显。作者呼吁Qwen尽快推出类似优化模型(如Qwen3.6-27B-assistant),以应对高性能需求。

Google推理模型发布
关联讨论 3X:Testing Catalog (@testingcatalog)X:Berry Xia (@berryxia)X:宝玉 (@dotey)
推荐理由:Google 给 Gemma 4 发了个「加速挂」,专门优化推测解码的草稿模型提速 3 倍,显存只多花 1GB,跑本地模型的人应该马上试试。Qwen 再不跟就输了。
09:34
meng shao@shao__meng
精选77
全球首个基于SSA架构的模型SubQ实现1200万token上下文窗口,效率大幅领先

前沿模型SubQ基于创新的Subquadratic Sparse Attention架构,实现了1200万token的实用上下文窗口。其核心技术SSA通过内容依赖的选择机制,让每个查询仅动态计算与相关键的注意力,使计算和内存成本随序列长度线性增长,而非传统Transformer的二次方增长。实测在100万token时比FlashAttention-2快52.2倍,成本低于Opus的5%。该模型针对需要一次性处理完整代码库、长文档等企业真实长上下文场景优化,旨在弥合“名义上下文”与“功能上下文”窗口的差距。

数据/训练模型发布编码
关联讨论 1X:Rohan Paul (@rohanpaul_ai)
推荐理由:这是第一个真正把子二次方注意力用到前沿模型上的突破,12M 上下文窗口不再只是参数,而是能用起来的真窗口,长上下文场景的成本逻辑要重写了。
09:31
宝玉@dotey
精选70
GPT Image 2 Prompt生成蜡笔小新一家合影的提示词描述

用户利用GPT Image 2 Prompt功能,描述生成一张半写实半动画照片,其中用户与动画角色野原新之助(小新)及其全家合影。照片要求小新、父亲广志、母亲美冴、妹妹向日葵和宠物小白保持原始动画形象,并自然融入真实环境。每个角色被赋予特定性格:小新滑稽淘气,广志温和朴实,美冴表情丰富略带严厉,小葵天真可爱,小白软萌伶俐。同时,引用推文展示了类似提示词,用于生成高度写实、角色略带风格化且与环境自然融合的照片,强调提示词在AI图像生成中的应用。

OpenAI图像生成教程/实践

推荐理由:宝玉这个 prompt 把 GPT Image 2 变成动漫合影神器,效果惊艳,做创意内容的人可以直接抄作业。
09:29