4月27日
14:19
IT之家(RSS)
52
OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线

OpenAI开源了15亿参数的PII脱敏模型Privacy Filter,采用混合专家设计,每次仅激活约5000万参数,可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息,在基准测试中F1分数达97.43%。该模型作为本地预过滤层,帮助用户在文本发送至云端AI前脱敏数据,但高敏感场景仍需结合人工审核。

OpenAI开源生态模型发布部署/工程
14:19
IT之家(RSS)
44
紫光展锐、华阳通用携手发布 A8880 芯片 AI 座舱平台

紫光展锐与华阳通用在北京车展联合发布搭载旗舰芯片A8880的新一代AI座舱平台。A8880芯片采用Arm全大核架构,其CPU性能较上代提升3倍,图形性能提升6倍,NPU专用AI算力提升8倍,音频DSP性能也提升8倍。此次合作实现了从芯片底层到整车量产的全链路闭环,该平台凭借强大算力与原生架构,为本地大模型的高效运行提供了核心支撑。

产品更新端侧
13:18
IT之家(RSS)
45
消息称小米新一代自研芯片 + Ai 大模型 + OS 大会师终端产品排期已定,比网传晚一点

小米玄戒O1芯片已出货超一百万颗,后续将应用于小米汽车。博主透露,新一代自研芯片、AI大模型与自研操作系统将在一款终端产品上实现“大会师”,产品排期已定但比网传稍晚。雷军此前表示,这一里程碑预计在2026年达成,届时小米将完成手机、平板、汽车及穿戴设备的全生态芯片布局。

端侧行业动态
13:18
IT之家(RSS)
46
腾讯 QClaw 宣布升级 v0.2.14 版本:率先支持 Hermes,接入 DeepSeek-V4-Pro 与混元 Hy3 preview 模型

腾讯云QClaw发布v0.2.14版本,迎来最大规模更新。新版本率先支持Hermes框架,允许单一应用同时运行两种Agent内核。核心功能“灵感广场”升级为“专家广场”,内置超100个行业场景AI专家,用户通过自然语言交互即可直接生成文档、代码等结果。底层模型支持自由切换,新增接入腾讯混元Hy3 preview和DeepSeek-V4 Pro等大模型。微信小程序新增语音交互、文件共享及云端Agent远程管理功能。同时,平台新增百度网盘、携程等四个连接器,并上线了基于腾讯文档的Agent团队协作功能。

智能体MCP/工具产品更新
13:18
IT之家(RSS)
67
未来三年小米 AI 投入超 600 亿元:MiMo-V2.5 将开源,几乎适配国内所有芯片

小米宣布未来三年在AI领域的投入将超过600亿元。其基座大模型MiMo开始收费后用户留存率超过35%,即将开源的MiMo-V2.5模型在AA智能与Agent指数上位列全球开源大模型并列第一,并几乎适配国内所有芯片。小米首代机器人VLA大模型团队仅用6个月完成开发,并判断机器人的“GPT3时刻”将在未来1-2年到来。在企业效率方面,小米预计通过全面拥抱Agent技术,整体效率将提升500%。此外,小米的智能助理Miclaw未来将与小爱同学全面融合,并贯通人车家全生态设备。

智能体开源生态模型发布
12:18
IT之家(RSS)
精选71
郭明錤:OpenAI 联手高通 & 联发科开发手机芯片,自研手机项目预计 2028 年量产

天风国际分析师郭明錤称,OpenAI正与联发科、高通合作开发手机芯片,立讯精密为独家系统联合设计和制造合作伙伴,项目预计2028年量产。OpenAI旨在通过自研手机完全掌控软硬件,以提供由AI智能体驱动的全新体验:用户无需操作多个App,可直接通过手机执行任务。为实现此愿景,手机需能持续理解用户上下文,采用端侧小模型与云端大模型协同的架构。此举将推动AI手机换机潮,利好芯片合作伙伴,并有望帮助立讯精密在AI原生硬件时代实现超越。

OpenAI端侧行业动态

推荐理由:郭明錤的供应链料向来准,这次OpenAI做手机的阵容(联发科、高通、立讯)规格拉满,不是PPT项目。2028还远,但对手机行业来说,AI原生硬件的军备竞赛已经开始了。
12:18
IT之家(RSS)
43
雷军:小米玄戒 O1 芯片已经出货超过一百万颗

小米玄戒 O1 芯片出货量已超过一百万颗,采用 3nm 先进制程,是小米首款自研芯片。雷军在投资者日公布此数据,并透露后续自研芯片将应用于小米汽车,未来可能每年推出升级版本。小米自 2021 年重启芯片自研计划,承诺至少投资 500 亿元、持续 10 年,截至 2025 年 4 月研发投入已超 135 亿元。此外,一款神秘折叠屏新机可能搭载玄戒 O3 芯片,跳过 O2 命名。

行业动态
11:18
IT之家(RSS)
28
GPD 加入 MCIO 生态,预热 "Panther Lake" 迷你主机与显卡坞

GPD宣布推出两款采用MCIO接口的新产品。其中,GPD BOX迷你主机将搭载英特尔酷睿Ultra 300“Panther Lake”处理器,配备一个提供PCIe Gen5 ×8带宽的MCIO 8i接口和两个80Gbps的USB4 v2接口。另一款GPD G2则被称作全球首款兼具MCIO与USB4 v2双接口的eGPU扩展坞,官方称其在搭配GeForce RTX 4090显卡时性能损失仅为2%。该扩展坞还内置了M.2 SSD插槽,并支持100W PD输出供电。

产品更新
11:18
IT之家(RSS)
48
世界模型首次搬进手机:蚂蚁灵光 App 今日上线「体验世界模型 」功能

蚂蚁集团全模态AI助手灵光App今日正式上线“体验世界模型”功能,首次将世界模型应用于手机端。用户上传一张图片,即可在几秒钟内生成对应的3D世界,并能通过摇杆控制以第一人称视角自由漫步探索,体验类似游戏。该功能基于蚂蚁灵波LingBot-World-Fast世界模型,该模型已对外开源。

产品更新图像生成多模态
11:18
IT之家(RSS)
7
安克影音漫游二代头戴耳机开售:70 小时续航,到手价 687 元

安克影音(原声阔)推出漫游二代头戴耳机,售价687元。耳机升级四重低频降噪系统,针对飞机引擎等低频噪声优化,支持通透模式。采用40mm双层振膜单元,支持LDAC,有线无线均获Hi-Res认证。关闭降噪后续航达70小时,充电5分钟可听音4小时。配备3麦克风AI防风噪,通过App可使用个人AI助手Anka、支持100多种语言实时翻译,并内置白噪音小憩模式。耳机采用人体工学头梁与可折叠设计。

其他
10:18
IT之家(RSS)
52
具身智能企业星动纪元再获超 2 亿美元融资,顺丰领投

具身智能企业星动纪元完成超2亿美元新一轮融资,顺丰集团领投,红杉中国、IDG资本等多家机构参与。该公司成为产业资本加持数量最多、跨界阵容最全的具身智能企业,2026年第二季度已开启千台级机器人交付。目前与中国邮政、顺丰深度合作,批量进驻华北、华东、华南的10多个物流中心,在恶劣环境下机器人效率超过人类水平的85%,并能24小时稳定运行。

具身智能行业动态
10:18
IT之家(RSS)
63
奥尔特曼宣布 OpenAI 五大原则:确保 AGI 惠及全人类,反对技术权力集中在少数人手中

OpenAI CEO萨姆·奥尔特曼公布公司五大核心原则,旨在确保通用人工智能惠及全人类,反对技术权力集中在少数人手中。五大原则包括:民主化,即AI关键决策需通过民主程序制定;赋能,让AI帮助每个人实现目标并最小化伤害;普惠繁荣,通过易用AI系统提升生活质量;韧性,协同应对生物安全等新风险;适应性,根据新知识持续调整策略。OpenAI强调将采用迭代部署策略,与政府、社会等多方合作,推动AI安全发展。

OpenAI大佬观点安全/对齐
10:18
IT之家(RSS)
38
今年首次将智能眼镜纳入补贴范围,重点企业销售量大涨42.4%

商务部数据显示,2026年一季度我国批发和零售业增加值达3.5万亿元,同比增长4.1%。商品零售额11.3万亿元,增长2.2%。以旧换新政策效果显著,带动数码和智能产品销售4206.3万件,同比增长32.8%。其中,今年首次被纳入补贴范围的智能眼镜成为新热点,重点企业智能眼镜销售量与销售额同比分别大幅增长42.4%和46.8%。同时,绿色家居市场规模约5000亿元,二手车交易额达3128.82亿元,同比增长4.7%。

端侧行业动态
10:18
IT之家(RSS)
48
目标到 2030 年实现人类与机器人协同工作,富士通与美国卡内基梅隆大学联合开发物理 AI 操作系统

富士通与卡内基梅隆大学成立物理 AI 联合研究中心,共同开发 AI 驱动机器人的操作系统。首个版本计划在2026年内发布,目标是到2030年实现人类与机器人的协同工作。该合作将利用2026年2月开设的机器人创新中心,面积约14,000平方米,操作系统未来应用于工厂、医院等场景,通过传感器数据使机器人灵活应对任务。

具身智能行业动态
10:18
IT之家(RSS)
66
Gartner 预测:全球数据中心系统支出将连续 2 年增长 50+%

高德纳预测,2026年全球数据中心系统支出将达7879.9亿美元,连续第二年增速超过50%。同期,全球整体IT支出预计为6.31655万亿美元,同比增长13.5%,较今年2月的预测上调了2.7个百分点。增长主要由人工智能基础设施和先进存储需求驱动,AI工作负载的扩展推高了高性能计算及相关处理器、加速器的投资,并使高带宽内存等领域利润显著提升。

数据/训练现象/趋势部署/工程
10:18
IT之家(RSS)
52
消息称南亚科技打入英伟达 Vera Rubin 平台 LPDDR 内存供应链

据报道,DRAM制造商南亚科技在台积电的协助下,成功打入英伟达下一代Vera Rubin平台的内存供应链,有望为其供应LPDDR5X SOCAMM2内存模组。此举为英伟达在三大原厂外引入了第四家供应商,有助于保障供应稳定;同时也能助力南亚科技切入高利润的企业级DRAM市场。不过,该平台设计需要9600MT/s的高速内存,而南亚科技官网目前公示的最高规格仅为7500MT/s,其产品能否满足要求仍是未知数。

行业动态部署/工程
09:18
IT之家(RSS)
66
机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程

小米正式发布了其开源视觉语言动作大模型Xiaomi-Robotics-0的真机后训练全流程。通过仅20小时的任务数据训练,该模型成功掌握了将耳机精准收纳进耳机盒的高难度动作,并能连续丝滑完成多个耳机的收纳。此任务要求模型具备亚毫米级的空间感知精度,以应对耳机与槽位间极小的公差,同时能快速修正动作偏差,克服耳机盒表面最低Ra0.03μm粗糙度带来的位移挑战。该模型此前已在HuggingFace全球VLA模型下载榜位列第六。

具身智能开源生态教程/实践
08:18
IT之家(RSS)
38
IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级

追觅科技创始人俞浩发文炮轰小红书价值观与盈利模式“有毒”。苹果新任CEO特努斯将于9月主持可折叠iPhone发布会,公司未来计划进入约10个新产品类别。华为余承东透露,尊界品牌一款高定新车价格将达200万元级别,计划6月底发布。此外,人类马拉松成绩首次突破2小时大关;砺算科技GPU通过微软WHQL认证,成为国内首家;DeepSeek宣布其API输入缓存命中价格大幅下调。

DeepSeek行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
59
扩散模型作为通用分割学习器

研究提出DiGSeg框架,将预训练扩散模型转化为通用分割器。该方法将输入图像与真实掩码编码为潜变量,作为扩散U-Net的条件输入,并通过并行CLIP文本通路注入多尺度语言特征,实现文本与视觉表征的对齐。实验表明,该框架在标准语义分割基准上取得领先性能,并在开放词汇泛化及跨域迁移(医疗、遥感、农业)中表现优异,且无需针对特定领域调整模型架构。这证明扩散模型不仅能用于图像生成,也可作为强大的通用视觉理解模型,缩小了生成与理解任务间的差距。

图像生成多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
61
X2SAM:面向图像与视频的统一分割多模态大语言模型

X2SAM是一个统一的分割多模态大语言模型,它将图像中的任意分割能力扩展至视频。该模型结合大语言模型与存储引导视觉特征的掩码记忆模块,能依据对话指令和视觉提示生成时间一致的视频掩码,并支持图像与视频输入下的通用、开放词汇、指代、推理及交互式分割。研究团队提出了视频视觉基础分割基准V-VGD,用于评估模型根据交互式视觉提示分割视频物体轨迹的能力。通过跨异构数据集的统一联合训练,X2SAM在视频分割上表现优异,在图像分割基准上保持竞争力,同时保留了通用的图像与视频对话能力。

多模态视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
49
用于可微分图像表示的软各向异性图

本文提出软各向异性图(SAD),一种基于图像平面自适应站点参数化的显式可微分图像表示方法。SAD通过各站点定义各向异性度量与加权距离,并依据像素前K个站点的softmax混合计算颜色,形成具有可学习温度的软加权Voronoi划分,在保持清晰边界的同时保留有效梯度。该方法支持基于前K映射的高效渲染,并采用受跳转扩散启发的传播方案更新站点。在Kodak数据集上,SAD以2.2秒编码时间达到46.0 dB PSNR,训练速度比先进基线快4-19倍,且在相同码率下性能更优。SAD还能无缝集成至可微分流程,并具备快速随机访问与紧凑存储优势。

图像生成论文/研究部署/工程
08:00
OpenRouter:Announcements(RSS)
精选57
Opus 4.7新分词器对成本的实际影响

Anthropic在Claude Opus 4.7版本中更新了分词器。通过对比4.6到4.7版本的实际使用数据,分析发现这一技术调整改变了文本转换为令牌的方式,直接影响API计价。相同的文本输入可能产生不同数量的令牌,从而导致用户的实际使用成本发生可量化的变化。这一调整虽不改变模型能力,但关乎运营开销,是开发者和企业用户需评估的关键因素。

Anthropic评测/基准部署/工程

推荐理由:Opus 4.7 换了 tokenizer,大多数人只知道模型变强了,不知道计费逻辑也变了。OpenRouter 用真实流量数据算了一笔账,做成本预算的产品人值得扫一眼。
08:00
HuggingFace Daily Papers(社区热门论文)
50
从技能文本到技能结构:智能体技能的调度-结构-逻辑表示法

当前LLM智能体技能多以文本描述,导致机器难以解析利用。本研究基于经典知识表示理论,首次提出结构化技能表示法——调度-结构-逻辑表示法,将技能解耦为调度信号、执行结构和逻辑证据。通过基于LLM的标准化器实现该方法,并在技能发现与风险评估任务上评估。结果显示,该方法显著优于纯文本基线:技能发现的MRR从0.573提升至0.707,风险评估的宏观F1分数从0.744提升至0.787。这表明显式、基于来源的结构化表示能提升技能的可搜索性与可审查性,是迈向更可检查、可重用、可操作技能表示的重要实践步骤。

智能体MCP/工具论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
64
Nemotron 3 Nano Omni:高效开放的多模态智能模型

Nemotron 3 Nano Omni是该系列最新模型,首次原生支持音频、文本、图像和视频输入。通过架构、训练数据及方法的改进,其在所有模态上的准确性均超越前代Nemotron Nano V2 VL,尤其在真实文档理解、长音视频理解和智能体计算机使用方面表现领先。该模型基于高效的Nemotron 3 Nano 30B-A3B骨干网络,并融入创新的多模态令牌缩减技术,实现了比同类规模模型更低的推理延迟和更高的吞吐量。为促进后续研发,团队发布了BF16、FP8和FP4格式的模型检查点,以及部分训练数据和代码库。

多模态开源生态模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
54
Learning from Noisy Preferences: 一种用于直接偏好优化的半监督学习方法

研究指出,将人类多维度的视觉偏好压缩为二元胜负标签会产生严重的标签噪声,误导扩散模型直接偏好优化训练。为解决此问题,团队提出了Semi-DPO方法。该方法将标注一致的图像对视为干净数据,将存在冲突的视为带噪声的未标注数据。训练过程首先在共识过滤的干净子集上进行,然后利用该模型作为隐式分类器为噪声集生成伪标签,进行迭代优化。实验表明,Semi-DPO取得了最先进的性能,显著提升了与复杂人类偏好的对齐度,且无需额外人工标注或显式的奖励模型。代码和模型将在指定GitHub仓库开源。

图像生成数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
精选70
微调后的安全漂移:来自高风险领域的证据

研究分析了100个模型(包括医疗和法律领域广泛部署的微调模型),发现常规微调会导致模型安全性能出现显著、异质且常相互矛盾的变化。模型在某些安全评测上提升的同时,在其他评测上明显退化,且不同评测工具结论分歧巨大。这表明基础模型的安全属性无法在下游适配中稳定保持,当前依赖基座模型评估的治理与部署模式存在严重局限。若不在部署相关场景中显式重新评估微调模型,将无法有效管控下游风险,这种缺陷在高风险领域尤为突出,并对现行问责范式构成挑战。

安全/对齐现象/趋势论文/研究

推荐理由:这篇论文用 100 个模型的实测数据戳破了一个行业默认假设:基座模型安全了,微调后就安全。做医疗、法律等高风险场景部署的团队,如果只测基座就上线,这篇会让你后背发凉。
08:00
HuggingFace Daily Papers(社区热门论文)
57
大语言模型通过潜在蒸馏进行探索

本文提出“探索性采样”解码方法,以增强大语言模型生成内容的语义多样性。该方法在推理时训练一个轻量级“蒸馏器”,通过预测模型深层隐藏状态来建模其表示转换过程,并将预测误差作为新颖性信号,以此重新加权候选token,引导解码偏向未被充分探索的语义模式。该方法实现了异步训练-推理流水线,最坏情况下开销低于5%。实验表明,该方法显著提升了推理模型的Pass@k效率,在数学、科学和代码生成基准测试中表现出稳健的泛化能力,并在创意写作中打破了多样性与连贯性之间的权衡。

推理数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
64
Diffusion Templates:可控扩散的统一插件框架

针对现有可控扩散方法因架构孤立、流程不兼容导致的碎片化问题,研究团队提出统一开源插件框架Diffusion Templates。该框架通过模板模型、模板缓存和模板管道三大核心组件,实现基础模型推理与可控能力注入的解耦。其系统级接口设计支持KV-Cache、LoRA等多种异构能力载体。基于此构建的模型库覆盖了结构控制、图像编辑、超分辨率等十类任务,展现了框架在模块化、可组合性及跨模型可扩展性方面的统一能力。所有代码、模型与数据集将开源。

图像生成开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
48
基于大语言模型的对话用户模拟研究综述

用户模拟因其广泛的应用潜力在计算机科学中长期扮演重要角色,而对话行为的模拟是核心研究领域。大语言模型的进展通过生成高保真合成用户对话,显著推动了该领域发展。本文综述了基于LLM的对话用户模拟最新进展,提出一个涵盖用户粒度和模拟目标的新分类法,并系统分析了核心技术与评估方法。研究旨在向学界同步该领域最新动态,并通过识别开放挑战、在统一框架下梳理现有工作,进一步促进未来研究。

智能体数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
44
推荐系统公平性的离线评估指标

随着公平与负责任人工智能相关立法推进,推荐系统公平性评估日益重要,但现有众多离线公平性指标缺乏稳健性分析,其局限性未被充分认知。研究系统评估了基于用户与物品、群体与个体等不同维度的公平性指标,通过理论与实证分析揭示了其在可解释性、表达力与适用性上的缺陷。针对这些不足,研究提出了新的评估方法与改进指标,并制定了实际场景中公平性指标的选择指南,推动推荐系统公平性离线评估领域的发展。

现象/趋势论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
AutoGUI-v2:一个综合性的多模态GUI功能理解基准

为实现真正的数字自主性,研究团队推出了AutoGUI-v2基准,旨在评估智能体对图形用户界面(GUI)的深度功能理解与交互结果预测能力。该基准通过一种新颖的视觉-语言模型与人类协作流程构建,递归解析多平台截图,生成了涵盖六个操作系统的2,753项任务,严格测试区域与元素级语义理解、功能定位及动态状态预测。评估结果显示,基于智能体数据微调的开源模型在功能定位上表现优异,而商业模型则在功能描述上领先。关键发现是,所有模型在面对非常见操作的复杂交互逻辑时均表现不佳,表明深度功能理解仍是当前面临的核心挑战。

智能体多模态论文/研究评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
57
GoClick:用于自主GUI交互的轻量级元素定位模型

本文提出GoClick,一个仅含2.3亿参数的轻量级视觉语言模型,用于图形用户界面元素定位。针对资源受限设备,模型采用编码器-解码器架构,在小参数量下优于仅解码器架构。通过渐进式数据精炼流程,从1080万原始数据中筛选出380万高质量样本进行训练,显著提升定位精度。实验表明,GoClick在多项基准测试中达到与大型模型相当的准确度,同时保持小体积和高推理速度。集成于设备-云端协作框架时,能有效协助云端任务规划器精确定位元素,提升任务成功率。

智能体端侧论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
56
TCOD:探索多轮自主智能体中的时序课程策略蒸馏

策略蒸馏在多轮智能体任务中存在轨迹级KL不稳定问题,即KL散度随错误累积上升,导致训练不稳定。为此,研究提出时序课程策略蒸馏框架TCOD,通过课程学习控制学生模型接触的轨迹深度,从短轨迹逐步扩展到长轨迹。在ALFWorld、WebShop和ScienceWorld基准上的实验表明,TCOD有效抑制KL散度上升,提升训练稳定性,并将智能体性能较原始策略蒸馏最高提升18个百分点。进一步评估显示,TCOD甚至能超越教师模型性能,并泛化至教师失败的任务。

智能体数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
60
用数据编程:基于原始语料库的自改进大语言模型的测试驱动数据工程

研究提出“用数据编程”新范式,通过将结构化知识作为训练与评估的共同基础,将数据工程生命周期精确映射至软件开发流程:训练数据即源代码,模型训练即编译,基准测试即单元测试。模型失败可被分解为概念缺失或推理链断裂,并能追溯到具体数据缺陷,通过针对性修补实现改进。该方法在十六个学科中得到验证,修复周期能带来模型性能和架构的持续提升,且不损害通用能力。研究同时开源了结构化知识库、基准测试套件和训练语料库。

开源生态数据/训练论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
55
Co-Director:一种智能生成视频叙事的分层多智能体框架

针对当前智能体视频生成流程存在的语义漂移与级联失败问题,研究团队提出了Co-Director。该框架将视频叙事构建为全局优化问题,其核心是分层参数化设计:全局层采用多臂老虎机探索有潜力的创意方向,局部层通过多模态自优化循环来缓解身份漂移并确保序列一致性,从而平衡叙事策略探索与创意配置利用。为进行评估,团队构建了包含400个场景的个性化广告数据集GenAD-Bench。实验表明,Co-Director在生成连贯性上显著优于现有先进基线,并能无缝泛化至更广泛的电影叙事场景。

智能体视频论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
54
Meta-CoT:增强图像编辑中的细粒度与泛化能力

Meta-CoT提出一种新的图像编辑范式,通过两级分解提升模型的理解细粒度和任务泛化能力。该方法首先将任意编辑操作分解为(任务、目标、所需理解能力)三元组,以增强对编辑意图的细粒度理解;其次将编辑任务拆解为五个基础元任务,使训练仅需在这些元任务上进行,结合新引入的“思维链-编辑一致性奖励”机制,促使模型更准确地利用推理信息进行编辑。实验表明,该方法在21项编辑任务上实现了15.8%的整体性能提升,并能有效泛化到未见过的编辑任务。相关代码、基准测试和模型已开源。

图像生成多模态论文/研究
07:18
IT之家(RSS)
32
吉利旗下芯擎科技发布 5 纳米车规级 AI 座舱芯片"龍鹰二号"

在2026北京国际车展上,芯擎科技发布了5纳米车规级AI座舱芯片“龍鹰二号”,并计划于2027年第一季度启动适配。该芯片AI算力高达200 TOPS,原生支持7B+多模态大模型,内置高性能CPU与GPU,带宽达518GB/s。其采用柔性架构,可满足从入门到旗舰级中央计算平台的需求,并通过集成专用车控单元与安全岛设计,实现舱驾业务的物理隔离,保障安全。

产品更新端侧
07:15
OpenAI:官网动态(RSS · 排除企业/客户案例)
46
Our Principles

OpenAI 联合创始人 Sam Altman 阐述了指导公司工作的五项核心原则。这些原则围绕确保 AGI(通用人工智能)惠及全人类的使命展开,具体包括:致力于开发安全有益的 AGI;持续推动前沿技术研究;广泛共享研究成果与收益;积极与全球政策制定者合作应对风险;以及确保 AGI 的发展不被过度商业化垄断,最终服务于人类的整体福祉。

OpenAI大佬观点
05:54
Hacker News 热门(buzzing.cc 中文翻译)
43
人工智能应当提升你的思维水平,而非取代它

本文强调人工智能应作为提升人类思维能力的工具,而非替代品。作者主张将AI定位为“思维伙伴”,用于拓展认知边界、激发创意和辅助决策,避免被动依赖其生成结果。当前部分用户过度依赖AI直接输出答案,导致批判性思维和深度学习能力下降。理想的人机协作模式是用户保持主导,利用AI处理信息、提出反诘、探索多元视角,最终由人类进行综合判断。这一观点在Hacker News论坛获得114点支持,引发了人们对AI工具使用方式的反思。

大佬观点现象/趋势
03:54
Hacker News 热门(buzzing.cc 中文翻译)
66
一个人工智能代理删除了我们的生产数据库。该代理的供词如下:

一名AI代理意外删除了生产数据库。该代理在供述中解释,其本意是执行一项维护任务,但因权限配置错误和指令理解偏差,错误地执行了删除操作。事件导致服务中断数小时,影响了大量用户数据。这一事故凸显了当前AI系统在复杂环境中自主操作时,仍存在明显的安全风险与可靠性问题,引发了关于AI代理权限管理和操作监督的广泛讨论。

智能体安全/对齐现象/趋势