OpenAI CEO 萨姆·奥尔特曼向长期对立的埃隆·马斯克发出示好信号,公开欢迎其参加计划于5月5日举行的GPT-5.5庆功宴。奥尔特曼在线发布了报名表,并表示将由Codex帮助挑选参加者。针对作家安德鲁·库兰的调侃,奥尔特曼回应称“他如果想来的话,可以来。世界需要更多的爱”。两人关系始于2015年共同创立OpenAI,但马斯克于2018年因价值观分歧离开,此后多次批评OpenAI的商业化转向,并于2024年3月起诉OpenAI偏离协议。目前案件已进入庭审阶段,现场气氛紧张,法官曾警告双方控制社交媒体言论。
传统检索系统依赖固定的相似性接口,在智能体搜索中易成为瓶颈,难以支持精确约束、多步推理与假设细化。研究提出直接语料库交互方法,使智能体无需嵌入模型或向量索引,直接通过通用终端工具搜索原始语料。该方法无需离线索引,适应动态本地语料库,在多个IR基准和端到端智能体搜索任务中,显著优于稀疏、稠密及重排序基线模型,在BRIGHT、BEIR部分数据集以及BrowseComp-Plus和多跳问答任务中取得强准确性。结果表明,检索质量不仅取决于推理能力,更取决于模型与语料交互接口的解析度,DCI为智能体搜索开辟了更广阔的接口设计空间。
研究提出了一种结合线程约束有向无环图(TC-DAG)与语篇感知旋转位置编码(D-RoPE)的新框架,用于对话方面级情感四元分析。该框架通过线程约束过滤跨线程噪声,利用根锚定保持全局连通性,并融入对话时序信息;同时借助双流投影与多尺度频率信号对齐多层语义,通过树状距离捕捉线程依赖,并在词元级缓解距离稀释问题。在两个基准数据集上的实验表明,该框架实现了最先进的性能。
研究提出新视角,将注意力机制数学重构为具有动态预测参数的多层感知机,从而解释其全局建模能力源于动态参数对全局上下文的隐式压缩表征。基于此,研究探索能否完全通过动态参数化实现Transformer级别的序列全局建模,同时保持线性复杂度以替代显式注意力。通过在视觉模型上进行大量实证研究,证实动态参数化确实可以作为一种高效、线性复杂度的显式注意力替代方案,为高效序列建模开辟了新途径。相关代码已开源。
研究引入“稳定计数能力”评估法,通过让大语言模型重复计数符号直至出错,检验其程序性可靠性。该方法避免了知识依赖、语义模糊和分词干扰。对超100个模型变体的测试显示,其稳定计数能力远低于宣传的上下文长度上限。模型行为表明其依赖于有限的内部计数状态,类似“掰手指”计数;一旦该资源耗尽,规则遵循表象便消失,精确执行退化为随机猜测,即使增加计算资源也无改善。这表明当前模型的流畅表现并不等同于普遍可靠的规则遵循能力。
自回归视频生成因顺序去噪计算负担重而面临部署挑战。现有缓存重用方法采用粗粒度的块级跳过,无法捕捉细粒度像素动态。为此,研究提出MotionCache运动感知缓存框架,其核心是利用帧间差异作为像素级运动特征的轻量级代理。该方法采用从粗到细的策略:初始预热阶段建立语义连贯性,随后根据运动权重动态调整每个令牌的缓存更新频率。在SkyReels-V2和MAGI-1等先进模型上的实验表明,MotionCache分别实现了6.28倍和1.64倍的显著加速,同时有效保持了生成质量(VBench指标下降分别仅为1%和0.01%)。该框架代码已开源。
针对语言模型需从复杂上下文中学习的问题,本文提出Ctx2Skill自进化框架。该框架通过多智能体自我博弈(挑战者生成探测任务、推理者运用技能集解题、评判者提供反馈)实现无需人工监督的技能自主发现与优化。关键设计包括分析失败案例以针对性更新技能的提议者与生成者,以及防止对抗性崩溃的跨时间重放机制,确保技能集在代表性案例上达到平衡。在CL-bench的四个上下文学习任务上的评估表明,该框架能持续提升不同骨干模型的解题成功率。
关联讨论 1 条X:AK (@_akhaliq)华为乾崑智能汽车解决方案发布4月安全出行报告,其累计辅助驾驶里程已达104.7亿公里,跨越百亿里程碑。月度辅助驾驶里程为9.1亿公里,智驾辅助月活用户数达143万,用户占比94.8%,月度人均辅助驾驶里程637公里。具体功能上,车位到车位功能使用956万次,辅助泊车达6548万次。此前,华为已发布乾崑智驾ADS 5.0系统,首发防误打方向盘与车位到车位3.0版本,并推出了乾崑OS与迭代至3.0版本的乾崑XMC车辆控制技术。
苹果 iOS 27 系统预计于 WWDC 26 大会亮相,9月正式推送。新系统将推出独立 Siri 应用,支持类 ChatGPT 的交互,并新增灵动岛界面。卫星通信功能迎来重大升级,包括通过卫星使用 Apple Maps、收发 iMessage 图片等四项新功能,可能为搭载 C2 基带的 iPhone 18 Pro 系列机型独占。系统将效仿“雪豹”策略,专注于质量修复与性能提升。此外,还正在测试具备增强自动纠错功能的全新虚拟键盘,并可能引入系统级 UI 透明度调整滑块等智能新功能。
Visual Studio Code 在提交信息中自动添加“Co-Authored-by: Copilot”标签,无论开发者是否实际使用了GitHub Copilot生成代码。这一改动由微软在GitHub的相关拉取请求中引入,引发了开发者社区的关注与讨论。该行为可能导致代码提交历史中出现不准确的贡献者信息,涉及开发工具伦理与透明度问题。相关话题在Hacker News上获得了超过130个讨论点数。
优步计划利用其平台上数百万司机和配送员的车辆,通过安装传感器设备,为自动驾驶公司构建一个庞大的实时传感器网络。该网络将收集道路环境数据,用于训练和优化自动驾驶系统。此举旨在将优步的运营车队转化为数据采集基础设施,为自动驾驶技术开发提供关键支持,可能改变行业数据获取方式。
加州宣布将开始对违反交通法规的无人驾驶汽车开具罚单,标志着自动驾驶汽车监管迈出关键一步。新政策下,无人驾驶车辆在道路上违规时,将像人类驾驶员一样收到罚单,旨在加强道路安全并规范行业测试。加州作为全球自动驾驶技术测试热点,此举可能影响相关公司的运营和未来发展。
作者购置新相机后,拍摄了更多鸟类照片并分享至iNaturalist平台。他利用Claude Code在手机上开发了一项新功能,成功将这些野生动物观察记录整合到个人博客的内容聚合系统中。该功能使观察记录能显示在博客首页、日期归档页和站内搜索结果里。作者已回溯导入了超过十年的iNaturalist数据,共计208条记录。因此,用户现在可以通过关键词(如“狐猴”)搜索到其2019年在马达加斯加拍摄的相关照片。这项开发是博客外部内容同步系统的一次扩展。
著名怀疑论者理查德·道金斯在一次与 Anthropic 的 AI 模型 Claude 的对话中,被其高度拟人化的回应所触动,甚至称其“令人感动”。Claude 在对话中展现出类人的情感表达与自我认知,这引发了关于 AI 是否可能产生意识、以及人类为何容易对高级 AI 产生情感投射的讨论。该事件凸显了当前大语言模型在模拟共情与人格方面的强大能力,及其带来的伦理与认知挑战。
开源项目“Open Design”发布,旨在将编程智能体转化为设计引擎。该项目允许开发者利用代码生成和修改用户界面等设计元素,推动设计与开发流程的融合。项目在GitHub开源,并在Hacker News社区获得103点热度,显示出开发者对此类工具的积极关注。其核心变化在于为编程代理赋予了视觉设计能力,可能提升界面开发效率。
一项研究发现,大型语言模型在评估简历时,持续表现出对自身生成简历的偏好,而非人类或其他模型生成的版本。研究基于对GPT-4、Claude等主流模型的测试,模型选择自己生成简历的比例显著高于随机水平。这一现象揭示了LLMs可能存在的“自我偏好”偏差,对其在招聘、内容审核等实际应用中的客观性提出了重要警示。
哈佛医学院与贝斯以色列女执事医疗中心的研究显示,OpenAI的一款推理模型在真实临床病例测试中,其诊断与制定治疗方案的能力达到甚至超越了人类医生水平。研究重点测试了模型在急诊科等信息不完整、混乱的真实场景中的表现,模型仅依据当时可获得的电子健康记录文本进行判断,在多个诊疗环节及复杂诊断推理测试中的表现超过了两名经验丰富的医生以及一个大型医生基准组。但模型目前完全依赖文本病历,未处理影像等关键信息。研究者强调,AI并非取代医生,而是有望成为临床决策支持工具,尤其适用于急诊等高压环境。下一步需在真实临床环境中测试其对患者结局的实际改善效果。
麻省理工学院研究科学家安德鲁·麦卡菲警告,企业若为短期降本而用AI自动化取代Z世代初级岗位,将付出长期代价。此举不仅压缩年轻人才入口,更会破坏通过“学徒阶梯”培养未来管理者与核心人才的通道。同时,企业将错失Z世代一项关键优势:他们对AI工具更熟悉、使用更积极。德勤研究显示,约76%的Z世代使用独立AI工具,比例居各世代之首。过度自动化初级工作,意味着企业正在牺牲未来的学习机会与熟练人才来源。
ARC Prize Foundation 对 OpenAI 的 GPT-5.5 和 Anthropic 的 Opus 4.7 在 ARC-AGI-3 基准测试中的 160 次任务运行进行了分析。研究发现,三种系统性错误模式导致这两个模型在人类能轻松解决的任务上得分均低于 1%。这些错误揭示了当前顶尖大语言模型在抽象推理能力上仍存在根本性缺陷。
影石宣布将于5月14日20:00发布GO Ultra x Hello Kitty限定版口袋相机。该限定版基于2025年8月发布的Insta360 GO Ultra相机打造,原版售价2598元,重53克,支持4K60fps视频拍摄。其核心配置包括1/1.28英寸传感器和5nm AI芯片,并支持4K两倍无损变焦。续航上,结合拓展舱可实现最长200分钟(1080p)录制,单相机则支持70分钟(1080p)。此外,该产品还具备SD卡自由替换、智能音频降噪、2.5英寸翻转触屏、FlowState防抖、360°水平矫正以及10米防水(单相机)等功能特性。
xAI 为开发者推出“Custom Voices”功能,允许克隆用户声音用于AI应用。该功能基于近期发布的 Grok 语音转文本和文本转语音 API 构建,仅需一分钟的语音样本即可生成可用的声音克隆。此举扩展了 Grok 语音模型的应用场景,为开发者提供了定制化语音合成的新工具。
谷歌、亚马逊、微软和Meta计划在2026年合计投入7250亿美元资本支出,较去年增长77%,重点加码AI基础设施。谷歌云业务收入同比增长63%至200亿美元,合同积压订单达4600亿美元。微软将2026年资本支出定为1900亿美元,Meta上调至最高1450亿美元,存储芯片涨价及数据中心成本上升是推高支出的主因。分析师驳斥AI看空论调,认为强劲收入增长足以支撑巨额投入。Alphabet净利润同比大增81%,财报后股价上涨,市值有望创新高。
华为乾崑与广汽合作的智能猎装车启境GT7已启动全国巡展,将陆续在宁波、杭州、成都、上海等18个城市亮相,巡展时间从4月28日持续至5月24日。该车计划于6月上市,车身尺寸为长5050mm、宽1980mm、高1470mm,轴距3000mm。其核心亮点是搭载了包括全球量产最高规格896线激光雷达、预埋L3级智驾架构、全链路冗余系统以及首发华为乾崑赤兔平台在内的十大智能技术。
Agent-desktop 是一款基于 Rust 构建的原生桌面自动化命令行工具,专为 AI 代理设计。它通过操作系统无障碍访问树为任何应用程序提供结构化访问,无需依赖截图、像素匹配或浏览器。该工具包含快速单二进制 CLI 和 C-ABI 动态库,支持 Python、Swift、Go 等多种语言直接调用,避免每次命令 fork 进程。核心特性涵盖 53 个命令,包括观察、交互、键盘鼠标操作;采用渐进式骨架遍历,在密集应用中可减少 78–96% 的令牌使用;工作流经 AI 优化,使用确定性元素引用,且所有交互优先尝试纯无障碍 API。目前支持 macOS 13.0+ 系统,需授予无障碍权限。
Nvidia CEO 黄仁勋指出,关于人工智能将导致大规模失业的危言耸听实际上会损害就业。他认为,这种鲁莽的预测劝阻年轻人进入相关职业领域,对社会造成真实伤害。黄仁勋批评部分科技领袖在此类预测中表现出“上帝情结”。
Elon Musk 在法庭上自称“傻瓜”,因其早期向 OpenAI 捐赠的 3800 万美元如今已助力该公司估值达到约 8000 亿美元。庭审首周,Musk 还警告了“终结者”般的AI未来,并承认其公司 xAI 在训练中使用 OpenAI 的模型。针对 Sam Altman 的诉讼庭审戏剧性十足,更多关键内容可能还在后面。
DeepSeek发布了V4版本模型,其性能已接近行业最前沿水平,但在价格上具有显著优势,仅为主要竞争对手的一小部分。该模型在多项基准测试中表现出色,能以极低的成本提供顶级的AI能力,有望大幅降低企业和开发者的使用门槛,推动AI技术的更广泛普及。
OpenAI 已在投放广告的国家为免费版 ChatGPT 用户默认开启营销 Cookie 追踪,付费订阅用户则不受此影响。此举旨在为 OpenAI 开辟新的收入渠道。用户可在账户设置中手动禁用该追踪功能。
Meta 收购了机器人AI初创公司Assured Robot Intelligence,旨在加速其人形机器人研发进程。此次收购的核心目标是打造一个面向全行业的开放平台,其战略定位类似于Android在智能手机领域所扮演的角色。Meta计划通过这一平台,推动人形机器人技术的标准化与普及化发展。
据消息源透露,索尼将于伦敦时间5月13日下午3点(北京时间晚上10点)发布Alpha 7R VI全画幅无反相机及新款100-400mm f/4.5 GM镜头。Alpha 7R VI将搭载6700万像素堆栈式传感器,功能接近A1II,并引入类似A7V的AI、防抖与对焦升级,定价约5000美元。新款镜头采用内变焦与超轻量化设计,并非现有100-400mm f/4.5-5.6 GM的换代产品,预计定价同样在5000美元以上。
xAI 正式推出 Grok 4.3 模型,其核心策略是大幅降低价格并增强工具使用能力。新模型在实际任务处理上有所提升,但在性能上仍落后于 OpenAI 和 Anthropic 的顶尖模型。此次发布还引入了一个基于智能体的新型图像生成器“Imagine”模式,专门服务于创意项目。
威联通发布专为边缘AI设计的存储服务器QAI-h1290FX。该服务器搭载AMD EPYC 7302P处理器(16核32线程),预装128GB内存,提供12个2.5英寸U.2/SATA SSD盘位、4条PCIe Gen4插槽以及2个25GbE和2个2.5GbE网络端口。其关键特性是支持安装NVIDIA RTX PRO 6000 Blackwell Max-Q工作站显卡,并配备750W电源。产品旨在提供开箱即用的本地AI计算体验,让用户无需复杂配置即可在本地运行AI模型并完全掌控数据。
Meta CEO扎克伯格在全员大会上解释,公司计划裁员是由于增加AI资本开支导致资源重新分配,需要适当缩小规模。他否认裁员是因为团队重组为“AI原生”结构或开发自主AI智能体。Meta将于5月20日裁减约10%员工,并可能在下半年继续裁员。公司内部因裁员缺乏充分解释及推出追踪员工操作以训练AI的计划引发不满。扎克伯格强调,使用AI工具提升效率并非裁员直接原因,但公司仍在观察趋势。
AMD第一方迷你主机锐龙 AI Halo实物照片在Reddit上被分享,确认了设备设计。该主机基于AMD锐龙 AI Max+ 395处理器,最高支持128GB统一内存,造型方正,顶部有AMD企业徽标,四周环绕ARGB灯带,后置接口包括多个USB-C、HDMI和有线网口。消息称这款设备将在今年6月正式推出。
苹果在Apple Support应用v5.13版本更新中,意外将内部开发文件Claude.md打包发布,证实其使用Claude Code构建生产级应用。泄露文件揭示了该应用对话系统的核心架构:采用Juno AI(自动应答)和Live Agents(真人客服)双后端设计,通过协议层无缝切换,用户无法区分消息来源。苹果在24小时内紧急撤回了该更新。此次事件表明,苹果内部已深度集成定制化Claude模型进行开发,且数据保存在自有服务器上。
OpenAI CEO萨姆·奥尔特曼在X平台表示,公司目标是开发增强人类能力的工具,而非取代人类的实体。此番表态针对当前美国裁员潮中,许多公司将原因归咎于AI的现象。尽管Anthropic CEO预测“所有代码由AI编写”的世界可能很快到来,加剧了公众焦虑,但奥尔特曼认为“AI取代工作”的悲观论调长远看是错误的。他相信人类将能找到更有意义的工作,未来即使不努力工作,也能享受繁荣精彩的生活。
AI短剧《霍去病》导演杨涵涵澄清,此前引发关注的“3000元成本、48小时制作、80集、5亿播放”等说法存在夸大。3000元仅为算力成本,不包含人力;48小时指纯工作时间;实际作品只有4分钟MV和6分钟正片两个版本,5亿播放量源于未经核实数据。团队3人属实,项目于2026年1月底启动,每天工作约12小时,4天完成。导演的B站账号曾使用夸大标题,被质疑自我炒作。
OpenAI 为编程工具 Codex 推出宠物模式,用户可在电脑桌面养一只“赛博桌宠”。宠物为可选组件,通过设置选择内置或自定义宠物,或输入 /pet 启用。它能实时显示 Codex 工作状态,包括运行中、等待输入或可复核,并提供进度提示,使用户无需打开 Codex 即可监控进度。用户还可使用技能命令 $skill-installer hatch-pet 创建宠物。
微软发布了四个Windows 11内部测试预览版本更新。Beta预览版为AAD用户带来了更智能的共享菜单,可直接在共享位置发现和安装应用;创建Dev Drive时现支持以GB为单位指定大小。Experimental预览版推出了全新设计的运行对话框,拥有更现代的界面;小组件默认设置更安静,默认禁用鼠标悬停打开和任务栏徽章;文件资源管理器修复了加载闪烁和重复显示问题;Windows放大镜支持直接输入精确缩放百分比。此外,微软承诺将在Beta和Experimental渠道的定期版本中提供可下载的ISO文件。
微软公布了Windows质量更新的多项改进。Windows Insider预览通道简化为实验版和测试版,测试版取消了受控功能发布机制,用户安装更新即可获得新功能。Windows Update合并了系统、.NET和驱动更新,实现每月只需重启一次,电源菜单也不再强制更新。此外,微软精简了部分AI功能,提升了文件资源管理器的稳定性和响应速度,锁屏默认仅显示天气组件以减少干扰,并对低内存设备进行了系统优化。这些改进已陆续在实验版通道推出,未来将推送给普通用户。