5月7日
08:16
IT之家(RSS)
54
IT早报 0507:三星在中国大陆停销所有家电产品;DeepSeek获国家大基金领投磋商;安卓小机器人变透明形象;三星电子市值破万亿美元

三星电子宣布在中国大陆市场停止销售所有家电产品,但售后服务照常提供。DeepSeek正与国家集成电路产业投资基金洽谈首轮融资,估值约450亿美元。安卓系统官宣将于5月13日揭晓新形象,小机器人变为彩色半透明设计。三星电子市值突破1万亿美元,成为亚洲第二家万亿美元市值企业。此外,华为发布HarmonyOS 6新功能及超薄平板,字节跳动推出全模态理解模型,携程否认大裁员传闻,星空卫视将暂停卫星传输服务。

DeepSeek行业动态
08:16
IT之家(RSS)
精选71
马斯克:xAI 作为独立公司将被解散,更名为 SpaceXAI

马斯克宣布,其人工智能公司xAI将结束独立运营,完全并入SpaceX并更名为SpaceXAI,成为后者的AI产品部门。此举源于今年2月SpaceX对xAI的收购,旨在整合人工智能、航天火箭及天基互联网等技术,最终目标是在太空部署数据中心。同时,SpaceX已与AI公司Anthropic达成协议,后者将可使用SpaceX旗下拥有超过22万颗英伟达GPU的Colossus 1数据中心全部算力,双方还计划合作开发规模达数吉瓦的轨道AI算力。

Anthropic行业动态部署/工程

推荐理由:xAI 解散并入 SpaceX,改名 SpaceXAI,同时 Anthropic 签下 Colossus 1 算力大单,马斯克的太空 AI 数据中心叙事开始落地。
08:16
IT之家(RSS)
65
Adobe Acrobat 发布 PDF Spaces:静态文档秒变 AI 交互工作空间

Adobe于5月6日在Acrobat中推出PDF Spaces功能,可将PDF、文档、链接等静态材料转化为交互式AI工作空间。该功能利用AI自动生成摘要、音频概览、品牌演示文稿及定制聊天机器人。接收者能与AI助手对话以快速获取信息并定位关键内容,适用于销售提案、市场营销和人力资源等场景。目前,该功能已在Acrobat Express和Acrobat Studio上线。

智能体产品更新多模态
08:08
08:06
宝玉@dotey
精选70
手机化身"意图路由器":Agent办公助手实现三端联动与任务自动化

Anthropic工程负责人Boris Cherny透露,他已习惯用手机管理大量Claude Agent,并通过定时任务(Loop)自动化工作。作者体验TRAE SOLO Mobile后指出,Agent正从编程工具泛化为通用办公助手。最新版本实现了移动端、Web端和桌面端的全量开放与实时同步,使手机成为随时下发指令的“意图路由器”,用户可通过语音便捷派发任务,由Agent在多设备间接力执行。同时,定时任务功能支持将日常重复性工作自动化,大幅降低使用门槛,推动办公模式向“人指挥、Agent执行”转变。

智能体教程/实践端侧
关联讨论 1X:阿易 AI Notes (@AYi_AInotes)
推荐理由:不是重大发布,但宝玉把「手机指挥Agent」的体验讲透了,如果你也想用碎片时间让AI干活、设定时任务,这一篇的实操思路可以照着抄。
08:06
meng shao@shao__meng
69
SpaceX 与 Anthropic 达成 Colossus 超算集群合作,支持 Claude 扩大推理部署

SpaceX 与 Anthropic 就 Colossus 超算集群达成合作,将 Colossus 1 出租给后者以扩展 Claude 的推理部署能力。此次合作源于埃隆·马斯克与 Anthropic 高层深入接触后,对其安全文化及团队责任感的认可。马斯克评估认为团队具备高度能力与自我批判精神,无人触发其“邪恶探测器”,Claude 很可能对人类有益。合作的关键背景是 xAI 已将训练工作迁移至 Colossus 2,从而释放了 Colossus 1 的算力资源。

Anthropic推理行业动态部署/工程
08:04
Hacker News 热门(buzzing.cc 中文翻译)
65
《深度学习理论》

一篇题为《深度学习理论》的文章在Hacker News上获得103点热度。文章探讨了深度学习的理论基础,旨在为这一复杂领域构建更系统的理解框架。尽管具体理论细节未在摘要中展开,但其核心目标指向解释深度神经网络为何有效以及如何工作,这反映了学术界和工业界对超越经验性实践、寻求坚实理论支撑的持续追求。

推理数据/训练论文/研究
08:04
Hacker News 热门(buzzing.cc 中文翻译)
52
Show HN: 《幻觉百科》

名为《幻觉百科》的新网站Halupedia正式发布,这是一个专注于收集和记录人工智能生成内容中各类“幻觉”现象的在线百科。网站旨在系统化归类AI模型产生的事实错误、逻辑矛盾或虚构信息,为开发者和研究者提供参考案例以改善模型可靠性。目前该平台已获得106个Hacker News社区点赞,显示出技术社区对此类工具的关注。

产品更新数据/训练
08:00
HuggingFace Daily Papers(社区热门论文)
63
EMO:为涌现模块化预训练混合专家模型

EMO是一种新型混合专家模型,旨在实现模块化部署,允许独立使用和组合专家子集,而无需人工定义先验。其核心设计是让来自相似领域的token依赖相似的专家,仅利用文档边界即可在预训练中自发形成连贯的专家分组。研究团队使用1T token预训练了一个活跃参数1B、总参数14B的EMO模型。完整模型性能与标准MoE相当,但关键优势在于支持选择性使用专家:仅保留25%的专家仅导致1%的绝对性能下降,保留12.5%时下降3%,而标准MoE在相同设置下会失效。此外,EMO中的专家子集在语义层面(如数学、代码等领域)实现专业化,不同于标准MoE仅表现出的低层次句法专业化。这为大型稀疏模型的模块化、内存高效部署开辟了新路径。

arXiv推理论文/研究部署/工程
07:16
IT之家(RSS)
63
SpaceX 向 Anthropic 开放大型 AI 超级计算机 Colossus 1 使用权,包含超 22 万颗英伟达 GPU

SpaceX与Anthropic达成协议,后者将获得其大型AI超算Colossus 1的全部算力使用权。该超算配备超过22万颗英伟达H100、H200及下一代GB200 GPU。Anthropic将利用这些算力显著提升Claude付费订阅用户的服务容量,包括将Claude Code的五小时速率限制提高一倍、取消高峰时段限速,并大幅提高Claude Opus模型的API速率限制。此外,双方还计划合作开发吉瓦规模的轨道AI算力设施。

Anthropic推理行业动态部署/工程
07:16
IT之家(RSS)
53
微信鸿蒙版 App 8.0.17.36 正式版更新发布

微信鸿蒙版 App 发布 8.0.17.36 正式版,安装量已达 5369 万次。本次更新聚焦视频号、听一听及支付交互功能:视频号支持资料修改、新账号注册、双击点赞及直播选项细化;听一听新增 AI 写歌与翻唱功能,并可将歌曲设为状态或跳转至 QQ 音乐;支付方面新增 Apple 服务扣费管理,收款时可选择存入零钱或零钱通。此外,还优化了头像查看、图片引用浏览、跨端文件传输及聊天框语音转文字快捷按钮等多项用户体验细节。

产品更新语音
07:11
xAI:News(网页)
精选79
Grok Imagine API 推出"Quality Mode"图像生成与编辑功能

xAI正式向企业开发者和团队推出Grok Imagine API的“Quality Mode”图像生成与编辑功能。该模式在真实性、文本渲染和创意控制上实现显著提升,能生成细节精细、纹理准确、场景逼真的图像,并具备清晰的多语言文本生成能力。在独立排行榜中,该API已位列顶级模型之列。定价为输入提示每次0.01美元,输出图像根据分辨率(1K或2K)每张费用在0.05至0.07美元之间。此功能适用于产品可视化、营销素材快速生成、用户内容风格创作等多种商业场景。

xAI产品更新多模态
关联讨论 1X:xAI (@xai)
推荐理由:Grok Imagine 的 Quality Mode 在写实度和文字渲染上提升很明显,对需要高频生成产品图和 UGC 内容的品牌团队是个实在的更新,API 直接能用,单张才几分钱。
07:07
karminski-牙医@karminski3
50
字节跳动Doubao-Seed-2.0-Lite集成AI电竞教练框架

作者开发的AI电竞教练框架“Harness Agent”被字节跳动官方采用。该框架能分析CS2游戏录屏中的走位、身法、对枪、经济等多维度数据,并提供改进建议。字节跳动将其与自家的Doubao-Seed-2.0-Lite模型结合,进行了长达25小时的不间断对局分析演示,该演示已成为Doubao-Seed-2.0-Lite的官方宣传案例。具体的项目细节视频仍在制作中。

智能体行业动态视频
06:55
OpenAI:官网动态(RSS · 排除企业/客户案例)
50
Singular Bank 借助 ChatGPT 和 Codex 助力银行家高效工作

Singular Bank 开发了名为 Singularity 的内部助手,该工具整合了 ChatGPT 和 Codex 技术,旨在帮助银行家节省日常工作时间。它主要应用于会议准备、投资组合分析和后续跟进等任务,可使银行家每天在这些事务上节省 60 至 90 分钟。

智能体OpenAI行业动态
06:40
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选72
Uber 利用 OpenAI 帮助司机更智能地赚钱、乘客更快地叫车

Uber 宣布在其全球实时交通服务平台中集成 OpenAI 技术,用于驱动 AI 助手与语音功能。新功能旨在帮助司机更智能地规划接单以提升收入,同时让乘客能够更快完成叫车流程。该技术将应用于优化实时供需匹配与用户体验。

OpenAI行业动态语音

推荐理由:Uber 把 OpenAI 的语音和助手能力搬进了打车场景,这是 AI 真正融入日常服务的一个信号,对做产品的人来说,落地路径比技术参数更重要。
06:40
06:30
Apple Machine Learning Research(RSS)
精选72
从位置认知到功能理解:为多模态大语言模型设立空间功能智能基准

现有基准如VSI-Bench主要评估基础几何感知能力,但未能触及具身智能所需的高阶认知。为此,研究团队推出了空间功能智能基准SFI-Bench,该基准包含超过1700个问题,数据来源于多样化的第一人称室内扫描视频。SFI-Bench旨在系统评估多模态大模型从物体位置感知到功能意图理解的高级空间推理能力,标志着对智能体空间认知的评估从几何层面迈向功能层面。

多模态推理论文/研究

推荐理由:Apple 自己搞的 SFI-Bench 把评估从几何定位推进到功能理解,这个方向很对,做具身智能和空间推理的团队该跟一下。
06:30
Claude Code:GitHub Releases(RSS)
51
Claude Code v2.1.132 版本更新与问题修复

Claude Code 发布 v2.1.132 版本,新增多项功能并修复超过20个问题。主要新增内容包括:为 Bash 工具子进程环境添加 `CLAUDE_CODE_SESSION_ID` 环境变量;引入 `CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN=1` 环境变量以退出全屏渲染器;在粘贴图片时显示“Pasting…”提示。关键修复涉及:外部 SIGINT 信号现在能触发优雅关机并打印 `--resume` 提示;修复了原生构建下终端关闭或 SSH 断开时的未捕获异常;解决了 `--resume` 因表情符号被截断而失败以及 `--permission-mode` 标志在恢复会话时被忽略的问题。此外,还修复了全屏模式唤醒后黑屏、特定字符输入损坏、鼠标滚动过快、内存无限增长等具体问题。

Anthropic产品更新编码
06:10
xAI:News(网页)
精选83
Grok Web 正式推出 Connectors 功能,实现与日常应用深度集成

xAI 正式在 Grok Web 上线 Connectors 功能,提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务,如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格,无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear,涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。

MCP/工具xAI产品更新

推荐理由:Grok这波连接器把 Office、GitHub 和 Notion 全打通了,不是演示级挂接,是能直接读写编辑的真集成,外加开放自建 MCP,产品经理和开发者都该立刻上手试试。
06:06
06:04
Hacker News 热门(buzzing.cc 中文翻译)
63
Google Cloud 反欺诈防护,reCAPTCHA 的全新升级

Google Cloud 发布了其反欺诈防护产品“Google Cloud fraud defense”,这是对 reCAPTCHA 的重大升级。新方案旨在为网站和应用提供更强大的自动化欺诈和滥用防护,同时致力于改善用户体验,减少对用户的中断和验证干扰。此次升级标志着 reCAPTCHA 从传统的挑战应答测试,向一个更全面、基于云服务的主动防御系统演进。

Google产品更新安全/对齐
06:04
Hacker News 热门(buzzing.cc 中文翻译)
精选76
Show HN: Tilde.run - 具备事务性和版本控制文件系统的代理沙箱

Tilde.run 发布了一款代理沙箱,其核心特点是具备事务性和版本控制功能的文件系统。该系统支持事务操作,确保文件更改的原子性,同时提供完整的版本历史记录。该工具旨在为开发者提供一个安全、可回溯的代码执行环境,适用于需要高可靠性的自动化代理或脚本测试场景。目前该项目已在 Hacker News 上获得 102 点关注度。

智能体产品更新部署/工程

推荐理由:Agent 沙箱里的文件操作终于有了事务和版本回滚,对自动化链路调试是个实在的改进,搞 LLM 工具调用的可以试试。
05:30
GitHub Blog
精选56
Validating agentic behavior when "correct" isn't deterministic

GitHub 探讨如何为 Copilot 编码智能体构建“信任层”。文章提出,在“正确”答案非确定性的场景下,可通过领域分析来验证智能体的自主行为,避免使用脆弱的脚本或黑盒判断。该方法旨在提升 AI 编码助手的可靠性与透明度,确保其行为符合预期标准。

智能体GitHub教程/实践编码

推荐理由:做coding agent最头疼的就是如何验证产出质量,GitHub这篇把他们的内部方法论开源了,用dominance分析替代脆弱的脚本,对正在折腾AI编程工具的团队是实打实的参考,值得逐帧学习。
04:34
Rohan Paul@rohanpaul_ai
57
NVIDIA、微软和OpenAI联合推出多路径可靠连接(MRC)协议

多路径可靠连接(MRC)是一种新型RDMA传输协议,由NVIDIA、微软和OpenAI联合推出,并与AMD、博通和英特尔合作。该协议首先在NVIDIA Spectrum-X以太网硬件上得到验证和优化。MRC的核心创新是改变连接方式,允许单个RDMA数据流利用多条网络路径传输AI训练流量,而非强制每个GPU连接走单一固定路由。RDMA技术使GPU能以极少CPU帮助移动数据,这对于数千GPU在训练中不断交换模型更新至关重要。当网络出现拥塞、链路故障或交换机过载时,流量可自动绕行,无需软件层面修复,从而避免单一不良路径拖慢整个计算集群,保障大规模AI训练任务的高效进行。

OpenAI数据/训练行业动态部署/工程
04:34
Rohan Paul@rohanpaul_ai
精选76
xAI正在成为SpaceXAI。
xAI行业动态

推荐理由:Musk 把 xAI 拆了塞进 SpaceX,这一步比任何模型发布都更狠,但「SpaceXAI」这名字更像 PR 操作,关键得看 Grok 团队是真融合还是换个招牌。