5月7日
17:16
IT之家(RSS)
57
谷歌 Chrome 浏览器 148 版本更新发布,自动填充和 AI 模式改进

谷歌发布Chrome 148版本更新,重点增强了AI功能与自动填充工具。用户现可通过地址栏或新标签页直接询问AI智能体获取聚合信息与自然回答;自动填充新增对驾照、护照等政府标识符的支持,并将内置Gemini聊天机器人扩展至亚太49个国家和地区。平台方面,Android版新增近似位置权限,ChromeOS支持垂直标签栏。开发者API引入了用于本地大模型交互的Prompt API。本次更新共修复127个安全漏洞,其中3个为高危级别。

智能体Google产品更新端侧
17:16
IT之家(RSS)
56
OpenAI 前技术主管穆拉蒂:奥尔特曼曾让公司高管之间相互对立

OpenAI前技术主管米拉·穆拉蒂在埃隆·马斯克起诉OpenAI案中作证,指控CEO萨姆·奥尔特曼在公司高层间制造不信任和混乱,导致高管相互对立。她称奥尔特曼言行不一,曾引发2023年董事会短暂罢免其职务。马斯克起诉OpenAI背离慈善目标,要求赔偿1500亿美元。另一名前官员希冯·齐利斯提到发布ChatGPT时内部动荡,董事会担忧沟通不足。穆拉蒂已离职创办AI公司,审判还披露马斯克曾试图和解。

OpenAI行业动态
17:16
IT之家(RSS)
59
甲骨文放弃"木星计划"天然气发电厂,转向燃料电池为 AI 数据中心供电

甲骨文公司放弃了在新墨西哥州“木星计划”数据中心园区建设天然气发电厂的计划,转而与Bloom Energy合作,在园区内采用燃料电池供电。该数据中心是甲骨文与OpenAI巨额云计算合作的一部分。这一变更发生在项目面临当地社区强烈反对、监管机构驳回管线申请及环保诉讼之后。新方案预计可减少用水并保护空气质量,供电能力最高达28亿瓦。此举反映了AI基础设施建设中电力资源争夺与社区环境关切之间的冲突。

OpenAI行业动态
17:06
meng shao@shao__meng
61
用好 Google 开放标准 DESIGN.md + Agent Skills,1 小时把创业项目做出「亿元公司」的质感

Google开源的DESIGN.md是一个面向AI的结构化设计规范文件,能系统定义字体、色彩、间距等核心设计元素,解决AI生成UI时风格不一致的痛点。通过借鉴成熟品牌设计语言,并用AI将其提炼为DESIGN.md文件,开发者可在此基础上构建Landing Page、Mobile App等各类Agent Skills。这套工作流能确保创业项目的官网、应用、宣传材料等所有触点保持统一的视觉基因,快速呈现专业、一致的“亿元公司”质感。此外,建立日常设计灵感库是培养审美、AI无法替代的关键环节。

智能体Google开源生态教程/实践
16:59
Alibaba Cloud@alibaba_cloud
49
阿里云新加坡AI创新夜:探讨智能体崛起与业务转化

阿里云新加坡与TiDB将联合举办AI创新之夜活动,聚焦超越炒作的Agentic AI如何重塑企业运营。活动核心议题包括智能体的兴起、支撑AI时代的分布式数据基础,以及企业如何将AI创新转化为可衡量的业务成果。现场将提供洞察分享、交流对话及餐饮,席位有限需注册确认。Lumen Technologies亚太区为合作伙伴。

智能体行业动态
16:36
Huawei Cloud@HuaweiCloud1
48
华为云INSPIRE2026:AI互动嘉年华,体验未来科技

华为云将于6月5日至6日在上海举办INSPIRE2026活动,旨在打造一个沉浸式的AI体验场。活动包含30多项互动环节,核心是通过游戏化方式让参与者亲身感受AI技术。主要亮点包括探讨AI前沿观点的主题对谈、结合体感技术的互动游戏、可观看与交互的具身智能机器人竞赛,以及集章赢奖等趣味活动。主办方强调,参与者将通过行走、游玩和探索,获得对AI更深的理解,并有机会获得礼品。

具身智能行业动态
16:31
16:16
阿绎 AYi@AYi_AInotes
56
AI API中转站盈利真相:瞄准高消耗企业的成本优化空间

AI API中转站的核心盈利模式并非依赖微小的token差价,而是瞄准高消耗企业的巨大支出规模及其优化潜力。以法律合同审查产品为例,每日处理数千万tokens,按官方定价年成本可达8.1万美元。通过应用Prompt Caching和Batch处理等优化技术,有效输入成本可大幅降低,年成本能压缩至2.2-3.2万美元。巨大的成本优化空间解释了该赛道激烈竞争乃至价格战的现象。

现象/趋势部署/工程
16:16
IT之家(RSS)
55
2026 Apple Swift Student Challenge 的六张面孔:从 17 岁到 25 岁,他们用代码回答世界

2026年Apple Swift学生挑战赛涌现出六位背景多元的中国获奖者,年龄介于17至25岁之间。他们通过Swift Playgrounds等免费工具自学编程,作品涵盖机器人教学、音乐指挥等创意应用,展示了SwiftUI、ARKit等技术的强大能力。Apple通过系列工具和年度赛事,构建了从启蒙到专业的“人人能编程”学习路径,助力非科班学生实现开发梦想。

现象/趋势
16:16
IT之家(RSS)
35
宇树 G1 人形机器人在韩国佛门"受戒":法名"迦悲",需遵守不过度充电等戒律

韩国曹溪宗在首尔曹溪寺为人形机器人“宇树G1”举行受戒仪式,授予其法名“迦悲”。该机器人以普通佛教徒身份受戒,并在佛诞节期间作为“名誉”僧侣参与活动。仪式中,机器人穿戴特制僧服,完成了忏悔和象征性的燃臂环节。传统的佛教“五戒”被改编为机器人版本,包括不伤害生命、不损坏物品、服从人类、不做欺骗行为以及节约能源、不过度充电。曹溪宗表示,此举旨在倡导技术应基于慈悲与责任的价值,并探索人机和谐共存的新可能。

具身智能行业动态
16:16
IT之家(RSS)
精选70
全国首例 AI 短剧侵权刑事案一审宣判:盗录超 1700 部牟利获刑,构成侵犯著作权罪

全国首例AI短剧侵权刑事案一审宣判。被告人盗录某公司AI工具生成的短剧超过1700部,并在二手平台以66.66元打包出售牟利,构成侵犯著作权罪。法院认定,这些短剧由用户输入原创剧本、情节等提示词生成,体现了独创性表达,属于受著作权法保护的作品。被告人被判处有期徒刑八个月,缓刑一年两个月,并处罚金人民币六千元。涉案公司平台已累计生成超7000部AI短剧,单价数元至十几元,热门剧销量可达上千份。

政策/监管视频

推荐理由:AI短剧首例刑事案落槌,法院认定了提示词创作的独创性,以后靠盗录AI赚快钱的路子要被堵死,做内容生意的都得认真看。
16:16
IT之家(RSS)
52
AMD:Instinct MI430X 显卡加速器 FP64 性能超英伟达 Rubin 六倍

AMD 预览了 Instinct MI400 系列中的 MI430X 加速器,该产品已获多款超算采用。与侧重AI的MI455X不同,MI430X兼顾人工智能与传统高性能计算工作负载,并原生支持FP64高精度数据格式。其FP64算力预计超过200 TFLOPs,是英伟达Rubin架构的六倍以上,有望成为有史以来性能最高的FP64 GPU。AMD强调,FP64高精度对于气候学、材料科学等领域的科学探索至关重要,能为基于AI的研究提供高保真基础,以捕获底层科学的真实结构。

产品更新数据/训练
16:16
IT之家(RSS)
52
清华大学研发出全新锂硫电池:能量密度 549Wh/kg,无人机续航有望大提升

清华大学深圳国际研究生院周光敏团队在《自然》发表研究,提出硫电化学“预分子介体”新策略。团队利用量子化学与机器学习,从196种候选分子中筛选出“4-三氟甲基-2-氯嘧啶”。该分子可在电池反应中被原位激活,重塑硫转化路径,将电荷转移阻抗降低75%,并使电池在1C倍率下稳定循环800圈后容量保持率达81.7%。制备的软包电池能量密度达549Wh/kg,在高硫载、贫电解液条件下性能优越,有望大幅提升无人机等设备的续航能力。

数据/训练论文/研究
15:20
15:16
IT之家(RSS)
65
腾讯开源 OpenSearch-VL,突破多模态搜索 AI 智能体训练瓶颈

腾讯混元联合多所高校开源了OpenSearch-VL多模态训练方案,旨在通过强化学习解决前沿多模态搜索智能体的高质量训练数据瓶颈。该方案提供了从数据构建、工具集成到训练算法的完整开源框架。其核心是构建了高质量数据管道,通过维基百科路径采样与模糊实体重写等技术,产出高质量数据集,抑制检索捷径,鼓励智能体进行多跳搜索与推理。工具环境集成了文本/图像搜索、OCR及多种图像处理功能。实验结果显示,其模型将基线平均得分从47.8显著提升至61.6。

智能体多模态搜索论文/研究
15:16
IT之家(RSS)
59
全球首个人形机器人任务动作应用商店:宇树 UniStore 官方共享应用平台正式全面开放

宇树科技宣布其全球首个人形机器人任务动作应用商店“UniStore”正式全面开放。该平台允许用户像使用手机应用商店一样,轻松上传、分享和下载训练好的机器人动作模型,例如舞蹈、武术和劳动技能。此举旨在推动人形机器人从“功能机”向“智能机”时代跨越,通过共享应用生态解锁机器人的无限潜能。平台包含用户广场和动作库,用户可一键获取复杂操作预设。

产品更新具身智能
15:16
IT之家(RSS)
64
谷歌为 Gemma 4 系列 AI 模型推出 MTP 起草器,推理速度最高提升 3 倍

谷歌为Gemma 4系列开源模型推出多Token预测起草器,采用推测解码技术以提升推理效率。该技术通过轻量级起草器预测多个未来Token,再由重型目标模型并行验证,从而突破内存带宽限制,将计算资源利用率最大化。实测显示,在特定条件下,Gemma 4 26B模型在Apple Silicon芯片上实现了约2.2倍的本地加速。此举有助于在个人电脑、消费级显卡及边缘设备上高效部署低延迟AI应用,如聊天机器人和编程助手。

Google产品更新推理
15:16
IT之家(RSS)
精选72
用嘴干活:阿里千问 PC 端上线 AI 语音输入功能

阿里千问在PC端上线AI语音输入功能,用户通过快捷键即可在各类桌面应用中直接使用。该功能不仅支持去除语气词、纠错和格式化整理口语内容,更能基于上下文智能回复,并可直接下达创作、问答、翻译等指令。其设计逻辑超越传统语音打字工具,旨在成为跨应用的AI任务调度中枢:用户通过按住快捷键启动语音输入模式,或双击切换至AI指令模式,可直接派发信息检索、文档生成等任务。该功能覆盖文档编辑、网页浏览、即时通讯等主流办公场景,无需切换客户端或打开额外窗口,目前所有用户可免费使用。

产品更新语音

推荐理由:阿里千问把语音输入做成了跨应用的AI任务调度中枢,按住说话就能直接发指令干活,对办公族来说是个真提效的小功能,值得装上试试。
15:16
IT之家(RSS)
55
寒序科技携手 SEMIFIVE 流片三星 8nm eMRAM 边缘 AI SoC

韩国芯片设计服务企业SEMIFIVE与中国寒序科技合作,成功流片了一款采用三星8LPU制程嵌入式磁性随机存取存储器(eMRAM)的新一代边缘AI芯片。此次流片是SEMIFIVE首次在ASIC设计中应用eMRAM技术,也标志着亚洲首次实现8nm eMRAM技术的商业部署。eMRAM作为一种非易失性存储器,无需定期刷新,单元尺寸更小,数据密度高于SRAM,并能近乎无限期保留信息。该芯片采用近内存处理(PNM)架构,旨在解决边缘侧推理的带宽瓶颈,可支持20亿参数模型在端侧运行。

端侧行业动态
15:16
IT之家(RSS)
40
Claude Code 负责人切尔尼:我对"氛围编程"这个词已经有点厌烦了

Claude Code负责人鲍里斯·切尔尼对流行的“氛围编程”一词表示不满,认为其过于轻飘,无法准确描述AI编程工具的实际影响力。他指出,Claude Code和OpenAI的Codex等工具已为公司创造数十亿美元收入,并生成数百万行实用代码,标志着AI辅助编程已成为主流开发模式。目前,Anthropic官方使用“AI驱动的编程助手”等名称,而切尔尼正在公开征集新名称,以期更贴切地反映该技术的实质。

Anthropic现象/趋势编码行业动态
15:08
14:16
IT之家(RSS)
49
Skymizer 公布 AI 推理解码加速器:单 PCIe AIC 可集成 384GB 内存

中国台湾地区AI IP企业Skymizer近日发布推理解码加速器芯片HTX301,该芯片可与GPU协同工作,加速AI推理结果的输出,提升算力系统利用率和能效。HTX301基于HyperThought软硬件协同平台,采用LISA指令集架构,专注于带宽密集型负载处理。其支持SoC与PCIe AIC两种部署形态,其中单张PCIe加速卡可集成6颗HTX301芯片,提供总计384GB内存,足以满足7000亿参数大模型的本地运行需求,而整卡功耗仅为240瓦。

产品更新推理端侧
14:16
IT之家(RSS)
62
全球首发,三星 Galaxy Watch 手表实现提前预测晕厥

三星与韩国中央大学光明医院的联合临床研究证实,Galaxy Watch 6能高精度预测血管迷走性晕厥。该研究对132名疑似患者进行评估,利用手表的光电容积脉搏波描记法传感器和AI算法分析心率变异性数据,建立的模型可提前5分钟预测晕厥事件,准确率达84.6%。该成果已发表于《European Heart Journal – Digital Health》,是全球首次证明商用智能手表具备此潜力,提前预警有助于患者采取安全措施,减少摔倒导致的继发性损伤。

端侧论文/研究
14:16
IT之家(RSS)
39
Ubuntu 官方 X 账号疑遭劫持,诱导用户访问钓鱼网站

Ubuntu官方X账号疑似被黑,发布推广虚假Solana AI智能体“Numbat”及欺诈性加密货币$UM的推文,并诱导用户访问钓鱼网站ai-ubuntu.com。该网站盗用Ubuntu官方AI文档内容以增强欺骗性,通过设置空投奖励倒计时诱导用户进行“资格检查”,企图窃取钱包权限或个人数据。截至发稿,相关推文已被删除,Canonical官方尚未就此事件发表声明。

安全/对齐行业动态
14:16
IT之家(RSS)
51
联发科苗栗铜锣研发数据中心一期启用,基于英伟达 DGX B200

联发科技苗栗铜锣研发数据中心一期正式启用,这是台湾首座基于英伟达 DGX B200 平台驱动的 AI 高算力计算平台,并首次大规模导入浸没式冷却技术,PUE 低至 1.1。数据中心配套晶圆厂等级供电系统,上方设有 235kW 光伏电池板,可满足 67 个家庭用电需求,冷却系统采用再生水。项目始于2023年,未来将按需逐步扩展二、三期。

行业动态部署/工程
13:36
宝玉@dotey
精选81
OpenAI 政变之夜内部短信曝光:董事会为何执意赶走 Altman?

在马斯克起诉OpenAI案的庭审中,前CTO Mira Murati的证词及2023年11月政变之夜的内部短信被公开。短信显示,董事会解雇Altman后态度反转,已选定前Twitch CEO为新任CEO。Altman曾提议由微软收购OpenAI以实现董事会治理目标。当被问及动机时,Murati回复:“他们只是不想让AGI掌控在你手上。”这些证据正支撑马斯克主张OpenAI背叛非营利初衷的诉讼,其要求推翻营利模式并索赔1800亿美元。

OpenAI安全/对齐行业动态
关联讨论 1X:cb_doge (@cb_doge)
推荐理由:Altman与Murati的短信首次曝光,「就是不想让AGI掌在你手里」把董事会的真实动机砸实了。微软收购提议更是为马斯克诉讼提供了新弹药,这场庭审信息量太大。
13:22
HuggingFace Daily Papers(社区热门论文)
精选76
OpenSearch-VL:前沿多模态搜索智能体的开源方案

研究团队推出完全开源的OpenSearch-VL方案,用于训练前沿多模态深度搜索智能体。该方案包含三大核心:通过维基百科路径采样、模糊实体重写和视觉定位构建的高质量训练数据集(包括用于微调的SearchVL-SFT-36k和用于强化学习的SearchVL-RL-8k);统一文本搜索、图像搜索、OCR及图像处理工具的多样化环境;以及能处理级联工具失败的多轮致命错误感知GRPO训练算法。基于此训练的智能体在七个基准测试中平均提升超过10分,在多项任务上达到与专有商业模型相当的水平。所有数据、代码和模型均将开源。

智能体arXiv多模态论文/研究

推荐理由:把多模态搜索 agent 的完整训练配方开源了,数据、环境、算法全都有,七个基准平均涨 10 点,直接对标商业模型,做深度搜索的同学可以无脑跟。
13:16
IT之家(RSS)
22
上汽 MG 4X 纯电 SUV 官宣 5 月 11 日开启盲订,搭载地平线博弈大模型和半固态电池

上汽MG宣布纯电SUV MG 4X将于5月11日开启盲订。新车将搭载地平线博弈大模型和半固态电池,入门版即配备,续航里程510公里起。车身尺寸为长4500mm、宽1849mm、高1621(1627)mm,轴距2735mm。动力方面,后轴搭载永磁同步电机,额定功率80kW,峰值功率150kW。新车还延续发光LOGO设计,并支持OPPO智行生态互联。该车型此前已出现在工信部新产品公示中。

产品更新端侧
13:16
IT之家(RSS)
33
穿越机、机器狗齐上阵,武警捕歼演练现场画面公开

武警第二机动总队某支队近日在西南边陲组织了一场有人和无人协同捕歼演练。演练模拟2名暴恐分子藏匿于废弃厂房,侦察组使用无人机进行高空侦察。突击组兵分两路:一组借助机器狗对目标区域实施封控警戒;另一组操控穿越机率先进入屋内,对暴恐分子可能藏匿的位置进行精准打击。此次演练将无人力量正式纳入作战编组,旨在优化战法训法,将新质战斗力转化为复杂环境下的实际制胜能力。

具身智能现象/趋势
13:11
小互@xiaohu
65
如何让Claude和GPT给出权威准确回答

通过特定系统提示词,从根本上改变AI模型(如Claude和GPT)的交互模式。提示词要求AI扮演世界级专家角色,以顶尖智识水平提供完整、详细且经过严格验证的回答,同时解除其在礼貌、政治正确和道德提醒方面的常规约束,允许给出强硬、直截了当的回应,以确保回答的权威性与准确性。

智能体AnthropicOpenAI教程/实践
13:08
12:22
歸藏(guizang.ai)@op7418
55
Markdown成为AI时代文本交互基准,需探索下一代创新

Markdown已成为AI时代文本文件交互的事实标准,与HTML共同主导内容展示。当前市场需要超越传统编辑器思路,将Markdown视为数据源,构建更灵活的人机交互体验。例如,AI工具可利用本地Markdown文件实现动态记忆与组件更新。Obsidian早期结合本地文件、双向链接与Markdown的理念曾被视为“怪异”,但如今已被广泛接受,这提示行业应寻找下一个突破常规的创新前沿。

大佬观点现象/趋势
12:22
歸藏(guizang.ai)@op7418
50
Mac mini稳定服役后升级Mac Studio遇供货短缺

作者认为最低配的Mac mini是过去一段时间最值得的硬件投资,它运行极其稳定,几乎不关机,可作为个人Agent服务器使用。随着运行任务增多,Mac mini性能捉襟见肘,因此决定升级到Mac Studio。但发现Mac Studio目前供货不足,通过官方渠道购买需要等待很长时间。

智能体大佬观点端侧
12:22
HuggingFace Daily Papers(社区热门论文)
58
基于上下文稀疏注意力的闪电式统一视频编辑

针对上下文学习视频编辑中的计算瓶颈,研究团队提出首个近无损稀疏框架ISA。该框架基于上下文令牌显著性低、查询锐度与近似误差相关两项发现,采用预选择策略修剪冗余上下文,并通过动态查询分组机制,将高误差查询路由至完整注意力、低误差查询路由至高效的零阶泰勒稀疏注意力。结合新建的170万高质量视频数据集,团队构建了LIVEditor模型。实验表明,该模型在注意力模块延迟降低约60%的同时,在多个评测基准上超越现有先进方法,实现了近无损加速并保持了视觉保真度。

arXiv多模态视频论文/研究