4月30日
01:42
Ant Ling@AntLingAGI
精选61
AntLingAGI 开源了 Ling-2.6-1T 模型,这是一个面向现实世界智能体工作流程的新旗舰模型。作为 1T 参数规模模型的先驱,团队强调了硬件、软件与 LLM 协同设计的重要性。vLLM 项目从发布首日(Day-0)起即提供支持,体现了顶尖工程生态系统的协作。这种合作旨在实现最佳的优化效果与用户体验,共同推动技术进步。
智能体开源生态模型发布
关联讨论 3X:蚂蚁百灵 (@AntLingAGI)X:Artificial Analysis (@ArtificialAnlys)X:阿易 AI Notes (@AYi_AInotes)
推荐理由:vLLM 对 1T 模型的 Day-0 适配,说明开源推理栈对大尺寸模型的跟进速度越来越快,做私有化部署的可以直接参考官配 recipe 跑起来。
01:42
The Decoder:AI News(RSS)
57
Google Gemini 现可直接在聊天界面内生成完整文档、电子表格和演示文稿

Google Gemini 新增了在聊天界面内直接创建完整办公文档的功能。用户现可基于PDF、Word文件等源材料,让AI生成对应的文档、电子表格和演示文稿。这一集成将内容创建流程进一步简化,用户无需切换应用即可在对话中完成多种办公文件的制作。

Google产品更新
00:39
Google Developers Blog(RSS)
精选57
加速AI:通过GCSFS和Rapid Bucket将Google Colossus引入PyTorch

Google Cloud推出了一项高性能集成方案,通过fsspec接口将Rapid Storage直接连接至PyTorch,以消除AI训练瓶颈。该方案利用Google的Colossus架构和双向gRPC流技术,可提供高达15 TiB/s的聚合吞吐量,并显著降低延迟。开发者仅需更新存储桶类型而无需修改代码,即可将总训练时间缩短23%。

Google产品更新部署/工程

推荐理由:Google 把自家 Colossus 存储架构直接接进 PyTorch,号称零代码改动提速 23%,做大规模训练的团队值得评估一下,但对大多数人来说这更像 GCP 的护城河加固。
00:39
Hugging Face:Blog(RSS)
50
DeepInfra 登陆 Hugging Face 推理服务提供商 🔥

DeepInfra 作为高性能、低成本的推理服务提供商,现已在 Hugging Face 平台正式上线。该服务支持众多开源模型,包括 LLaMA、Mistral 等系列,并提供按需付费的灵活计费模式。其 GPU 实例涵盖 H100、A100 等多种型号,显著降低了 AI 模型部署与调用的门槛,进一步推动了开源人工智能技术的普及与应用。

Hugging Face行业动态部署/工程
00:08
4月29日
22:34
IT之家(RSS)
60
华为鸿蒙"龙虾"小艺 Claw 迎重磅更新:上线"自进化"能力、接入 DeepSeek V4

华为鸿蒙“龙虾”小艺 Claw 迎来11.6.3.300版本更新。核心升级包括上线“自进化”能力,可学习用户长期偏好以减少重复沟通;并正式接入DeepSeek V4模型,获得百万级上下文处理能力,在信息搜集、文档处理等任务中具备更强推理能力。此外,更新引入了社区与生态伙伴的精选技能,覆盖金融、办公等多领域。该智能体已获得信通院首个终端厂商权威安全认证。目前,支持该功能的小艺App已开启尝鲜升级。

智能体产品更新推理
22:33
21:45
向阳乔木@vista8
精选71
OpenAI开源Symphony:为每个任务分配AI代理的项目管理系统

OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具(如Linear)的任务看板作为控制中枢,为每个任务自动分配并运行一个独立的AI代理(基于Codex),直至完成。人类仅在“人工审查”节点介入,实现了从微观管理到任务级分配的转变。系统允许大粒度任务,代理能自主拆解依赖、创建新任务,并保证持续运行。初步数据显示,该方法能显著提升开发效率。

智能体GitHubOpenAI开源生态
关联讨论 3X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)OpenAI:官网动态(RSS · 排除企业/客户案例)
推荐理由:Symphony 把 AI 代理管理从盯着终端变成了管理看板,对每个任务自动分配代理,这个思路会让所有用 AI 编程的团队重新思考工作流程,做工程落地的建议都看看。
20:33
Qwen@Alibaba_Qwen
精选60
闪存QLA:基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。

开源/仓库推理端侧

推荐理由:2 倍加速的背后是 Warp 特化流水线和自动 Copy 策略,像给手机 GPU 开了条专用跑道,做端侧 Agent 的可以直接拉代码试试。
20:12
The Decoder:AI News(RSS)
53
Google 在欧洲推出 Gemini 记忆功能,并希望用户导入 ChatGPT 数据

Gemini 现已具备记忆用户偏好的能力,并支持从其他人工智能应用导入聊天历史记录。该功能率先在欧洲市场推出,允许用户将外部数据(例如来自 ChatGPT 的对话记录)迁移至 Gemini,以提升服务的个性化体验。

Google产品更新
20:00
Cursor Blog
精选75
使用 Cursor SDK 构建可编程智能体

Cursor 正式推出 SDK 公开测试版,开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型(如 GPT-5.5)支持,并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施,如安全沙箱和持久状态管理,智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。

智能体产品更新编码

推荐理由:Cursor 把自家产线拆出来给外部用,对于想把 AI 代理嵌入 CI/CD 或产品的团队,省掉了自建完整 agent 栈的麻烦,对做自动化编码的开发者是个必看的更新。
20:00
OpenRouter:Announcements(RSS)
精选65
通过 Stripe Projects 命令行创建 OpenRouter 账户

运行 `stripe projects add openrouter/api` 命令,即可直接从命令行创建 OpenRouter 账户、获取 API 密钥并开通 Stripe 计费功能。该操作支持自动化代理执行,实现了账户开通与支付配置的一站式集成。

产品更新部署/工程

推荐理由:OpenRouter 把账户创建搬到了 CLI,你的 agent 也可以直接开号了,这对于需要自动化计费流程的开发者是个便利小更新,但普通用户几乎感受不到变化。
18:42
Orange AI@oran_ge
60
只要你学得慢,就什么都不用学

作者以文科生经历指出,过去因缺乏技术工具难以实现想法。如今借助AI,其团队开发的Cola平台让非技术人员无需编程,仅通过描述需求即可快速创建应用,如自动剪辑语气词的工具。作者强调,AI时代稀缺的是想法与审美,而非技术技能。Cola旨在像打电话一样简单使用AI。平台近期因集成低成本DeepSeek V4模型,开启第二轮免费内测,目前支持Mac设备,目标是让每个人都能轻松跟上技术浪潮,实现“言出法随”。

产品更新现象/趋势
18:34
IT之家(RSS)
18
砺算科技 7G100 国产显卡官宣 5 月 20 日首发开售,官方晒工厂产线回应"画大饼"质疑

砺算科技宣布其国产显卡砺算科技7G100将于5月20日在京东首发开售。为回应“画大饼”质疑,官方通过视频展示了该显卡的制造与测试产线。该GPU采用TrueGPU架构,基于6nm工艺,宣称从核心到架构均为自主研发。同系列消费级型号LX 7G106配备12GB GDDR6显存,兼容主流图形API,可运行《赛博朋克2077》等游戏并支持AI PC大模型,且7G100已通过微软WHQL认证。

产品更新端侧
18:34
IT之家(RSS)
26
三星新款 Win11 Arm 笔记本 Galaxy Book 6 Edge 发布:16 英寸屏幕、厚 12.3 毫米

三星在法国发布了新款Windows 11 Arm笔记本Galaxy Book 6 Edge。该机配备16英寸Dynamic AMOLED 2X屏幕,支持120Hz刷新率,并搭载了算力更强的骁龙X2 Elite处理器,NPU算力最高达80 TOPS。机身厚度显著缩减至12.3毫米。其续航表现突出,满电可播放视频22小时,并支持65W快充。提供512GB和1TB存储版本,冰川灰配色,预计5月初开售,起售价约为2199欧元。

产品更新其他
17:33
IT之家(RSS)
52
DeepSeek 终于能"看图"了!灰度"识图模式",图片理解功能内测

DeepSeek已灰度测试“识图模式”,新增多模态图片理解功能,用户可上传图片并获取描述。该模式与“快速模式”“专家模式”并列,并非简单OCR文字识别。部分测试用户反馈响应速度很快,类似flash;但亦有用户遇到“识图模式暂不可用”提示。网络响应内容显示该功能模型类型为“vision”,状态为“图片理解功能内测中”。

DeepSeek产品更新多模态
16:33
IT之家(RSS)
27
华为 MateBook 14 鸿蒙版电脑 HarmonyOS 6.1 版本发布,新增支持对单应用调节音量

华为为MateBook 14鸿蒙版推送了HarmonyOS 6.1更新。核心更新包括新增对单个应用进行音量调节的功能,以及全新的沉浸光感视效。智慧助手小艺获得增强,新增联网分析、投喂感应区和深度解题智能体等功能。多屏协同能力提升,支持同时打开多个手机协同窗口。此外,更新还带来了Dock栏高度自定义、触控板快捷返回、浏览器双击关闭标签页、文件直接拖拽解压等多项系统与应用优化。

产品更新端侧
15:33
IT之家(RSS)
43
蚂蚁数科亮相 2026 数字中国建设峰会,推出 DataX 智能体数据生态平台

蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议(MCP)和专用智能体DTClaw,旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库,将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent,实现“开箱即用”。平台还构建了基于数据的图谱知识库,支持通过自然语言进行智能编排与高效检索,帮助企业快速构建专业智能体。

智能体MCP/工具产品更新数据/训练
15:33
IT之家(RSS)
39
漫步者首款带屏旗舰耳机 Lolli5 ANC 发布,首发 539 元

漫步者发布其首款带屏旗舰耳机Lolli5 ANC,首发价539元,将于5月6日开售。该耳机充电盒配备智能触控屏,可显示时间并控制音乐、拍照。采用第4代半入耳前腔设计,支持ANC自适应降噪与3+3麦智能通话降噪,通过双Hi-Res金标认证,具备IP55级防尘防水。搭载13mm双复合LCP液晶振膜单元,支持豆包与DeepSeek双AI问答、会议录音及App实时互译功能,采用蓝牙6.0并支持双设备连接。

其他
15:33
IT之家(RSS)
39
特斯拉更新 FSD 接管反馈菜单,新增"导航问题"选项

特斯拉在最新软件更新中,将FSD系统的接管反馈菜单里的“其他问题”选项替换为专门的“导航问题”选项。此举旨在更精准地收集因导航故障(如限速错误、路线规划不合理)导致的人工接管数据,直接回应了车主长期以来的集中反馈。通过这一分类优化,特斯拉希望为神经网络模型提供更纯净的数据,以优先改进其自动驾驶系统的导航算法和地图精度。

产品更新
14:38
ginobefun@hongming731
57
BestBlogs 上新"主题解读"栏目

BestBlogs 推出“主题解读”新栏目,旨在解决信息过载下内容分散的痛点。该栏目并非简单罗列文章,而是由编辑围绕特定事件、领域或横向对比,将站内多篇内容重新组织成系统性解读。内容涵盖大模型发布、技术领域话题及工具对比等,为用户提供串联知识的入口,并邀请读者反馈需补充的主题方向。

产品更新
13:33
IT之家(RSS)
51
腾讯张军:腾讯文档正式"塞进"WorkBuddy,变成 AI 工具一个真正的原子组件

腾讯公关总监张军宣布,腾讯文档已正式集成至全场景AI智能体WorkBuddy中,成为其一个真正的原子组件。此次整合后,WorkBuddy支持直接连接腾讯文档,用户修改文档后可即时保存至云端。同时实现了小程序与电脑端的能力体验同步,用户可通过手机指挥AI处理云端文档,提升了办公场景下的易用性和效率。

智能体产品更新
13:33
IT之家(RSS)
50
Adobe Photoshop 引入 AI 3D 旋转对象功能,光影可自动匹配

Adobe于4月29日更新了Photoshop和Lightroom。Photoshop引入了全新的AI“旋转对象”工具,用户可在3D空间中实时旋转、倾斜和翻转素材,点击“协调”按钮可自动调整光照和阴影以匹配背景。同时,Photoshop还推出了“图层清理”工具,能智能清理、组织并自动重命名图层,移除空图层。Lightroom的搜索功能现支持自然语言描述查找照片,新增多款胶片风格预设,且辅助筛选速度更快,交互式滑块性能提升最高达5倍。

产品更新图像生成多模态
13:33
IT之家(RSS)
46
微软酝酿 Win11 新版时钟应用:专注模式支持"反思",任务集成 AI 建议

微软正测试Windows 11新版时钟应用,重点升级“专注”功能并集成任务管理与AI辅助。新界面采用圆角设计,任务面板占据半屏,支持排序并深度联动Microsoft To Do。专注模式可最小化运行,允许自定义时长与休息间隔,新增“反思”环节供用户记录专注状态。AI能为任务步骤提供智能建议,可能依托本地NPU运行。当前测试版尚不完善,基础模块如闹钟暂缺,且运行时内存占用接近旧版两倍。

产品更新