AIHOT

4月30日

01:42

Ant Ling@AntLingAGI

精选61

AntLingAGI 开源了 Ling-2.6-1T 模型，这是一个面向现实世界智能体工作流程的新旗舰模型。作为 1T 参数规模模型的先驱，团队强调了硬件、软件与 LLM 协同设计的重要性。vLLM 项目从发布首日（Day-0）起即提供支持，体现了顶尖工程生态系统的协作。这种合作旨在实现最佳的优化效果与用户体验，共同推动技术进步。

智能体开源生态模型发布

关联讨论 3 条

推荐理由：vLLM 对 1T 模型的 Day-0 适配，说明开源推理栈对大尺寸模型的跟进速度越来越快，做私有化部署的可以直接参考官配 recipe 跑起来。

01:42

The Decoder：AI News（RSS）

Google Gemini 现可直接在聊天界面内生成完整文档、电子表格和演示文稿

Google Gemini 新增了在聊天界面内直接创建完整办公文档的功能。用户现可基于PDF、Word文件等源材料，让AI生成对应的文档、电子表格和演示文稿。这一集成将内容创建流程进一步简化，用户无需切换应用即可在对话中完成多种办公文件的制作。

Google产品更新

01:41

TestingCatalog News 🗞@testingcatalog

Mistral AI宣布其Le Chat平台现已直接集成Mistral Vide功能。同时，平台推出了处于预览阶段的Work Mode，这是一个能够处理复杂、长期任务的智能体。该模式专为研究、分析和跨连接工具执行操作等场景设计，默认开启连接器，可自动从文档、电子邮件和日历中获取上下文信息。任务会话会持续进行，直至任务完成。

智能体产品更新视频

01:13

Replit ⠕@Replit

课堂改变了。作业改变了。我们的学习方式改变了。已有1800万学生在Replit上构建项目，现在，他们有了专属空间。无需设置。无需听课。只管构建。教师可免费使用。学生购买Core可享五折优惠。如果您正在运营项目，我们将助您扩大规模。立即申领：http：//replit.com/edu

产品更新

01:13

Replit ⠕@Replit

构建应用很容易--让它们持续运行则不然 Replit应用监控正式推出 Replit代理现可监控您生产环境中的应用，排查问题并协助修复--让您无需亲力亲为

智能体产品更新部署/工程

01:11

TestingCatalog News 🗞@testingcatalog

GOOGLE 🚨：Gemini 现在可以直接在聊天中生成文档、表格、幻灯片和 PDF。已面向所有用户开放 👀 【引用 @joshwoodward】：Gemini 新功能：生成文件并导出告诉 Gemini 你想创建什么内容和格式，它现在就能为你完成工作。目前支持： 📄 Google 文档、Word （.docx）和 PDF 📊 Google 表格、Excel （.xlsx）和 CSV 🖥️ Google 幻灯片 🛠️ Markdown、LaTeX、TXT、RTF 现已全球全面上线！

Google产品更新

关联讨论 1 条

01:01

OpenRouter@OpenRouter

`stripe projects add openrouter/api` 为 400 多种 LLM 及图像/视频/音频模型接受 @stripe 付款的便捷方式，现已向所有人开放！https：//openrouter.ai/announcements/openrouter-on-stripe-projects

产品更新部署/工程

00:43

Josh Woodward@joshwoodward

Gemini 新功能：生成文件并导出告诉 Gemini 你想创建什么以及格式，它现在就能为你完成。现已支持： 📄 Google 文档、Word （.docx）和 PDF 📊 Google 表格、Excel （.xlsx）和 CSV 🖥️ Google 幻灯片 🛠️ Markdown、LaTeX、TXT、RTF 现已面向全球所有平台推出！

Google产品更新

关联讨论 1 条

00:41

dax@thdxr

我们正在让OpenCode在2.0版本中更易于嵌入你甚至可以使用工作区功能来运行分布式会话数据复制已为你处理，因此你无需考虑它正在远程运行的事实你的服务器甚至可能宕机，但它会在恢复时重新同步

产品更新编码

00:39

Google Developers Blog（RSS）

精选57

加速AI：通过GCSFS和Rapid Bucket将Google Colossus引入PyTorch

Google Cloud推出了一项高性能集成方案，通过fsspec接口将Rapid Storage直接连接至PyTorch，以消除AI训练瓶颈。该方案利用Google的Colossus架构和双向gRPC流技术，可提供高达15 TiB/s的聚合吞吐量，并显著降低延迟。开发者仅需更新存储桶类型而无需修改代码，即可将总训练时间缩短23%。

Google产品更新部署/工程

推荐理由：Google 把自家 Colossus 存储架构直接接进 PyTorch，号称零代码改动提速 23%，做大规模训练的团队值得评估一下，但对大多数人来说这更像 GCP 的护城河加固。

00:39

Hugging Face：Blog（RSS）

DeepInfra 登陆 Hugging Face 推理服务提供商 🔥

DeepInfra 作为高性能、低成本的推理服务提供商，现已在 Hugging Face 平台正式上线。该服务支持众多开源模型，包括 LLaMA、Mistral 等系列，并提供按需付费的灵活计费模式。其 GPU 实例涵盖 H100、A100 等多种型号，显著降低了 AI 模型部署与调用的门槛，进一步推动了开源人工智能技术的普及与应用。

Hugging Face行业动态部署/工程

00:09

Sundar Pichai@sundarpichai

你现在可以直接在聊天中让Gemini创建Docs、Sheets、Slides、PDF等文件。无需再复制、粘贴或重新格式化，只需输入指令并下载即可。此功能已面向全球所有@GeminiApp用户开放。

Google产品更新

关联讨论 1 条

00:09

Chubby♨️@kimmonismus

Cursor正从集成开发环境转向平台化战略，通过发布SDK，将其智能体运行时转变为可编程基础设施。该基础设施可无头运行于CI/CD流水线、内部工具及第三方产品中。每次通过SDK启动的智能体都将消耗Cursor的计费代币，这意味着其收入模式将按计算量而非用户席位进行扩展。由于无需人工介入，使用量可大幅提升。此举旨在让开发者能利用驱动Cursor的相同运行时、工具链和模型来构建智能体。

智能体MCP/工具产品更新部署/工程

00:08

Google Gemini@GeminiApp

精选60

现在您可以在与Gemini的聊天中直接生成多种可下载文件，包括PDF、@GoogleWorkspace文件、Microsoft Word & Excel等。只需在提示时告诉Gemini要创建的内容和所需文件格式，无需上传模板。

Google产品更新

关联讨论 1 条

推荐理由：Gemini 聊天里现在能直接生成 PDF、Word 和 Sheets，不用模板，说一声就行，办公党效率提升很实在。

4月29日

23:40

TestingCatalog News 🗞@testingcatalog

Google正在为NotebookLM开发思维导图定制功能以及新的Google Play Books集成。即将推出什么？👀 > 用户将能指导NotebookLM为特定主题或一组资料构建思维导图。 > 用户将能把Google Play Books用作资料来源。 "将畅销书转化为个性化见解。将知名作者的全本著作添加到你的笔记本中。"

Google产品更新

23:40

TestingCatalog News 🗞@testingcatalog

DeepSeek 发布了 DeepSeek Vision 测试版，这是 DeepSeek Chat 中专门用于图像理解任务的新模式。

DeepSeek产品更新多模态

23:09

OpenAI Developers@OpenAIDevs

限时添加 Codex 席位，免收席位费。在六月底之前，符合条件的 ChatGPT Business 和 Enterprise 客户可以添加仅限 Codex 的席位，从而更轻松地让更多开发者在日常工作流程中使用 Codex。

OpenAI产品更新编码

22:40

TestingCatalog News 🗞@testingcatalog

ElevenLabs 推出 ElevenMusic 平台 🔥 ElevenMusic 基于 ElevenLabs 音乐生成模型构建，现已在网页端和移动端上线。

产品更新多模态

22:34

IT之家（RSS）

华为鸿蒙"龙虾"小艺 Claw 迎重磅更新：上线"自进化"能力、接入 DeepSeek V4

华为鸿蒙“龙虾”小艺 Claw 迎来11.6.3.300版本更新。核心升级包括上线“自进化”能力，可学习用户长期偏好以减少重复沟通；并正式接入DeepSeek V4模型，获得百万级上下文处理能力，在信息搜集、文档处理等任务中具备更强推理能力。此外，更新引入了社区与生态伙伴的精选技能，覆盖金融、办公等多领域。该智能体已获得信通院首个终端厂商权威安全认证。目前，支持该功能的小艺App已开启尝鲜升级。

智能体产品更新推理

22:33

Runway@runwayml

精选63

用Runway将你的相机胶卷变成视觉特效引擎。只需选择照片或视频，输入你想要的效果，就这么简单。万物皆可创作，通过下方链接开始使用。

产品更新图像生成视频

关联讨论 1 条

推荐理由：Runway 把特效制作的门槛降到了选图+打字，对短视频创作者是个直击痛点的更新，虽然算不上重大发布，但实用度拉满。但它不是新模型，别期待太高。

21:45

向阳乔木@vista8

精选71

OpenAI开源Symphony：为每个任务分配AI代理的项目管理系统

OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具（如Linear）的任务看板作为控制中枢，为每个任务自动分配并运行一个独立的AI代理（基于Codex），直至完成。人类仅在“人工审查”节点介入，实现了从微观管理到任务级分配的转变。系统允许大粒度任务，代理能自主拆解依赖、创建新任务，并保证持续运行。初步数据显示，该方法能显著提升开发效率。

智能体GitHubOpenAI开源生态

关联讨论 3 条

推荐理由：Symphony 把 AI 代理管理从盯着终端变成了管理看板，对每个任务自动分配代理，这个思路会让所有用 AI 编程的团队重新思考工作流程，做工程落地的建议都看看。

20:33

Qwen@Alibaba_Qwen

精选60

闪存QLA：基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang构建的高性能线性注意力内核，专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核，通过提升流处理器利用率，在前向传播上实现2-3倍加速，反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著，虽然在大批次处理时内存I/O开销略高，但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。

开源/仓库推理端侧

推荐理由：2 倍加速的背后是 Warp 特化流水线和自动 Copy 策略，像给手机 GPU 开了条专用跑道，做端侧 Agent 的可以直接拉代码试试。

20:12

The Decoder：AI News（RSS）

Google 在欧洲推出 Gemini 记忆功能，并希望用户导入 ChatGPT 数据

Gemini 现已具备记忆用户偏好的能力，并支持从其他人工智能应用导入聊天历史记录。该功能率先在欧洲市场推出，允许用户将外部数据（例如来自 ChatGPT 的对话记录）迁移至 Gemini，以提升服务的个性化体验。

Google产品更新

20:00

Cursor Blog

精选75

使用 Cursor SDK 构建可编程智能体

Cursor 正式推出 SDK 公开测试版，开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型（如 GPT-5.5）支持，并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施，如安全沙箱和持久状态管理，智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。

智能体产品更新编码

推荐理由：Cursor 把自家产线拆出来给外部用，对于想把 AI 代理嵌入 CI/CD 或产品的团队，省掉了自建完整 agent 栈的麻烦，对做自动化编码的开发者是个必看的更新。

20:00

OpenRouter：Announcements（RSS）

精选65

通过 Stripe Projects 命令行创建 OpenRouter 账户

运行 `stripe projects add openrouter/api` 命令，即可直接从命令行创建 OpenRouter 账户、获取 API 密钥并开通 Stripe 计费功能。该操作支持自动化代理执行，实现了账户开通与支付配置的一站式集成。

产品更新部署/工程

推荐理由：OpenRouter 把账户创建搬到了 CLI，你的 agent 也可以直接开号了，这对于需要自动化计费流程的开发者是个便利小更新，但普通用户几乎感受不到变化。

18:42

Orange AI@oran_ge

只要你学得慢，就什么都不用学

作者以文科生经历指出，过去因缺乏技术工具难以实现想法。如今借助AI，其团队开发的Cola平台让非技术人员无需编程，仅通过描述需求即可快速创建应用，如自动剪辑语气词的工具。作者强调，AI时代稀缺的是想法与审美，而非技术技能。Cola旨在像打电话一样简单使用AI。平台近期因集成低成本DeepSeek V4模型，开启第二轮免费内测，目前支持Mac设备，目标是让每个人都能轻松跟上技术浪潮，实现“言出法随”。

产品更新现象/趋势

18:34

IT之家（RSS）

砺算科技 7G100 国产显卡官宣 5 月 20 日首发开售，官方晒工厂产线回应"画大饼"质疑

砺算科技宣布其国产显卡砺算科技7G100将于5月20日在京东首发开售。为回应“画大饼”质疑，官方通过视频展示了该显卡的制造与测试产线。该GPU采用TrueGPU架构，基于6nm工艺，宣称从核心到架构均为自主研发。同系列消费级型号LX 7G106配备12GB GDDR6显存，兼容主流图形API，可运行《赛博朋克2077》等游戏并支持AI PC大模型，且7G100已通过微软WHQL认证。

产品更新端侧

18:34

IT之家（RSS）

三星新款 Win11 Arm 笔记本 Galaxy Book 6 Edge 发布：16 英寸屏幕、厚 12.3 毫米

三星在法国发布了新款Windows 11 Arm笔记本Galaxy Book 6 Edge。该机配备16英寸Dynamic AMOLED 2X屏幕，支持120Hz刷新率，并搭载了算力更强的骁龙X2 Elite处理器，NPU算力最高达80 TOPS。机身厚度显著缩减至12.3毫米。其续航表现突出，满电可播放视频22小时，并支持65W快充。提供512GB和1TB存储版本，冰川灰配色，预计5月初开售，起售价约为2199欧元。

产品更新其他

17:33

IT之家（RSS）

DeepSeek 终于能"看图"了！灰度"识图模式"，图片理解功能内测

DeepSeek已灰度测试“识图模式”，新增多模态图片理解功能，用户可上传图片并获取描述。该模式与“快速模式”“专家模式”并列，并非简单OCR文字识别。部分测试用户反馈响应速度很快，类似flash；但亦有用户遇到“识图模式暂不可用”提示。网络响应内容显示该功能模型类型为“vision”，状态为“图片理解功能内测中”。

DeepSeek产品更新多模态

16:33

IT之家（RSS）

华为 MateBook 14 鸿蒙版电脑 HarmonyOS 6.1 版本发布，新增支持对单应用调节音量

华为为MateBook 14鸿蒙版推送了HarmonyOS 6.1更新。核心更新包括新增对单个应用进行音量调节的功能，以及全新的沉浸光感视效。智慧助手小艺获得增强，新增联网分析、投喂感应区和深度解题智能体等功能。多屏协同能力提升，支持同时打开多个手机协同窗口。此外，更新还带来了Dock栏高度自定义、触控板快捷返回、浏览器双击关闭标签页、文件直接拖拽解压等多项系统与应用优化。

产品更新端侧

16:11

Kling AI@Kling_ai

720p看见叶子，但4K看见露珠里的整个世界。💧 在Kling 4K中查看更多。

产品更新视频

15:33

IT之家（RSS）

蚂蚁数科亮相 2026 数字中国建设峰会，推出 DataX 智能体数据生态平台

蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议（MCP）和专用智能体DTClaw，旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库，将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent，实现“开箱即用”。平台还构建了基于数据的图谱知识库，支持通过自然语言进行智能编排与高效检索，帮助企业快速构建专业智能体。

智能体MCP/工具产品更新数据/训练

15:33

IT之家（RSS）

漫步者首款带屏旗舰耳机 Lolli5 ANC 发布，首发 539 元

漫步者发布其首款带屏旗舰耳机Lolli5 ANC，首发价539元，将于5月6日开售。该耳机充电盒配备智能触控屏，可显示时间并控制音乐、拍照。采用第4代半入耳前腔设计，支持ANC自适应降噪与3+3麦智能通话降噪，通过双Hi-Res金标认证，具备IP55级防尘防水。搭载13mm双复合LCP液晶振膜单元，支持豆包与DeepSeek双AI问答、会议录音及App实时互译功能，采用蓝牙6.0并支持双设备连接。

其他

15:33

IT之家（RSS）

特斯拉更新 FSD 接管反馈菜单，新增"导航问题"选项

特斯拉在最新软件更新中，将FSD系统的接管反馈菜单里的“其他问题”选项替换为专门的“导航问题”选项。此举旨在更精准地收集因导航故障（如限速错误、路线规划不合理）导致的人工接管数据，直接回应了车主长期以来的集中反馈。通过这一分类优化，特斯拉希望为神经网络模型提供更纯净的数据，以优先改进其自动驾驶系统的导航算法和地图精度。

产品更新

14:41

Kling AI@Kling_ai

这是弗里德里希两百年前在《雾海上的漫游者》中描绘的预言 🎨 一个拒绝露面的背影，任何人都能代入的主体位置。本视频中每个场景均由Kling 4K生成。感谢Kling AI创作者@wildpusa

其他图像生成视频

14:38

ginobefun@hongming731

BestBlogs 上新"主题解读"栏目

BestBlogs 推出“主题解读”新栏目，旨在解决信息过载下内容分散的痛点。该栏目并非简单罗列文章，而是由编辑围绕特定事件、领域或横向对比，将站内多篇内容重新组织成系统性解读。内容涵盖大模型发布、技术领域话题及工具对比等，为用户提供串联知识的入口，并邀请读者反馈需补充的主题方向。

产品更新

13:40

Tibo@thsottiaux

通过一些小调整，Codex 能在困难任务上连续工作数天。我们将发布一些更新，让每个人都能更轻松地使用它。你见过 GPT-5.5 成功完成的最困难任务是什么？

OpenAI产品更新编码

13:33

IT之家（RSS）

腾讯张军：腾讯文档正式"塞进"WorkBuddy，变成 AI 工具一个真正的原子组件

腾讯公关总监张军宣布，腾讯文档已正式集成至全场景AI智能体WorkBuddy中，成为其一个真正的原子组件。此次整合后，WorkBuddy支持直接连接腾讯文档，用户修改文档后可即时保存至云端。同时实现了小程序与电脑端的能力体验同步，用户可通过手机指挥AI处理云端文档，提升了办公场景下的易用性和效率。

智能体产品更新

13:33

IT之家（RSS）

Adobe Photoshop 引入 AI 3D 旋转对象功能，光影可自动匹配

Adobe于4月29日更新了Photoshop和Lightroom。Photoshop引入了全新的AI“旋转对象”工具，用户可在3D空间中实时旋转、倾斜和翻转素材，点击“协调”按钮可自动调整光照和阴影以匹配背景。同时，Photoshop还推出了“图层清理”工具，能智能清理、组织并自动重命名图层，移除空图层。Lightroom的搜索功能现支持自然语言描述查找照片，新增多款胶片风格预设，且辅助筛选速度更快，交互式滑块性能提升最高达5倍。

产品更新图像生成多模态

13:33

IT之家（RSS）

微软酝酿 Win11 新版时钟应用：专注模式支持"反思"，任务集成 AI 建议

微软正测试Windows 11新版时钟应用，重点升级“专注”功能并集成任务管理与AI辅助。新界面采用圆角设计，任务面板占据半屏，支持排序并深度联动Microsoft To Do。专注模式可最小化运行，允许自定义时长与休息间隔，新增“反思”环节供用户记录专注状态。AI能为任务步骤提供智能建议，可能依托本地NPU运行。当前测试版尚不完善，基础模块如闹钟暂缺，且运行时内存占用接近旧版两倍。

产品更新