4月30日
13:35
IT之家(RSS)
23
vivo X300 Ultra / X300s 手机影像创作升级,新增与上海迪士尼度假区的联名样张水印等

vivo 为 X300 Ultra 和 X300s 手机推出影像系统升级。X300 Ultra 在 19.10 及以上版本中获得了多项功能提升,包括支持追光、浓郁等风格的拍后可逆编辑;新增与上海迪士尼度假区的联名样张水印及旅拍风格水印;人像模式加入希区柯克变焦实况;通过云端大模型增强长焦画质;人像录像可手动调节曝光;录像支持地平线防抖;Log视频支持外接硬盘录制。X300s 在 10.5 及以上版本中,主要获得了拍后可逆编辑和全新的迪士尼联名、旅拍水印两项升级。

其他
12:35
IT之家(RSS)
40
2.69 万元起,宇树双臂人形机器人发布

宇树科技发布新款双臂人形机器人,起售价2.69万元。该机器人主打上半身双臂操作,配备视觉双目算力模组,支持15至31个自由度,手臂自由度可选5x2或7x2。机身和头部各搭载8核CPU,头部模组算力达10TOPS。下半身可选固定底座或移动底盘,末端执行器可更换为双指、三指或五指灵巧手。产品提供四个不同配置版本。

产品更新具身智能
11:44
小互@xiaohu
59
Stripe推出Link代理钱包,AI代付不泄露真实卡号

Stripe发布Link agent wallet,使AI agent能代表用户发起支付,同时保护银行卡信息安全。其核心机制是让AI agent生成一次性支付凭证,每笔交易需用户在Link中手动批准或拒绝。真实卡号既不会提供给AI agent,也不会泄露给其调用的外部工具。此外,Stripe已开源Link CLI,开发者可将其集成至Claude Code、MCP客户端或自定义的agent工作流中。

智能体MCP/工具产品更新
11:39
11:34
IT之家(RSS)
48
打破纯文本限制,微软 OneNote 内置 AI 现支持理解表格 / 图像等

微软于4月29日宣布,为拥有Microsoft 365 Copilot许可的用户在Windows、macOS及iOS平台的OneNote应用推出AI功能更新。新版内置Copilot AI突破纯文本限制,新增对表格、图像及标签的理解与分析能力。例如在规划旅行时,AI可综合分析行程表格、检查清单和景点照片,智能排查行程漏洞并提供优化建议。该更新通过服务器端推送自动部署,用户无需手动更新,只需确保设备版本符合要求即可。

Microsoft产品更新多模态
10:34
IT之家(RSS)
31
ASUSTOR 预热 Flashstor Gen3 全闪 NAS,用上 8640U

ASUSTOR宣布将推出新一代全闪存NAS产品Flashstor Gen3系列,包括Flashstor 6 Gen3和Flashstor 12 Pro Gen3两款型号。新品均搭载AMD锐龙5 PRO 8640U处理器,提供16 TOPS的NPU AI算力,支持本地边缘计算和智能影像识别。该系列分别提供6个和12个M.2 NVMe SSD盘位,最高支持PCIe Gen4,并配备USB4、HDMI等接口。其支持双USB网络直连,传输效率可超越10GbE。同期推出的还有12盘位存储扩充设备Xpanstor 12R Gen2,配备550W白金效率冗余电源和热插拔风扇,可为特定NAS系列提供额外存储空间。

产品更新端侧
10:21
Alibaba Cloud@alibaba_cloud
精选60
你知道吗?Wan2.7-Image 也有自己的"调色板"功能?😉 只需输入参考图像、精确色码,甚至插入自己的调色板,该模型就能确保色码匹配以保持品牌一致性,并克服长期困扰 AI 图像的色彩还原不一致问题 🎨 观看视频,立即完美掌控你的色彩! #AlibabaAI #Wan #Innovation
产品更新图像生成

推荐理由:通义万相2.7新增调色板功能,靠参考图或色号就能锁定品牌色,算是解决了AI画图颜色跑偏的老问题,做品牌视觉的可以试试。
10:21
Alibaba Cloud@alibaba_cloud
53
OKX与阿里云推出开放支付协议APP,共建AI代理经济金融层

AI代理经济需要开放的支付通道,正如互联网依赖HTTP协议。OKX推出首个跨链开放标准Agent Payments Protocol(APP),为AI代理之间的支付与商业交互提供基础框架。OKX与AlibabaCloud的合作从云基础设施与AI领域进一步延伸,共同构建代理经济的金融层。作为APP创始合作伙伴,双方认为AI时代刚刚起步,开放支付通道将激发代理生态的创新潜力。

智能体行业动态
09:34
Simon Willison 博客
47
llm 0.32a0 发布

Simon Willison 发布了其命令行工具 LLM 的 0.32a0 版本。此次更新为 alpha 预发布版本,主要变更与详细说明可通过 GitHub 的发布页面及作者博客上的注解式发布说明获取。该版本标志着 LLM 工具在功能或兼容性上的进一步迭代,通常涉及对大型语言模型(如 GPT、Claude、LLaMA 等)进行访问或操作的改进。

产品更新开源生态部署/工程
09:34
Simon Willison 博客
30
llm 0.32a1 发布

llm 发布了 0.32a1 版本,修复了 0.32a0 版本中存在的一个关键缺陷。该缺陷会导致从 SQLite 数据库重新加载时,工具调用对话无法正确恢复。此次更新解决了 GitHub 上的 issue #1426。

GitHub产品更新
08:37
阿绎 AYi@AYi_AInotes
精选70
Google Gemini实现AI"交付时代"跨越,直接生成可下载办公文件

Google Gemini迎来重磅更新,用户现可在聊天中通过一句话指令,直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件,无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表,且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”,迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成,实现了降维打击,对依赖AI生成文档的初创公司构成巨大压力,并推动行业竞争焦点转向直接产出可用成果。

Google产品更新
关联讨论 4X:Gemini (@GeminiApp)X:Testing Catalog (@testingcatalog)X:Josh Woodward (@joshwoodward, Google Labs VP)X:Sundar Pichai (@sundarpichai)
推荐理由:Gemini原生生成文档这功能,不是简单的“能出Word”,而是把二十年Workspace生态变成AI的输出管道,那些靠格式转换吃饭的中间商要慌了。
08:34
IT之家(RSS)
36
消息称苹果 iOS 27 版相机新增 Siri 模式,AI 记录食品标签、名片、活动门票等

苹果计划在 iOS 27 版相机应用中新增 Siri 模式,整合 Visual Intelligence 功能。该模式将与现有拍照模式并列显示,使智能视觉能力更易访问。功能包括扫描食品营养标签记录卡路里数据并同步至健康应用,识别名片信息添加联系人,以及扫描活动门票和会员卡生成数字版本存入钱包。此前需长按按钮激活的隐蔽操作被直接集成,提升用户使用便捷性。

产品更新多模态
08:34
IT之家(RSS)
37
谷歌相册推出衣橱规划功能:AI 提取服装图像整理到数字衣橱,支持虚拟试穿

<谷歌相册推出AI衣橱规划功能,通过人工智能自动提取用户照片中的服装图像,整理到数字衣橱。用户可按类别筛选服装,混搭单品设计穿搭,并支持虚拟试穿预览;还可保存穿搭到数字情绪板,适用于不同场合。该功能预计今年夏季首发于安卓平台,随后登陆iOS设备。>

Google产品更新图像生成
08:00
OpenRouter:Announcements(RSS)
54
April Release Spotlight

本月发布聚焦视频生成、工作空间、智能体SDK与重排序模型。多家公司推出前沿大模型,包括GPT、Claude和LLaMA系列的新版本。核心变化体现在模型多模态能力增强,特别是视频生成功能成为竞争焦点。部分新模型在标准基准测试中性能提升超过15%,同时上下文窗口扩展至百万token级别。开发者工具方面,新的智能体SDK支持更复杂的任务编排,而重排序模型显著提升了检索精度。

智能体产品更新多模态模型发布
07:39
Berryxia.AI@berryxia
52
Moonlake推出3D Agent:AI自动化生成可编辑3D资产

Moonlake发布3D Agent,这是一个AI驱动的工具,能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景(包含数百物体)。它支持从零建模,自动处理独立部件和关节绑定,无需预设规则,并能重建完整可编辑的室内或室外场景。通过原生集成Blender,该工具实现了真实工作流的自动化,简化3D创作过程。

智能体产品更新多模态
07:34
IT之家(RSS)
45
苹果 AI 眼镜曝光:内置 2 颗摄像头、支持 Siri 智能交互、可手势控制

据报道,苹果正加速研发其首款智能眼镜,预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备,核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头:高分辨率主摄用于拍照录像,低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄,眼镜不内置显示屏及LiDAR等模块,并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri,支持拍照、通话及环境交互。产品可能于2026年晚些时候预览,2027年正式上市。

多模态端侧行业动态
06:09
05:09
OpenAI Developers@OpenAIDevs
精选62
⚙️ 我们通过 Responses API 中的 WebSockets 让代理循环运行得更快 随着 Codex 速度提升,瓶颈从推理转移到了低效的 API 调用 WebSockets 在工具调用之间保持响应状态活跃,帮助工作流程端到端运行速度提升高达 40% https://openai.com/index/speeding-up-agentic-workflows-with-websockets
智能体OpenAI产品更新

推荐理由:这不是颠覆性更新,但对依赖 Responses API 搭 agent 的开发者是个实打实的好消息,loop 加速 40% 意味着延迟和成本双降,官方推荐的最佳实践值得直接套用。
04:12
ClaudeDevs@ClaudeDevs
精选62
Claude Code 内置一项用于操作 Claude Platform 的技能。 适用于模型迁移、使用 API 功能(例如提示缓存),或接入较新的 API 如 Claude Managed Agents。
AnthropicMCP/工具产品更新
关联讨论 3Anthropic:Engineering(事故复盘 + 工程实践 · 网页)X:宝玉 (@dotey)X:Berry Xia (@berryxia)
推荐理由:Claude Code 终于把平台操作集成进命令行,模型迁移和 prompt caching 现在一条命令搞定,做 agent 开发的省了大把配配置文件的时间。
03:34
Simon Willison 博客
68
LLM 0.32a0 发布重大向后兼容重构

LLM Python库和CLI工具发布0.32a0 alpha版本,进行了两项核心架构升级。首先,模型输入现支持表示为消息序列,能直接处理包含多轮对话历史的完整上下文,解决了此前难以载入已有对话的局限。其次,模型响应升级为支持由不同类型部分组成的流式输出,以更好地适配现代前沿模型处理多样化输入(如图像、音频)和输出(如结构化JSON、工具调用)的能力。此次重构旨在让该库的抽象层跟上LLM技术自2023年以来的快速演进。

GitHubMCP/工具开源/仓库部署/工程
02:41
Claude:Blog(网页)
精选66
企业级部署指南:如何利用Claude Cowork推动全员AI协作

Anthropic发布《企业级Claude Cowork部署指南》,旨在帮助非技术岗位员工规模化应用AI。该指南基于内部团队及Thomson Reuters等客户实践,提供了从试点到全面推广的完整路径。核心内容包括一个五级成熟度模型、试点用例评估方法以及为期六个月的组织级部署路线图。Claude Cowork作为桌面应用,能深度集成本地文件、Slack、Google Drive及浏览器,并结合Claude for Excel/PPT实现跨文档工作流,适用于金融、法律、销售等多行业的生产场景。

智能体Anthropic产品更新

推荐理由:Claude Cowork 把 agent 能力从开发者命令行搬到全公司桌面,配了五级成熟度模型和六个月落地路线图,企业 IT 负责人和产品经理值得拿这份指南当部署参考。
02:36
阿绎 AYi@AYi_AInotes
67
Cursor发布SDK:将生产级编程Agent能力嵌入基础设施

Cursor正式发布SDK,将生产级编程Agent能力转化为可嵌入基础设施。此前Agent仅限于编辑器内使用,现可通过SDK集成到CI/CD流水线、自动化脚本或自有产品中,且采用与桌面端相同的runtime、harness和模型,确保智能程度一致。用户无需自行处理沙箱、上下文管理或工具调用,即可免费利用Cursor积累的经验。这使编程Agent能突破编辑器限制,在后台自动修bug、提PR、实时生成功能,甚至修复CI构建错误。开发者角色从直接编码转变为指挥Agent,Cursor正演变为AI编程时代的操作系统。

智能体产品更新编码
关联讨论 1X:阿易 AI Notes (@AYi_AInotes)
02:36
Cloudflare Blog
精选65
Agents 现可创建 Cloudflare 账户、购买域名并部署

Cloudflare 宣布 AI 代理现可作为独立客户直接使用其服务。代理能够自主创建 Cloudflare 账户、开通付费订阅、注册域名,并立即获取 API 令牌以部署代码。人类用户可保留授权监督权限,但无需手动操作控制台、复制粘贴 API 令牌或输入信用卡信息。这一更新使代理能够以自动化流程完成从账户开设到服务部署的全链路操作。

智能体产品更新部署/工程

推荐理由:Cloudflare 把 AI 代理当成真正客户,从注册到部署一气呵成,这比给个 API 更彻底,做 agent 框架的同学该看一眼。
02:11
Claude:Blog(网页)
精选64
Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp

Claude API技能现已扩展集成至CodeRabbit、JetBrains、Resolve AI和Warp四款开发工具中,使开发者能在其常用环境中直接获得生产就绪的Claude API代码支持。该技能能自动捕获API最佳实践细节,如适配的智能体模式、参数变更与提示缓存规则,从而减少错误并简化模型迁移。开发者可在工具内直接指示Claude执行“提高缓存命中率”或“升级至最新Claude模型”等任务。此开源技能会随SDK更新自动同步,帮助团队更快采用新功能,避免因API知识过时导致的生产问题。

AnthropicMCP/工具产品更新编码

推荐理由:Anthropic 把 claude-api skill 从自家 IDE 扩散到 JetBrains、Warp 等主流开发工具,本质是用「内置专家知识」抢开发者心智,做 Claude API 集成的产品人值得看看它覆盖了哪些坑。
02:06
Google AI@GoogleAI
52
智能体时代启幕:谷歌发布第八代TPU,专为AI训练与服务打造

在Google Cloud Next '26大会上,谷歌正式推出专为智能体时代设计的第八代TPU芯片,分别针对AI训练与服务两大核心挑战。TPU 8t专注于训练,其性能约为前代的3倍,并通过加速数据移动和优化硬件容错,将原本需数月的训练时间缩短至数周。TPU 8i则专为执行复杂任务的AI智能体服务,内存扩大三倍以支持多步推理,每美元性能提升80%,延迟降低5倍,助力企业以更低成本扩展服务规模。这些芯片将为医疗研究、客户支持等广泛场景提供核心算力,推动AI应用创新。

Google产品更新推理部署/工程
关联讨论 1IT之家(RSS)
01:44
宝玉@dotey
67
Cursor开放TypeScript SDK公测,提供智能体框架

Cursor开放官方TypeScript SDK公测,允许开发者使用其智能体(agent)框架,该框架驱动Cursor编辑器、CLI和网页版。智能体可在本机或云端独立虚拟机中运行,云端提供沙箱、代码仓库和完整开发环境,支持任务持续执行并自动提交PR。模型层面不绑定,可一键切换OpenAI、Anthropic、Google等前沿模型,或使用Cursor专为编码训练的Composer 2。SDK开放了代码库索引、语义搜索、MCP工具接入、技能加载和任务拆分等核心能力。应用场景包括CI/CD流水线自动化、内部工具开发以及嵌入客户产品,使最终用户获得智能体体验。计费按token用量计算,SDK基于Cursor自身的运行时、harness和模型,让开发者能构建与Cursor相同能力的智能体。

智能体MCP/工具大佬观点
关联讨论 1X:阿易 AI Notes (@AYi_AInotes)
01:42
Ant Ling@AntLingAGI
精选61
AntLingAGI 开源了 Ling-2.6-1T 模型,这是一个面向现实世界智能体工作流程的新旗舰模型。作为 1T 参数规模模型的先驱,团队强调了硬件、软件与 LLM 协同设计的重要性。vLLM 项目从发布首日(Day-0)起即提供支持,体现了顶尖工程生态系统的协作。这种合作旨在实现最佳的优化效果与用户体验,共同推动技术进步。
智能体开源生态模型发布
关联讨论 3X:蚂蚁百灵 (@AntLingAGI)X:Artificial Analysis (@ArtificialAnlys)X:阿易 AI Notes (@AYi_AInotes)
推荐理由:vLLM 对 1T 模型的 Day-0 适配,说明开源推理栈对大尺寸模型的跟进速度越来越快,做私有化部署的可以直接参考官配 recipe 跑起来。