Google Gemini 新增了在聊天界面内直接创建完整办公文档的功能。用户现可基于PDF、Word文件等源材料,让AI生成对应的文档、电子表格和演示文稿。这一集成将内容创建流程进一步简化,用户无需切换应用即可在对话中完成多种办公文件的制作。
Google Cloud推出了一项高性能集成方案,通过fsspec接口将Rapid Storage直接连接至PyTorch,以消除AI训练瓶颈。该方案利用Google的Colossus架构和双向gRPC流技术,可提供高达15 TiB/s的聚合吞吐量,并显著降低延迟。开发者仅需更新存储桶类型而无需修改代码,即可将总训练时间缩短23%。
DeepInfra 作为高性能、低成本的推理服务提供商,现已在 Hugging Face 平台正式上线。该服务支持众多开源模型,包括 LLaMA、Mistral 等系列,并提供按需付费的灵活计费模式。其 GPU 实例涵盖 H100、A100 等多种型号,显著降低了 AI 模型部署与调用的门槛,进一步推动了开源人工智能技术的普及与应用。
华为鸿蒙“龙虾”小艺 Claw 迎来11.6.3.300版本更新。核心升级包括上线“自进化”能力,可学习用户长期偏好以减少重复沟通;并正式接入DeepSeek V4模型,获得百万级上下文处理能力,在信息搜集、文档处理等任务中具备更强推理能力。此外,更新引入了社区与生态伙伴的精选技能,覆盖金融、办公等多领域。该智能体已获得信通院首个终端厂商权威安全认证。目前,支持该功能的小艺App已开启尝鲜升级。
OpenAI开源项目Symphony旨在解决人类管理多个AI编码代理时的注意力瓶颈。其核心思路是将项目管理工具(如Linear)的任务看板作为控制中枢,为每个任务自动分配并运行一个独立的AI代理(基于Codex),直至完成。人类仅在“人工审查”节点介入,实现了从微观管理到任务级分配的转变。系统允许大粒度任务,代理能自主拆解依赖、创建新任务,并保证持续运行。初步数据显示,该方法能显著提升开发效率。
关联讨论 3 条X:阿易 AI Notes (@AYi_AInotes)X:邵猛 (@shao__meng)OpenAI:官网动态(RSS · 排除企业/客户案例)FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。
Gemini 现已具备记忆用户偏好的能力,并支持从其他人工智能应用导入聊天历史记录。该功能率先在欧洲市场推出,允许用户将外部数据(例如来自 ChatGPT 的对话记录)迁移至 Gemini,以提升服务的个性化体验。
Cursor 正式推出 SDK 公开测试版,开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型(如 GPT-5.5)支持,并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施,如安全沙箱和持久状态管理,智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。
运行 `stripe projects add openrouter/api` 命令,即可直接从命令行创建 OpenRouter 账户、获取 API 密钥并开通 Stripe 计费功能。该操作支持自动化代理执行,实现了账户开通与支付配置的一站式集成。
作者以文科生经历指出,过去因缺乏技术工具难以实现想法。如今借助AI,其团队开发的Cola平台让非技术人员无需编程,仅通过描述需求即可快速创建应用,如自动剪辑语气词的工具。作者强调,AI时代稀缺的是想法与审美,而非技术技能。Cola旨在像打电话一样简单使用AI。平台近期因集成低成本DeepSeek V4模型,开启第二轮免费内测,目前支持Mac设备,目标是让每个人都能轻松跟上技术浪潮,实现“言出法随”。
砺算科技宣布其国产显卡砺算科技7G100将于5月20日在京东首发开售。为回应“画大饼”质疑,官方通过视频展示了该显卡的制造与测试产线。该GPU采用TrueGPU架构,基于6nm工艺,宣称从核心到架构均为自主研发。同系列消费级型号LX 7G106配备12GB GDDR6显存,兼容主流图形API,可运行《赛博朋克2077》等游戏并支持AI PC大模型,且7G100已通过微软WHQL认证。
三星在法国发布了新款Windows 11 Arm笔记本Galaxy Book 6 Edge。该机配备16英寸Dynamic AMOLED 2X屏幕,支持120Hz刷新率,并搭载了算力更强的骁龙X2 Elite处理器,NPU算力最高达80 TOPS。机身厚度显著缩减至12.3毫米。其续航表现突出,满电可播放视频22小时,并支持65W快充。提供512GB和1TB存储版本,冰川灰配色,预计5月初开售,起售价约为2199欧元。
DeepSeek已灰度测试“识图模式”,新增多模态图片理解功能,用户可上传图片并获取描述。该模式与“快速模式”“专家模式”并列,并非简单OCR文字识别。部分测试用户反馈响应速度很快,类似flash;但亦有用户遇到“识图模式暂不可用”提示。网络响应内容显示该功能模型类型为“vision”,状态为“图片理解功能内测中”。
华为为MateBook 14鸿蒙版推送了HarmonyOS 6.1更新。核心更新包括新增对单个应用进行音量调节的功能,以及全新的沉浸光感视效。智慧助手小艺获得增强,新增联网分析、投喂感应区和深度解题智能体等功能。多屏协同能力提升,支持同时打开多个手机协同窗口。此外,更新还带来了Dock栏高度自定义、触控板快捷返回、浏览器双击关闭标签页、文件直接拖拽解压等多项系统与应用优化。
蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议(MCP)和专用智能体DTClaw,旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库,将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent,实现“开箱即用”。平台还构建了基于数据的图谱知识库,支持通过自然语言进行智能编排与高效检索,帮助企业快速构建专业智能体。
漫步者发布其首款带屏旗舰耳机Lolli5 ANC,首发价539元,将于5月6日开售。该耳机充电盒配备智能触控屏,可显示时间并控制音乐、拍照。采用第4代半入耳前腔设计,支持ANC自适应降噪与3+3麦智能通话降噪,通过双Hi-Res金标认证,具备IP55级防尘防水。搭载13mm双复合LCP液晶振膜单元,支持豆包与DeepSeek双AI问答、会议录音及App实时互译功能,采用蓝牙6.0并支持双设备连接。
特斯拉在最新软件更新中,将FSD系统的接管反馈菜单里的“其他问题”选项替换为专门的“导航问题”选项。此举旨在更精准地收集因导航故障(如限速错误、路线规划不合理)导致的人工接管数据,直接回应了车主长期以来的集中反馈。通过这一分类优化,特斯拉希望为神经网络模型提供更纯净的数据,以优先改进其自动驾驶系统的导航算法和地图精度。
BestBlogs 推出“主题解读”新栏目,旨在解决信息过载下内容分散的痛点。该栏目并非简单罗列文章,而是由编辑围绕特定事件、领域或横向对比,将站内多篇内容重新组织成系统性解读。内容涵盖大模型发布、技术领域话题及工具对比等,为用户提供串联知识的入口,并邀请读者反馈需补充的主题方向。
腾讯公关总监张军宣布,腾讯文档已正式集成至全场景AI智能体WorkBuddy中,成为其一个真正的原子组件。此次整合后,WorkBuddy支持直接连接腾讯文档,用户修改文档后可即时保存至云端。同时实现了小程序与电脑端的能力体验同步,用户可通过手机指挥AI处理云端文档,提升了办公场景下的易用性和效率。
Adobe于4月29日更新了Photoshop和Lightroom。Photoshop引入了全新的AI“旋转对象”工具,用户可在3D空间中实时旋转、倾斜和翻转素材,点击“协调”按钮可自动调整光照和阴影以匹配背景。同时,Photoshop还推出了“图层清理”工具,能智能清理、组织并自动重命名图层,移除空图层。Lightroom的搜索功能现支持自然语言描述查找照片,新增多款胶片风格预设,且辅助筛选速度更快,交互式滑块性能提升最高达5倍。
微软正测试Windows 11新版时钟应用,重点升级“专注”功能并集成任务管理与AI辅助。新界面采用圆角设计,任务面板占据半屏,支持排序并深度联动Microsoft To Do。专注模式可最小化运行,允许自定义时长与休息间隔,新增“反思”环节供用户记录专注状态。AI能为任务步骤提供智能建议,可能依托本地NPU运行。当前测试版尚不完善,基础模块如闹钟暂缺,且运行时内存占用接近旧版两倍。