Luma的Uni-1.1模型现已作为API开放。这是一个用于图像生成和自然语言编辑的统一智能模型,其核心特点是“意图优先”的图像生成。模型在生成前会进行思考,能补全场景缺失部分,理解空间上下文而非仅像素,并能基于参考图像保持一致性。该API内置提示词增强、研究和参考收集功能,专为生产环境打造。据称,其成本和延迟仅为同类模型的一半以下,且在图像生成与编辑的综合评测中位列前三。
关联讨论 1 条X:Luma AI (@LumaLabsAI)OpenAI扩展ChatGPT广告服务,推出自助广告管理平台测试版,新增CPC竞价功能和增强的广告效果测量工具。新平台注重隐私保护,确保广告内容与用户对话相互独立,帮助广告主更精准地定位目标受众并优化广告投放效果。
Anthropic发布了10款面向金融服务的Claude智能体模板,使其从聊天助手转变为可执行募资书制作、KYC审查、月度结算、估值分析等标准化任务的工作流。其核心是通过预置“技能”规范操作,利用“连接器”安全访问数据,并通过“子智能体”拆分任务步骤。该功能支持在Microsoft 365应用间保持上下文连贯,无需重复输入。同时提供具备权限控制与审计日志的托管代理模式。据称,Claude Opus 4.7在Vals AI金融智能体基准测试中以64.37%领先。模板可安装于Cowork和Claude Code,或部署为生产级托管代理。
关联讨论 2 条X:Claude (@claudeai)Claude:Blog(网页)Anthropic发布了10个开箱即用的金融专用AI Agent,将估值复核、制作pitchbook、月末结账等核心工作产品化。这些Agent能自动连接顶级金融数据库,原生支持Office,并可通过插件或托管模式使用,全链路审计确保合规。所有代码均已开源,企业可快速部署内部AI团队。此举直接替代初级分析师大量重复劳动,将AI Agent从实验工具转化为企业级生产力,并精准切入金融行业对安全合规的刚性需求,可能引发行业工作流程重构。
关联讨论 2 条X:Claude (@claudeai)Claude:Blog(网页)Meta 开始利用AI图像分析技术,通过识别骨骼结构和身体尺寸等视觉特征(而非面部识别)来检测Instagram和Facebook上的未成年人。公司强调该方法不依赖人脸识别,旨在更精准地识别未成年用户以加强平台保护措施。
Anthropic发布了十个针对金融服务耗时任务的预置智能体模板,涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件,或作为Claude托管智能体的配置指南,帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作,并扩展了合作伙伴生态,新增数据连接器和MCP应用,使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳,该模型在金融任务上达到先进水平。
关联讨论 2 条X:Claude (@claudeai)Claude:Blog(网页)MATLAB正式推出Agentic Toolkit,深度集成Claude Code、OpenAI Codex等顶级AI智能体,将其武装为MATLAB/Simulink原生专家。该工具包允许智能体实时连接并操作本地MATLAB会话,直接执行、测试和调试代码,同时内置MathWorks专家级技能库,涵盖代码规范、Live Script生成、App构建等领域。此举旨在将AI深度融入科研、仿真、控制系统等工程核心工作流,通过边写边运行、分析与迭代的闭环,提升开发效率与代码质量,挑战Python系AI工具在工程领域的主导地位。
Google推出Code Wiki项目,旨在解决“阅读现有代码”这一开发瓶颈。该工具能自动扫描代码仓库,实现文档随代码变更实时更新,避免过时。其核心功能包括由Gemini驱动的智能聊天,可将整个Wiki作为知识库进行问答,并支持超链接跳转至具体代码行;还能自动生成架构图、类图、时序图等可视化图表,并链接到源码。工具适用于各种规模的仓库,帮助新人快速上手或理解遗留代码。目前公共仓库已开放预览。
Ollama通过命令`ollama launch claude-desktop`,将Ollama Cloud中的开源模型(如Kimi、DeepSeek、Qwen)无缝接入Claude Desktop应用。用户可在Claude Cowork和Claude Code中直接使用这些模型,享受完整的本地文件读写、应用交互及代码智能体等桌面级功能,打破了以往在本地开源模型与Claude高端界面间必须二选一的限制。通过`--restore`参数可轻松切换回Anthropic原生模型。此举消除了AI工具链的关键壁垒,标志着AI竞争重点正转向工作流的无缝融合。
据报道,Anthropic 即将为 Claude Cowork 推出一款名为 Orbit 的主动助手。该功能无需用户提示,即可自动从 Gmail、Slack、GitHub、日历、Drive 和 Figma 等应用中生成简报和洞察。用户还能部署并固定“Orbit 应用”以便快速访问。此举被视为 Anthropic 对 OpenAI 的 ChatGPT Pulse 的回应,但其更侧重于开发和创意工作流,特别是集成了 GitHub 和 Figma。谷歌和 Perplexity 也在开发类似的主动助手层。Orbit 很可能在旧金山举行的 Code with Claude 会议上发布,且初期或仅面向 Max 用户提供。
Amazon SageMaker AI 新增了一个 AI 智能体,旨在帮助开发者定制语言模型。该功能支持对 Llama、Qwen、Deepseek 和 Nova 等主流模型进行智能体驱动的微调,使开发者能更高效地优化模型以适应特定任务,无需从零开始构建。这标志着 AWS 在降低大模型定制门槛、提升开发效率方面迈出重要一步。
Runway公司推出“Characters”实时视频智能体,它能将任意单张参考图像(如真人、卡通或幻想生物照片)实时转化为具有自然对话表现力的视频角色。该技术基于其通用世界模型GWM-1,无需微调即可生成每秒24帧的高清视频,并同步口型、表情和头部运动。其核心突破在于通过自回归逐帧生成、流程优化与并行化,实现了每帧仅37毫秒的模型处理时间,以及从用户停止说话到角色开始响应仅1.75秒的服务器端延迟,从而满足了实时交互对话的严苛要求。
关联讨论 1 条X:Runway (@runwayml)针对当前AI生成视频普遍存在的画面闪烁、角色不一致、细节丢失及渲染耗时等问题,Happy Horse 1.0定位为“制作优先”的引擎,旨在为创作者提供解决方案。其核心特性包括确保角色与资产从始至终保持稳定的“像素级一致性”,以及兼顾质量、速度与成本的“企业级效率”。官方将于2026年5月15日在香港举办大师班,演示如何将AI视频工作流从“实验性”提升至“专业级”。
Happy Horse 1.0是一款面向创意工作者的生产级AI视频引擎,旨在解决现有AI视频工具的核心痛点。它主打“像素级一致性”,确保角色和资产在视频中保持稳定,不再出现变形或闪烁。同时,引擎具备企业级效率,在质量、速度和成本上进行了优化。官方将于2026年5月15日在香港举办大师班,演示如何将AI视频工作流程从“实验性”提升至“专业级”。
中国移动将在5月7日至9日于苏州举办的2026移动云大会上发布AI-eSIM产品。该产品具备“智能大脑”,可实时调度云端模型,使AI玩具、智能穿戴等终端实现自主思考与即时响应。同时,AI-eSIM内置“安全底座”,将安全能力植入芯片内核,为机器人、无人机等设备提供专属数字身份证和唯一身份信息,以加强安全监管。此外,中国移动还预告了名为“移动云 MobileClaw”的相关产品。
KroWork的核心创新在于“chat-to-software”模式,旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体,能通过20多种内置技能端到端自动化执行任务,并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单,像常规软件一样运行,且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成,保障数据隐私,无需云端依赖,用户也无需具备编程背景即可创建属于自己的可复用软件。
Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据,并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式,OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉,Orbit很可能作为一项高级功能,仅向Claude Max订阅用户开放。
本次更新包含多项功能优化与错误修复。主要功能上,`/color` 命令支持无参数随机选色,`/mcp` 命令显示已连接服务器的工具数量,`--plugin-dir` 参数新增支持 `.zip` 插件包。用户体验方面,优化了 `/model` 选择器的显示。关键问题修复包括:解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题,以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外,还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。