AIHOT

4月29日

08:00

HuggingFace Daily Papers（社区热门论文）

本文针对扩散生成模型中未被充分研究的组合复杂性问题，指出现有训练方案可能难以充分覆盖高维数据样本及其附加属性所构成的空间，从而限制模型性能。为此，我们提出了ComboStoc方法，通过构建充分利用组合结构的随机过程，显著加速了图像和3D形状等多种数据模态的网络训练。此外，该方法还支持在测试时生成过程中，为不同维度和属性使用异步时间步，从而实现对它们不同程度的灵活控制。代码已开源。

arXiv图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

更优模型，更快训练：用于单细胞基础模型的Sigmoid注意力机制

本研究提出将Sigmoid注意力作为Softmax注意力的直接替代方案，用于构建更稳定的生物基础模型。在六个单细胞数据集上的实验表明，Sigmoid注意力能提升25%的细胞类型分离度，改善细胞类型内聚性，并降低验证损失，同时训练速度提升高达10%。理论分析揭示，Sigmoid具有全局有界导数和对角雅可比结构，这缓解了Softmax的稠密耦合带来的不稳定性。在压力测试中，训练1.6亿参数模型时，Softmax出现梯度爆炸，而Sigmoid保持稳定。团队开源了高性能GPU内核TritonSigmoid，在H100上实现515 TFLOPS，性能超越现有方案，并原生支持生物序列所需的填充处理。

开源/仓库数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Prox-E：通过基于基元的抽象实现细粒度3D形状编辑

研究团队提出Prox-E，一个无需训练即可实现细粒度3D控制的框架。该方法先将输入3D形状抽象为一组紧凑的几何基元，再利用预训练的视觉语言模型对该抽象进行基元层级的编辑指定，最终引导3D生成模型完成局部结构修改，同时严格保持物体未变化区域的原始身份。实验表明，该方法在身份保持、形状质量和指令遵循度上，均优于现有的基于2D的3D编辑器和需要训练的方法。

arXiv图像生成论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

Web2BigTable：面向互联网规模信息搜索与提取的双层多智能体LLM系统

Web2BigTable是一个支持广度和深度搜索的双层多智能体框架。上层编排器将任务分解为子问题，下层工作智能体并行求解。系统通过运行-验证-反思的闭环流程，利用持久化外部记忆联合改进任务分解与执行，并实现单智能体的自我进化。工作智能体通过共享工作空间协调，减少冗余探索、调和冲突证据并适应覆盖缺口。该系统在广度搜索基准WideSearch上达到新SOTA：Avg@4成功率为38.50（是第二名的7.5倍），行F1为63.53，项F1为80.12。在深度搜索基准XBench-DeepSearch上也取得73.0的准确率。代码已开源。

智能体搜索论文/研究

08:00

Apple Machine Learning Research（RSS）

精选57

Adaptive Thinking：大型语言模型知道何时在潜在空间中思考

研究提出了一种名为“自适应思考”的新方法，使大型语言模型能够动态决定是否需要执行链式思考推理。该方法利用自我一致性作为判断标准，当模型对简单问题已有高置信度答案时，会跳过显式推理步骤，直接生成最终答案。实验表明，在保持相同性能水平下，该方法在GSM8K和MATH基准测试上分别减少了20.3%和41.7%的推理计算量，实现了更高效的计算最优推理。

推理论文/研究

推荐理由：苹果这篇论文用自一致性作为「要不要深度思考」的代理，把推理预算分配从玄学变成了可计算的优化问题，做推理加速的同行值得细读。

08:00

Apple Machine Learning Research（RSS）

精选56

DSO：用于缓解偏见的直接引导优化

研究团队提出DSO方法，旨在缓解视觉语言模型决策中的社会偏见。该方法允许用户在模型部署时，通过单一标量参数直接、实时地控制偏见缓解程度，实现无需重新训练的动态调整。实验表明，DSO能在偏见指标上实现高达90%的改善，同时将性能损失控制在10%以内，有效平衡了偏见缓解与任务性能。这一技术为需要根据具体场景权衡公平性与效用的应用提供了灵活解决方案。

多模态安全/对齐论文/研究

推荐理由：Apple 这篇提出了一个直接操控生成方向的优化方法，把偏见缓解变成了可调节的旋钮，而不是一刀切地牺牲性能，做公平性研究的人可以仔细读一下。

08:00

HuggingFace Daily Papers（社区热门论文）

面向高效计算机使用代理的步骤级优化

现有计算机使用代理在长周期图形界面任务中因每一步都调用大型多模态模型而导致效率低下。此类任务轨迹具有高度异质性：多数步骤可由轻量策略可靠处理，而错误多集中于少数高风险时刻，表现为进度停滞与语义漂移。为此，本文提出一种事件驱动的步骤级级联框架，默认运行轻量策略，仅当轻量监测器识别到风险升高时才升级至强模型。该框架整合了停滞监测器与里程碑监测器，能根据交互进程自适应分配计算资源，将始终开启的前沿模型推理转变为按需调用。该模块化设计无需改变现有代理架构或重新训练大模型即可直接集成。

智能体arXiv推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ViPO：大规模视觉偏好优化

针对现有开源视觉偏好数据集存在的冲突偏好、低分辨率等问题，研究团队提出Poly-DPO算法，通过多项式项动态调整模型置信度以增强抗噪性。为突破数据瓶颈，团队构建了大规模高质量数据集ViPO，包含百万级图像对与数十万视频对。实验表明，在高质量ViPO上，Poly-DPO最优配置会收敛至标准DPO，验证了数据质量；而在噪声数据集上，Poly-DPO相比Diffusion-DPO在SD1.5和SDXL模型上分别取得6.87和2.32的性能提升。研究证实，算法适应性与数据质量共同推动视觉偏好优化的规模化发展。

图像生成数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

合规性与合理性：大语言模型中推理可控性研究

本研究通过推理冲突视角，探讨大语言模型能否将归纳、演绎等基本推理模式与具体问题实例解耦。发现LLMs优先考虑合理性而非合规性，即使指令冲突也倾向任务适用推理。任务准确率不严格由合理性决定，模型依赖内部参数记忆且随规模增强。推理冲突可内部检测，置信度显著下降。实验显示推理类型从中后层线性编码，表明激活层面可控。通过机制干预，成功将模型导向合规，指令遵循率最高提升29%。这表明主动干预能有效解耦逻辑模式与数据，提升可控性、忠实度和泛化能力。

arXiv推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

长度价值模型：面向令牌级长度建模的可扩展价值预训练

长度价值模型（LenVM）是一个创新的令牌级框架，它将剩余生成长度预测转化为价值估计问题，通过为每个生成令牌分配恒定负奖励来获得密集、无偏且可扩展的监督信号。实验表明，LenVM能显著提升模型对生成长度的精确控制能力：在LIFEBench精确长度匹配任务中，它将一个7B模型的长度分数从30.9大幅提升至64.8，超越了前沿闭源模型。同时，该模型支持性能与效率的连续权衡，如在GSM8K上设定200令牌预算时，能保持63%的准确率，远超基线模型的6%。此外，LenVM能从提示开始预测总长度，并提供生成动态的可解释视图，展现了其作为通用长度建模框架的广泛潜力。

推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

精选71

基于RoundPipe在消费级多GPU上实现高效训练

针对消费级GPU服务器内存有限和PCIe互联慢的问题，研究团队提出了RoundPipe流水线调度方案。该方法通过将GPU视为无状态工作节点，以轮询方式动态分配计算阶段，打破了权重绑定限制，实现了接近零气泡的流水线。系统集成了优先级感知传输调度、细粒度事件同步协议与自动分层划分算法。在8块RTX 4090的服务器上测试表明，其对1.7B至32B模型的微调速度比现有最优基线快1.48至2.16倍，并能单机完成Qwen3-235B模型（31K序列长度）的LoRA微调。该工具已作为开源Python库发布。

开源生态论文/研究

推荐理由：RoundPipe 在消费级 GPU 上实现了近乎零气泡的流水线并行，能让 8 张 4090 跑起 235B 的 Qwen，还开源了代码。做模型训练又缺卡的人值得仔细读一下，说不定能省掉一张 A100。

08:00

HuggingFace Daily Papers（社区热门论文）

最后一篇人类撰写的论文：智能体原生研究制品

传统科学论文为追求线性叙事，舍弃了大量失败实验与分支路径，且描述与可执行细节间存在鸿沟，严重阻碍了AI智能体的理解与复现。为此，研究团队提出“智能体原生研究制品”（ARA）协议，以包含科学逻辑、可执行代码、探索图谱及证据层的机器可执行研究包取代传统论文。其生态系统由实时研究管理器、ARA编译器和原生评审系统支持。实验表明，ARA将问答准确率从72.4%提升至93.7%，复现成功率从57.4%提高至64.4%。保存的失败轨迹能加速扩展任务，但也可能限制高能力智能体跳出既有框架。

智能体arXiv论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

协同进化策略蒸馏（CoPD）

研究提出协同进化策略蒸馏（CoPD），以解决混合RLVR的跨能力发散问题和传统OPD因行为模式差距导致的能力吸收不全问题。CoPD通过推动专家并行训练，并在每个专家的RLVR训练中引入双向OPD，使专家互为教师、协同进化，从而保持行为模式一致且知识互补。实验表明，CoPD能全面集成文本、图像和视频推理能力，性能显著优于混合RLVR和MOPD等基线，甚至超越领域专用专家。该方法可能启发新的训练扩展范式。

智能体多模态推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

大原子模型与语言模型的智能体融合加速超导体发现

研究团队提出名为ElementsClaw的智能体框架，通过协同大型原子模型与大型语言模型来加速材料发现。该框架利用微调自10亿参数原子模型Elements的工具进行原子尺度计算，并借助LLM进行高层语义推理，将材料发现转向集成化、人机交互模式。在超导体搜索中，该框架仅用28个GPU小时便筛选了240万种晶体，识别出6.8万个高置信度候选材料，将已知超导体空间扩大了数个数量级。它不仅成功识别出文献中隐藏的超导体，更发现了四种经实验验证的新型超导体，其中Zr3ScRe8和HfZrRe4的转变温度分别为6.8K和6.7K。

智能体arXivHugging Face论文/研究

07:33

IT之家（RSS）

加速你的创意落地：Claude AI 接入 Adobe、Blender 等创意软件生态

Anthropic于4月29日宣布升级Claude AI，新增专属连接器，全面接入Adobe、Blender等八大主流创意软件生态。此次更新将AI能力深度整合至专业工作流，用户可直接在Adobe系列软件中调用50多项工具，在Autodesk Fusion中通过对话创建修改3D工业模型，在Blender中生成脚本与调试场景。此外，音频软件Ableton和Splice用户也能快速查询文档与检索采样库。Claude旨在充当智能助手，自动化处理重复任务，让创作者更专注于核心创意。

AnthropicMCP/工具产品更新多模态

07:33

IT之家（RSS）

苹果 AirPods 将迎史诗级加强，iOS 27 全面重构 Siri AI 语音交互

据报道，苹果将在 iOS 27 系统中全面重构 Siri，旨在通过深度集成将其打造为用户的全天候智能伴侣，显著增强 AirPods 的交互体验。新版 Siri 将采用类似 ChatGPT 的对话式交互，利用大语言模型理解上下文与用户意图，并能深度控制系统及应用，自动执行多步骤任务，同时支持接入第三方 AI 平台。此次升级致力于提供无缝、连续的对话体验，解决当前 Siri 与第三方 AI 交互生硬、割裂的问题，让用户通过 AirPods 即可便捷唤醒和使用更智能的语音助手。

产品更新语音

07:33

IT之家（RSS）

IT早报 0429：央视解读"中方禁止 Manus 并购案"；"探店网红"白冰偷税被追罚 1891 万元；DeepSeek 多位骨干离职去大厂

央视解读中方禁止Meta收购AI公司Manus，意在遏制“洗澡式出海”。税务部门查处网红“白冰”偷逃税款，追缴罚款1891万元，其多平台账号被封禁。网信部门依法查处“剪映”等平台未落实AI生成内容标识规定。DeepSeek-V4技术报告显示，包括王炳宣在内的10名核心骨干已离职。百度宣布调整职级体系，打通专业与管理通道。华为Pura X Max横向折叠手机首销日销量约为前代215%。吉利银河M7上市，CLTC综合续航1730公里。比亚迪发布汉EV闪充版，支持9分钟快充。

政策/监管行业动态

07:33

IT之家（RSS）

消息称苹果 iOS 27 将扩展 AI 修图功能，新增 3 项编辑功能

据彭博社爆料，苹果计划在WWDC26上为iOS 27系统引入三项AI照片编辑功能。新版照片应用将新增“Apple Intelligence Tools”菜单，其核心是“Extend”功能，可生成并自动填补原始画幅之外的图像内容。另外两项工具分别是用于自动优化图像光线与色彩的“Enhance”，以及支持在后期自由改变空间照片观看视角的“Reframe”。不过，内部测试显示“Extend”和“Reframe”目前运行不稳定，苹果正评估模型优化进度，这些功能可能面临推迟或缩减。

产品更新图像生成端侧

07:33

IT之家（RSS）

马斯克庭审自述：创办公司只为拯救人类，OpenAI 奥尔特曼正掏空美国慈善根基

在庭审中，马斯克将自己描绘成心系人类福祉的拯救者。他回顾从南非到创办多家公司的经历，称创立SpaceX是为生命“买保险”，创办特斯拉是为摆脱化石燃料。他早年即担忧AI的双刃剑效应，并称参与创立OpenAI是为实现《星际迷航》式AI乌托邦。马斯克指责OpenAI CEO奥尔特曼为“小偷”，并警告若其行为被合法化，将摧毁美国慈善事业的根基。

OpenAI行业动态

06:35

Claude Code：GitHub Releases（RSS）

版本v2.1.122更新摘要

本次更新主要新增了通过环境变量选择Bedrock服务层级的功能，并支持在/resume搜索框粘贴PR链接以定位创建该PR的原始会话。同时修复了多项关键问题：修正了源会话含时间线回退条目时，/branch命令可能创建失败分支的问题；解决了发送给新版模型的图像被错误调整为2576px（应为2000px上限）的问题；增强了OpenTelemetry日志记录，确保数字属性以数值类型输出；并修复了Vertex AI/Bedrock在生成会话标题等场景下可能返回无效请求错误的问题。此外，还包含对MCP工具显示、CLI命令退出行为等多项细节的优化与修正。

AnthropicMCP/工具产品更新部署/工程

06:33

Simon Willison 博客

引用 OpenAI Codex 基础指令

OpenAI 在其 Codex 项目的模型管理器文件中，为 GPT-5.5 设置了一条基础系统指令。该指令明确要求模型“除非与用户的查询绝对且明确相关，否则绝不要谈论地精、小妖精、浣熊、巨魔、食人魔、鸽子或其他动物或生物”。这条指令揭示了大型语言模型在系统提示词层面进行的特定内容限制与引导，是理解模型行为边界和提示工程实践的一个具体案例。

OpenAI大佬观点编码

06:09

Hacker News 热门（buzzing.cc 中文翻译）

OpenAI 模型即将登陆亚马逊 Bedrock：专访 OpenAI 和 AWS 首席执行官

OpenAI 与亚马逊 AWS 宣布合作，将其 AI 模型集成到 Bedrock 托管服务平台。用户可通过 AWS 直接访问 OpenAI 的先进模型，如 GPT 系列，从而简化企业部署 AI 应用的过程。此次集成提升了模型的可访问性和管理效率。在专访中，OpenAI 首席执行官 Sam Altman 和 AWS 首席执行官 Matt Garman 强调了双方在推动 AI 普及方面的合作细节，包括对 Bedrock Managed Agents 的优化，旨在为企业提供更高效的 AI 解决方案。

OpenAI大佬观点部署/工程

关联讨论 5 条

05:38

HuggingFace Daily Papers（社区热门论文）

通过表示稳定性提升表格检索的鲁棒性

基于Transformer的表格检索系统将结构化表格扁平化为序列，导致即使语义不变，不同序列化格式（如CSV、HTML）也会产生显著差异的检索结果。研究将不同格式的嵌入视为共享语义的噪声视图，以其质心作为规范表示。质心平均法能有效抑制格式特异性变异，在多个检索模型的比较中优于单一格式。此外，研究引入轻量级残差瓶颈适配器，将单格式嵌入映射向质心目标，并施加协方差正则化。该适配器提升了多个稠密检索器的鲁棒性，但改进效果因模型而异，对稀疏检索提升较弱。相关代码与模型已开源。

检索增强论文/研究部署/工程

03:09

Hacker News 热门（buzzing.cc 中文翻译）

人工智能的经济逻辑站不住脚

当前人工智能的经济逻辑面临严峻挑战。尽管AI公司投入巨大，但其商业模式难以持续，高昂的算力和能源成本与创造的实际经济价值不匹配。许多AI应用并未产生预期中的生产力爆发或显著收入增长，反而可能导致市场垄断和资源集中。行业需要重新审视AI技术的投资回报率，探索更可持续的发展路径。

现象/趋势行业动态

03:09

Hacker News 热门（buzzing.cc 中文翻译）

Claude.ai 目前无法使用

Claude.ai 人工智能服务目前无法访问，官方状态页面（status.claude.com）已确认服务中断。该故障于2026年4月28日18:01（UTC）被报告，在Hacker News上相关帖子获得112个点赞，反映了技术社区的高度关注。具体中断原因和恢复时间尚未公布，用户需通过状态页面获取更新。

Anthropic行业动态

02:39

Hacker News 热门（buzzing.cc 中文翻译）

克劳德·科德编写的代码归谁所有？

克劳德·科德编写代码的所有权问题引发法律讨论，聚焦AI生成代码的归属权。文章指出，当前法律框架下此类代码的版权归属尚不明确，可能涉及用户协议、版权法更新及知识产权争议。该话题在科技社区热度高，相关文章在Hacker News上获得109 points，反映对AI技术进步中法律挑战的广泛关注。

安全/对齐现象/趋势编码

02:37

HuggingFace Daily Papers（社区热门论文）

用于认知-偶然不确定性分解的信度概念瓶颈模型

针对概念瓶颈模型（CBM）将认知不确定性与偶然不确定性混为一谈的问题，研究团队提出了CREDENCE框架。该框架将每个概念表示为概率区间，通过不同概念头之间的分歧量化认知不确定性，并训练一个专门的模糊性输出来估计偶然不确定性。实验证明，认知不确定性正相关于模型预测错误，而偶然不确定性则紧密跟踪标注者间的真实分歧。基于此分解，该方法能支持明确的决策：自动化处理低不确定性案例，优先收集高认知不确定性数据以改进模型，将高偶然不确定性案例转交人工审核，并在两者皆高时主动弃权。代码已开源。

安全/对齐推理论文/研究

02:11

The Decoder：AI News（RSS）

一个对1930年后世界一无所知的LLM如何想象2026年

名为“Talkie”的130亿参数语言模型仅使用1931年前的文本训练，其对未来世界的预测呈现出强烈的时代局限性。该模型怀疑第二次世界大战是否会发生，并将2026年想象成一个仍以蒸汽船、铁路和廉价小说为主导的世界。这直观揭示了训练数据的时间范围如何从根本上限制大语言模型对现实发展的认知与预测能力。

数据/训练现象/趋势论文/研究

02:09

Hacker News 热门（buzzing.cc 中文翻译）

人工智能在最大规模的开源病历软件中发现了38处漏洞

一项人工智能安全研究在目前规模最大的开源电子病历软件OpenEMR中发现了38个安全漏洞。这些漏洞涵盖多个类别，包括跨站脚本、SQL注入和身份验证绕过等高风险问题。该软件被全球超过10万家医疗服务提供商所使用，影响范围广泛。研究团队利用AI驱动的代码分析工具完成了此次漏洞挖掘，凸显了AI在提升软件安全审计效率方面的潜力。所有已发现的漏洞细节均已报告给开发团队进行修复。

智能体安全/对齐部署/工程

01:39

Hacker News 热门（buzzing.cc 中文翻译）

据报道，谷歌与五角大楼就人工智能的"任何合法"用途达成协议

据报道，谷歌已与美国五角大楼达成一项关于人工智能技术应用的协议。根据协议，谷歌将允许美国国防部在“任何合法”的军事用途中使用其人工智能工具。这一合作标志着谷歌与军方关系的显著转变，此前谷歌员工曾因涉及AI的军事项目（如Maven项目）发起抗议。新协议旨在为国防部提供广泛的AI技术访问权限，涵盖从后勤到情报分析等多个领域，但强调所有应用必须符合法律和伦理规范。此举可能引发关于科技公司与军事部门合作边界的进一步讨论。

Google政策/监管行业动态

01:11

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选71

OpenAI模型、Codex与托管智能体登陆AWS平台

OpenAI的GPT系列模型、代码生成模型Codex以及托管智能体现已正式上线亚马逊云科技。企业用户可直接在AWS环境中集成并调用这些AI服务，基于自身云基础设施构建安全、可控的定制化人工智能应用。此次合作将OpenAI的前沿模型能力与企业级云环境的安全性和可扩展性相结合，为企业部署生成式AI与自动化智能体提供了新的平台选择。

OpenAI行业动态部署/工程

关联讨论 5 条

推荐理由：OpenAI 终于上了 AWS，这意味着大量被云锁定的企业不用再绕道 API，直接在自家环境里跑 GPT 和 Codex，对做企业级 AI 产品的人来说是个真信号。

01:09

Hacker News 热门（buzzing.cc 中文翻译）

Anthropic 加入 Blender 开发基金，成为企业赞助商

Anthropic宣布以企业赞助商身份加入Blender开发基金。该基金旨在支持开源3D创作套件Blender的持续开发。作为企业级赞助商，Anthropic将提供资金支持，助力Blender在3D建模、动画和渲染等核心功能的研发。此举标志着AI公司与开源图形软件社区的重要合作，将进一步推动创意工具的发展。相关新闻在Hacker News上获得了111个社区积分。

Anthropic开源生态行业动态

00:37

Hugging Face：Blog（RSS）

精选70

介绍 NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频智能体的长上下文多模态模型

NVIDIA 发布了 Nemotron 3 Nano Omni 模型，这是一个专为处理长上下文多模态任务设计的轻量级模型。该模型能够同时理解并处理文档、音频和视频数据，旨在赋能新一代多模态智能体。其核心变化在于将长上下文能力与多模态理解结合到一个小型化模型中，提升了在复杂跨模态场景下的处理效率与应用灵活性。

多模态模型发布端侧

关联讨论 3 条

推荐理由：NVIDIA 把多模态长上下文塞进 Nano 级别模型，文档、音频、视频 Agent 通吃，做端侧多模态应用的团队值得认真看看这个架构思路。

00:36

Claude：Blog（网页）

精选72

像培训新开发者一样引导Claude Code：来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code，以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块（如调试技能），为Claude Code建立项目认知。该方法显著提升了开发效率：搁置一年的文件视图面板功能在两周内完成；CSS布局更新从依赖设计师变为不到一天实现。此外，Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成，团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由：这不是又一篇 Claude Code 安利文，而是一个维护了 17 年 70 万行 C# 代码库的人，把带新人的方法论原封不动搬给了 AI，结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。

00:09

Hacker News 热门（buzzing.cc 中文翻译）

GitHub Copilot 代码审查功能将开始消耗 GitHub Actions 配额

GitHub宣布自2026年6月1日起，GitHub Copilot的代码审查功能将开始消耗用户的GitHub Actions配额分钟数。这一变化意味着开发者使用该AI辅助审查代码时，将计入其月度Actions使用量，可能影响免费额度用户或用量较大的团队。此前该功能可能未计入配额或采用独立计费方式，新政策将统一至Actions计费体系。

产品更新编码部署/工程

00:06

Google Blog：AI（RSS）

庆祝 Google Translate 20 周年：趣闻、技巧与可尝试的新功能

Google Translate 迎来 20 周年，从 2006 年的一项 AI 实验起步，现已支持近 250 种语言。官方分享了 20 条相关趣闻，并介绍了用户可尝试使用的实用技巧与新功能，以展示其多年来的技术演进与服务扩展。

Google产品更新多模态

4月28日

23:39

Mistral AI：News（网页）

精选68

Mistral AI 发布 Workflows 公开预览版，为企业AI工作流提供编排支持

Mistral AI 正式推出 Workflows 公开预览版，该产品定位为企业AI的编排层，旨在通过提供持久性、可观察性和容错性，帮助AI驱动的工作流从概念验证可靠过渡到生产环境。它集成于Studio平台，允许开发者用Python编写工作流，并可发布至Le Chat供组织成员触发。其核心功能包括持久化执行（支持从断点恢复）、完整的步骤跟踪与审计，以及通过 wait_for_input() 等方法实现人工介入审批。目前已有ASML、ABANCA等企业客户使用其自动化货物放行、文档合规检查等关键业务流程，将原本耗时数小时的人工操作缩短至几分钟。

智能体产品更新部署/工程

推荐理由：Mistral 把 Temporal 的持久执行引擎包装成企业 AI 编排层，解决的是「demo 能跑、上线就挂」这个最痛的落地问题。做企业级 Agent 的团队值得认真看看，尤其是 human-in-the-loop 那个 wait_for_input 一行代码的设计。

23:33

IT之家（RSS）

ACEMAGIC 阿迈奇推出 F5A 迷你主机：锐龙 AI 9 HX 470 处理器、32GB 内存，支持 OCuLink 外接显卡

ACEMAGIC在海外发布F5A迷你主机，搭载AMD锐龙AI 9 HX 470处理器（12核24线程，NPU AI算力55 TOPS）与Radeon 890M显卡。主机配备32GB LPDDR5X内存，支持通过3个M.2插槽扩容至12TB存储，并具备Wi-Fi 7、双2.5G网口及丰富的接口，包括双USB4和可外接显卡的OCuLink端口。其性能释放最高65W，准系统版售价759美元起。

产品更新端侧

23:33

IT之家（RSS）

苹果 Vision Pro 辅助完成白内障手术，支持 3D 可视化与远程协作

纽约眼科医生埃里克·罗森伯格借助苹果Vision Pro及手术平台ScopeXR，成功完成了首例及后续数百例白内障手术。该平台可将3D手术显微镜画面实时传输至头显，提供立体可视化视角并叠加术前数据，同时支持其他医生远程虚拟参与协作。此举是苹果将Vision Pro重点拓展至医疗等专业应用领域的例证。目前，苹果已暂停新款头显研发，转向轻量化智能眼镜方向。

具身智能行业动态

23:10

Anthropic：Newsroom（网页）

精选70

Claude创意工作套件

Anthropic推出Claude for Creative Work，这是一套连接器工具，可实现Claude与Blender、Autodesk、Adobe等主流创意软件的直接集成。这些连接器允许Claude访问各平台功能，例如在Adobe系列中调用50多款应用，在Autodesk Fusion中通过对话创建3D模型，或在Blender中通过自然语言操作Python API。创意工作者可利用Claude加速软件学习、编写脚本插件、桥接多工具工作流以及自动化批量处理等重复任务。该系列工具基于MCP标准，并已与多所艺术设计院校合作，旨在推动创意计算教育。

AnthropicMCP/工具产品更新

关联讨论 2 条

推荐理由：Anthropic 把 Claude 塞进 Blender、Adobe、Ableton 这些创意工具里，不是又一个聊天框，而是用 MCP 让 AI 真正操作软件。做设计、做音乐、做 3D 的人第一次有了一个能跨工具干活的 AI 助手，值得试试。