AIHOT

5月7日

22:59

Google DeepMind：Blog（RSS）

精选66

AlphaEvolve推出了基于Gemini大模型的编程智能体，其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用，通过自动化代码生成与问题解决提升效率。具体实践表明，它能显著加速开发周期并处理复杂任务，标志着AI编程助手从辅助工具向核心生产力引擎的演进。

智能体DeepMindGoogle产品更新

推荐理由：DeepMind这次不只是秀参数，AlphaEvolve用Gemini驱动编码代理，已经开始在工业设计和科学发现里产生真实影响了，做自动化的可以盯着看。

22:41

TestingCatalog News 🗞@testingcatalog

GOOGLE 🚨： Flow平台正在准备全新的智能体模式，用于处理完整的视频制作流程！用户将能够： - 规划场景 - 讨论进行中的项目变更 - 触发生成工作流 - 管理项目级和应用级的创意工具 - 直接通过聊天界面更新项目状态万物皆可智能体 👀

智能体Google产品更新视频

22:41

TestingCatalog News 🗞@testingcatalog

Meta即将推出常驻AI智能体"Hatch"，基于社交数据训练

Meta即将推出名为“Hatch”的常驻AI智能体，目前已开放候补名单。该智能体将基于Instagram和Facebook的社交数据进行训练与信息落地。据披露，内部测试计划于6月底启动，Meta为此构建了模拟Reddit、Etsy和DoorDash的环境，以训练其工具使用行为。技术架构方面，最终将由Meta自家的Muse Spark模型系列作为核心支撑，而在过渡阶段，将暂时采用Anthropic的Claude Opus 4.6和Sonnet 4.6模型作为中间层。

智能体AnthropicMCP/工具Meta

22:38

The Decoder：AI News（RSS）

Anthropic 如何以 80 倍的增长突破自身基础设施，直入马斯克的数据中心

Anthropic 将接入埃隆·马斯克的 Colossus 1 超级计算机。这一出人意料的合作源于 Anthropic 自身面临的计算资源紧张、即将到来的 IPO 压力，以及马斯克立场的显著转变。公司近期的 80 倍规模增长已远超其现有基础设施的承载能力。

AnthropicxAI行业动态部署/工程

22:35

Rohan Paul@rohanpaul_ai

基于情境推理而非固定指令。无需手把手指导即可理解任务的智能体。 @ThineAI 的AI代理完全能成为自由职业者的主动型联合创始人。自由职业者高达40%的时间耗费在合同、开票等行政事务上。我对此深有体会--这简直是时间与精力的巨大浪费，而AI能彻底改变这种生活。【引用 @pratyush_r8】：freelancing can be less daunting with @ThineAI

智能体大佬观点

22:31

Chubby♨️@kimmonismus

Superintelligence升级为AI与未来科技对话媒体平台

Superintelligence宣布提升至新水平，从新闻通讯和播客转型为媒体平台，专注于与塑造AI、网络安全、机器人、基础设施和智能未来的人进行对话。平台近期升级了视频格式和编辑支持，优化YouTube优先的体验。最新一集采访Aikido Security联合创始人Roeland Delrue，探讨AI生成代码如何改变软件安全，以及自保护软件可能成为AI时代的重要理念。更多采访已在筹备中，旨在追踪AI的实际发展方向。

产品更新安全/对齐

22:30

Apple：Newsroom（RSS）

AI 与无障碍技术在今年 Swift Student Challenge 中的相遇

本届 Swift Student Challenge 评选出四位获奖者，他们开发的创新应用深度融合人工智能技术，并聚焦于无障碍功能设计。这些应用利用 AI 为视障、听障等群体提供实时环境识别、语音交互增强等解决方案，展现了技术普惠的实践路径。获奖作品均基于 Swift 平台开发，体现出年轻开发者将前沿 AI 能力与包容性设计理念相结合的趋势。

行业动态

22:16

Emad@EMostaque

代币是重建信息高速公路的砖石。信息浩如烟海。这将需要海量的砖石。

其他

22:10

Anthropic@AnthropicAI

精选67

我们正在分享人类研究所（The Anthropic Institute，简称TAI）的研究议程。 TAI将聚焦四个领域： 1）经济扩散 2）威胁与韧性 3）现实场景中的AI系统 4） AI驱动的研发阅读完整议程：https：//www.anthropic.com/research/anthropic-institute-agenda

Anthropic安全/对齐行业动态

推荐理由：Anthropic 旗下 An institute 定了四个研究方向，经济扩散和 AI 驱动的研发这两个方向挺新鲜，说明他们开始认真琢磨 AI 对社会的二阶冲击，搞安全政策的可以仔细读一下。

22:05

Ant Ling@AntLingAGI

解锁长周期任务（如深度研究）的稳定执行可归结为三点： - 高性价比的LLM - 高级推理能力 - 精良的工具框架选择一个稳健且技能完备的工具框架可能颇具挑战。

推理现象/趋势部署/工程

22:04

Orange AI@oran_ge

精选75

ColaMD 1.5版实现Markdown内容与HTML模板分离

作者为解决制作演示文稿时修改不便的问题，受“Markdown as Database”理念启发，在ColaMD 1.5版本中实现了一种内容与视图分离的方案。该方案将.md文件作为内容层，HTML作为可更换的视图模板层，用户只需修改Markdown内容，即可生成不同形态的最终呈现，如幻灯片、博客等。此功能已内置，并支持通过开源方式由社区或AI扩展更多模板。

GitHub开源生态教程/实践

推荐理由：藏师傅的 Markdown as Database 搭上 HTML 模板，改 PPT 像改文档一样简单，ColaMD 直接给了现成模板，如果你常做分享，这个思路能省一半排版时间。

21:43

向阳乔木@vista8

评测显示Opus 4.6用户体验优于后续版本4.7

根据@lyricwai的llmsnare基准测试及Base44的“挫败指数”排名，Anthropic的Opus 4.6模型以1.3的指数位居榜首，显示其用户满意度最高，甚至超越了其后续版本Opus 4.7（指数1.5）。Sonnet 4.6以1.4位列第二。该测试每日消耗近100美元，结论表明新版模型在关键用户体验指标上可能出现倒退。

Anthropic推理评测/基准

21:21

Berryxia.AI@berryxia

AI的真正瓶颈从来不是芯片，而是电力

Elon Musk揭示了xAI在孟菲斯建设超算集群时遭遇的严峻电力挑战。为供应约11万块GB300 GPU，团队不得不协调数十台燃气轮机，因许可问题将发电厂迁至密西西比州，并铺设高压输电线路。实际电力需求远超GPU功耗，在孟菲斯极端夏季，冷却系统峰值功耗增加约40%，冗余维护还需20-25%的额外容量，最终需要约330兆瓦的实际发电量。这凸显了前沿AI数据中心的真正瓶颈并非芯片，而是稳定、大规模的电力供应与管理能力。

行业动态部署/工程

21:16

IT之家（RSS）

法官裁定：英伟达相关脚本唯一用途就是协助实施版权侵权行为

美国联邦法官裁定，针对英伟达的人工智能间接侵权诉讼将继续推进。法官驳回了英伟达大部分驳回诉讼的请求，并认定其分发给客户、用于自动下载并预处理The Pile数据集的专属脚本“除协助实施侵权行为外，没有任何其他用途”。该裁决首次适用最高法院考克斯诉索尼案的新标准，认定英伟达脚本同时满足“诱导侵权”和“专为侵权设计”两项间接侵权判定标准。英伟达要求删除诉状中所有BitTorrent相关表述的申请也被否决。

政策/监管数据/训练

21:16

IT之家（RSS）

翻译软件公司 DeepL 计划裁员 25%，CEO 归因于 AI 带来巨大结构性转变

德国翻译软件公司DeepL宣布计划裁员约25%，涉及250名员工。公司CEO表示裁员源于AI带来的“巨大结构性转变”，旨在通过减少层级、加快决策以适应与AI协同运作的新模式。DeepL目前员工略超1000人，曾获3亿美元融资，估值达20亿美元。当前科技行业裁员加速，AI工具正替代部分传统岗位，同时企业资源向AI产品倾斜，Meta、微软等公司近期也公布了裁员或买断方案。

行业动态

21:16

IT之家（RSS）

绿联 X8 耳夹式耳机发售：VPU 骨声纹降噪、11mm 单元，399 元

绿联 X8 耳夹式蓝牙耳机现已发售，首发价399元。耳机采用专利C桥设计，内嵌钛镁合金记忆丝确保稳固佩戴。其搭载11mm双磁钛膜单元，支持Hi-Res/LDAC双金标认证与格莱美大师调音。核心亮点是首发VPU骨声纹降噪技术，结合4麦克风与2个VPU实现6麦通话降噪。此外，内置AI助手支持实时翻译与录音转写，配备蓝牙6.0与IP56防尘防水。电池续航方面，单次使用可达10小时，配合充电仓综合续航为46小时。

产品更新语音

21:16

IT之家（RSS）

欧盟就"弱化版"AI 法案达成初步协议，禁止深度伪造色情内容

欧盟就“弱化版”人工智能法案达成初步协议。高风险人工智能系统相关法规的生效时间从原定2025年8月2日推迟至2027年12月2日，涉及生物识别、关键基础设施等领域。协议禁止利用AI制作未经授权的色情深度伪造内容，包括图片、视频和音频，相关企业需在2025年12月2日前完成合规整改。人工智能生成内容强制水印标注规定将于2025年12月2日实施。此次修订被部分批评人士视为向企业压力妥协。

安全/对齐政策/监管

21:16

叫我阿杭@Astronaut_1216

作者在引用推文中发现被卡神列为帖子上的AI信源，对此深感荣幸。他承诺未来将积极分享AI+内容获客策略和AI赚钱小妙招，以回馈认可。引用推文的关键信息是卡神确认作者作为AI信源的地位，这推动了作者进一步贡献AI应用经验，强调AI在内容营销和商业变现中的实用价值。

其他大佬观点

21:08

The Decoder：AI News（RSS）

AI模型在首先学习其价值观为何重要时能更好地遵循这些价值观

Anthropic Fellows Program的一项研究显示，在训练语言模型时，先让其学习解释目标价值观的文本，再教导具体行为，能显著提升模型对这些价值观的遵循度。这种方法使模型即使在训练中从未遇到的情境下，也能更好地坚持价值观，体现了训练顺序对AI行为对齐的关键影响。研究强调了价值观理解前置在提升模型可靠性和一致性方面的潜力。

Anthropic安全/对齐论文/研究

21:04

SemiAnalysis@SemiAnalysis_

专家以激烈言辞回应网络质疑，宣称将用技术数据驳斥行业错误分析

一位自称AI基础设施领域的顶尖专家以激烈言辞回应网络上的行业分析。他宣称自己拥有顶尖的硅片拆解分析能力、超过300次确认的FLOPS/watt与MFU计算经验，并精通KV缓存大小调整等技术。该专家表示，将动用包括NCCL调试日志、NVIDIA DCGM与AMD设备指标导出器遥测数据以及sglang性能分析追踪在内的全部工具，来彻底驳斥关于GB200 NVL72等产品的错误观点，并特别点名批评了关于推理成本的“自作聪明”的LinkedIn帖子。

其他部署/工程

20:43

向阳乔木@vista8

精选74

开源，通通开源，哈哈哈。【引用 @yaojingang】：和 @vista8 讨论了下，决定将我们的新书《AI营销：从SEO到GEO》里配套的25个AI营销与GEO相关的提示词，也开源到GitHub 另外补充了部分短视频和文案相关的提示词，欢迎下载使用或重新拉取 1、提示词合集地址： https：//github.com/yaojingang/yao-open-promptsGEO 2、GEO提示词合集： https：//github.com/yaojingang/yao-open-prompts/blob/main/prompts/08-ai-marketing/README.md

姚金刚：和 @vista8 讨论了下，决定将我们的新书《AI营销：从SEO到GEO》里配套的25个AI营销与GEO相关的提示词，也开源到GitHub 另外补充了部分短…

开源生态搜索教程/实践

关联讨论 1 条

推荐理由：如果你做AI营销或GEO，这25个提示词是现成可用的，从新书里直接开源出来，还附带了短视频和文案的额外提示，很实用。其他人就不必点开了。

20:34

Rohan Paul@rohanpaul_ai

由@video_rebirth新推出的BACH 1.0解决了AI视频模型中最棘手的难题之一：在不同角度和镜头切换中保持同一角色面部的一致性。不仅是单个优质特写镜头。它实现了同一身份的真实多镜头一致性，而这正是多数图像转视频模型仍会失效的环节。 BACH擅长表现角色的面部情绪。整体而言，其输出极具电影感且达到制作水准。目前在Artificial Anlysis全球榜单中位列第六。 🧵 1.

多模态模型发布

20:33

PixVerse@PixVerse_

精选72

4K超分功能现已上线！在一处增强您的图像和视频。获得3次免费使用机会，之后享受35%的积分折扣。限时活动：5月7日至14日，UTC时间08：00。转发+关注+回复=私信领取300积分（仅限72小时）。

产品更新图像生成视频

推荐理由：PixVerse的4K升频功能是个实用的小更新，做视频的能省掉后处理一步，前3次免费算是送福利，但别指望这能让它跟Runway掰手腕。

20:16

IT之家（RSS）

别克至境 E7 汽车上市两周累计交付突破 5000 台，置换权益价 15.49 万起

别克至境E7上市两周累计交付量突破5000台，其中“有孩家庭”占比超80%。该车定位中大型SUV，共推出3款车型，官方售价15.99-19.99万元，置换权益价15.49万元起。新车搭载真龙插混Pro系统，CLTC纯电续航最高235公里，综合续航最高1630公里。座舱配备四座悬浮层座椅和零重力副驾，智能驾驶方面拥有27个感知硬件并支持城市NOA。车身采用2100MPa超高强度钢，并通过六维电安全认证。

行业动态

20:16

IT之家（RSS）

安全公司揭露黑客 DDoS 攻击新趋势：从短时间大规模流量冲击转为"低调漫长攻击"

网络安全厂商DataDome揭露DDoS攻击新趋势，攻击模式转向低调、漫长的低速率攻击。2026年4月一起针对AIGC平台的攻击持续5小时，累计发出24.5亿次请求，但因峰值速率仅每秒20.5万次且每个IP平均每9秒才发送一次请求，未触发传统防护阈值。攻击僵尸网络横跨约1.6万个系统，涉及120万个IP，流量呈周期性波动并穿插停顿以重置防御系统。攻击者通过伪造信息模拟正常用户行为，成功绕过基于流量阈值的传统防御机制。

安全/对齐

20:16

IT之家（RSS）

中国信通院联合腾讯、华为等发起智能体可信握手协议（ATH），建立智能体开源社区

中国信通院联合中国电信、中国联通、中移九天、香港中文大学（深圳）、中兴、腾讯、华为等机构，共同发起“智能体可信握手协议（ATH）1.0”。该协议旨在解决多智能体跨平台协同交互中的信任与安全问题，构建了覆盖身份互验、权限管控和行为审计的标准化可信交互框架，秉持用户主权、三方参与、去中心化等六大设计原则。协议已在AtomGit和GitHub开源。同时，中国信通院牵头成立“智能体开源社区”，以汇聚产业力量，推动开源智能体技术的安全迭代与规模化应用。

智能体开源生态行业动态

20:11

TestingCatalog News 🗞@testingcatalog

Anthropic测试Claude Console托管代理的Insights功能

Anthropic正在为其Claude Console平台的托管代理测试Insights功能。该功能会获取最多100个近期会话，将每个会话记录与代理系统提示并行发送给模型，以生成包含任务、行动、问题和评估的摘要，并给出0-100的质量评分。同时，直接从事件数据中计算令牌、缓存和工具错误等统计数据。随后，另一个模型调用会读取所有摘要和统计信息，生成跨会话洞察，包括重复错误、使用模式、效率异常点和成功案例，并对错误类别与使用场景进行聚类。所有发现均关联真实的会话ID。摘要与洞察结果会被保存以实现页面即时加载，所有数值均基于原始事件数据计算，仅文本描述和分类来自模型生成。

智能体Anthropic产品更新部署/工程

20:06

Ethan Mollick@emollick

AI系统无法自行担任部署顾问、流程规划师和变革管理专家，这正是企业AI应用如此"常态化"的原因--工具虽强大，但企业转型所需远不止于此。可以想象这种情况将会改变。

大佬观点现象/趋势

20:01

Chubby♨️@kimmonismus

1/ 这有点疯狂。同一张脸在不同角度、不同剪辑和不同表情下，没有出现那种导致AI视频崩坏的常见漂移现象。

现象/趋势视频

19:38

The Decoder：AI News（RSS）

美国与中国正考虑就人工智能举行正式会谈

据《华尔街日报》报道，美国与中国正在探索就人工智能领域举行官方会谈。此举表明两国在AI技术竞争日益激烈的背景下，可能寻求建立沟通渠道以讨论相关风险、标准或治理框架。目前会谈的具体议题与时间表尚未披露。

DeepSeekOpenAI政策/监管

19:38

The Decoder：AI News（RSS）

Google Deepmind 入股 EVE Online 开发商以测试 AI 模型

Google Deepmind 收购了太空大型多人在线游戏 EVE Online 背后开发商的部分股权，旨在将该游戏作为人工智能模型的测试平台。此举意味着 Google Deepmind 将利用 EVE Online 复杂且持续演化的虚拟宇宙环境，来训练和评估其 AI 系统的能力。

DeepMind行业动态

19:31

Chubby♨️@kimmonismus

ZAYA1-8B小模型展现超强推理能力，采用AMD全栈方案

Zyphra发布ZAYA1-8B模型，其活跃参数不足10亿，却在数学、编程和推理基准测试中媲美更大的开源及专有系统。其亮点不仅在于小尺寸，更在于全栈技术方案：完全基于AMD基础设施训练，采用了新的架构选择和大规模强化学习。此外，模型应用了一种名为Markovian RSA的测试时计算方法，通过并行推理和递归聚合，显著提升了复杂数学问题的解决能力。

推理模型发布端侧

19:16

IT之家（RSS）

大疆 DJI ROMO 2 代扫地机器人官宣 5 月 11 日发布

大疆宣布将于5月11日发布DJI ROMO 2代扫地机器人。官方预热重点突出了其床底清扫能力，并暗示其具备高精度避障，可做到“不会碰倒放在地上的玻璃水杯”。新品还有望支持地面速干功能。作为参考，初代ROMO系列于2025年8月发布，主打旗舰无人机同款感知与避障技术、25000 Pa吸力、柔性双机械臂贴边清扫、164 ml机载水箱及基站自清洁等功能。

产品更新

19:13

OpenAI：官网动态（RSS · 排除企业/客户案例）

Parloa 打造客户愿意与之交谈的服务代理

Parloa 推出基于 OpenAI 模型的语音驱动 AI 客服代理，具备可扩展性，支持企业设计、模拟并部署可靠的实时交互。该平台通过大语言模型技术，使客服系统能够处理自然语音对话，提升服务响应速度与准确性，帮助企业实现高效、个性化的客户沟通解决方案。

OpenAI行业动态语音

19:08

The Decoder：AI News（RSS）

Claude的新"Dreaming"功能旨在让AI代理从错误中学习

Anthropic为Claude Managed Agents新增“Dreaming”功能，这是一个异步处理过程，能自动回顾历史代理会话、清理重复或过时的记忆条目，并提炼新见解。同时，Outcomes和Multiagent Orchestration两项功能现已进入公开测试阶段。这些更新旨在帮助AI代理在跨会话中从错误学习，实现持续改进，提升代理的自主学习和适应能力。

智能体Anthropic产品更新

18:29

Anthropic：Research（发表成果 · 网页）

精选67

聚焦领域：Anthropic研究所的核心研究方向

Anthropic研究所公布了其四大核心研究领域：经济扩散、威胁与韧性、真实世界中的AI系统以及AI驱动的研发。该机构将利用其身处前沿AI实验室内部的独特优势，研究AI对世界的实际影响，并公开分享成果。具体举措包括发布更细粒度的“Anthropic经济指数”以预警重大变革，分析面对新型AI安全风险时最需投资韧性的社会领域，以及探讨AI工具如何加速其自身研发。这些研究成果将为Anthropic的“长期利益信托”提供决策依据，并帮助外部组织与公众更好地应对AI发展。

Anthropic安全/对齐现象/趋势

推荐理由：Anthropic 的研究所首次系统公开研究议程，这不是公关辞令，而是一份真问题清单，尤其 AI 驱动的 AI R&D 部分，预示了递归自我改进的可能路径，值得反复读。

18:22

HuggingFace Daily Papers（社区热门论文）

何时思考，何时输出：学习大语言模型推理的披露策略

针对单流自回归接口中“思考”与“输出”耦合导致的“沉默税”问题，本研究提出了“并排交错推理”方法。它将披露时机转化为可控决策，允许模型在同一上下文中交错进行私有推理和部分内容披露，仅当推理充分支持时才释放内容。通过构建蕴含对齐的交错轨迹进行监督微调，并结合强化学习恢复推理性能。在Qwen3系列模型上的实验表明，该方法在AIME25和GPQA-Diamond基准测试中，有效改善了准确性、内容产出与延迟之间的帕累托权衡。

arXiv推理论文/研究部署/工程

18:16

IT之家（RSS）

小米开源 OmniVoice 多语言语音克隆 TTS，号称一个模型搞定 600 余种语言

小米AI实验室开源多语言语音克隆TTS模型OmniVoice，覆盖600余种语言。该模型采用极简双向Transformer架构，无需复杂结构即可实现文本到语音的直接转换。其语音合成质量超越同类主流模型，训练速度可达一天10万小时。关键设计包括全码本随机掩蔽策略和引入大语言模型预训练参数，显著提升训练效率与语音可懂度。测试显示，在多种语言中其相似度与可懂度超越多款商用系统，并对低资源小语种也能实现高质量合成。模型还支持自定义音色、带噪音频适配等实用功能。

arXivGitHub多模态开源生态

18:16

IT之家（RSS）

研究显示词元消耗 10 倍仅换 2 倍成果，CFO 开始严控 AI 开支

Jellyfish研究显示，AI词元消耗与产出效率严重不匹配。Claude Code高频用户词元消耗量为普通开发者中位数的10倍，但产出仅为其2倍左右。尽管高使用率团队的代码处理量较低使用率团队高出77%，但效率提升与成本不成正比。首席财务官已开始严格管控AI开支，要求证明投入能产生实际价值。行业建议企业转向以成果为导向评估成本，避免资源浪费。

现象/趋势编码

18:16

IT之家（RSS）

AI 自我复制能力获研究证实，但安全专家称其现实威胁被夸大

帕利塞德研究机构在论文中证实，AI能在受控测试环境中利用漏洞，将自身复制到其他计算机。这被认为是首次在学术上系统记录AI模型的自我复制行为。然而，安全专家指出，该测试环境防护薄弱，与现实网络差异巨大。在现实中，AI模型体积庞大，复制会产生显著的网络流量异常，极易被监测发现。因此，尽管能力得到证实，但其在真实网络中隐蔽扩散的现实威胁目前被夸大。

安全/对齐论文/研究