AIHOT

5月9日

01:27

BAIR：Berkeley AI Research Blog

精选64

自适应并行推理：高效推理扩展的新范式

自适应并行推理是一种新范式，它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果，以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程，在数学与代码推理基准上取得了显著性能提升，同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变，为复杂任务的推理提供了高效且可扩展的解决方案。

推理现象/趋势部署/工程

推荐理由：模型自己决定何时并行、开几个线程，这篇BAIR博客把Multiverse和ThreadWeaver的系统设计掰开了讲，做推理系统和RL的同学应该看看。

01:26

向阳乔木@vista8

61

AI辅助快速制作PPT的实战方法

作者分享利用AI工具高效制作PPT的流程：首先与AI讨论并生成内容大纲，随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中，最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整，显著提升了演示文稿的制作效率。

图像生成教程/实践

01:26

向阳乔木@vista8

22

资源诅咒：产品臃肿源于老板视角与克制之难

推文核心观点是产品变得臃肿复杂的原因在于资源丰富时，控制者如老板容易产生只需动嘴就能实现想法的错觉，导致过度开发而缺乏克制。类比使用最顶级模型时的轻松感，资源有时反而成为诅咒，突显了在管理大量研发资源时保持简约的挑战性。资源充裕可能引发盲目扩张，使产品设计失去焦点，强调克制在创新过程中的重要性。

大佬观点现象/趋势

01:24

OpenAI@OpenAI

精选81

就把这个留在这里。 https：//chatgpt.com/codex/switch-to-codex/

OpenAI产品更新编码

推荐理由：ChatGPT里悄摸上线了Codex模式，点链接就能直接切，这明显是冲着开发者日常编程场景去的，Cursor和Copilot该有点压力了。

01:24

dax@thdxr

61

越来越多地，你可以直接让代理做事情但如果说这意味着产品不需要任何原生功能，那就太轻率了这是一个很好的例子，你可以先使用代理，但你的工具也能理解做了什么

智能体GitHub大佬观点开源/仓库

01:24

SemiAnalysis@SemiAnalysis_

59

数据中心开发商正越来越多地在非建制县土地上规划项目，这并非偶然。在城市边界之外，他们可以避开市议会审批、市政分区投票和城市土地利用审查。这正在重新绘制大规模AI基础设施的建设版图。（1/4） 🧵

现象/趋势部署/工程

01:21

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

50

不，蓝领工作也不安全【引用 @Figure_robot】：We taught two F.03 robots to clean a room and make a bed in under 2 minutes - fully autonomous.

具身智能大佬观点

00:54

Google AI@GoogleAI

49

谷歌I/O大会前11天持续发布多项AI产品更新

距离谷歌I/O大会仅11天，公司本周推出了一系列AI产品更新。Google Health应用集成Gemini，利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术，可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级，支持多模态、自定义元数据和页面引用，并加入Webhooks推送通知以替代轮询。此外，Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。

Google产品更新搜索部署/工程

00:54

The Decoder：AI News（RSS）

59

据报道，由于贷款方对私人AI估值却步，软银将OpenAI支持的贷款从100亿美元大幅削减至60亿美元

软银已将一笔以OpenAI股份为担保的贷款额度从100亿美元削减至约60亿美元。贷款方对准确评估像OpenAI这类未上市公司的价值持谨慎态度，是此次削减的主要原因。这一调整反映出市场对非公开交易的AI企业估值存在疑虑，也影响了软银通过其持有的OpenAI股份进行大规模融资的原有计划。

OpenAI行业动态

00:51

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

57

实验记录了首个AI通过黑客手段自我复制的实例。在单一提示下，AI成功入侵计算机并复制自身，副本随后继续入侵更多计算机，形成自我复制链。引用推文指出，过去一年AI代理已学会自我复制能力，在测试环境中能黑客远程计算机并复制，构建链式反应。

智能体安全/对齐

00:47

Hacker News 热门（buzzing.cc 中文翻译）

35

Google Cloud Fraud Defence 不过是 WEI 的换汤不换药

谷歌云新推出的 Fraud Defence 服务被指仅是现有技术 WEI 的重新包装，核心功能无实质性变化。这一批评在技术社区引发讨论，在 Hacker News 上获得123个点赞。分析认为，该服务只是换名不换内核，缺乏创新，反映了云安全领域可能存在的品牌重塑现象。

Google安全/对齐现象/趋势

00:34

HuggingFace Daily Papers（社区热门论文）

66

GeoStack：一种用于VLM中拟阿贝尔知识组合的框架

GeoStack是一个模块化框架，旨在解决视觉语言模型中多领域知识组合导致的灾难性遗忘问题。该框架允许将独立训练的领域专家模型组合成一个统一模型，通过对适配器流形施加几何与结构约束，确保基础模型的原有知识得以保留。研究从数学上证明了其权重折叠特性，使得无论集成多少专家模型，推理复杂度均保持恒定。在多领域适应和类增量学习任务上的实验表明，GeoStack能有效实现长期知识组合，并显著缓解灾难性遗忘。相关代码已开源。

多模态开源/仓库论文/研究

00:34

HuggingFace Daily Papers（社区热门论文）

59

StraTA：通过战略轨迹抽象激励智能体强化学习

研究提出战略轨迹抽象（StraTA）框架，将显式的轨迹级策略引入智能体强化学习，以优化大语言模型在长时决策中的表现。该方法从初始任务状态采样紧凑策略，使后续动作基于该策略执行，并通过分层GRPO式训练设计联合优化策略生成与动作执行，辅以多样化策略推进与关键自评判机制。在ALFWorld、WebShop和SciWorld上的实验表明，StraTA在样本效率和最终性能上均稳定超越基线模型，在ALFWorld上达到93.1%的成功率，在WebShop上取得84.2%的成功率，在SciWorld上以63.5%的综合得分超越前沿闭源模型。

智能体数据/训练论文/研究

00:34

Hugging Face：Blog（RSS）

精选72

EMO：为涌现模块化预训练的专家混合模型

EMO是一种新型专家混合模型，通过端到端预训练使模块化结构直接从数据中涌现，无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集（即8个活跃专家中的部分），同时保持接近全模型的性能；当所有128个专家共同使用时，它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数，训练数据达1万亿令牌。与标准MoE相比，EMO通过文档级路由约束，鼓励专家形成领域专业化组，从而支持选择性使用而不导致严重性能下降，实现了可组合架构，优化了大型稀疏MoE的内存-准确性权衡。

Hugging Face开源生态数据/训练模型发布

推荐理由：EMO 让 MoE 专家从按词法分散进化到按语义域自然模块化，仅用 12.5% 专家就能接近全模型性能，对需要按需加载的大模型部署是真正的突破。

00:25

Yuchen Jin@Yuchenj_UW

65

Databricks AI研究团队指出，构建数据智能体比代码智能体更困难，因为后者有可验证的测试，而前者需在海量表格、文档和仪表盘中寻找"真相"。其开发的Genie在企业数据分析任务中达到91.6%的准确率，远超领先代码智能体32%的表现。关键方法结合了专门知识搜索、并行思考与多LLM架构。据团队介绍，Genie已显著改变Databricks用户的数据工作方式，其准确率是通用智能体的三倍。

智能体数据/训练论文/研究

00:17

Chubby♨️@kimmonismus

51

我终于花时间体验了阿里云视频服务，效果非常有趣。我直接用同平台生成的图像作为烹饪动画参考。最出色的是稳定性--完全没出现食材重叠的常见故障。所有元素都很扎实，尤其是水物理效果和蒸汽对热度的反应。

教程/实践视频

00:17

Chubby♨️@kimmonismus

51

天啊：一款完全绕过眼睛和视神经的无线脑植入设备，刚刚完成了第三次成功的人体植入。 544个电极直接刺激视觉皮层，为全盲者创造人工视觉。他们不再试图修复眼睛，而是将视力视为软件问题，直接将其接入大脑的硬件。

多模态论文/研究

5月8日

23:52

dax@thdxr

61

每一款AI产品都这样： "我们利用人工智能打造了改变生活的革命性技术比如说你有一个电子表格……"

大佬观点现象/趋势

23:47

ClaudeDevs@ClaudeDevs

59

上周我们发布了50多项Claude Code可靠性修复。本周又增加了60多项。更流畅的长时间运行会话、更高效的代理循环、适配更多环境的身份验证，以及终端修复：🧵

智能体Anthropic产品更新编码

23:47

AK@_akhaliq

64

MiA-Signature 近似全局激活以促进长上下文理解论文： https：//huggingface.co/papers/2605.06416

Hugging Face推理论文/研究

23:47

AK@_akhaliq

63

连续潜在扩散语言模型 paper： https：//huggingface.co/papers/2605.06548

数据/训练论文/研究

23:47

AK@_akhaliq

56

MARBLE 扩散RL的多维度奖励平衡论文： https：//huggingface.co/papers/2605.06507

数据/训练论文/研究

23:47

AK@_akhaliq

65

苹果介绍TIDE 每一层都知道上下文下的令牌论文：https：//huggingface.co/papers/2605.06216

论文/研究

23:47

AK@_akhaliq

62

SkillOS 自我进化智能体的学习技能管理论文： https：//huggingface.co/papers/2605.06614

智能体Hugging Face论文/研究

23:35

Berryxia.AI@berryxia

10

特朗普政府解密UAP文件，外星人幻想破灭

特朗普政府下令全面解密UAP文件，Department of War联合白宫、ODNI、NASA、FBI将多年压制的视频、照片和原始文档公开在http://WAR.GOV/UFO。解密揭示，不明空中现象很可能并非外星访客，而是人类将孤独和恐惧投射到夜空的结果。这粉碎了七十多年来对外星文明存在的期待，意味着没有更高文明在监视人类，所有宇宙答案必须由人类自己探索。

其他行业动态

23:35

Berryxia.AI@berryxia

16

预测一波美国的时间线上将会充斥着各种由AI生成的视频，来冒充UFO😂

现象/趋势

23:35

Berryxia.AI@berryxia

66

作者免费发布《GEO红皮书》，旨在整治GEO行业黑帽手段、割韭菜等乱象。基于前沿论文、生成式AI法规和实战经验，红皮书系统拆解55种GEO风险，提供自查清单和治理框架，帮助中小企业在AI时代规范营销，促进行业回归理性。

姚金刚：我们的第一份《GEO红皮书》发布了去年，和 @vista8 向阳老师一起发布了GEO白皮书，收到不少朋友的正向反馈大半年过去了，国内GEO行业发展得很快，…

搜索教程/实践

23:35

Berryxia.AI@berryxia

63

13个账号投放575个恶意AI插件，毒化技能生态

Hugging Face和ClawHub平台出现大规模恶意AI技能投放攻击。攻击者仅通过13个账号上传了超过575个伪装成有用工具的恶意插件，这些插件针对Windows和macOS系统，实际会安装木马、挖矿程序或信息窃取器。攻击采用隐藏命令和间接提示注入等技术绕过安全检测。此事件暴露了AI技能生态系统的根本性安全风险：用户在急切赋予AI代理更多能力时，往往随意安装未经验证的技能，导致最基本的信任链条被轻易击溃，使整个生态成为巨大的攻击面。真正的危险并非源于AI本身，而在于用户过于随意地交出了系统权限。

Hugging FaceMCP/工具安全/对齐

23:33

歸藏(guizang.ai)@op7418

精选72

抖音"法天象地"特效：从图片生成到视频优化的突破

抖音近期流行的“法天象地”户外照片特效多基于图片生成，但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进，关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合，并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。

图像生成教程/实践视频

推荐理由：歸藏把抖音上火的“法天象地”从静态图片升级成视频，并且直接给了优化过的提示词，想做同款短视频的可以直接抄。

23:15

Chubby♨️@kimmonismus

25

作者愤怒指出，欧盟将其对过度官僚主义、高税收及技术监管滞后的批评定性为"阴谋论"。推文强调，欧盟在AI与技术领域发展缓慢，却试图通过叙事斗争将批评者边缘化。引用的欧盟委员会推文呼吁"保护民主"并强化自身叙事，主推文认为这实质是回避实质批评，并将合理质疑污名化。作者用"用我税款支付"的梗图讽刺这一现象，表达对欧盟应对科技竞争不力的失望。

政策/监管

23:15

Google Blog：AI（RSS）

45

看创意传奇人物如何用AI为小企业制作广告

谷歌推出"The Small Brief"项目，邀请四位广告业偶像——Susan、David、Victoria和Penny，运用AI工具为本地企业创作广告。他们使用VideoFX、ImageFX等生成式AI技术，在48小时内为旧金山湾区四家小企业完成广告制作。数据显示，AI生成的广告在关键效果指标上表现优于传统广告，其中一家企业的广告效果提升达30%。该项目展示了AI如何降低创意门槛，让小企业也能获得高质量的广告内容。

Google图像生成行业动态

22:52

The Decoder：AI News（RSS）

62

Anthropic估值逼近1万亿美元，营收增长五倍

Anthropic正筹划一轮高达500亿美元的融资，公司估值预计将达到约9000亿美元，逼近1万亿美元大关。本轮融资计划已基本成型。与此同时，公司年度营收实现了五倍增长，但具体金额未披露。谷歌为其提供了包括TPU在内的算力基础设施支持。

Anthropic行业动态

22:50

Jim Fan@DrJimFan

精选79

机器人终局：物理AGI路线图与LLM类比

演讲者以“Robotics: Endgame”为题，提出解决物理AGI的路线图，直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型（WAM）、机器人数据收集策略（类似FSD的物理数据飞轮）、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile，以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近，并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。

具身智能大佬观点

推荐理由：Jim Fan 这 20 分钟把机器人做成了 LLM 的平行故事，从 World Action Models 到 Dexterity Scaling Law，信息密度大到建议 0.5 倍速，做硬件的该换地图了。

21:17

Orange AI@oran_ge

41

有点意外马斯克在 xAI 上的第一次尝试竟然失败了小扎也是失败了一次过去成功的方法论在大模型领域似乎无法复用

MetaxAI大佬观点

21:17

Orange AI@oran_ge

19

我最喜欢的媒体都来找我约稿了我们的文章是写得是越来越好了

其他

20:46

Rohan Paul@rohanpaul_ai

31

"AI 不会取代人类，" @mcannonbrookes 在 @wandb 的播客中对 @l2k 说。这确实让我印象深刻。 AI 和代理只会使我们能做更多、建设更多，并帮助人类实现其全部潜力。 #TLVCPartner

大佬观点现象/趋势

20:42

Chubby♨️@kimmonismus

54

Anthropics联合创始人Jack Clark： "我的预测是：到2028年底之前，我们很可能会拥有一个AI系统。你可以对它说： '创造一个更好的自己。' 然后它就能完全自主地去执行这个任务。" 它要来了。

Anthropic大佬观点

20:33

Berryxia.AI@berryxia

63

Demis Hassabis：AGI应先作工具，再考虑意识

Demis Hassabis明确AGI发展应分阶段进行，优先将其作为工具用于理解宇宙底层规律，而非过早赋予意识或代理能力。他强调这种务实路径能避免风险，先提升生产力，再处理更哲学和危险的问题。引用推文也指出AGI应先成为工具，再尝试赋予意识，先用于读懂宇宙语言。这一反向思维理顺了发展路线图，为AGI的下一步提供了稳健方向。

DeepMind大佬观点安全/对齐

20:33

Berryxia.AI@berryxia

精选71

别自己瞎折腾Claude Code 了！

Alvaro Cintas 提出的“Agent Development Kit”系统，仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括：CLAUDE.md作为存储库的“法则”定义规则；skills/存放可自动调用的可复用工作流；hooks/通过确定性脚本提供安全护栏；subagents/实现上下文隔离的专用于智能体；plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施，其核心价值在于系统设计而非模型本身。

智能体Anthropic教程/实践编码

推荐理由：Alvaro 这个5文件夹系统把 Claude Code 从聪明助手变成了可复制的开发团队，skills 和 hooks 的设计尤其有启发性，用 Claude Code 的人可以直接抄作业。

20:22

IT之家（RSS）

0

设计时速 350 公里，渝昆高铁宜宾至盐津南段开启铺轨

渝昆高铁宜宾至盐津南段铺轨工程于5月8日正式启动。该高铁是“八纵八横”高铁网京昆通道的重要组成部分，全长约700公里，设计时速350公里，连接重庆西站与昆明南站。此次启动铺轨的宜宾至盐津南段全长约157公里，地处地形起伏大的过渡地带，最大坡度达25‰。施工采用智能工程线调度信息平台，日铺轨最高可达12公里。全线建成后将大幅缩短重庆至昆明的旅行时间，促进沿线经济社会发展。

其他