AIHOT

5月9日

01:27

BAIR：Berkeley AI Research Blog

精选64

自适应并行推理：高效推理扩展的新范式

自适应并行推理是一种新范式，它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果，以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程，在数学与代码推理基准上取得了显著性能提升，同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变，为复杂任务的推理提供了高效且可扩展的解决方案。

推理现象/趋势部署/工程

推荐理由：模型自己决定何时并行、开几个线程，这篇BAIR博客把Multiverse和ThreadWeaver的系统设计掰开了讲，做推理系统和RL的同学应该看看。

01:26

向阳乔木@vista8

61

AI辅助快速制作PPT的实战方法

作者分享利用AI工具高效制作PPT的流程：首先与AI讨论并生成内容大纲，随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中，最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整，显著提升了演示文稿的制作效率。

图像生成教程/实践

01:26

向阳乔木@vista8

22

资源诅咒：产品臃肿源于老板视角与克制之难

推文核心观点是产品变得臃肿复杂的原因在于资源丰富时，控制者如老板容易产生只需动嘴就能实现想法的错觉，导致过度开发而缺乏克制。类比使用最顶级模型时的轻松感，资源有时反而成为诅咒，突显了在管理大量研发资源时保持简约的挑战性。资源充裕可能引发盲目扩张，使产品设计失去焦点，强调克制在创新过程中的重要性。

大佬观点现象/趋势

01:24

dax@thdxr

61

越来越多地，你可以直接让代理做事情但如果说这意味着产品不需要任何原生功能，那就太轻率了这是一个很好的例子，你可以先使用代理，但你的工具也能理解做了什么

智能体GitHub大佬观点开源/仓库

01:24

SemiAnalysis@SemiAnalysis_

59

数据中心开发商正越来越多地在非建制县土地上规划项目，这并非偶然。在城市边界之外，他们可以避开市议会审批、市政分区投票和城市土地利用审查。这正在重新绘制大规模AI基础设施的建设版图。（1/4） 🧵

现象/趋势部署/工程

01:21

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

50

不，蓝领工作也不安全【引用 @Figure_robot】：We taught two F.03 robots to clean a room and make a bed in under 2 minutes - fully autonomous.

具身智能大佬观点

00:54

Perplexity@perplexity_ai

精选78

我们已发布构建智能体技能的内部手册。开发者需要以全新思维方式构建技能。 https：//research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

智能体MCP/工具教程/实践

推荐理由：Perplexity 把内部构建 agent skills 的玩法公开了，如果你正在做 agent，这份手册比很多教程都要实战，看完就知道怎么设计、优化和维护。

00:47

Hacker News 热门（buzzing.cc 中文翻译）

35

Google Cloud Fraud Defence 不过是 WEI 的换汤不换药

谷歌云新推出的 Fraud Defence 服务被指仅是现有技术 WEI 的重新包装，核心功能无实质性变化。这一批评在技术社区引发讨论，在 Hacker News 上获得123个点赞。分析认为，该服务只是换名不换内核，缺乏创新，反映了云安全领域可能存在的品牌重塑现象。

Google安全/对齐现象/趋势

00:21

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

64

推文指控OpenAI总裁Greg Brockman将非营利组织转为营利实体以提取巨额资金，并挪用这些资金支持超级政治行动委员会Leading the Future及其关联组织Build American AI进行虚假政治宣传。具体证据显示，这些组织虽资金充裕，但操作极其草率：使用AI生成虚假新闻、付费推广未披露、涉嫌违反选举财务披露规则，甚至在宣传"Put People Over Profit"时配图自相矛盾。这暴露了该行业试图以巨额资金影响政策，却因执行无能而自我揭穿。

OpenAI政策/监管

00:21

Ethan Mollick@emollick

59

我意识到"神话即炒作"对不同群体意味着两件事：对业内人士而言，它意味着"Mythos并非AI能力的魔法式跨越进步"；对圈外人而言，则意味着"Mythos其实找不到零日漏洞"。后者是错的，前者可能是对的。

大佬观点安全/对齐

00:17

Chubby♨️@kimmonismus

51

我终于花时间体验了阿里云视频服务，效果非常有趣。我直接用同平台生成的图像作为烹饪动画参考。最出色的是稳定性--完全没出现食材重叠的常见故障。所有元素都很扎实，尤其是水物理效果和蒸汽对热度的反应。

教程/实践视频

5月8日

23:52

dax@thdxr

61

每一款AI产品都这样： "我们利用人工智能打造了改变生活的革命性技术比如说你有一个电子表格……"

大佬观点现象/趋势

23:35

Berryxia.AI@berryxia

10

特朗普政府解密UAP文件，外星人幻想破灭

特朗普政府下令全面解密UAP文件，Department of War联合白宫、ODNI、NASA、FBI将多年压制的视频、照片和原始文档公开在http://WAR.GOV/UFO。解密揭示，不明空中现象很可能并非外星访客，而是人类将孤独和恐惧投射到夜空的结果。这粉碎了七十多年来对外星文明存在的期待，意味着没有更高文明在监视人类，所有宇宙答案必须由人类自己探索。

其他行业动态

23:35

Berryxia.AI@berryxia

16

预测一波美国的时间线上将会充斥着各种由AI生成的视频，来冒充UFO😂

现象/趋势

23:35

Berryxia.AI@berryxia

66

作者免费发布《GEO红皮书》，旨在整治GEO行业黑帽手段、割韭菜等乱象。基于前沿论文、生成式AI法规和实战经验，红皮书系统拆解55种GEO风险，提供自查清单和治理框架，帮助中小企业在AI时代规范营销，促进行业回归理性。

姚金刚：我们的第一份《GEO红皮书》发布了去年，和 @vista8 向阳老师一起发布了GEO白皮书，收到不少朋友的正向反馈大半年过去了，国内GEO行业发展得很快，…

搜索教程/实践

23:33

歸藏(guizang.ai)@op7418

精选72

抖音"法天象地"特效：从图片生成到视频优化的突破

抖音近期流行的“法天象地”户外照片特效多基于图片生成，但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进，关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合，并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。

图像生成教程/实践视频

推荐理由：歸藏把抖音上火的“法天象地”从静态图片升级成视频，并且直接给了优化过的提示词，想做同款短视频的可以直接抄。

23:15

Chubby♨️@kimmonismus

25

作者愤怒指出，欧盟将其对过度官僚主义、高税收及技术监管滞后的批评定性为"阴谋论"。推文强调，欧盟在AI与技术领域发展缓慢，却试图通过叙事斗争将批评者边缘化。引用的欧盟委员会推文呼吁"保护民主"并强化自身叙事，主推文认为这实质是回避实质批评，并将合理质疑污名化。作者用"用我税款支付"的梗图讽刺这一现象，表达对欧盟应对科技竞争不力的失望。

政策/监管

22:50

Jim Fan@DrJimFan

精选79

机器人终局：物理AGI路线图与LLM类比

演讲者以“Robotics: Endgame”为题，提出解决物理AGI的路线图，直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型（WAM）、机器人数据收集策略（类似FSD的物理数据飞轮）、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile，以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近，并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。

具身智能大佬观点

推荐理由：Jim Fan 这 20 分钟把机器人做成了 LLM 的平行故事，从 World Action Models 到 Dexterity Scaling Law，信息密度大到建议 0.5 倍速，做硬件的该换地图了。

21:17

Orange AI@oran_ge

41

有点意外马斯克在 xAI 上的第一次尝试竟然失败了小扎也是失败了一次过去成功的方法论在大模型领域似乎无法复用

MetaxAI大佬观点

21:17

Orange AI@oran_ge

19

我最喜欢的媒体都来找我约稿了我们的文章是写得是越来越好了

其他

20:46

Rohan Paul@rohanpaul_ai

31

"AI 不会取代人类，" @mcannonbrookes 在 @wandb 的播客中对 @l2k 说。这确实让我印象深刻。 AI 和代理只会使我们能做更多、建设更多，并帮助人类实现其全部潜力。 #TLVCPartner

大佬观点现象/趋势

20:42

Chubby♨️@kimmonismus

54

Anthropics联合创始人Jack Clark： "我的预测是：到2028年底之前，我们很可能会拥有一个AI系统。你可以对它说： '创造一个更好的自己。' 然后它就能完全自主地去执行这个任务。" 它要来了。

Anthropic大佬观点

20:33

Berryxia.AI@berryxia

63

Demis Hassabis：AGI应先作工具，再考虑意识

Demis Hassabis明确AGI发展应分阶段进行，优先将其作为工具用于理解宇宙底层规律，而非过早赋予意识或代理能力。他强调这种务实路径能避免风险，先提升生产力，再处理更哲学和危险的问题。引用推文也指出AGI应先成为工具，再尝试赋予意识，先用于读懂宇宙语言。这一反向思维理顺了发展路线图，为AGI的下一步提供了稳健方向。

DeepMind大佬观点安全/对齐

20:33

Berryxia.AI@berryxia

精选71

别自己瞎折腾Claude Code 了！

Alvaro Cintas 提出的“Agent Development Kit”系统，仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括：CLAUDE.md作为存储库的“法则”定义规则；skills/存放可自动调用的可复用工作流；hooks/通过确定性脚本提供安全护栏；subagents/实现上下文隔离的专用于智能体；plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施，其核心价值在于系统设计而非模型本身。

智能体Anthropic教程/实践编码

推荐理由：Alvaro 这个5文件夹系统把 Claude Code 从聪明助手变成了可复制的开发团队，skills 和 hooks 的设计尤其有启发性，用 Claude Code 的人可以直接抄作业。

20:14

Rohan Paul@rohanpaul_ai

58

AI不会取代人类，"@mcannonbrookes 在@wandb的播客中对@l2k说道。这句话确实让我印象深刻。 AI和智能体只会让我们能做得更多、创造更多，并帮助人类实现全部潜能。

智能体大佬观点

19:20

IT之家（RSS）

59

斯坦福 AI 教授安杰尼 · 米达：若想让美国人接受数据中心，企业得先学会共情

斯坦福AI教授安杰尼·米达指出，美国科技公司需以共情和透明沟通应对数据中心建设阻力。越来越多地方社区因担忧电费上涨、环境影响和生活质量下降而反对新建数据中心，皮尤报告显示43%受访者认为数据中心推高了其电费账单。米达强调，科技公司应清晰说明数据中心对社区的实际影响与建设目的，主动倾听社区意见，否则将面临重大阻力。部分政界人士已提议暂停新项目审批。他认为，在基础设施扩张中平衡技术需求与社区关切，通过类似“营养成分标签”的透明信息缩小分歧，是推动AI发展的关键。

现象/趋势部署/工程

18:49

向阳乔木@vista8

32

GEO行业乱象丛生，《红皮书》助力企业理性营销

作者与姚老师继年初发布《GEO白皮书》后，观察到行业在2025年出现严重变质，黑帽GEO手段泛滥、服务商良莠不齐、虚假承诺盛行，甚至被央视315点名。为促使行业回归理性，帮助中小企业有效利用AI进行营销，他们结合前沿学术论文、相关法规及自身实战经验，整理发布了《GEO红皮书》。该书旨在揭露黑帽GEO手法、提供服务商甄别指南，并给出风险自查清单，以协助企业规避陷阱，目前可免费获取。

其他搜索现象/趋势

18:44

meng shao@shao__meng

12

创业起点新潮流：从车库到法国城堡

创业起点正突破传统的“车库”模式。@dottxtai 团队选择在法国城堡开启创业，引发对多元创业场所的讨论。中国创业者常从共享办公空间、居民楼或别墅起步。推文引用 @remilouf 的观点，认为车库创业已显乏味，城堡等独特地点为创业故事注入新意。这反映了创业文化中对环境创新性与象征意义的日益重视。

其他

18:42

Chubby♨️@kimmonismus

9

我知道，让Ilya来主导。但老兄，@ilyasut 能不能给个更新？

其他

17:26

-Zho-@ZHO_ZHO_ZHO

52

AI图像生成未达设计标准，保罗·兰德阐释设计本质

推文引用设计师保罗·兰德的观点，指出仅将视觉元素进行美观排列不等于好的布局，这是对平面设计师职能的误解。作者借此解释当前AI图像生成技术为何尚未达到真正的设计标准。兰德强调，设计超越表面的视觉组合，涉及更深层的构思与判断，而这正是当前AI所缺乏的核心能力。

图像生成大佬观点

17:21

ginobefun@hongming731

60

语音AI成为主交互界面，AI智能体系统自主性增强

OpenAI发布GPT-Realtime-2等实时语音模型，将高级推理能力引入语音交互，推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元，并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战，与SpaceX合作获取大规模计算能力，同时升级Claude托管智能体，使其具备自我改进与多智能体协作能力。行业趋势显示，AI正从工具演变为能自主运行的智能体系统，这给GitHub等基础设施带来了新的负载压力。

智能体AnthropicOpenAI现象/趋势

17:21

ginobefun@hongming731

46

语音AI模型显著提升，编程范式加速变革

BestBlogs 周刊 #94｜语音 AI 突围本周主线：OpenAI 发布了三个实时语音模型，GPT-Realtime-2 实测通话成功率从69%提升到95%。ElevenLabs 年收入4亿美元，下一个方向是情绪智能。Anthropic 增长80倍，算力成为核心瓶颈。同时 AI 编程范式加速：Claude Code 创作者日均150个PR，GitHub 被 AI 流量压到86%可用性。播客和图文都已上线 ↓

AnthropicOpenAI现象/趋势编码

17:15

小互@xiaohu

58

Claude开发者大会展示Cardputer实体交互设备

Cardputer是Anthropic在Claude开发者大会上推出的售价29.9美元的实体设备，通过WiFi连接电脑，支持键盘输入问题由Claude处理并显示结果、语音对讲经STT/TTS转换交互，以及作为Claude实体宠物显示动态像素动物，还可接入OpenClaw平台扩展语音功能。

Anthropic教程/实践端侧语音

17:05

Baidu Inc.@Baidu_Inc

26

DuMate的智能体能力刚经历测试，结果出炉：在@pinchbench和DeepResearch Bench上均位列第一。详细分析如下👇

智能体评测/基准

16:23

Hugging Face：Blog（RSS）

精选70

在AMD ROCm平台微调临床问答模型MedQA：无需CUDA

一篇博客介绍了在AMD ROCm开源计算平台上微调临床问答AI模型MedQA的实践。该工作成功摆脱了对英伟达CUDA生态的依赖，证明了在AMD GPU上高效运行并适配医疗领域大模型的可行性。此案例源于Lablab.ai与AMD联合举办的开发者黑客松，为在非CUDA环境中进行AI训练提供了具体的技术参考。

Hugging Face教程/实践数据/训练

推荐理由：如果你手头只有AMD显卡却想跑医疗AI微调，这篇官方教程把ROCm实操流程讲透了，填补了生态里一个不小的空缺。

15:23

Marc Andreessen 🇺🇸@pmarca

26

推文认为，二十世纪中期美国曾涌现一批能够长期积累并行使巨大个人权力的"伟大整合者"，如Robert Moses、Hoover、Von Braun等。他们通过个人影响力整合国家与经济的复杂体系。但1970年代后的改革使这类人物在公共机构中基本消失。如今，类似的角色与权力集中现象仅存于商业世界，尤其体现在硅谷及科技领域对创始人的崇拜中。主推文补充指出，这类人其实仍存在于传统机构，只是所需的技能组合已完全不同。

大佬观点现象/趋势

15:23

Marc Andreessen 🇺🇸@pmarca

46

AI精神错乱的对立面是AI应对。

其他大佬观点

15:16

IT之家（RSS）

63

新研究点破 AI 生图弱点：透视线和阴影最容易露馅

《科学》最新研究指出，AI图像生成器虽已修复畸形手指等早期缺陷，但在光照、阴影、反射和透视几何上仍存在明显破绽。研究者指出，鉴别重点已转向“物理规则是否合理”。AI生成的图片因色彩鲜艳、戏剧感强，更接近大众对现实的想象，故易于传播。论文推荐通过检查“消失点”来鉴别：现实中平行线应汇聚于同一点，若图像中线条无法合理相交，则空间关系不成立。此方法同样适用于分析反射与阴影的平行光透视规律。

图像生成安全/对齐教程/实践

15:14

向阳乔木@vista8

精选71

Codex Chrome插件安装使用注意事项

安装Codex Chrome插件需注意：确保Codex为最新版本并使用官方订阅登录，第三方API模式不支持。插件安装对网络节点有要求，部分区域（如香港）可能无法使用。建议将Chrome设为默认浏览器以便引导。安装后，需在对话中通过“@ Chrome”指令调用。若连接失败，可尝试重启电脑。

智能体教程/实践部署/工程

关联讨论 11 条

推荐理由：向阳乔木第一时间踩坑Codex Chrome插件，总结的四个坑都很具体，尤其第三方API不支持插件这点没试过的肯定会踩，想用电脑操作的先看这个能省半小时。

13:43

Tibo@thsottiaux

13

Codex已经成功问世。 shadcn，我的英雄

OpenAI其他编码