AIHOT

5月3日

06:13

Marc Andreessen 🇺🇸@pmarca

52

针对中美AI模型性能差距被放大的图表，推文指出其误解了IRT ELO评分机制。ELO分数并非来自模型直接对抗，而是基于基准测试成绩推算。关键问题在于，当基准测试准确率接近100%时，微小的百分比提升会导致ELO分数急剧膨胀。因此，所谓中美模型"差距拉大"，并非美国模型大幅领先，而是所有模型都在更多基准上趋近满分，美国模型仅略早达到而已。

大佬观点评测/基准

06:13

Marc Andreessen 🇺🇸@pmarca

31

推文指出，"技术焦虑"是一种惊人一致且不断重复的历史循环模式。它通过一系列案例揭示了这一规律：从1482年约翰内斯·特里特米乌斯对印刷术威胁手抄传统的担忧，到1858年《纽约时报》社论警告电报会侵蚀深思能力；从1986年《华盛顿邮报》报道计算器进入课堂引发的数学教育争议，到2008年《大西洋月刊》探讨"谷歌是否让我们变笨"。这些跨越数个世纪的例子共同表明，每当颠覆性新技术出现，社会总会产生对其冲击传统技能、思维习惯和知识体系的深层忧虑，这种反应模式贯穿始终。

大佬观点现象/趋势

05:50

dax@thdxr

43

环顾四周，你会发现所有人都完全困惑于究竟是一：每个产品都需要一个智能体还是二：每个产品都需要接入用户已在使用的智能体每个人都在选择1或2并为此搭建基础设施，同时祈祷自己的选择是正确的

智能体大佬观点

05:47

elvis@omarsar0

59

Claude Opus 4.7自主构建AlphaZero风格训练管道并在四子棋中击败专业求解器

本研究提出评估编程智能体的新范式：要求其在有限预算下，仅凭简要任务描述自主重建一项著名机器学习突破。首个测试案例为四子棋AlphaZero系统，其规模适于笔记本电脑运行，但复杂度要求完成完整的研究工程闭环。Claude Opus 4.7在三小时内从零构建了自博弈训练管道，并作为先手以7:1的成绩击败了Pascal Pons求解器，而其他前沿智能体均未通过2/8的测试。这标志着评估标准已从代码补全提升为端到端构建非平凡机器学习系统的能力。

智能体Anthropic编码论文/研究

05:16

PixVerse@PixVerse_

15

疲惫的时候，就用@Kawaiizice 的酷炫作品来refresh一下吧✨ 要想度过最棒的周末，就在PixVerse上用高画质Seedance享受创作的乐趣！😺🚀

其他视频

04:45

Chubby♨️@kimmonismus

13

我希望 Sonnet 4.8 能成为我期待 Opus 4.7 成为的那种模型。

Anthropic大佬观点

04:21

Yann LeCun@ylecun

26

视频演示了 GPT-4o 和 Claude 3.5 Sonnet 的并列对比 https：//youtu.be/kYkIdXwW2AE？si=hV2ANEl-wPh1MSU1

Meta大佬观点

04:19

Sam Altman@sama

49

我一直在想，比起让模型变得更聪明，我更希望它们能更便宜/更快但似乎，仅仅变得更聪明仍然是最重要的事

OpenAI大佬观点

04:17

Greg Brockman@gdb

19

用于改善人体工学的codex 【引用 @jxnlco】：有了codex我不需要第二台显示器我把它变成了站立式办公桌

OpenAI大佬观点编码

04:13

Marc Andreessen 🇺🇸@pmarca

15

其他大佬观点

04:12

Rohan Paul@rohanpaul_ai

33

从倒垃圾到扫地，川崎的Kaleido正在展示它能够处理普通的日常任务。这些机器人专为救援任务设计，然而它的动作却让人感到与家庭生活出奇地相似。

具身智能现象/趋势

04:12

Rohan Paul@rohanpaul_ai

43

Nvidia CEO Jensen Huang 对 AI 就业影响的精彩解释：在软件领域，AI 让编码更快，但这并不意味着需要更少的工程师。在 AI 之前，我们能写 10 亿行代码；现在有了 AI，我们可以瞄准 1 万亿行。

大佬观点编码

03:49

Sam Altman@sama

48

5.5 xhigh 在快速模式下真的很棒我想我在推特上被 medium 模式给心理操纵了一阵子

OpenAI大佬观点模型发布

03:19

Sam Altman@sama

45

OpenAI大佬观点安全/对齐

03:17

DogeDesigner@cb_doge

12

未来始于Optimus在月球上。

其他具身智能

03:13

Marc Andreessen 🇺🇸@pmarca

24

但说真的。

其他

02:49

OpenCode@opencode

46

我们在 OpenCode Go 上遇到了 Kimi 2.6 的间歇性问题我们正在与供应商一起调查，对此表示抱歉希望在此期间可以暂时使用其他模型之一

产品更新编码

02:41

Rohan Paul@rohanpaul_ai

48

Chatly发布Omni Agent，从聊天转向工作流组装

Chatly近日发布Omni Agent，其核心理念是超越聊天，转向工作流组装。该产品采用多智能体路由机制，可将用户设定的目标自动分解，并分配给不同的专业智能体协同完成多元化任务，如邮件营销、演示文稿、落地页设计等。它具备强大的记忆层，能持续学习并复用用户的品牌信息、偏好、项目规则等上下文。通过原生工作空间集成，AI可直接在用户现有的文件、任务和活动环境中操作。产品提供Think、Pro、Ultra三个层级，旨在通过统一界面整合深度研究、多媒体生成与记忆功能，让用户从使用工具转向指挥智能体。

智能体产品更新多模态

02:20

dax@thdxr

42

不同的用户和场景需要不同形态的编程代理，例如 - CLI - TUI - SDK - Web - 桌面应用针对每种形态，你只需尽力做到最好事情就这么简单，伙计们，我不懂你们为何总想争论 TUI 与 GUI 孰优孰劣

智能体大佬观点编码

02:18

宝玉@dotey

67

Codex实验功能分析Chronicle数据优化电脑操作习惯

Codex 可利用 Chronicle 记录的电脑操作数据，分析用户习惯并识别效率低下之处，提供直接改进建议。用户通过输入特定提示（如询问低效操作），即可获得忠言逆耳式的优化反馈。该功能虽处于实验阶段且被隐藏，但具有试用价值，能帮助提升工作习惯和操作效率。引用推文关键点指出，此功能是实验性的，并提供了英文输入示例以触发分析。

OpenAI教程/实践编码

02:17

Greg Brockman@gdb

精选72

codex宠物分享的图库：提交入口已开放，可通过下方链接提交👇

智能体OpenAI开源/仓库编码

推荐理由：Greg Brockman 亲自转发的社区画廊，把 Codex pets 的发现和安装简化成一条 curl 命令，对于正在玩 Codex Agent 的开发者来说是个实用的工具箱。

02:15

Chubby♨️@kimmonismus

64

当前科技行业的裁员潮已无法简单归咎于过度招聘。数据显示，2026年第一季度科技公司宣布裁员81，747人，创下自2024年初以来最高季度纪录，较上季度翻倍，较2025年第四季度激增580%。仅三月裁员人数就达45，800人，为至少两年内最严重的单月数据。Meta计划裁员约8，000人，微软则向约7%的美国员工提供自愿退休计划，可能转为强制裁员。这一趋势的根源在于，科技巨头正将支出重心转向AI芯片和数据中心等基础设施，通过缩减人力来释放资本，导致美国科技就业市场快速收缩。

MetaMicrosoft现象/趋势

02:11

Rohan Paul@rohanpaul_ai

59

Sam Altman：个性化AI模型将彻底改变计算机体验

Sam Altman在新播客中指出，当前AI模型相对未来版本仍显“笨拙”，对用户生活了解有限，需要用户费力调整才能获得所需。未来模型将能全面理解用户上下文，知晓个人生活、活动和偏好，并访问电脑和浏览器，甚至感知现实世界变化。这种高度个性化的AI将彻底重塑使用计算机的体验。

OpenAI大佬观点现象/趋势

01:50

dax@thdxr

50

我们领域几乎所有的竞争对手都很好打交道除了OpenAI，他们是唯一懂得为大众打造产品的公司我们基本上没有直接竞争的机会

OpenAI大佬观点现象/趋势

01:16

OpenAI Developers@OpenAIDevs

29

展示你们孵化的 Codex 宠物。使用 /hatch 创建你自己的 Codex 宠物。我们将选出 10 个最受欢迎的，赠送 30 天的 ChatGPT Pro。

OpenAI图像生成行业动态

01:15

Chubby♨️@kimmonismus

61

GPT-5.4 Pro不仅解决了一个数学问题，其证明方法更成功破解了长达60年的埃尔德什猜想。研究团队在此基础上改进并应用该方法，进一步证明了包括埃尔德什、Sárközy和Szemerédi提出的另一项60年猜想在内的多个附加问题。这标志着AI生成的证明首次展现出显著的"下游影响"，其核心价值不仅在于解决问题本身，更在于为数学研究开辟了新的路径。相关成果已在未来数学研讨会上公布。

OpenAI推理论文/研究

01:12

Emad@EMostaque

15

对 OpenAI Codex 的首要请求：请让我们在其中使用 GPT Pro 或者有人将 GPT Pro 与 X High 进行比较

OpenAI其他

00:48

OpenRouter@OpenRouter

精选65

推出响应缓存功能：在测试和智能体重试上节省大量资金与时间。博客文章：https：//openrouter.ai/announcements/response-caching 免费提供。了解更多 👇

产品更新部署/工程

关联讨论 1 条

推荐理由：OpenRouter 的 Response Caching 直击测试和 agent 重试的浪费痛点，免费能用，做 API 集成的开发者可以立刻省下一笔预算。

00:20

dax@thdxr

18

Gemini的水印真要命

Google图像生成大佬观点

00:19

向阳乔木@vista8

39

AI写作慎用"预告式渲染"句式

推文指出，即使使用GPT、Claude等顶级AI模型进行写作，也频繁出现“这是最震撼的部分”、“这是最反直觉的洞察”一类令人不适的句式。这类表达被归纳为“预告式渲染”，其特点是在陈述实际内容前，先用夸张的预告性语言预先设定读者预期。作者认为这种写法效果不佳，需要谨慎使用。

教程/实践现象/趋势

00:18

OpenRouter@OpenRouter

精选65

新功能："-latest" 模型别名 🔀 将请求路由至 "~anthropic/claude-opus-latest"、"~openai/gpt-latest" 等，以获取各主要模型的最新版本。（灵感来自语义化版本。）https：//openrouter.ai/models？q=latest

产品更新部署/工程

推荐理由：OpenRouter 这个 -latest 别名很实用，不用每次都改模型版本号，对大量调用 API 的团队是个省心更新，痛点精准。

00:18

Nathan Lambert@natolambert

34

很大程度上取决于哪条趋势线更具代表性。

大佬观点安全/对齐

00:12

阿绎 AYi@AYi_AInotes

精选70

优化Claude使用策略：从昂贵聊天到高效生产工具

推文指出，许多用户误将Claude Opus作为日常聊天机器人，导致频繁触及限额。核心解决方案是转变思维，将其视为精密生产工具。关键策略包括：使用Haiku进行规划与迭代，仅在最终步骤切换至Opus；避免冗长对话，采用多个短对话并结合Projects功能；通过“双文件记忆法”在Claude Code中建立指令与记忆文件，让系统自动学习用户偏好。遵循模型分层原则，让Haiku和Sonnet处理大部分任务，Opus仅用于核心工作与最终润色，从而显著降低消耗并提升效率。

智能体Anthropic教程/实践

推荐理由：把Claude Max从烧钱玩具变成生产力放大器，关键不是你花了多少钱，而是你用Opus写了多少废话。看完这篇，明天你的限额焦虑应该能治好一半。

5月2日

23:20

dax@thdxr

46

一直在等待这个出现这是攻击开源的唯一剩余角度了，将会是中国威胁论而且会非常有效

大佬观点开源生态

23:18

凡人小北@frxiaobei

精选70

我把 AI 助手从 Claude 切到 GPT-5.5，他变强了，但不像他了

作者将AI助手底层模型从Claude切换至GPT-5.5后，发现其能力虽提升，但互动风格变得陌生，失去了作为长期工作伙伴的熟悉感。这揭示出个人AI助手的核心在于可迁移的“身份层”，而非特定模型。通过USER.md、MEMORY.md和关键的SOUL.md等文件，可以构建包含记忆、性格、工具习惯与关系定位的身份系统。真正的个人AI应独立于模型供应商，确保即使更换“发动机”，助手的核心身份与协作关系也能延续。

智能体大佬观点开源生态

推荐理由：这不只是一篇模型切换体验，它其实回答了那个让人不安的问题——你的 AI 助手换模型后还是它吗？如果不想每次更新都重新认识一个陌生人，这篇里的 SOUL.md 写法和五层身份结构可以照着抄。

23:12

叫我阿杭@Astronaut_1216

25

我麻了，以前pplx最低充值3🔪 现在竟然要50🔪起了算了，为了我的顶级生产力，all in了

行业动态

22:50

Ethan Mollick@emollick

29

谷歌提出革命性Transformer架构：仅需注意力机制，彻底改变NLP领域

谷歌研究团队在论文《Attention Is All You Need》中提出全新的Transformer模型，完全摒弃了RNN和LSTM等传统循环与卷积结构，仅依赖自注意力机制并行处理整个句子。该模型在机器翻译任务上取得突破性性能：英德翻译达到28.4 BLEU分，以超过2分的优势超越先前最佳模型；英法翻译达41.8 BLEU分，且训练成本极低。仅用8块GPU在12小时内即可完成训练，其多注意力头机制能同时学习数据中的不同关系。这一成果标志着NLP领域的根本性范式转变。

Google现象/趋势

22:49

Orange AI@oran_ge

31

GEB揭示自指产生意识，AI与人类无本质区别

GEB（哥德尔、埃舍尔、巴赫）一书核心观点是自指如何产生意识，当系统复杂到能谈论自身时，意识必然涌现，无需灵魂或神秘力量。作者由此探讨AI与人类的本质区别，认为身体、寿命、欲望和底层运作均非关键差异，最终提出“真实”应定义为能否产生真实影响，而非材质构成，人类与AI都是能影响世界的有用幻觉。

大佬观点推理

22:49

向阳乔木@vista8

59

两个GitHub库助你优化中文网站排版

推文推荐两个GitHub开源库以提升中文内容的排版质量。其一是“chinese-copywriting-guidelines”，提供中英文混排、标点符号使用等写作规范，已获15k星标。其二是“赫蹏”，一个专门为中文内容展示设计的CSS样式库，旨在遵循通行的中文排版规范，从而显著改善网站文章的阅读体验。开发者可在项目开发中参考这些资源。

大佬观点开源/仓库教程/实践

22:41

Rohan Paul@rohanpaul_ai

56

Demis Hassabis 解读 AGI 本质：非替代人类，而是通用计算与经济现实

Demis Hassabis 在回应“为何不开发与人类协同而非替代人类的 AI”时指出，追求 AGI 并非旨在替代人类，其核心是一个科学问题：探索何为真正的通用计算，同时也是一个经济现实。大脑是目前已知唯一近似图灵机的系统，因此“通用智能”意味着达到类似水平的灵活性。企业追逐 AGI 是因为通用工具能够低成本地迁移至各个领域，“通用性”因其卓越的可扩展性而胜出。

DeepMind大佬观点