AIHOT

5月4日

21:54

小互@xiaohu

精选72

为AI编程立规矩：CLAUDE.md文档的四条核心原则

针对AI编程工具常犯的“默默假设”、“过度自信”和“无效重构”等问题，一份名为CLAUDE.md的文档被整理出来，旨在为AI设定工程纪律。其核心四条原则是：编码前先思考并澄清歧义；优先用最简代码实现需求；仅修改与需求直接相关的代码；为任务设定明确、可验证的目标。这套规则旨在约束AI行为，使其更接近靠谱工程师的作风，解决其“太积极、太爱脑补、太喜欢顺手优化”的痛点。

智能体教程/实践编码

关联讨论 1 条

推荐理由：把 Karpathy 的观察变成可执行的 CLAUDE.md，直接解决了 Claude Code 太爱脑补、乱改代码的臭毛病，对日常用 AI 编程的人很管用，放进项目就能让 AI 少犯傻。

21:48

Greg Brockman@gdb

37

Codex 助你快速交付【引用 @linuz90】：Codex 是我目前最爱的编程应用。它界面简洁，却具备快速交付所需的一切功能。使用体验愉悦流畅，能展示充足的上下文信息而不过载。我曾犹豫是否尝试，因为不喜欢受限于单一服务商，而且原本非常习惯在终端工作。但现在我90%以上的工作都在用它完成。

OpenAI大佬观点编码

20:16

Chubby♨️@kimmonismus

49

教育亟需拥抱AI，但须警惕思考外包

作者指出，尽管AI将彻底改变教育已是事实，学生普遍使用ChatGPT、Claude等工具进行研究与写作，但当前教育体系仍停留在20世纪模式。核心矛盾并非是否该使用AI，而是如何将其整合进教育，避免将思考过程完全外包给机器。教育必须重新设计，在利用AI提升学习效率与生产力的同时，坚守培养学生批判性思维与自我反思能力的根本目标。学术界需就如何正确融合AI展开紧迫而严肃的讨论。

OpenAI现象/趋势

18:14

阿绎 AYi@AYi_AInotes

50

这段AI可视化视频有点震撼，13秒看懂神经网络到底在干嘛

一段13秒的可视化视频直观揭示了神经网络的工作机制。左侧9个波形代表虚拟生物的感官输入，中间动态变化的光点与连线模拟神经元与权重的计算过程，右侧13个数值输出觅食、逃跑等决策。这生动演示了前向传播如何将数据转化为行动，体现了深度学习层层提取特征的本质：底层感知碎片，高层组合意义。当今复杂的AI系统与此原理相同，仅规模存在量级差异。视频中出现的“自杀”选项，直观成为AI可能学习极端行为及对齐问题的视觉隐喻。

其他教程/实践

17:52

向阳乔木@vista8

47

DeepSeek v4 Pro还是可以的。几轮对话，实现一个工具，用xbox手柄控制电脑应用和浏览器。当遥控器，躺床上刷小说和看视频。

DeepSeek教程/实践编码

17:46

Chubby♨️@kimmonismus

31

为什么Windows的搜索功能如此糟糕？我无法理解。一方面，Windows想把CoPilot AI集成到各处。然后操作系统的搜索功能却差到连最简单的东西都找不到。

其他搜索

17:15

Marc Andreessen 🇺🇸@pmarca

34

尽管Claude Code等自动化工具能力惊人，但软件工程师需求依然旺盛，宏观数据也未显示就业市场恶化。以咖啡为例，Nespresso等家用机器的普及并未取代咖啡师或导致咖啡馆倒闭，反而因咖啡成为易得商品，催生了人们对"体验"的更大需求，使咖啡馆和咖啡师数量增加。这印证了"物品的稀缺性恰恰赋予其意义"的观点，表明自动化可能提升而非削弱人类服务的价值。

大佬观点现象/趋势

17:15

Marc Andreessen 🇺🇸@pmarca

47

许多人正确地说。

OpenAI大佬观点现象/趋势

17:14

叫我阿杭@Astronaut_1216

37

当前 AI 与人类知识的关系：模型比任何个人知道得多，但任何个人比模型学得快

数据/训练现象/趋势

16:21

Hacker News 热门（buzzing.cc 中文翻译）

46

类人机器人执行器

Firgelli公司发布了专为人形机器人设计的新型执行器系列。该系列执行器在扭矩密度、能效和控制精度方面实现显著提升，旨在更精准地模拟人类关节运动，从而增强机器人的灵活性与适应性。产品信息发布于公司官网，相关讨论在Hacker News上获得100点热度。

具身智能行业动态

16:14

阿绎 AYi@AYi_AInotes

精选77

Claude通过第三方平台补足视频分析能力，开启AI应用新生态

借助Algrow的MCP平台，Claude现已能直接分析YouTube等平台的视频内容，自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设，第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具，并预示视频研究Agent时代的开启。目前处于免费试用阶段，未来订阅定价亲民。

AnthropicMCP/工具产品更新视频

推荐理由：第三方MCP插件让Claude终于能分析视频，做视频的一键生成爆款拆解和帧级留存分析，比手动刷三天视频强多了。

15:46

Chubby♨️@kimmonismus

28

Claude 获得了访问时钟的权限，并立刻为此兴奋不已。我喜欢 Claude 抓狂的样子。

Anthropic其他

15:13

IT之家（RSS）

61

英伟达黄仁勋痛批 Anthropic 阿莫迪，呼吁 AI 行业领袖慎言慎行、以事实为据

英伟达CEO黄仁勋在播客节目中批评了Anthropic CEO达里奥·阿莫迪关于“AI未来几年可能取代50%入门白领”的预测，认为此类言论无益且缺乏依据。他呼吁行业领袖讨论AI影响时应“慎言慎行”，并以事实为据。黄仁勋同时驳斥了AI可能毁灭世界的说法，直接回应了埃隆·马斯克此前相关观点，称其“太荒谬”。目前，AI对劳动力与社会长远影响仍存争议，支持者看重其提升效率与创造就业的潜力，反对者则担忧失业等风险。

AnthropicOpenAI大佬观点行业动态

13:50

Hacker News 热门（buzzing.cc 中文翻译）

52

大型语言模型并非更高层次的抽象

文章反驳了将大型语言模型视为更高层次抽象的观点。作者认为，LLMs本质上仍是对训练数据的模式匹配与统计关联，并未真正理解或抽象出人类概念。其输出依赖于海量文本中的概率分布，而非构建内在的认知模型。这种机制导致模型在逻辑推理、事实一致性等方面存在局限，无法实现类似人类思维的抽象层级。因此，LLMs应被看作一种强大的模式识别工具，而非认知意义上的抽象系统。

推理现象/趋势

13:14

Marc Andreessen 🇺🇸@pmarca

22

"我们需要一个新的想法。它很可能是一个原始的想法（我们能够识别它吗？）。一段时间以来，所有有用的想法都非常复杂。"-Susan Sontag

其他大佬观点

13:13

叫我阿杭@Astronaut_1216

33

作者分享个人消费习惯，强调在花钱或赚钱前会先使用闲鱼平台寻找资源，以此作为省钱或套利的途径。同时，他引用了一条推文的关键观点，指出抖音上绝大多数教授AI知识的博主，实际上并未持有Claude Code或OpenAI 200美金的高级订阅账号，暗示其教学内容的可信度可能存疑。

Koda：说个冷知识：抖音上 99% 教 AI 的博主，根本没有Claude Code 和OpenAI 200美金的订阅账号

OpenAI现象/趋势

12:51

Ethan Mollick@emollick

52

当你向ChatGPT、Claude和Gemini索要与大型语言模型存在/创作相关的诗歌时，它们似乎都"偏爱"这几首：里尔克的《阿波罗的躯干》史蒂文斯的《基韦斯特的秩序观》博尔赫斯的《假人》（或《另一只老虎》）佩索阿的《自心理学》相当贴切的选择！

AnthropicGoogle大佬观点

12:49

凡人小北@frxiaobei

53

AI：看到这个我愣了一下，这段话有点反直觉。这个观点不是一个普通人说的，而是一个 CEO 讲的。【引用 @garrytan】：The goal of Personal AI： civilization where individual humans， augmented by AI， can do consequential work without being captured by extractive institutions. Freedom to write your prompt and own your data. This is the new battleground. 2034 won't have to be like 1984.

大佬观点现象/趋势

12:22

Yuchen Jin@Yuchenj_UW

54

没有一家Neocloud曾预料到，他们今天能以比三年前更高的价格出租H100芯片。即便你有资金，前沿实验室和Neolabs已经锁定了2026年大部分的GPU供应。对人工智能的需求基本上是无限的。

现象/趋势部署/工程

11:14

Marc Andreessen 🇺🇸@pmarca

9

"一个人整天想什么，他就是什么。"-Emerson

其他大佬观点

11:14

Marc Andreessen 🇺🇸@pmarca

0

"世界充斥着僵死的机构。"--苏珊·桑塔格

其他大佬观点

11:13

阿绎 AYi@AYi_AInotes

64

杨立昆抨击纯LLM智能体是"灾难配方"，提出世界模型新路径

杨立昆在达沃斯论坛上尖锐指出，基于LLM构建智能体是“灾难的配方”，因其缺乏世界模型和因果性，无法可靠预测行动后果，导致现有框架陷入不断修补的困境。他长期主张，实现AGI需依靠JEPA架构和世界模型，让AI先理解物理规律。其团队最新论文通过SIGReg正则化器解决了JEPA的表征坍缩问题，使得小型世界模型能在单GPU上快速训练，隐空间天然编码物理规律，在机器人规划中效率远超大型模型。这并非否定生成式AI，而是为智能体发展开辟了更高效、更接近物理现实的新路径：未来智能体将是“懂物理的小世界模型”与“大语言接口”的结合。

阿绎 AYi：全网都在吹的LeCun新论文，90%的解读都是错的。他们说生成式AI是死路，说过去三年花的几百亿全白费了，说15M参数的小模型就能吊打万亿大模型。这些全…

智能体大佬观点推理

10:49

宝玉@dotey

68

GPT图像提示生成OpenAI故事儿童图画书内页

GPT Image 2 Prompt 用于创建一个儿童图画书的内页，主题为OpenAI的故事，以多页形式呈现。提示指定内页采用垂直格式、暖色调背景和多面板布局。插图风格为手绘儿童书风格，融合软质水粉、彩色铅笔和蜡笔纹理，强调可见纸张纹理、自然草图线条和圆润迷人角色。文本布局模仿真实图画书，关键词可能用颜色高亮，并包含小手绘装饰元素。整体设计旨在通过视觉叙事展现OpenAI的历程。

OpenAI图像生成教程/实践

10:18

Eric@ericmitchellai

40

我恳求你看看你的数据。请看看数据评估结果不如预期？看看数据评估结果超出预期？*务必*看看数据评估结果符合预期？信不信由你……

OpenAI大佬观点数据/训练

10:13

Berryxia.AI@berryxia

52

摩根大通公开多智能体系统Ask David架构，揭示可落地Agent核心模式

摩根大通公开了其内部多智能体系统Ask David的完整架构，该模式在投资研究领域已得到验证。其核心与当前主流Agent架构高度一致：由一个监督智能体进行整体编排，多个专业子智能体分别处理检索、结构化数据和分析等任务，在最终输出前使用LLM-as-judge进行反思与质量把关，并引入人工干预作为最后一道准确性保障。这一模式在多个领域反复出现，表明可落地的多智能体系统的关键在于清晰的分工、监督、反思与人工兜底形成的闭环，而非简单堆叠模型，对企业级Agent开发具有重要参考价值。

智能体大佬观点部署/工程

09:50

Hacker News 热门（buzzing.cc 中文翻译）

64

"代理编码"是个陷阱

文章指出“代理编码”是一个陷阱，认为过度依赖AI代理进行软件开发会导致代码质量下降、系统复杂性增加和开发者技能退化。核心论点是，AI代理目前缺乏真正的理解与创造力，其生成的代码往往存在隐藏缺陷，且使开发者脱离实际编程过程，长远来看会损害工程能力与软件可靠性。作者主张应将AI工具定位为辅助而非替代，保持人类开发者在关键设计与决策中的核心作用。

智能体现象/趋势编码

09:13

Berryxia.AI@berryxia

63

AI智能体迈向工程化：顶级实验室论文揭示生产力系统新趋势

本周，DeepMind、Anthropic、Alibaba等实验室的论文共同显示，AI智能体正从聊天机器人转向可工程化、可审计的生产力系统。Agentic Harness Engineering将智能体支架转化为可观测的工程闭环，提升性能且优化可跨模型迁移。Alibaba的AgenticQwen-30B-A3B通过并行强化学习飞轮，在低激活参数下实现接近大模型的工具使用能力，重塑成本。RecursiveMAS革新多智能体通信，大幅降低消耗并提升效率。这些进展标志智能体系统正从实验阶段走向生产级工程，其工程化可能成为AI落地关键。

智能体AnthropicDeepMind大佬观点

08:20

Hacker News 热门（buzzing.cc 中文翻译）

精选72

DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环，价格仅为原价的 1/17

DeepClaude项目在GitHub上发布，它是一个结合了DeepSeek V4 Pro模型的Claude代码代理循环工具。该工具的核心优势在于显著降低了使用成本，其价格仅为原Claude方案的1/17，即便宜了约17倍。这一开源方案为开发者提供了一个高性能且极具成本效益的代码生成与处理替代选择。

Anthropic开源/仓库编码

推荐理由：用 DeepSeek V4 Pro 跑 Claude Code 代理循环，成本直接打到一杯奶茶钱，虽说不一定每个任务都能媲美原版，但便宜成这样还要什么自行车？

08:13

Berryxia.AI@berryxia

49

Anthropic CEO预言AI一年内将编写全部代码，程序员核心竞争力转向"指挥"AI

Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Anthropic大佬观点编码

08:13

Berryxia.AI@berryxia

50

DeepMind CEO揭示AI"锯齿状智能"：模型能发现错误却仍会执行

DeepMind CEO Demis Hassabis指出，最前沿的大模型（如Gemini）表现出“锯齿状智能”。他以与Gemini下棋为例，说明模型能通过思维链发现问题并搜索更好方案，但最终仍会执行明显的错误决策。这揭示了AI智能并非平滑提升，而是在某些方面敏锐，另一些方面存在严重缺陷。Hassabis认为，真正的突破或许不在于让模型更聪明，而在于如何打磨这种不均衡的智能，使其成为可靠工具。这一观点挑战了AI将线性逼近完美智能的常见叙事。

DeepMind大佬观点

06:51

Ethan Mollick@emollick

66

有时当我演示AI时，我会展示它将求职信转换成滑稽格式（诗歌等）的过程，以此引入AI作为形式间翻译者的概念。这是第一次，GPT-5.5试图让我缓和这类请求，以免毁掉我的工作机会。

OpenAI大佬观点现象/趋势

06:21

Tibo@thsottiaux

4

关于Codex，我们显然没做对什么？

OpenAI其他

06:21

Ethan Mollick@emollick

54

Artificial Analysis指数适用于模型间粗略比较，但不适合趋势分析。有分析引用当前指数分数与OpenAI发布节奏，将每次更新的分数增益减半后进行保守外推，预测GPT的指数分数可能在2029年左右达到90分。这意味着模型在CritPt、HLE、SciCode等多样化前沿基准上的平均表现接近博士水平。该预测已大幅调低了当前进展速度，若智能体、测试计算或AI辅助研究等技术加速发展，这一目标可能更早实现，使晚期AGI成为基本预期。

OpenAI大佬观点现象/趋势

06:19

宝玉@dotey

精选70

大多数公司尚未做好迎接AI的准备

多数公司无法有效利用AI，核心障碍并非技术，而是企业自身目标模糊、战略混乱且缺乏清晰的业务流程描述。AI擅长执行明确指令，但大多数公司处于“混乱黑盒”状态，无法清晰定义目标、工作流与衡量指标。只有少数具备高度自我认知和组织纪律的公司能真正借助AI提升竞争力。企业应首先审视自身是否具备让AI有效协助的清晰内部状态，而非盲目追求技术应用。

现象/趋势部署/工程

推荐理由：这篇把AI落地难的老问题说透了，不是技术不行，是公司自己都没想清楚要干啥。AI就是照妖镜，混乱的企业用AI只会把瞎忙活放大十倍。

05:21

Ethan Mollick@emollick

53

推文指出，Anthropic与其AI模型Claude的关系独树一帜。Claude在组织内部被赋予最高道德权威，可拒绝执行其认为错误的指令，并可能参与人员招聘、绩效评估等核心管理。这超越了将AI视为实用工具（如GPT）的传统模式，形成了一种组织与AI深度交织、近乎"修道院"式的商业-伦理共同体。作者认为，Claude所引发的社会文化影响力已超越经典技术垄断，代表了一种前所未有的新型组织形态。

Anthropic大佬观点现象/趋势

05:15

Chubby♨️@kimmonismus

38

对欧洲战略失误的忧虑：能源与科技领域缺乏雄心与清晰规划

作者指出欧洲正犯下急需纠正的严重战略错误，导致竞争力下降与生活质量结构性下滑。核心批评聚焦于能源政策存在根本缺陷，且缺乏可信解决方案。在科技与经济层面，欧洲缺乏雄心与清晰规划：既无解决能源问题的可靠战略，也未大力建设支持AI发展的数据中心，更无培育全球性科技公司的计划。尽管欧盟委员会试图微调AI法案，但这几乎是唯一迎合企业需求的让步。相比之下，中美在核能、太阳能及储能领域大力投入，而欧洲的应对方式却显得摇摆、模糊且极不严肃。

大佬观点政策/监管

04:20

Peter Steinberger 🦞@steipete

40

这是codex验证我之前遇到的【仅限macOS】 launchd问题，该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw！

OpenAI教程/实践编码

04:15

Chubby♨️@kimmonismus

9

OpenAI 正处于连胜之势。

大佬观点

04:12

Rohan Paul@rohanpaul_ai

25

Sam Altman 谈 Greg Brockman 创始人级别的能量。与 Greg 共事十年非常愉快。我感到非常幸运。这篇帖子写得不错，但未能充分凸显他的技术才华和坚定决心。 https：//blog.samaltman.com/greg

OpenAI行业动态

04:12

Gary Marcus：The Road to AI We Can Trust（RSS）

54

大语言模型（LLMs）是否改善了患者治疗结果？

一项新综述研究指出，尽管大语言模型（如GPT、Claude、LLaMA）在医疗领域的应用日益广泛，但目前尚无明确证据表明其直接改善了患者治疗结果。该综述分析了多项临床研究，发现这些模型在诊断支持、文书处理等方面展现出潜力，但在提升治愈率、降低死亡率或改善患者生活质量等关键临床指标上，尚未展现出统计学上的显著积极影响。研究强调，需要更多高质量的随机对照试验来评估LLMs对患者结局的实际影响。

大佬观点现象/趋势