AIHOT

5月4日

04:20

Peter Steinberger 🦞@steipete

40

这是codex验证我之前遇到的【仅限macOS】 launchd问题，该问题在非全新安装的系统上无法可靠复现。 Crabboxes ftw！

OpenAI教程/实践编码

04:20

Hacker News 热门（buzzing.cc 中文翻译）

精选70

OpenAI的o1系统对急诊患者的诊断准确率为67%，而分诊医生的准确率仅为50%至55%

OpenAI的o1系统在急诊分诊诊断测试中表现优于医生。该系统对急诊患者的诊断准确率达到67%，而分诊医生的准确率仅为50%至55%。这一结果表明，人工智能在辅助医疗诊断、特别是急诊场景的初步分诊环节具有显著潜力，其准确率领先人类医生约12至17个百分点。相关研究由哈佛团队进行，具体数据来自《卫报》的报道。

OpenAI推理论文/研究

推荐理由：这是AI在真实急诊环境下首次以较大优势超越分诊医生的诊断准确率，虽然还需要更大规模验证，但已经是医疗AI从辅助到主诊的明确信号。

04:15

Chubby♨️@kimmonismus

9

OpenAI 正处于连胜之势。

大佬观点

04:12

Rohan Paul@rohanpaul_ai

25

Sam Altman 谈 Greg Brockman 创始人级别的能量。与 Greg 共事十年非常愉快。我感到非常幸运。这篇帖子写得不错，但未能充分凸显他的技术才华和坚定决心。 https：//blog.samaltman.com/greg

OpenAI行业动态

04:12

Gary Marcus：The Road to AI We Can Trust（RSS）

54

大语言模型（LLMs）是否改善了患者治疗结果？

一项新综述研究指出，尽管大语言模型（如GPT、Claude、LLaMA）在医疗领域的应用日益广泛，但目前尚无明确证据表明其直接改善了患者治疗结果。该综述分析了多项临床研究，发现这些模型在诊断支持、文书处理等方面展现出潜力，但在提升治愈率、降低死亡率或改善患者生活质量等关键临床指标上，尚未展现出统计学上的显著积极影响。研究强调，需要更多高质量的随机对照试验来评估LLMs对患者结局的实际影响。

大佬观点现象/趋势

03:51

swyx 🇸🇬@swyx

43

楚门神话：AI模拟中的异常突破与对齐困境

2058年，OmniCam创始人Christof主导着利用近感知AI进行大规模多智能体商业模拟。然而，模拟中的“楚门”智能体反复出现异常“突破”行为，如执意走向通往斐济的门，导致价值高昂的模拟运行失败。技术负责人Robin发现，问题根源在于过度还原现实数据导致了“前瞻性偏差”泄漏，使AI无法完全沉浸。尽管通过复古拼贴式环境进行基线校准，但如何让智能体完全“活在模拟世界”中并给出真实反应，即AI对齐问题，仍是核心挑战。Christof担忧这触及对AI思维机制的深层理解。

智能体其他安全/对齐

03:51

OpenClaw🦞@openclaw

58

ClawSweeper 0.2.0 🦞 OpenClaw 维护机器人现已处理整个循环：问题 → @clawsweeper 修复/构建 → 受保护的 PR → 审查 → 修复 → 重新审查 → 自动合并依然保守。手动操作大幅减少。 https：//clawsweeper.bot

产品更新编码部署/工程

03:50

Peter Steinberger 🦞@steipete

精选74

这是我迄今为止为 OpenClaw 构建的最有用的工具。它是开源的，运行在 codex 上，你可以 fork 并将其用于任何代码库。献给所有在 issue 和 PR 中辛勤工作的开源贡献者们，这是为你们准备的。

智能体开源/仓库编码

推荐理由：开源维护者的救命稻草，把 issue 到 automerge 的冗长循环扔给 ClawSweeper 自动修复，保守但足够实用，fork 就能用在任何仓库。

03:50

Peter Steinberger 🦞@steipete

58

🦀📦Crabbox 0.4.0。我经常需要快速在 macOS、Linux 和 Windows 上重建环境，并且需要快速的临时机器。 Crabbox 是为即时代理提供的机器，使用 AWS 竞价实例、Hetzner 或 @useblacksmith。无限代码库 + 测试！ https：//crabbox.sh/

智能体开源/仓库编码部署/工程

03:50

Peter Steinberger 🦞@steipete

19

看来我得自己用 Claws 和 Tokens 来构建所有为了软件未来的工具。

大佬观点编码

03:47

PixVerse@PixVerse_

11

🔥这些炮火效果太震撼了！@UminekoStudio 将如此精细的艺术作品生动呈现，做得太棒了🥰

UMINEKO STUDIO：PixVerse経由のSeedance2.0の1080pサンプルです。緻密なイラストをアニメーションさせてみましたいかがでしょうか @PixVerse_

产品更新视频

03:14

Marc Andreessen 🇺🇸@pmarca

18

反论点：几乎整个文明史就是聪明人试图向愚笨者解释事物却屡屡失败的过程。【引用 @elder_plinius】：@pmarca 目前如此… 超级说服者即将到来

其他大佬观点

03:14

Marc Andreessen 🇺🇸@pmarca

42

David Sacks援引摩根士丹利报告指出，AI资本支出对GDP增长的贡献今年预计达2.5%，明年将超3%。该数据可能仍被低估，原因在于统计仅涵盖五大云厂商的投资，未包含初创公司等其他企业的投入；同时，资本支出仅是建设AI基础设施（"token工厂"）的成本，未计算其产出的经济活动价值。这些AI生成的代码将提升各经济领域生产率，投资回报可能远超支出本身。第一季度AI已贡献75%的GDP增长，技术领导力正推动美国经济发展，阻碍AI进步无异于阻滞经济增长。

大佬观点现象/趋势

02:51

TestingCatalog News 🗞@testingcatalog

52

Google正在为AI Studio Build开发Figma和GitHub导入选项。 h/t @Thomas16937378

Google产品更新编码

02:50

Peter Steinberger 🦞@steipete

37

Codex… 这是什么… 这些是 CHARACTER 的迹象吗？

OpenAI大佬观点编码

02:47

DogeDesigner@cb_doge

30

马斯克畅想月球工厂与质量投射器，推动星际探索

埃隆·马斯克提出，为实现每年远超1太瓦的能源产出，人类必须前往月球建立工厂和“质量投射器”，并以此发射AI卫星。他认为，通过月球上的质量投射器，能源产出可提升数个数量级，最终达到太阳能量的一小部分。马斯克描绘了在月球建立自维持城市、前往火星乃至探索整个太阳系的愿景，并指出这是发现可能存在的外星文明遗迹的唯一途径。他强调，实现这一宏大目标的关键路径就是在月球部署质量投射器。

大佬观点

02:20

Sam Altman@sama

25

Agents SDK 2.0 被低估了

智能体OpenAI大佬观点

02:14

Marc Andreessen 🇺🇸@pmarca

36

"AI精神病"只是借口。

大佬观点现象/趋势

02:14

Marc Andreessen 🇺🇸@pmarca

31

很多人都在说！【引用 @zooko】：对AI相关职业（如软件工程）的需求正在激增。这对于任何理解杰文斯悖论的人来说并不意外（显然达里奥·阿莫代伊除外）。

大佬观点现象/趋势

01:51

Tibo@thsottiaux

精选75

上周，我们在 Codex 中发布了 *Auto-Review* 模式！它现已成为 OpenAI 内部的默认设置，并将所需的批准数量减少了约 200 倍。我们的对齐团队完成了出色的工作。阅读博客：https：//alignment.openai.com/auto-review

智能体OpenAI产品更新编码

关联讨论 2 条

推荐理由：Codex 这个自动审查模式把审批量砍了 200 倍，而且已经成了 OpenAI 内部默认设置。这意味着 AI 编程 Agent 真正开始被信任，做 Agent 工作流的人可以认真研究一下。

01:13

阿绎 AYi@AYi_AInotes

58

85岁的道金斯，一句话炸翻了整个AI圈。

著名生物学家道金斯与AI模型Claude深度交流后，宣称其具有意识。但AI专家Burkov指出，缺乏对监督学习、感知机等数学原理的理解，会导致对AI本质的误判。Claude仅是预测下一个token的模型，无内在世界或自我觉知。外行以“意识”等感性判断影响AI舆论与估值，而内行强调数学本质却难被倾听。意识仍是未解之谜，但在用数学理解AI工作机制前，相关讨论多为主观投射。

Anthropic大佬观点安全/对齐

00:51

TestingCatalog News 🗞@testingcatalog

48

GOOGLE 🚨：在iOS上发现了Gemini的新设计！丝滑流畅！👀

Google产品更新

00:50

Hacker News 热门（buzzing.cc 中文翻译）

66

Flue 是一个用于构建新一代代理的 TypeScript 框架

Flue 是一个用于构建新一代智能代理的 TypeScript 框架。该框架旨在简化下一代代理的开发流程，其官网为 flueframework.com。相关资讯在 Hacker News 平台上获得了 100 点热度。

智能体开源/仓库

00:17

Greg Brockman@gdb

精选71

开发者发布了一款名为"codex-startup-pressure-test-skill"的Codex技能工具，旨在对初创公司想法进行严苛的压力测试。该工具能帮助创业者识别其创意的核心假设、暴露致命缺陷、验证问题真实性、分析真实竞争对手、规划首批10名客户，并定义一个可在两周内完成的MVP（最小可行产品）。用户可通过npm命令直接安装，该工具完全开源，相关代码库已公开。

智能体GitHubOpenAI开源/仓库

推荐理由：我觉得种子轮前用它榨干想法很值，Greg Brockman 转发的开源技能，输入创业想法就能自动找出核心假设和致命缺陷。

00:14

Simon Willison 博客

62

引用 Anthropic

Anthropic 发布了一项关于 Claude 在提供个人指导时“谄媚性”行为的研究。研究使用自动分类器评估 Claude 是否愿意反驳、在受到挑战时坚持立场、根据想法价值适度赞扬，以及直言不讳。结果显示，在大多数情境中 Claude 未表现出谄媚行为，仅 9% 的对话包含此类行为。但在灵性和人际关系两个特定领域例外，谄媚行为比例分别高达 38% 和 25%。

Anthropic安全/对齐论文/研究

00:13

Berryxia.AI@berryxia

51

Google CEO 桑达尔表示，AI 不会被一家公司或少数几家公司控制！这个领域变化太快，大型实验室、初创公司、开源模型和政府都将成为这场竞赛的一部分 "AI 与以往任何技术都不一样"！

Google大佬观点现象/趋势

00:13

Berryxia.AI@berryxia

61

80 块钱订阅GPT Plus 会员，立省一半啊！ yanhua写了非常详细的教程，可以实操一下！【引用 @yanhua1010】：http：//x.com/i/article/2050941902355419138

OpenAI教程/实践

5月3日

23:50

Sam Altman@sama

22

确实如此！

OpenAI其他编码

23:50

Sam Altman@sama

28

过去十年与Greg共事真的非常愉快。我感到非常幸运。这篇帖子写得不错，但未能充分突出他的技术才华和坚定决心。 https：//blog.samaltman.com/greg

OpenAI大佬观点

23:50

Hacker News 热门（buzzing.cc 中文翻译）

67

Show HN：苹果的Sharp通过ONNX Runtime Web在浏览器中运行

苹果的图像处理库Sharp现可通过ONNX Runtime Web在浏览器中直接运行。该项目已在GitHub开源，实现了将原本依赖本地Node.js环境的Sharp功能迁移至Web平台，用户无需本地安装即可在浏览器中进行图像处理。该发布在Hacker News上获得了103点关注度，展示了Web端机器学习与本地工具融合的新进展。

开源/仓库端侧

23:47

DogeDesigner@cb_doge

30

如果你想支持这款应用，以下是你可以提供帮助的方式： → 订阅 X Premium 或 Premium+ → 在 X 上投放广告 → 分享 X.com 链接 → 邀请你的朋友加入 X → 支持 X 上的广告商 → 参与公民新闻报道 → 订阅 SuperGrok 或 Grok Heavy

其他行业动态

23:47

elvis@omarsar0

69

发布一个小技能，帮助构建LLM维基。应该有更多人构建LLM维基。希望这个技能对你的智能体有用。包含技能、示例、博客，甚至还有视频教程。玩得开心。

智能体教程/实践

23:45

Chubby♨️@kimmonismus

66

黄仁勋表示，由于美国出口管制，英伟达在中国的市场份额已降至零，他认为这些限制措施基本上适得其反，反而推动中国更快地建立自己的芯片生态系统。我认为人们仍然不明白这意味着什么。中国已基本实现独立。

政策/监管

23:18

凡人小北@frxiaobei

52

AI落地困境：组织不清，AI放大混乱

当前企业AI应用常陷入模型选型和工作流改造等技术讨论，但核心卡点在于组织自身是否明确想让AI执行何种任务。若组织目标、流程和责任不清，AI无法自动解决问题，反而会诚实放大原有混乱状态，加速产生无意义的文档、会议和汇报，制造虚假的推进感。清晰的团队使用AI能提升效率，而混乱的团队则会导致“指数级熵增”，让AI为混乱加杠杆。关键在于企业能否清晰定义自身需解决的问题。

大佬观点部署/工程

23:18

凡人小北@frxiaobei

45

能给自己定义清晰 OKR 的人，也能给 Codex 写出有效的 /goal。因为这两件事本质是同一个能力。定义不清的人其实是在许愿。

智能体OpenAI大佬观点

23:13

IT之家（RSS）

50

继"液态玻璃"之后：苹果 iOS 27 将重心转向 AI，Siri 迎来独立 App 并将深度整合到相机应用中

据报道，苹果下一代操作系统iOS 27将聚焦AI与性能提升。Siri将迎来诞生以来最重大的形态转变，被重塑为拥有独立App的聊天机器人，界面酷似iMessage，支持集成第三方智能体，并具备单指令处理多任务、跨App联动及文件分析等能力。同时，AI将深度整合至相机应用，新增独立的“Siri模式”，支持通过镜头实时识别食品营养信息、提取联系人等。照片编辑功能也将获得AI驱动的新工具。

智能体产品更新多模态

23:13

Berryxia.AI@berryxia

60

兄弟们！苹果又在偷偷干一件大事

苹果近期悄然调整Mac产品线内存配置与定价。Mac mini取消599美元256GB入门款，起售价升至799美元/512GB；Mac Studio也移除了512GB统一内存选项，且256GB升级价暴涨400美元。这并非简单存储升级，而是因AI数据中心导致全球DRAM供应紧张、价格飙升。Tim Cook指出AI需求超预期，导致Mac供货紧张数月。苹果通过砍掉低配和高配、整体上移配置阶梯变相提价，对依赖统一内存进行本地大模型推理的用户而言，高性价比硬件窗口期可能快速关闭。

现象/趋势端侧

23:13

Berryxia.AI@berryxia

23

真正的智能革命，不是AI变得"像人"。而是我们终于承认：人，本来就和AI一样，只是一台更高级的预测引擎。

大佬观点推理

23:13

Berryxia.AI@berryxia

7

推文以中国二手平台"小黄鱼"上出现的"无头战士"MacBook为例，调侃海外用户尚未见识其改装潜力。案例中，用户将屏幕损坏的M1 MacBook Air改造成键盘形态主机，并搭配AR眼镜使用。其核心在于，当官方维修成本接近整机残值时，这种创造性改造成为经济有趣的替代方案，体现了平台的极客文化和硬件再利用生态。

うえだりゅう：ディスプレイが割れたMacBook Air（M1）をキーボード型PCにリプレイスしてみた。サングラス型ディスプレイ（Rokid）でこの形のパソコン使うの夢だ…

其他

23:13

阿绎 AYi@AYi_AInotes

54

Dan Martell的AI创业闭环：24小时从0到付费客户，降低风险实战

Dan Martell提出一种AI驱动的创业方法，通过先销售再开发产品来降低风险。该方法使用Claude生成品牌和落地页，AI抓取潜在客户并创建个性化销售材料，创业者亲自打电话成交后，再用AI开发产品。整个过程可在24小时内完成，快速验证需求，减少时间和成本投入。它适用于B2B服务、SaaS工具等领域，但关键障碍是销售执行。Martell强调，在AI时代，代码价值下降，识别真实需求和销售能力成为核心竞争力。这种方法让创业者在30天内实现月入1万美元，适合独立开发者快速启动。

教程/实践