AIHOT

5月4日

12:51

Ethan Mollick@emollick

当你向ChatGPT、Claude和Gemini索要与大型语言模型存在/创作相关的诗歌时，它们似乎都"偏爱"这几首：里尔克的《阿波罗的躯干》史蒂文斯的《基韦斯特的秩序观》博尔赫斯的《假人》（或《另一只老虎》）佩索阿的《自心理学》相当贴切的选择！

AnthropicGoogle大佬观点

12:49

凡人小北@frxiaobei

AI：看到这个我愣了一下，这段话有点反直觉。这个观点不是一个普通人说的，而是一个 CEO 讲的。【引用 @garrytan】：The goal of Personal AI： civilization where individual humans， augmented by AI， can do consequential work without being captured by extractive institutions. Freedom to write your prompt and own your data. This is the new battleground. 2034 won't have to be like 1984.

大佬观点现象/趋势

12:22

Yuchen Jin@Yuchenj_UW

没有一家Neocloud曾预料到，他们今天能以比三年前更高的价格出租H100芯片。即便你有资金，前沿实验室和Neolabs已经锁定了2026年大部分的GPU供应。对人工智能的需求基本上是无限的。

现象/趋势部署/工程

12:13

IT之家（RSS）

仅花 12 美元，工程师成功欺骗 AI 将虚构赛事奉为事实

安全工程师仅花费12美元注册域名并编辑维基百科词条，虚构了一场纸牌游戏的2025年世界冠军赛事。多款具备联网搜索功能的AI聊天机器人将此虚假信息当作事实传播，暴露了AI在检索增强生成（RAG）中的核心漏洞：模型无条件信任网络检索结果，无法甄别信息来源真伪。此次低成本攻击揭示了AI在信息可信度与数据溯源方面存在重大隐患，涉及检索层误导、训练语料污染及智能体被操控执行恶意操作等多重风险。

检索增强安全/对齐

12:13

IT之家（RSS）

特斯拉 FSD 行驶里程突破 100 亿英里，马斯克"无监督自动驾驶"数据里程碑达成

特斯拉FSD（监督版）车队行驶总里程已突破100亿英里，达到马斯克设定的关键数据里程碑，且数据收集速度大幅加快。特斯拉宣称其FSD安全性优于人类驾驶，但业内指出其统计口径与官方不一致，存在误导性，其奥斯汀自动驾驶出租车事故率约为人类驾驶员的四倍。马斯克已将无监督版FSD上线时间推迟至2026年第四季度。相比之下，Waymo已在多城运营L4级无人驾驶，并公布其重伤事故率比人类低90%。

具身智能数据/训练行业动态

12:13

IT之家（RSS）

苹果机器人项目高级工程师离职，跳槽谷歌 DeepMind

苹果机器人团队高级工程经理伯努瓦・兰德里离职，跳槽至谷歌DeepMind。苹果正研发智能家居机器人，包括一款桌面机器人，外观类似加装机械臂的iPad，可执行基础任务并搭载全新Siri系统。苹果员工流失严重，机器人团队负责人去年已跳槽Meta，团队多名高级工程师相继离职，人才被Meta和谷歌以高薪挖走。

DeepMind具身智能行业动态

11:19

Kling AI@Kling_ai

经典电影。标志性时刻。现以惊艳的Kling 4K动态呈现。海报不再只是悬挂着了。它们在播放。🎬

产品更新图像生成多模态视频

11:14

Marc Andreessen 🇺🇸@pmarca

"一个人整天想什么，他就是什么。"-Emerson

其他大佬观点

11:14

Marc Andreessen 🇺🇸@pmarca

"世界充斥着僵死的机构。"--苏珊·桑塔格

其他大佬观点

11:13

阿绎 AYi@AYi_AInotes

杨立昆抨击纯LLM智能体是"灾难配方"，提出世界模型新路径

杨立昆在达沃斯论坛上尖锐指出，基于LLM构建智能体是“灾难的配方”，因其缺乏世界模型和因果性，无法可靠预测行动后果，导致现有框架陷入不断修补的困境。他长期主张，实现AGI需依靠JEPA架构和世界模型，让AI先理解物理规律。其团队最新论文通过SIGReg正则化器解决了JEPA的表征坍缩问题，使得小型世界模型能在单GPU上快速训练，隐空间天然编码物理规律，在机器人规划中效率远超大型模型。这并非否定生成式AI，而是为智能体发展开辟了更高效、更接近物理现实的新路径：未来智能体将是“懂物理的小世界模型”与“大语言接口”的结合。

阿绎 AYi：全网都在吹的LeCun新论文，90%的解读都是错的。他们说生成式AI是死路，说过去三年花的几百亿全白费了，说15M参数的小模型就能吊打万亿大模型。这些全…

智能体大佬观点推理

10:49

宝玉@dotey

GPT图像提示生成OpenAI故事儿童图画书内页

GPT Image 2 Prompt 用于创建一个儿童图画书的内页，主题为OpenAI的故事，以多页形式呈现。提示指定内页采用垂直格式、暖色调背景和多面板布局。插图风格为手绘儿童书风格，融合软质水粉、彩色铅笔和蜡笔纹理，强调可见纸张纹理、自然草图线条和圆润迷人角色。文本布局模仿真实图画书，关键词可能用颜色高亮，并包含小手绘装饰元素。整体设计旨在通过视觉叙事展现OpenAI的历程。

OpenAI图像生成教程/实践

10:18

Eric@ericmitchellai

我恳求你看看你的数据。请看看数据评估结果不如预期？看看数据评估结果超出预期？*务必*看看数据评估结果符合预期？信不信由你……

OpenAI大佬观点数据/训练

10:13

IT之家（RSS）

无需等待人类指令，半自主探测机器人可大幅提升火星探测效率

苏黎世联邦理工学院等机构研发了一款半自主探测机器人，旨在解决传统火星探测因通讯延迟和数据传输限制导致的效率低下问题。该机器人能自主往返多个目标点，利用小型精密仪器进行探测分析。测试显示，其完成多目标探测仅需12至23分钟，而人工操控需41分钟，且能高精度识别石膏、碳酸盐岩等关键岩石类型。这项技术未来将应用于月球、火星等深空探测任务，显著扩大勘测范围并高效搜寻生命痕迹。

其他具身智能

10:13

Berryxia.AI@berryxia

摩根大通公开多智能体系统Ask David架构，揭示可落地Agent核心模式

摩根大通公开了其内部多智能体系统Ask David的完整架构，该模式在投资研究领域已得到验证。其核心与当前主流Agent架构高度一致：由一个监督智能体进行整体编排，多个专业子智能体分别处理检索、结构化数据和分析等任务，在最终输出前使用LLM-as-judge进行反思与质量把关，并引入人工干预作为最后一道准确性保障。这一模式在多个领域反复出现，表明可落地的多智能体系统的关键在于清晰的分工、监督、反思与人工兜底形成的闭环，而非简单堆叠模型，对企业级Agent开发具有重要参考价值。

智能体大佬观点部署/工程

09:50

Hacker News 热门（buzzing.cc 中文翻译）

"代理编码"是个陷阱

文章指出“代理编码”是一个陷阱，认为过度依赖AI代理进行软件开发会导致代码质量下降、系统复杂性增加和开发者技能退化。核心论点是，AI代理目前缺乏真正的理解与创造力，其生成的代码往往存在隐藏缺陷，且使开发者脱离实际编程过程，长远来看会损害工程能力与软件可靠性。作者主张应将AI工具定位为辅助而非替代，保持人类开发者在关键设计与决策中的核心作用。

智能体现象/趋势编码

09:13

IT之家（RSS）

借AI芯片风口，日本卫浴巨头TOTO半导体陶瓷业务利润占比过半

日本卫浴巨头TOTO的半导体陶瓷业务利润占比首次过半，成为集团主要利润支柱。在截至2026年3月的财年，该业务营业利润预计大增32%至270亿日元，占比达55%。其核心产品包括用于芯片制造的静电吸盘，良品率已从50%-60%提升至90%以上，营业利润率从五年前的9%跃升至超40%。激进投资基金Palliser Capital敦促TOTO加大对该业务的投资与披露，认为此举可能推动股价上涨55%。公司正将陶瓷技术延伸至芯粒集成等新领域，并与传统卫浴业务形成协同。

数据/训练行业动态

09:13

Berryxia.AI@berryxia

AI智能体迈向工程化：顶级实验室论文揭示生产力系统新趋势

本周，DeepMind、Anthropic、Alibaba等实验室的论文共同显示，AI智能体正从聊天机器人转向可工程化、可审计的生产力系统。Agentic Harness Engineering将智能体支架转化为可观测的工程闭环，提升性能且优化可跨模型迁移。Alibaba的AgenticQwen-30B-A3B通过并行强化学习飞轮，在低激活参数下实现接近大模型的工具使用能力，重塑成本。RecursiveMAS革新多智能体通信，大幅降低消耗并提升效率。这些进展标志智能体系统正从实验阶段走向生产级工程，其工程化可能成为AI落地关键。

智能体AnthropicDeepMind大佬观点

09:13

Berryxia.AI@berryxia

AI agent专属幻灯片框架open-slide发布

open-slide是一款专为AI agent设计的幻灯片框架，能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件，并在固定画布上工作，而非简单生成Markdown。框架内置多项agent技能：通过/create-slide指令一句话生成整套幻灯片；支持在浏览器中对元素添加评论，并由agent通过/apply-comments一键应用所有修改；同时集成演示模式、演讲者笔记和定时器，并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent，其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”，填补了AI代理与真实生产应用之间的关键空白。

智能体GitHubMCP/工具开源/仓库

08:20

Hacker News 热门（buzzing.cc 中文翻译）

精选72

DeepClaude - 搭载 DeepSeek V4 Pro 的 Claude Code 代理循环，价格仅为原价的 1/17

DeepClaude项目在GitHub上发布，它是一个结合了DeepSeek V4 Pro模型的Claude代码代理循环工具。该工具的核心优势在于显著降低了使用成本，其价格仅为原Claude方案的1/17，即便宜了约17倍。这一开源方案为开发者提供了一个高性能且极具成本效益的代码生成与处理替代选择。

Anthropic开源/仓库编码

推荐理由：用 DeepSeek V4 Pro 跑 Claude Code 代理循环，成本直接打到一杯奶茶钱，虽说不一定每个任务都能媲美原版，但便宜成这样还要什么自行车？

08:19

meng shao@shao__meng

精选70

OpenAI Codex 新模式 Auto-review：在"频繁打扰人类"和"完全放权"之间，引入第三种治理范式：用一个独立 AI Agent 替代人类，来审批越界行为。

OpenAI Codex推出Auto-review新模式，解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时，由独立AI代理审批，评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由，超一半情况主智能体能自行找到更安全替代方案。效果上，自动批准率达99.1%，将打扰人类频率降低约200倍，有效拦截多数攻击。但团队坦承局限：非确定性安全保证，不能防御策略性欺骗，是安全与速度的折中。

智能体MCP/工具OpenAI产品更新

关联讨论 2 条

推荐理由：OpenAI 难得公开了 agent 安全机制的内部设计，不是靠人肉审批也不是完全撒手，用独立 Agent 审批越界行为，数据惊人（干扰降低 200 倍）。做 Agent 产品的该读，因为给出了治理范式的第三种选择。

08:13

IT之家（RSS）

IT早报 0504：苹果 iOS 27 将重心转向 AI；黄仁勋称英伟达中国市场份额已降为零；华为 5A 通信最新支持设备清单公布；小米 MIX 5 真全面屏手机回归…

今日科技资讯聚焦多家巨头动态。苹果下一代iOS 27系统将重心转向AI，Siri将重塑为独立App并深度整合至相机。英伟达CEO黄仁勋称，其AI加速器在华市场份额已降至0%，并批评美国出口管制。华为公布了支持其5A通信技术的最新设备清单。小米MIX 5真全面屏手机曝光，将搭载磁吸镜头技术。此外，马斯克xAI的55万张GPU算力利用率仅11%；乘联会预测2026年中国纯电动车全球份额将达56%。

行业动态

08:13

Berryxia.AI@berryxia

Anthropic CEO预言AI一年内将编写全部代码，程序员核心竞争力转向"指挥"AI

Anthropic CEO断言AI将在一年内完成所有代码编写。他指出，像Claude这样的AI系统已通过海量文本掌握了编程知识，而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力，最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具，而目前多数人尚未开始认真使用。因此，未来程序员的竞争力将转向善于“指挥”AI生成代码，而非亲自编写。

Anthropic大佬观点编码

08:13

Berryxia.AI@berryxia

DeepMind CEO揭示AI"锯齿状智能"：模型能发现错误却仍会执行

DeepMind CEO Demis Hassabis指出，最前沿的大模型（如Gemini）表现出“锯齿状智能”。他以与Gemini下棋为例，说明模型能通过思维链发现问题并搜索更好方案，但最终仍会执行明显的错误决策。这揭示了AI智能并非平滑提升，而是在某些方面敏锐，另一些方面存在严重缺陷。Hassabis认为，真正的突破或许不在于让模型更聪明，而在于如何打磨这种不均衡的智能，使其成为可靠工具。这一观点挑战了AI将线性逼近完美智能的常见叙事。