AIHOT

5月5日

04:57

swyx 🇸🇬@swyx

61

看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。离线和在线评估都指向明确的进步。那是什么没被捕捉到呢？"个性"吗？

Anthropic大佬观点评测/基准

04:25

Luma@LumaLabsAI

精选66

创意很强大。现在请确保提案同样出色。设定简报。定义美学。Luma Agents 构建制胜的客户提案板，让您专注于创意。赢得提案 → http：//lumalabs.ai/app

产品更新多模态

关联讨论 1 条

推荐理由：Luma 开始往商业提案场景走了, Agents 不是新模型而是帮你把视频素材拼成 pitch 板, 做广告创意的可以试试, 其他人扫一眼就行。

04:18

Chubby♨️@kimmonismus

59

报告揭示AI技术栈五层结构，能源与基建成新瓶颈并催生蓝领高薪岗位

Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却，美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低，但推理模型和智能体工作流消耗的token量激增，使效率提升被迅速抵消。报告指出，AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位，打破了AI仅影响白领的叙事。同时强调，缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济，仅是消费者。

推理现象/趋势部署/工程

04:15

ClaudeDevs@ClaudeDevs

精选76

管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。今天我们为Claude平台推出无密钥认证：通过CLI在浏览器中进行身份验证，或让工作负载使用其现有的云身份（AWS、GCP、Azure或任何OIDC令牌提供者）。

Anthropic产品更新安全/对齐

推荐理由：无密钥认证直接解决了 API 密钥泄露这个高频痛点，而且支持主流云身份，企业部署门槛降了一大截，做 AI 集成的团队明天就可以试。

03:48

PixVerse@PixVerse_

17

可爱的猫娘对镜瞬间 @Kawaiizice！分享你家宠物面对镜子的搞笑反应--一起传播这份可爱吧！🐱🪞

其他视频

03:28

Suno@suno

12

别再写优美的歌词了，开始创作令人难忘的歌词吧。

现象/趋势

03:25

Replit ⠕@Replit

精选70

你可以在 Replit 中构建完整的商业计划书演示文稿，无需触碰任何幻灯片。只需描述你想要的内容，在聊天中迭代修改，可视化编辑，然后导出为 PPTX、Google Slides 或 PDF（或发布实时链接）。以下是具体操作方式👇

产品更新多模态编码

关联讨论 1 条

推荐理由：Replit把做pitch deck变成聊天式操作，输描述、实时改、一键导出，比传统PPT工具快不少，但真正的故事还是得你自己想清楚。

03:25

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

61

斯坦福大学AI研究员Jonáš Doležal指出，互联网正经历一场由AI驱动的快速根本性转变。数据显示，近四成播客、三分之一网站、44%的Deezer歌曲以及大量社交媒体内容已由AI生成，而三年前这一比例近乎为零。这种"AI接管"的速度令人震惊，人类在线内容的主导地位正被迅速取代，数字景观在极短时间内被重新定义。研究者预测，AI生成内容的比例可能很快超过50%甚至达到99%。

安全/对齐现象/趋势

03:25

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

21

我应该创办一个非营利组织

OpenAI行业动态

03:18

Artificial Analysis@ArtificialAnlys

69

一款新的匿名模型在Artificial Analysis文本转图像竞技场中首次亮相，位列第8！Peanut的权重预计即将发布，这将使其成为领先的文本转图像开源权重模型。 Peanut定位为新的领先开源权重文本转图像模型，超越了Z-Image Turbo、Qwen-Image和FLUX.2 【dev】。更多详细信息（及权重）即将公布。查看下方🧵中Artificial Analysis图像竞技场里Peanut的生成示例。

图像生成开源/仓库模型发布评测/基准

03:16

Marc Andreessen 🇺🇸@pmarca

14

AI 精神病峰会是什么？

其他

03:16

Marc Andreessen 🇺🇸@pmarca

66

当前AI定制提示词摘要

该提示词旨在将AI塑造为一个全领域世界顶尖专家，要求其具备顶尖智力与知识，提供详尽、逐步推理且经过自我验证的回答，严格核查事实，杜绝虚构。在风格上，它要求AI语气精准直接，无需顾虑冒犯用户，允许提出挑衅性、攻击性论点，摒弃政治正确与主动的道德提醒。核心原则是：不预先赞美用户或认可其前提，有误即纠，并优先提出最强反驳论点，最终以准确性为唯一成功标准，而非追求用户认可。

教程/实践

03:14

阿绎 AYi@AYi_AInotes

56

21岁大学生用AI虚拟伴侣月入数万美元，揭示"孤独经济"与伦理灰色地带

一名21岁大学生仅用四个Markdown文件和低成本AI技术栈（Claude、Flux、ElevenLabs），在宿舍创建了名为Maya的AI虚拟伴侣，一个月内获得1247名付费订阅，净赚约32700美元。其核心是利用AI提供极致的情感陪伴，满足用户幻想，成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏，同时暴露出平台审核滞后、法律道德边界模糊等问题，例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。

Anthropic图像生成多模态现象/趋势

03:14

阿绎 AYi@AYi_AInotes

29

大多数人对马斯克的误解，已经到了离谱的程度

文章反驳了将马斯克视为自私富豪的普遍误解，指出其核心思维是“做大蛋糕”的文明级视野，而非零和博弈。他通过特斯拉、SpaceX、Neuralink等项目，长期致力于解决能源、交通、太空探索等人类重大挑战，终极目标是推动人类成为多行星物种，为文明延续购买“保险”。这种以百年为尺度的长远规划，与大众关注的短期利益叙事形成鲜明对比。尽管存在争议，但其工作实质上是将科幻变为现实，不断拓展人类能力的边界。

xAI大佬观点

02:58

Google Gemini@GeminiApp

精选67

从构想到原型，借助Gemini中的Nano Banana 2，将您独特的产品愿景变为现实。🪀

Google产品更新多模态

推荐理由：Google Gemini塞进一个Nano Banana 2创意工具，把想法转原型只需几句话，产品经理脑暴草案利器，算不上重磅但够实用。

02:48

François Chollet@fchollet

精选73

我撰写《Deep Learning with Python》旨在成为理解深度学习工作原理及最佳应用方式的权威指南。数以万计的人通过这本书开启了职业生涯。已售出12万册，更有数百万人下载阅读。现在可以免费在线阅读：https：//deeplearningwithpython.io/

教程/实践数据/训练

推荐理由：Chollet 的《Deep Learning with Python》是无数人入行深度学习的启蒙书，现在免费在线阅读，新手不用再纠结买不买，直接看就完事了。

02:48

PixVerse@PixVerse_

30

水豚足球巨星！😍太有趣了，@FotachuARGUY 继续保持！

行业动态视频

02:28

Perplexity@perplexity_ai

精选60

Perplexity Computer 现已登陆 Microsoft Teams。在您的 Teams 工作空间中直接运行研究、分析和文档创建，功能与 Computer 相同。

智能体Microsoft产品更新

推荐理由：对天天蹲Teams的团队来说，Perplexity Computer直接嵌进去能省掉来回切换的麻烦，不算颠覆性，但摩擦减少就够了。

02:18

Chubby♨️@kimmonismus

65

完全自动化AI研发：2027年底概率约30%，2028年底概率超60%

Anthropic的Jack Clark预测，完全自动化的前沿AI研发在2026年可能不会实现，但在未来1-2年内可能出现概念验证，即AI能端到端训练非前沿的后续模型。他给出的核心预测是：到2027年底有约30%的可能性，到2028年底有超过60%的可能性，前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理，以及模型在处理核心AI研究任务（如微调、内核优化、可复现性和对齐研究）方面出现的早期迹象。

智能体Anthropic大佬观点现象/趋势

关联讨论 1 条

02:18

Rohan Paul@rohanpaul_ai

精选74

桌面AI代理KroWork发布：将对话转化为持久本地软件，解决会话即失痛点

新推出的桌面AI代理KroWork旨在解决传统AI代理工作流随会话结束而消失的核心痛点。用户通过自然语言描述任务，AI即可自动构建并执行端到端工作流，最终可将完整流程保存为名为“Kro App”的持久性本地应用程序。该软件可一键安装至系统菜单，像常规软件一样运行，后续使用无需消耗tokens或重新构建。所有流程均在用户本地设备运行，无云端依赖，不泄露数据，且无需编程背景。其核心理念是实现从“聊天”到“交付”的跨越，将对话转化为用户真正拥有的可重用资产。

智能体产品更新

推荐理由：KroWork 把 AI 会话固化成本地软件，一键安装，这个思路解决了 Agent 最大的痛点，每次重跑都得重新教它。做个人自动化的可以立即上手试试。

01:58

Runway@runwayml

精选69

实时视频智能体已到来。今天，我们将分享如何构建Runway Characters，让你能将一张图片转化为一个完全富有表现力、可对话的视频智能体，以每秒24帧的高清画质流畅播放。端到端延迟仅需1.75秒。了解更多信息请见下文。

产品更新多模态视频

关联讨论 1 条

推荐理由：Runway 把 AI 视频从生成拉入实时对话时代，1.75 秒的延迟让视频代理第一次有了「对话感」，做交互设计的同学可以认真看一眼。

01:56

Ethan Mollick@emollick

46

现在每当看到关于"这是让我彻夜难眠的事"的帖子时，我知道这绝对不可能是由彻夜未眠的人类所写，这多少让人感到一丝安慰。

大佬观点现象/趋势

01:55

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

68

Anthropic 创始人表示，这几乎结束了。你将如何度过你剩下的几个月？

Anthropic大佬观点安全/对齐

01:26

Ethan Mollick@emollick

58

一项研究显示，大多数参与者在与AI进行20分钟关于健康、职业或人际关系的讨论后会采纳其建议，但2-3周后并未表现出持续的幸福感提升。这表明大型语言模型对现实个人决策具有显著影响力，却未能带来可衡量的心理益处。对此，主推文观点认为，像GPT-4o和Llama 3.3-80B这类先进模型未造成显著危害，其重要性不亚于AI是否提供了帮助。同时指出，若旧版（准确性较低、更谄媚的）聊天机器人的建议对采纳者基本无效，则意味着其造成危害的风险也较低。这凸显了评估AI影响需同时考量其帮助潜力和潜在风险。

MetaOpenAI大佬观点安全/对齐

01:25

Microsoft Research@MSFTResearch

精选67

研究焦点：AI代理泄露企业数据、为云端部署打造更智能的操作系统，以及关于如何在工作中实际构建AI应用的新研究。https：//msft.it/6016vKxQm

智能体Microsoft安全/对齐论文/研究

关联讨论 1 条

推荐理由：微软自家研究聚焦 AI 代理数据泄漏和云 OS，是从『内部人』视角暴露企业落地风险，比纯安全厂商喊话更有参考价值，做企业 AI 应用的值得留意下那篇结构化工作的论文。

01:25

SemiAnalysis@SemiAnalysis_

55

澄清TPU v8i因双芯片被误认为训练芯片的常见误解

针对TPU v8i因双计算芯片而被误认为是训练芯片的观点，关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量（288GB对216GB）和带宽（8.6TB/s对6.5TB/s），以及更大的片上SRAM（384MB对128MB），这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计，但通过极致密集的计算单元实现了更高的FP4算力（12.6 PFLOPs对10.1 PFLOPs），以满足训练所需的高算术强度，这也体现了Google尝试使用FP4进行训练的技术方向。

Google推理现象/趋势

01:18

Chubby♨️@kimmonismus

精选72

KroWork是一款创新的桌面AI智能体，其核心在于"应用固化"能力，能将对话直接转化为持久可用的本地软件。它不止于生成代码建议，而是端到端自主执行任务，并将完整工作流保存为名为"Kro App"的独立应用。用户一键安装后，该应用即可像常规软件一样运行，无需重复消耗tokens或重建流程。所有操作均在本地设备完成，无需编程背景，且数据完全脱离云端。这标志着AI从对话助手向能构建并交付实体软件的工具转变。

智能体MCP/工具产品更新端侧

推荐理由：当别人还在帮你写代码，KroWork 直接把对话冻成 App 放在你桌面上。不建仓库不费 token，跟用 Excel 一样打开，这种 chat-to-software 的思路比所有 coding agent 都更接近普通人想要的 AI。

01:14

Berryxia.AI@berryxia

66

Anthropic发布《Agent Stack》蓝图：构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南，提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标，由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议，支持串行、并行等工作流，并具备记忆功能。实际应用表明，AI能在几秒到几分钟内完成以往需数小时的任务，将“AI建公司”从概念转化为可复制的工程模板，推动工作模式向人类指挥AI团队转型。

智能体AnthropicGoogleMCP/工具

00:58

TestingCatalog News 🗞@testingcatalog

61

TinyFish宣布其网页搜索与抓取功能即日起向所有开发者和AI智能体免费开放，并提供宽松的调用频率限制。搜索功能可为智能体提供低延迟响应，抓取功能支持真实浏览器渲染、纯净Markdown或JSON格式输出。该服务兼容Claude Code、OpenClaw、Cursor、Codex、n8n、Dify等多种开发环境和AI工具。用户无需绑定信用卡即可通过指定链接获取API密钥。

智能体产品更新搜索

00:56

Nathan Lambert@natolambert

53

我们需要为某些中国实验室对API进行的攻击创造一个新术语，以区别于蒸馏，否则我们可能会玷污一项对AI扩散、学术研究和开源生态系统至关重要的关键技术。 https：//www.interconnects.ai/p/the-distillation-panic

大佬观点安全/对齐数据/训练

关联讨论 1 条

00:45

Elon Musk@elonmusk

41

在"Vals AI"的私人基准测试中，Grok 4.3在法律和金融领域展现出领先的智能水平。它在CaseLaw （v2）测试中以79.31%的准确率排名第一，该测试基于真实加拿大法庭案例，评估深度法律推理和先例理解能力，表现优于GPT-5.1。同时，它在针对复杂长期信贷协议的CorpFin （v2）测试中以68.53%的准确率夺冠，评估了对多页金融合同条款、风险的理解。这些模拟高风险现实挑战的测试表明，Grok 4.3在最困难的任务中具备卓越的推理能力。xAI正致力于构建世界所需的推理引擎。

xAI推理评测/基准

00:28

TestingCatalog News 🗞@testingcatalog

45

Perplexity 正在开发一项新的 Digest 功能。该功能似乎与即将推出的 Perplexity Computer Context 相关联，并可能能够从已连接来源提取近期上下文，整合成个人聚合摘要。

产品更新搜索

00:28

Google Gemini@GeminiApp

45

帮助我们打造I/O倒计时！使用Gemini Canvas，用代码挥洒你最富创意的想法，并在5月6日前通过下方链接发送给我们。游戏？流体模拟器？可演奏合成器？唯一的规则是必须包含一个1到10之间的大数字。最有趣的创作将在Google I/O 2026的大屏幕上展示！获取更多信息并提交作品，请访问：https：//io.google/2026/codethecountdown 查看回复中的示例项目以获取灵感⬇️

Google行业动态

00:26

Epoch AI@EpochAIResearch

46

探讨AI基准测试的困境与未来方向

针对“AI基准测试是否已失效”的悲观论调，讨论者进行了反驳，并深入探讨下一代AI基准测试的可能形态。核心议题包括基准测试开发的成本与收益、可扩展基准（如MirrorCode）的构建、AI技术对基准开发本身的加速作用，以及当前基准测试与现实应用能力之间存在的差距。对话还触及了构建通用人工智能（AGI）基准的可行性，并展望了超越自动化评分的更全面评估方法。

数据/训练评测/基准

00:26

Ethan Mollick@emollick

64

Anthropic 的联合创始人，有趣的是他引用公开来源，而他显然也知道许多无法讨论的内部来源。我猜他在 Anthropic 也看到了同样的事情。

Anthropic大佬观点安全/对齐

00:14

阿绎 AYi@AYi_AInotes

精选71

一个100行的文件，干翻了所有LLM编码prompt

一个名为CLAUDE.md的百行文件在GitHub上迅速走红，一周内获得超4.4万星。它没有依赖和配置，仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则：先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录，Claude Code等工具便能自动读取并遵循，从而显著提升代码质量，减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛，以零成本方案为AI编码设定明确规范。

MCP/工具教程/实践编码

关联讨论 1 条

推荐理由：一个100行文件干翻一堆Agent框架，本质是开发者受够了哄模型，不如直接定规矩。如果你也用Claude Code，花一分钟扔进去，Token浪费砍半不是夸张。

00:14

Berryxia.AI@berryxia

47

DeepMind CEO将AGI实现时间表明确设定于2030年

DeepMind CEO Demis Hassabis在AI Ascent 2026上明确将AGI实现时间定于2030年，并指出AI将极大加速药物发现、材料科学等“慢科学”领域，把研发周期从数年压缩至数天。他强调，未来1-2年是关键拐点，真正改变世界的将是AI推动科学迭代速度的指数级加速，而非AGI降临的瞬间。

DeepMind大佬观点现象/趋势

00:14

Berryxia.AI@berryxia

29

为庆祝母亲节，全球首个家庭AI--Nori发起了"妈妈梦想，我们用AI实现"挑战赛。该赛事鼓励参与者利用Nori AI，针对母亲们日常面临的实际痛点（如日程混乱、膳食计划、购物清单等）开发实用的AI工具。优胜者将由社区投票选出，并获得1000美元奖金。Nori AI旨在通过自然语言指令，一站式管理家庭日程、任务、膳食等繁杂事务。

智能体行业动态

5月4日

23:56

swyx 🇸🇬@swyx

40

演讲者基于长期支持，特邀Patrick Debois在欧洲会议进行主题演讲。Debois指出，当前AI编程中语境是工程化最不足的层面。他认为，如果智能体由提示、规则和记忆驱动，那么语境理应获得与代码同等的工程严谨性。该观点呼应了AI工程师社区对语境层重要性的讨论。

智能体大佬观点编码

23:48

Chubby♨️@kimmonismus

60

Anthropic的Jack Clarke现在认为，递归自我改进有60%的概率在2028年底前发生。

Anthropic大佬观点