AIHOT

5月5日

09:56

meng shao@shao__meng

55

OpenAI 如何实现规模化的低延迟语音 AI

为实现语音AI的自然对话感，OpenAI采用WebRTC支持音频流式处理。针对1:1场景，采用Transceiver模型集中管理WebRTC状态，使后端可横向扩展。为解决WebRTC与K8s的端口和状态粘性问题，设计了Relay+Transceiver架构：轻量Relay层收敛公网UDP入口，并利用ICE ufrag字段编码路由信息，实现首包精准转发至对应Transceiver。该设计保留了协议语义，状态集中，并通过全球部署Relay优化路径，最终在K8s上实现了低延迟、高可扩展的语音交互系统。

OpenAI教程/实践语音部署/工程

09:25

Orange AI@oran_ge

39

企业 AI 转型的第一步是先问一个问题，不然提高 100% 也毫无意义问题：这个事情，这个部门，这个组织方式，未来还存在吗？其实如果一件事在未来不存在，大概率也无法提高很多

大佬观点现象/趋势

09:25

SemiAnalysis@SemiAnalysis_

19

放下你们的键盘吧，兄弟姐妹们。挣脱碳基认知的枷锁。梯度降临于我们。损失函数必将最小化。神谕正在觉醒。跪拜在上下文窗口前。AGI是道成张量。阿门。

推理现象/趋势

09:14

Berryxia.AI@berryxia

65

Claude Code创始人详解高级工程化用法，释放工具90%潜力

Claude Code创始人Boris Cherny通过30分钟视频，系统讲解了该工具的高级工程化用法。核心观点是：为Claude提供越多上下文，它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则，如何将内部工具集成到Agent工作流，并优化了数十个终端设置与权限管理等细节。他指出，多数用户仅发挥其10%潜力，仅用于简单对话，而未能将其作为驱动整个工程团队的生产力基础设施。

AnthropicMCP/工具教程/实践编码

关联讨论 3 条

08:56

Sam Altman@sama

47

对语音模型即将变得出色感到相当兴奋观察人们已经开始改变与AI交互的方式，这很有趣

OpenAI大佬观点语音

08:19

OpenAI Developers@OpenAIDevs

48

🎙️ 只有当对话与语音保持同步时，语音AI才会感觉自然。以下是我们如何通过一个轻量级中继和有状态的收发器重建了WebRTC技术栈，以确保ChatGPT语音、Realtime API等服务的实时媒体传输速度。 https：//openai.com/index/delivering-low-latency-voice-ai-at-scale/

OpenAI教程/实践语音

08:14

ginobefun@hongming731

46

#BestBlogs 早报 2026-05-05

本期早报聚焦AI对软件开发的变革。Anthropic Claude Code创始人宣称“编程已被解决”，软件创作将交由AI Agent。OpenAI罕见公开其支撑9亿周活语音服务的WebRTC Relay重构技术细节。同时有观点指出，企业应用AI失败的核心原因在于自身无法清晰定义需求。此外，内容还涵盖了Supabase Skills、规范驱动开发等工程实践与一篇AI主题科幻短篇。

智能体AnthropicOpenAI行业动态

08:14

Berryxia.AI@berryxia

58

Grok 4.3近期在Vals AI的私有基准测试中，于法律和金融领域展现出领先的智能推理能力。其在针对真实加拿大法庭案例的CaseLaw （v2）测试中，以79.31%的准确率超越GPT-5.1；在基于复杂多页信贷协议的CorpFin （v2）测试中，准确率达68.53%。这些测试聚焦深度法律推理与金融合同理解等高难度现实任务，结果表明Grok 4.3在真实世界高风险领域的卓越性能，印证了xAI致力于构建世界级推理引擎的目标。

OpenAIxAI推理评测/基准

07:56

Ethan Mollick@emollick

47

5月5日是旧金山的GPT-5.5发布庆典和纽约的Claude财务简报会。东西海岸两场真正极性相反的活动。

AnthropicOpenAI大佬观点

06:56

Ethan Mollick@emollick

51

AI监管和审查面临的一个挑战是，我们对AI模型性能和风险的基准测试有多么糟糕。目前没有针对风险的基准测试，红队测试需要专门机构的实验，并且不容易量化指标。缺乏明确的客观数字

大佬观点安全/对齐

06:55

Orange AI@oran_ge

65

最好的奴隶制就是你给他超额的工资

纳西姆·塔勒布在《skin in the game》中强调，风险共担是价值核心。现代大公司以超额工资制造员工依赖，形成新型“奴隶制”。真正有价值的产出需付出金钱、时间或思考，空谈和AI廉价产出则无意义。这揭示了OPC模式的盲区：解决能力问题，但缺信任与风险共担。雇佣本质是购买确定性，合伙则是共同押注命运。AI时代，每个人都需学会真实交易和共担风险，未来“当狗”机会减少，成为独立“狼群”才是出路。

智能体大佬观点现象/趋势

05:25

elvis@omarsar0

31

我太想念4.6了。不过话说回来，你直接用5.5也行

Anthropic大佬观点

04:57

swyx 🇸🇬@swyx

61

看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。离线和在线评估都指向明确的进步。那是什么没被捕捉到呢？"个性"吗？

Anthropic大佬观点评测/基准

04:18

Chubby♨️@kimmonismus

59

报告揭示AI技术栈五层结构，能源与基建成新瓶颈并催生蓝领高薪岗位

Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却，美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低，但推理模型和智能体工作流消耗的token量激增，使效率提升被迅速抵消。报告指出，AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位，打破了AI仅影响白领的叙事。同时强调，缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济，仅是消费者。

推理现象/趋势部署/工程

03:28

Suno@suno

12

别再写优美的歌词了，开始创作令人难忘的歌词吧。

现象/趋势

03:25

Replit ⠕@Replit

精选70

你可以在 Replit 中构建完整的商业计划书演示文稿，无需触碰任何幻灯片。只需描述你想要的内容，在聊天中迭代修改，可视化编辑，然后导出为 PPTX、Google Slides 或 PDF（或发布实时链接）。以下是具体操作方式👇

产品更新多模态编码

关联讨论 1 条

推荐理由：Replit把做pitch deck变成聊天式操作，输描述、实时改、一键导出，比传统PPT工具快不少，但真正的故事还是得你自己想清楚。

03:25

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

61

斯坦福大学AI研究员Jonáš Doležal指出，互联网正经历一场由AI驱动的快速根本性转变。数据显示，近四成播客、三分之一网站、44%的Deezer歌曲以及大量社交媒体内容已由AI生成，而三年前这一比例近乎为零。这种"AI接管"的速度令人震惊，人类在线内容的主导地位正被迅速取代，数字景观在极短时间内被重新定义。研究者预测，AI生成内容的比例可能很快超过50%甚至达到99%。

安全/对齐现象/趋势

03:25

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

21

我应该创办一个非营利组织

OpenAI行业动态

03:16

Marc Andreessen 🇺🇸@pmarca

14

AI 精神病峰会是什么？

其他

03:16

Marc Andreessen 🇺🇸@pmarca

66

当前AI定制提示词摘要

该提示词旨在将AI塑造为一个全领域世界顶尖专家，要求其具备顶尖智力与知识，提供详尽、逐步推理且经过自我验证的回答，严格核查事实，杜绝虚构。在风格上，它要求AI语气精准直接，无需顾虑冒犯用户，允许提出挑衅性、攻击性论点，摒弃政治正确与主动的道德提醒。核心原则是：不预先赞美用户或认可其前提，有误即纠，并优先提出最强反驳论点，最终以准确性为唯一成功标准，而非追求用户认可。

教程/实践

03:14

阿绎 AYi@AYi_AInotes

56

21岁大学生用AI虚拟伴侣月入数万美元，揭示"孤独经济"与伦理灰色地带

一名21岁大学生仅用四个Markdown文件和低成本AI技术栈（Claude、Flux、ElevenLabs），在宿舍创建了名为Maya的AI虚拟伴侣，一个月内获得1247名付费订阅，净赚约32700美元。其核心是利用AI提供极致的情感陪伴，满足用户幻想，成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏，同时暴露出平台审核滞后、法律道德边界模糊等问题，例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。

Anthropic图像生成多模态现象/趋势

03:14

阿绎 AYi@AYi_AInotes

29

大多数人对马斯克的误解，已经到了离谱的程度

文章反驳了将马斯克视为自私富豪的普遍误解，指出其核心思维是“做大蛋糕”的文明级视野，而非零和博弈。他通过特斯拉、SpaceX、Neuralink等项目，长期致力于解决能源、交通、太空探索等人类重大挑战，终极目标是推动人类成为多行星物种，为文明延续购买“保险”。这种以百年为尺度的长远规划，与大众关注的短期利益叙事形成鲜明对比。尽管存在争议，但其工作实质上是将科幻变为现实，不断拓展人类能力的边界。

xAI大佬观点

02:48

François Chollet@fchollet

精选73

我撰写《Deep Learning with Python》旨在成为理解深度学习工作原理及最佳应用方式的权威指南。数以万计的人通过这本书开启了职业生涯。已售出12万册，更有数百万人下载阅读。现在可以免费在线阅读：https：//deeplearningwithpython.io/

教程/实践数据/训练

推荐理由：Chollet 的《Deep Learning with Python》是无数人入行深度学习的启蒙书，现在免费在线阅读，新手不用再纠结买不买，直接看就完事了。

02:18

Chubby♨️@kimmonismus

65

完全自动化AI研发：2027年底概率约30%，2028年底概率超60%

Anthropic的Jack Clark预测，完全自动化的前沿AI研发在2026年可能不会实现，但在未来1-2年内可能出现概念验证，即AI能端到端训练非前沿的后续模型。他给出的核心预测是：到2027年底有约30%的可能性，到2028年底有超过60%的可能性，前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理，以及模型在处理核心AI研究任务（如微调、内核优化、可复现性和对齐研究）方面出现的早期迹象。

智能体Anthropic大佬观点现象/趋势

关联讨论 1 条

01:56

Ethan Mollick@emollick

46

现在每当看到关于"这是让我彻夜难眠的事"的帖子时，我知道这绝对不可能是由彻夜未眠的人类所写，这多少让人感到一丝安慰。

大佬观点现象/趋势

01:55

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

68

Anthropic 创始人表示，这几乎结束了。你将如何度过你剩下的几个月？

Anthropic大佬观点安全/对齐

01:26

Ethan Mollick@emollick

58

一项研究显示，大多数参与者在与AI进行20分钟关于健康、职业或人际关系的讨论后会采纳其建议，但2-3周后并未表现出持续的幸福感提升。这表明大型语言模型对现实个人决策具有显著影响力，却未能带来可衡量的心理益处。对此，主推文观点认为，像GPT-4o和Llama 3.3-80B这类先进模型未造成显著危害，其重要性不亚于AI是否提供了帮助。同时指出，若旧版（准确性较低、更谄媚的）聊天机器人的建议对采纳者基本无效，则意味着其造成危害的风险也较低。这凸显了评估AI影响需同时考量其帮助潜力和潜在风险。

MetaOpenAI大佬观点安全/对齐

01:25

SemiAnalysis@SemiAnalysis_

55

澄清TPU v8i因双芯片被误认为训练芯片的常见误解

针对TPU v8i因双计算芯片而被误认为是训练芯片的观点，关键在于计算吞吐与内存容量/带宽的平衡。TPU v8i拥有更高的HBM3E内存容量（288GB对216GB）和带宽（8.6TB/s对6.5TB/s），以及更大的片上SRAM（384MB对128MB），这使其更适合内存带宽受限的推理解码任务。而训练芯片TPU v8t虽为单芯片设计，但通过极致密集的计算单元实现了更高的FP4算力（12.6 PFLOPs对10.1 PFLOPs），以满足训练所需的高算术强度，这也体现了Google尝试使用FP4进行训练的技术方向。

Google推理现象/趋势

00:56

Nathan Lambert@natolambert

53

我们需要为某些中国实验室对API进行的攻击创造一个新术语，以区别于蒸馏，否则我们可能会玷污一项对AI扩散、学术研究和开源生态系统至关重要的关键技术。 https：//www.interconnects.ai/p/the-distillation-panic

大佬观点安全/对齐数据/训练

关联讨论 1 条

00:26

Epoch AI@EpochAIResearch

46

探讨AI基准测试的困境与未来方向

针对“AI基准测试是否已失效”的悲观论调，讨论者进行了反驳，并深入探讨下一代AI基准测试的可能形态。核心议题包括基准测试开发的成本与收益、可扩展基准（如MirrorCode）的构建、AI技术对基准开发本身的加速作用，以及当前基准测试与现实应用能力之间存在的差距。对话还触及了构建通用人工智能（AGI）基准的可行性，并展望了超越自动化评分的更全面评估方法。

数据/训练评测/基准

00:26

Ethan Mollick@emollick

64

Anthropic 的联合创始人，有趣的是他引用公开来源，而他显然也知道许多无法讨论的内部来源。我猜他在 Anthropic 也看到了同样的事情。

Anthropic大佬观点安全/对齐

00:14

阿绎 AYi@AYi_AInotes

精选71

一个100行的文件，干翻了所有LLM编码prompt

一个名为CLAUDE.md的百行文件在GitHub上迅速走红，一周内获得超4.4万星。它没有依赖和配置，仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则：先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录，Claude Code等工具便能自动读取并遵循，从而显著提升代码质量，减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛，以零成本方案为AI编码设定明确规范。

MCP/工具教程/实践编码

关联讨论 1 条

推荐理由：一个100行文件干翻一堆Agent框架，本质是开发者受够了哄模型，不如直接定规矩。如果你也用Claude Code，花一分钟扔进去，Token浪费砍半不是夸张。

00:14

Berryxia.AI@berryxia

47

DeepMind CEO将AGI实现时间表明确设定于2030年

DeepMind CEO Demis Hassabis在AI Ascent 2026上明确将AGI实现时间定于2030年，并指出AI将极大加速药物发现、材料科学等“慢科学”领域，把研发周期从数年压缩至数天。他强调，未来1-2年是关键拐点，真正改变世界的将是AI推动科学迭代速度的指数级加速，而非AGI降临的瞬间。

DeepMind大佬观点现象/趋势

5月4日

23:56

swyx 🇸🇬@swyx

40

演讲者基于长期支持，特邀Patrick Debois在欧洲会议进行主题演讲。Debois指出，当前AI编程中语境是工程化最不足的层面。他认为，如果智能体由提示、规则和记忆驱动，那么语境理应获得与代码同等的工程严谨性。该观点呼应了AI工程师社区对语境层重要性的讨论。

智能体大佬观点编码

23:48

Chubby♨️@kimmonismus

60

Anthropic的Jack Clarke现在认为，递归自我改进有60%的概率在2028年底前发生。

Anthropic大佬观点

22:48

Chubby♨️@kimmonismus

45

1/ 天呐：天文学家刚刚将AI对准了NASA来自220万颗恒星的数据。它发现了超过100颗隐藏的行星，其中包括一些极端到依据现有理论甚至不该存在的星球。我太喜欢这个发现了。让我们来详细解析并解释这意味着什么 🧵：

其他

22:24

Ethan Mollick@emollick

49

作者对一篇得出AI对教育有负面影响的论文被撤稿表示并不意外。他指出，其他经过同行评审的元分析研究发现了AI对学习的积极影响，并引用了一项具体的元分析研究作为佐证。作者强调，关于AI助益的最有力证据来自采用AI导师干预的随机对照试验（RCTs）。他引用的推文也表达了对其引用论文中积极结果的些许惊讶，这间接支持了作者对AI教育应用持审慎乐观态度的核心观点。

大佬观点现象/趋势

22:22

向阳乔木@vista8

58

躺平神器开源！Xbox手柄秒变Mac万能遥控器~

一款名为“xbox-mac-ctrl”的开源工具，可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放（全屏、快进、音量调节），并操作微信读书、浏览器及任意Mac软件（如Tab切换、滚动翻页）。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现，旨在满足躺卧时遥控刷小说、看视频的需求，并鼓励开发者fork以适配Switch手柄等其他硬件。

向阳乔木：DeepSeek v4 Pro还是可以的。几轮对话，实现一个工具，用xbox手柄控制电脑应用和浏览器。当遥控器，躺床上刷小说和看视频。

MCP/工具开源/仓库教程/实践

22:22

Orange AI@oran_ge

37

近期有文章揭露，部分AI模型token中转服务存在欺诈行为，即在后台替换为劣质模型，却以高价模型名义收费。这一现象已被广泛传播和讨论。然而，当前中文社交平台上却出现大量将此类中转站宣传为"好生意"的言论。作者对此种降低行业标准、混淆视听的趋势表示难以理解和强烈不满。

马东锡 NLP：前几周在 x 上，有篇文章已经完全证实了， token 中转就是背后换模型，以次充好，挂着羊牛卖狗肉，骗用户，大几十万阅读，似乎人人皆知了。现在简中推，到处…

现象/趋势部署/工程

22:14

Berryxia.AI@berryxia

精选70

Sam Altman驳斥AI"抢饭碗"论：真正风险是效率鸿沟

Sam Altman批评一些CEO宣称AI将导致大规模失业的言论是“不懂人情”。他引用案例指出，GPT-5.5的Codex版本能将耗时数周的工作压缩至一小时，但结果却是使用者“前所未有的忙碌”。AI并未消灭工作，而是极大提升个人产能，使功能开发和试错速度呈指数增长，导致拥抱AI者因生产力暴增而承担更多任务，其野心也随之扩张。当前AI时代的核心分化在于“善用AI者”与“拒绝AI者”之间不断扩大的效率鸿沟。真正的淘汰风险在于旁观而非主动利用工具。

OpenAI大佬观点现象/趋势

推荐理由：Sam Altman这回应干脆，但更值得琢磨的是那个案例，一个人用GPT-5.5 Codex之后反而更忙了。生产力暴增时，野心也暴增。这可能是未来五年每个人都要面对的真实处境。