5月5日
09:56
meng shao@shao__meng
55
OpenAI 如何实现规模化的低延迟语音 AI

为实现语音AI的自然对话感,OpenAI采用WebRTC支持音频流式处理。针对1:1场景,采用Transceiver模型集中管理WebRTC状态,使后端可横向扩展。为解决WebRTC与K8s的端口和状态粘性问题,设计了Relay+Transceiver架构:轻量Relay层收敛公网UDP入口,并利用ICE ufrag字段编码路由信息,实现首包精准转发至对应Transceiver。该设计保留了协议语义,状态集中,并通过全球部署Relay优化路径,最终在K8s上实现了低延迟、高可扩展的语音交互系统。

OpenAI教程/实践语音部署/工程
09:28
DogeDesigner@cb_doge
精选77
奥特曼与布罗克曼被指在OpenAI进行自我交易,涉嫌背叛马斯克

推文指控萨姆·奥特曼和格雷格·布罗克曼在OpenAI非营利架构下进行自我交易。2017年,布罗克曼秘密持有Cerebras股份,并同期推动OpenAI与之合并,却未向埃隆·马斯克披露个人利益。2025年末至2026年,OpenAI与Cerebras签署了总额超200亿美元的合作协议并提供贷款,直接助推Cerebras估值从80亿飙升至近270亿美元。布罗克曼在宣誓证词中承认交易讨论期间自己是Cerebras投资者,但无法提供任何向马斯克披露此利益的邮件、聊天或文字记录。此举涉嫌违反加州慈善信托法,将本为造福人类的非营利组织变为个人牟利工具。

OpenAI行业动态
关联讨论 2X:AI Safety Memes (@AISafetyMemes)X:阿易 AI Notes (@AYi_AInotes)
推荐理由:庭审爆出大量证词,Altman和Brockman在一桩$20B交易中涉嫌未披露个人持股,慈善信托的自我交易指控对OpenAI公信力是沉重一击。
09:14
Berryxia.AI@berryxia
65
Claude Code创始人详解高级工程化用法,释放工具90%潜力

Claude Code创始人Boris Cherny通过30分钟视频,系统讲解了该工具的高级工程化用法。核心观点是:为Claude提供越多上下文,它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则,如何将内部工具集成到Agent工作流,并优化了数十个终端设置与权限管理等细节。他指出,多数用户仅发挥其10%潜力,仅用于简单对话,而未能将其作为驱动整个工程团队的生产力基础设施。

AnthropicMCP/工具教程/实践编码
关联讨论 3Anthropic:Engineering(事故复盘 + 工程实践 · 网页)X:宝玉 (@dotey)X:Claude Devs (@ClaudeDevs)
08:58
08:48
Rohan Paul@rohanpaul_ai
69
白宫拟对重大AI模型实施发布前政府审查,政策风向逆转

白宫正考虑对主要AI模型建立发布前政府审查机制,审查核心聚焦于模型的网络能力,即其发现、利用或串联软件漏洞以改变现实安全风险的水平。此举标志重大政策转向,此前政府曾放宽对强大AI系统的报告要求。政策转变的直接诱因是Anthropic公司的Mythos模型,该公司评估其发现软件漏洞的能力过强,广泛发布风险过高。此类模型能快速扫描代码、识别弱点并建议攻击路径,虽对防御方有用,但也恐助长攻击者入侵关键系统。审查不一定会阻止发布,但可让美国政府提前获取并测试先进模型。

Anthropic安全/对齐政策/监管
关联讨论 2The Decoder:AI News(RSS)X:Rohan Paul (@rohanpaul_ai)
08:48
Rohan Paul@rohanpaul_ai
54
DeepMind新研究让LLM学会在对话中学习

Google DeepMind的研究通过“师生对话”框架训练大型语言模型(LLM),使其能在对话中有效利用用户反馈进行学习。传统LLM将对话视为独立轮次,难以整合修正信息。该研究让“学生”模型尝试回答,由掌握额外信息的“教师”提供指导,并训练学生利用指导得出正确答案。在线强化学习训练效果优于离线过滤,且在简短对话中习得的技能能迁移至更长对话。该方法从数学任务泛化至编程任务,并能处理信息逐步到达的模糊任务。通过“Q-priming”步骤,模型在模糊任务中主动寻求澄清的可能性提高五倍以上,使对话更像与一个能在交流中实时学习的伙伴协作。

智能体DeepMind推理论文/研究
08:26
meng shao@shao__meng
66
KroWork:通过"对话生成软件"模式,将AI对话转化为本地持久应用

KroWork的核心创新在于“chat-to-software”模式,旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体,能通过20多种内置技能端到端自动化执行任务,并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单,像常规软件一样运行,且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成,保障数据隐私,无需云端依赖,用户也无需具备编程背景即可创建属于自己的可复用软件。

智能体产品更新开源/仓库端侧
08:14
ginobefun@hongming731
46
#BestBlogs 早报 2026-05-05

本期早报聚焦AI对软件开发的变革。Anthropic Claude Code创始人宣称“编程已被解决”,软件创作将交由AI Agent。OpenAI罕见公开其支撑9亿周活语音服务的WebRTC Relay重构技术细节。同时有观点指出,企业应用AI失败的核心原因在于自身无法清晰定义需求。此外,内容还涵盖了Supabase Skills、规范驱动开发等工程实践与一篇AI主题科幻短篇。

智能体AnthropicOpenAI行业动态
07:58
TestingCatalog News 🗞@testingcatalog
50
Anthropic将为Claude Cowork推出主动式AI助手"Orbit"

Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据,并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式,OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉,Orbit很可能作为一项高级功能,仅向Claude Max订阅用户开放。

智能体AnthropicMCP/工具产品更新
07:27
06:57
06:55
06:55
Orange AI@oran_ge
65
最好的奴隶制就是你给他超额的工资

纳西姆·塔勒布在《skin in the game》中强调,风险共担是价值核心。现代大公司以超额工资制造员工依赖,形成新型“奴隶制”。真正有价值的产出需付出金钱、时间或思考,空谈和AI廉价产出则无意义。这揭示了OPC模式的盲区:解决能力问题,但缺信任与风险共担。雇佣本质是购买确定性,合伙则是共同押注命运。AI时代,每个人都需学会真实交易和共担风险,未来“当狗”机会减少,成为独立“狼群”才是出路。

智能体大佬观点现象/趋势
06:45
05:25
05:25
SemiAnalysis@SemiAnalysis_
精选71
GB300 NVL72实测性能达GB200的2.7倍,凸显端到端实测价值

在行业标准推理引擎vLLM上的测试显示,NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同,但在大多数服务商实际运行的中段负载区间,凭借全栈优化的复合增益,GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成,结果印证了端到端实测性能才是衡量硬件效能的黄金标准,而非单纯的纸面理论算力。

推理评测/基准部署/工程

推荐理由:纸面 FP4 算力只多 50% 的 GB300,实际推理却快了 2.7 倍,全栈优化的复合增益比参数表好看太多,做推理服务的该重新算算 TCO 了。
04:25
04:18
Chubby♨️@kimmonismus
59
报告揭示AI技术栈五层结构,能源与基建成新瓶颈并催生蓝领高薪岗位

Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却,美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低,但推理模型和智能体工作流消耗的token量激增,使效率提升被迅速抵消。报告指出,AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位,打破了AI仅影响白领的叙事。同时强调,缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济,仅是消费者。

推理现象/趋势部署/工程
04:15
ClaudeDevs@ClaudeDevs
精选76
管理API密钥是我们从客户那里听到的最主要的安全顾虑之一。 今天我们为Claude平台推出无密钥认证:通过CLI在浏览器中进行身份验证,或让工作负载使用其现有的云身份(AWS、GCP、Azure或任何OIDC令牌提供者)。
Anthropic产品更新安全/对齐

推荐理由:无密钥认证直接解决了 API 密钥泄露这个高频痛点,而且支持主流云身份,企业部署门槛降了一大截,做 AI 集成的团队明天就可以试。