5月5日
01:14
Berryxia.AI@berryxia
66
Anthropic发布《Agent Stack》蓝图:构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。

智能体AnthropicGoogleMCP/工具
00:54
Google Developers Blog(RSS)
精选69
在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理

加州大学圣地亚哥分校的研究团队在谷歌TPU上成功部署了DFlash,一种基于块扩散的推测解码方法。该方法突破传统自回归草稿生成的序列性瓶颈,通过单次前向传播并行“绘制”整个候选令牌块,而非逐个预测。系统平均实现了3.13倍的推理加速,峰值性能接近EAGLE-3等现有方法的两倍。这一开源方案已集成至vLLM生态系统,通过利用“免费”的并行验证能力和针对复杂推理任务的高质量草稿预测,显著优化了TPU硬件的利用效率。

Google开源生态推理论文/研究

推荐理由:把扩散式的 speculative decoding 在 TPU 上跑出了 3 倍推理加速,峰值快到 EAGLE-3 的两倍,还直接集成了 vLLM,做推理优化的赶紧试一下。
00:26
Epoch AI@EpochAIResearch
46
探讨AI基准测试的困境与未来方向

针对“AI基准测试是否已失效”的悲观论调,讨论者进行了反驳,并深入探讨下一代AI基准测试的可能形态。核心议题包括基准测试开发的成本与收益、可扩展基准(如MirrorCode)的构建、AI技术对基准开发本身的加速作用,以及当前基准测试与现实应用能力之间存在的差距。对话还触及了构建通用人工智能(AGI)基准的可行性,并展望了超越自动化评分的更全面评估方法。

数据/训练评测/基准
00:14
阿绎 AYi@AYi_AInotes
精选71
一个100行的文件,干翻了所有LLM编码prompt

一个名为CLAUDE.md的百行文件在GitHub上迅速走红,一周内获得超4.4万星。它没有依赖和配置,仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则:先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录,Claude Code等工具便能自动读取并遵循,从而显著提升代码质量,减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛,以零成本方案为AI编码设定明确规范。

MCP/工具教程/实践编码
关联讨论 1X:小互 (@xiaohu)
推荐理由:一个100行文件干翻一堆Agent框架,本质是开发者受够了哄模型,不如直接定规矩。如果你也用Claude Code,花一分钟扔进去,Token浪费砍半不是夸张。
00:14
Berryxia.AI@berryxia
47
DeepMind CEO将AGI实现时间表明确设定于2030年

DeepMind CEO Demis Hassabis在AI Ascent 2026上明确将AGI实现时间定于2030年,并指出AI将极大加速药物发现、材料科学等“慢科学”领域,把研发周期从数年压缩至数天。他强调,未来1-2年是关键拐点,真正改变世界的将是AI推动科学迭代速度的指数级加速,而非AGI降临的瞬间。

DeepMind大佬观点现象/趋势
00:14
IT之家(RSS)
29
倍耐力把传感器塞进轮胎,力图让车辆知道自身精确位置、应对周边环境

倍耐力与瑞典科技公司Univrses合作,持有其30%股权,以强化Cyber Tyre智能轮胎技术。该系统将传感器集成于轮胎内部,结合外部摄像头和AI计算机视觉,使车辆能精确感知自身位置并实时应对环境变化。2025年,双方在意大利普利亚大区启动道路监测试点,利用轮胎数据与视觉技术构建持续更新的道路地图。该技术仍处概念验证阶段,但已进入深入开发,未来轮胎有望成为互联出行中的重要数据源。

端侧行业动态
00:14
IT之家(RSS)
精选71
Claude Token 榜:迪士尼「榜一大哥」9 天 46 万次,Meta 月烧 60 万亿

迪士尼内部上线AI使用看板,追踪员工调用Claude的频率和token消耗。数据显示,一名员工在9个工作日内调用Claude约46万次,平均每1.7秒一次。与此同时,迪士尼正裁员约1000人。硅谷正流行“tokenmaxxing”文化,比拼AI token消耗量。Meta内部统计显示,其8.5万名员工在30天内消耗了60万亿token,价值约900亿美元;Uber的年度34亿美元AI预算在4个月内耗尽。报告显示,Claude用户中非程序员用途已超半数。

Anthropic数据/训练现象/趋势

推荐理由:迪士尼搞AI排行榜,Meta月烧60万亿token,这不是段子,是AI真实渗透的活证据。从律师到全职妈妈,所有人都开始用Claude打工,这股浪潮比任何财报都真实。
00:11
Nathan Lambert:Interconnects(RSS)
47
蒸馏恐慌

AI领域出现“蒸馏攻击”现象,即利用GPT-4等闭源模型的输出训练更小的开源模型。这引发了关于知识产权与创新平衡的激烈争论。支持者视其为技术民主化途径,反对者则谴责其侵犯版权并可能损害模型质量。目前,部分开源模型性能已快速逼近顶级闭源模型,迫使行业重新审视数据使用边界与合规框架。

大佬观点数据/训练现象/趋势
00:11
Tomer Tunguz 博客(VC 分析)
精选63
每日仅需8条广告,广告支持型AI的经济可行性分析

基于开源模型和商用GPU的广告支持型AI在经济上可行。计算表明,一个由4块B200 GPU组成的集群服务300名用户时,每小时成本约18美元。通过广告收入即可覆盖成本:在内容网络中每3分钟展示一条广告(CPM 3.12美元),或在搜索广告中每39分钟展示一条(CPM 38.40美元),这一广告频率已与常见的移动和网页应用相当。对于代码代理等高强度任务,可采用混合盈利模式:用户每月支付10美元订阅费并每日观看8条广告,即可支持约200万token的用量,这证明了该模式的实用性。

开源生态推理现象/趋势

推荐理由:Tunguz 用一页纸的算账说清了广告支持 AI 的经济账,一天看 8 条广告就能换两百万 token,这对做免费 AI 产品的团队是个真正有说服力的模型。
5月4日
23:56
Hacker News 热门(buzzing.cc 中文翻译)
精选72
Show HN: Ableton Live MCP

这是一个名为 Ableton Live MCP 的开源项目,它通过模型上下文协议(MCP)将 Ableton Live 音乐制作软件与大型语言模型(如 GPT、Claude)连接起来。该项目在 Hacker News 上获得了 100 点热度,其核心功能是让 LLM 能够读取和控制 Ableton Live 的会话数据,从而可能实现基于自然语言指令的音乐创作与自动化流程。

MCP/工具开源/仓库

推荐理由:给 Ableton Live 接上了 LLM 的大脑,让 AI 能直接操作 DAW,虽然还只是原型,但已经能看到未来音乐制作的人机协作模式。做音频 Agent 的可以拿来玩。
23:16
GitHub Blog
37
立即注册 OpenClaw: After Hours @ GitHub

OpenClaw 社区将于微软 Build 2026 大会期间,在 GitHub 总部举办线下聚会。活动将包含项目演示和交流环节。参与者可选择亲临现场,或通过 Twitch 平台观看线上直播。

GitHub行业动态
23:14
IT之家(RSS)
57
英国警方扩大 AI 人脸识别应用,利用手机等设备实时比对数据库确认人员身份

英国警方正扩大AI人脸识别技术的应用范围,将系统整合至手机和执法记录仪等移动设备中,实现实时画面与警方数据库的比对,以快速确认人员身份。该技术从固定监控摄像头延伸至街头巡逻、大型活动安保及高风险区域执法等一线场景,旨在缩短身份核查时间并提升响应效率。外界担忧此举可能导致过度监控和误识别问题,警方回应称技术将持续完善,并承诺遵循现有数据保护与法律框架以平衡安全与隐私。

政策/监管行业动态
23:14
IT之家(RSS)
55
被"AI 教父"辛顿"判死刑"十年后,美国放射科医生平均年薪达 57.1 万美元

“AI教父”辛顿十年前预言AI将在5-10年内取代放射科医生,但现实恰恰相反。过去十年美国放射科医生数量增长约10%,目前仍供不应求,平均年薪高达57.1万美元。AI并未取代该职业,而是成为协作工具,帮助医生提升效率。同时,影像检查需求激增也增加了工作量。专家指出,AI自动化了流程化任务,但放射科医生将更多时间转向需要人性化沟通的临床工作,而共情、安慰等能力是AI无法替代的。这一案例表明,AI更可能改变而非消除复杂职业。

Anthropic现象/趋势
23:12
Gary Marcus:The Road to AI We Can Trust(RSS)
32
日益增长的 AI 抵制浪潮

由于您提供的正文内容仅为开篇句“Nobody should be surprised”,缺乏具体论述与事实细节,无法据此生成符合要求的摘要。摘要需要基于文章主体内容,提取如“发布了什么”、“具体变化”、“关键数据”等核心信息。建议提供完整的文章内容,以便撰写准确、信息量充足的摘要。

大佬观点现象/趋势
22:54
elvis@omarsar0
精选71
Sakana AI提出新型7B"指挥者"模型,通过协同多个智能体实现性能突破

Sakana AI在ICLR 2026上发表研究,提出一个仅70亿参数的“指挥者”模型。该模型不直接解决问题,而是通过强化学习训练,专注于为混合开源与闭源模型的工作者智能体设计通信拓扑结构,并为每个工作者生成精准指令以发挥其特长。经随机化智能体池训练后,它能在推理时适应任意智能体组合。其关键创新在于,当允许指挥模型将自己也选为工作者时,系统会形成递归拓扑,实现动态测试时扩展。该模型在GPQA-Diamond和LiveCodeBench上达到SOTA水平,在AIME25和GPQA-D上的性能比最佳单体工作者提升约3%,这相当于前沿模型一个代际的改进幅度,且增益完全来源于协同优化。

智能体arXivMCP/工具推理

推荐理由:Sakana AI 这篇 ICLR 论文把 Agent 之间的通信拓扑和提示词一起做成可训练的,协调本身变成模型,做多 Agent 系统的人真该重新想想架构了。
22:48
Rohan Paul@rohanpaul_ai
精选71
OpenAI启动百亿美元合资公司"部署公司"加速企业AI应用

OpenAI成立了名为“部署公司”的百亿美元合资公司,筹集超40亿美元,旨在帮助企业克服AI部署障碍。核心观点是,当前企业采用AI的主要瓶颈已非模型质量,而是缺乏整合团队、工作流程、数据访问和安全规则的能力。该公司通过联合TPG、Brookfield等私募股权投资者,打包软件、咨询和部署方案,直接触达超2000家投资组合公司,实现规模化分发。同时,Anthropic也正与Blackstone、Goldman Sachs等华尔街机构组建类似合资公司,为私募股权支持的企业部署Claude并重建工作流程。这标志着AI实验室的竞争焦点正从模型性能演示转向工业化部署速度与路径控制的争夺。

AnthropicOpenAI行业动态部署/工程

推荐理由:OpenAI和Anthropic几乎同时拉上黑石、高盛成立合资公司,把模型部署包装成服务卖给数千家企业。模型竞争正在降级,谁能最快把AI塞进真实业务流程才是下一阶段的王。
22:48
Rohan Paul@rohanpaul_ai
67
路透:AI芯片制造商Cerebras瞄准35亿美元美国IPO,每股定价115-125美元

AI芯片制造商Cerebras正计划在美国进行IPO,目标融资高达35亿美元,每股定价区间为115至125美元。该公司采用独特的晶圆级芯片技术,将几乎整个硅晶圆集成为一个巨型处理器,旨在通过将海量计算和内存置于单一硅片上,减少芯片间数据移动的瓶颈,从而为特定大型AI工作负载加速训练和推理过程。其技术路线与依赖多GPU协作、受限于数据移动速度的传统AI硬件形成对比。此次IPO是公司在撤回先前尝试后的新一轮努力,其竞争对手包括英伟达和AMD,后者同时也是其支持者。

行业动态部署/工程
22:43
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选72
关于近期 Claude Code 质量报告的更新说明

Anthropic 确认并解决了过去一个月影响 Claude Code、Claude Agent SDK 和 Claude Cowork 的三个问题,所有问题已于 4 月 20 日修复。具体包括:3月4日将 Claude Code 的默认推理强度从“高”改为“中”,导致用户感知智能下降,已于4月7日回滚;3月26日一项缓存优化存在缺陷,导致会话恢复后模型“健忘”和重复,4月10日修复;4月16日一项旨在减少冗余的系统提示指令意外损害了代码质量,4月20日撤销。这些问题影响了 Sonnet 4.6 和 Opus 4.6/4.7 模型,但 API 未受影响。公司已重置所有订阅用户的使用限额,并承诺改进流程以防止类似问题。

Anthropic安全/对齐编码行业动态

推荐理由:Anthropic 把 Claude Code 连续一个月质量下滑的三个 bug 全部摊开讲,这种级别的工程复盘在大模型公司里极少见。做 Agent 产品的人该认真读,因为这三个坑你迟早也会踩。
22:24
The Decoder:AI News(RSS)
62
OpenAI 为新企业部署合资公司筹集超40亿美元

OpenAI 已为一家名为“The Deployment Company”的新合资企业筹集了超过40亿美元资金。这笔巨额融资旨在专门推动企业级AI解决方案的部署与应用,标志着OpenAI正加速其商业化和规模化进程。

OpenAI行业动态
22:22
向阳乔木@vista8
58
躺平神器开源!Xbox手柄秒变Mac万能遥控器~

一款名为“xbox-mac-ctrl”的开源工具,可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放(全屏、快进、音量调节),并操作微信读书、浏览器及任意Mac软件(如Tab切换、滚动翻页)。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现,旨在满足躺卧时遥控刷小说、看视频的需求,并鼓励开发者fork以适配Switch手柄等其他硬件。

向阳乔木DeepSeek v4 Pro还是可以的。 几轮对话,实现一个工具,用xbox手柄控制电脑应用和浏览器。 当遥控器,躺床上刷小说和看视频。

MCP/工具开源/仓库教程/实践
22:22
meng shao@shao__meng
精选72
Cursor团队发布官方工作流插件,集成17项核心开发技能

Cursor官方团队将其内部使用的开发工作流打包成名为“cursor-team-kit”的插件。该插件集成了17个核心Skills、1个Agent和2条Rules,旨在提升团队协作与代码质量。核心Skills涵盖五大领域:CI/合并循环自动化、PR全流程管理、验证与测试、总结复盘以及代码治理。其中,ci-watcher Agent可后台监听CI状态,而两条Rules则强制规定了TypeScript的代码风格。该插件是团队用于构建Cursor产品自身经验的封装,专注于验证变更、驱动本地工具和交付可评审的PR。

智能体产品更新编码

推荐理由:Cursor 把自己的开发流程开源成插件了,这一套 17 个 skill 从 CI 盯盘到写周报全包,最牛的 verify-this 把 debug 变成了科学实验,装了立刻就能用。
22:22
Orange AI@oran_ge
37
近期有文章揭露,部分AI模型token中转服务存在欺诈行为,即在后台替换为劣质模型,却以高价模型名义收费。这一现象已被广泛传播和讨论。然而,当前中文社交平台上却出现大量将此类中转站宣传为"好生意"的言论。作者对此种降低行业标准、混淆视听的趋势表示难以理解和强烈不满。

马东锡 NLP前几周在 x 上,有篇文章已经完全证实了, token 中转就是背后换模型,以次充好,挂着羊牛卖狗肉,骗用户,大几十万阅读,似乎人人皆知了。 现在简中推,到处…

现象/趋势部署/工程
22:14
Berryxia.AI@berryxia
精选70
Sam Altman驳斥AI"抢饭碗"论:真正风险是效率鸿沟

Sam Altman批评一些CEO宣称AI将导致大规模失业的言论是“不懂人情”。他引用案例指出,GPT-5.5的Codex版本能将耗时数周的工作压缩至一小时,但结果却是使用者“前所未有的忙碌”。AI并未消灭工作,而是极大提升个人产能,使功能开发和试错速度呈指数增长,导致拥抱AI者因生产力暴增而承担更多任务,其野心也随之扩张。当前AI时代的核心分化在于“善用AI者”与“拒绝AI者”之间不断扩大的效率鸿沟。真正的淘汰风险在于旁观而非主动利用工具。

OpenAI大佬观点现象/趋势

推荐理由:Sam Altman这回应干脆,但更值得琢磨的是那个案例,一个人用GPT-5.5 Codex之后反而更忙了。生产力暴增时,野心也暴增。这可能是未来五年每个人都要面对的真实处境。
22:14
Berryxia.AI@berryxia
19
Nori AI发起母亲节AI产品挑战赛,奖金千元

Nori AI推出“Mom Dreams It, We Create It with AI”挑战赛,庆祝母亲节,旨在鼓励构建AI产品解决忙碌妈妈的痛点或实现其梦想工具,优胜者可获1000美元奖金,并由社区投票选出。Nori AI被描述为世界首个家庭AI,能通过自然语言命令处理日程、任务、餐计划等家庭事务。挑战赛和产品链接已提供,呼吁开发者参与构建帮助妈妈的AI产品。

智能体行业动态