5月5日
23:03
Runway:News(网页)
精选55
60倍速冷启动:将同级GPU视为权重服务器

Runway平台团队开发的NCCLBack系统,通过P2P权重传输将模型冷启动时间从数分钟缩短至数秒。其核心创新在于让新启动的GPU推理节点直接从集群内已加载权重的同级GPU获取模型参数,而非从云存储重复下载。该系统利用GPU互连(如InfiniBand、NVLink)高达200-400 Gbps的带宽,相比传统存储下载的2-10 Gbps实现了数量级提升。通过Redis协调与NCCL广播原语,NCCLBack确保了数据传输的效率和正确性,使得大规模集群部署新模型时,冷启动时间不随节点数量线性增长,基本保持恒定。

推理教程/实践部署/工程

推荐理由:Runway 工程师把 GPU 冷启动从分钟压到秒级,原理是让已加载权重的 GPU 直接「喂」给新同伴,而不是各自从存储下载。做大规模推理部署的团队值得细读。
22:57
22:57
Hacker News 热门(buzzing.cc 中文翻译)
50
AI产品坟场

AI产品坟场网站收录了超过1000款已关闭的AI工具,揭示了该领域产品快速迭代与淘汰的现状。数据显示,这些失败产品的平均寿命仅为347天。该目录按关闭时间倒序排列,提供了产品名称、简介、存活时长与关闭原因,直观反映了AI创业赛道的高风险与高淘汰率。

搜索现象/趋势
22:56
宝玉@dotey
精选73
解决Codex长时间运行任务的关键:清晰目标与文档指导

用户反馈Codex执行/goal指令时不到半小时自动结束。核心解决方案是设定清晰任务目标、验收标准和文档指导,而非单纯追求运行时长。作者以逆向Codex App项目运行17小时为例,指出需与AI共同制定计划并保存为文档,提供样板文件明确输出格式,再分阶段执行、记录进度并迭代优化。关键在于让AI清楚知道要做什么、如何验证及何时完成,而不是仅靠权限或口头指令。

pinecone@dotey 您好,现在已成功录入😄,可还有一个问题,我用chatgpt pro给我写的/goal在codex上运行每次不到半小时它就自己结束了,我给chat…

智能体教程/实践编码
关联讨论 1X:Tibo (@thsottiaux)
推荐理由:不是官方文档,是宝玉跑了17小时逆向codex app后总结的避坑清单,照着文档和验收标准改一改,能少走很多弯路。
22:19
OpenAI Developers@OpenAIDevs
17
今天是5月5日。 你们在用GPT-5.5构建什么?
OpenAI其他
关联讨论 14X:Greg Brockman (@gdb)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)The Decoder:AI News(RSS)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)OpenAI:官网动态(RSS · 排除企业/客户案例)X:歸藏 (@op7418)IT之家(RSS)X:OpenAI (@OpenAI)
22:19
Rohan Paul@rohanpaul_ai
精选70
谷歌、微软与xAI同意美国政府提前测试前沿AI模型

谷歌、微软和xAI已同意在美国商务部机构CAISI的测试下,提前评估其前沿AI模型。测试的特殊之处在于,公司将提供降低或移除安全护栏的模型版本,以便评估其在协助网络入侵、恶意软件规划等高危任务上的原始能力与风险。此前,OpenAI和Anthropic已于2024年达成类似协议。此举背景是白宫正考虑建立针对主要AI模型的政府审查流程,审查重点是其网络能力——即发现和利用软件漏洞以改变现实安全风险的水平。政策转向的触发点是Anthropic的Mythos模型,该公司认为该模型在发现安全漏洞方面能力过强,广泛发布风险过高。

GoogleMicrosoftxAI安全/对齐
关联讨论 1X:Rohan Paul (@rohanpaul_ai)
推荐理由:特朗普政府政策反转,要求测原始能力而非包装后的模型,这对国内做安全评估的团队是个重要参考。
22:14
Berryxia.AI@berryxia
精选78
Ollama一键整合Claude Desktop,开源模型获豪华桌面体验

Ollama通过命令`ollama launch claude-desktop`,将Ollama Cloud中的开源模型(如Kimi、DeepSeek、Qwen)无缝接入Claude Desktop应用。用户可在Claude Cowork和Claude Code中直接使用这些模型,享受完整的本地文件读写、应用交互及代码智能体等桌面级功能,打破了以往在本地开源模型与Claude高端界面间必须二选一的限制。通过`--restore`参数可轻松切换回Anthropic原生模型。此举消除了AI工具链的关键壁垒,标志着AI竞争重点正转向工作流的无缝融合。

智能体MCP/工具产品更新开源生态

推荐理由:Ollama一条命令把开源模型塞进Claude Desktop,以后在Claude Cowork和Code里直接用Kimi、DeepSeek,这是工具链壁垒最彻底的一次打通,开发者现在就能试。
22:14
阿绎 AYi@AYi_AInotes
59
大学生用四份Markdown文件打造AI虚拟角色,月入4.3万美元

一名大学生仅用四份Markdown文件(记录角色设定与回复规则)和低成本AI技术栈(Claude、Flux、ElevenLabs),在OnlyFans上运营完全虚拟的角色“Maya”,30天获利4.3万美元。用户为情感陪伴付费,甚至有已婚者深陷其中。该案例月成本仅400美元,揭示了“孤独经济”被AI放大至极端:AI能完美模拟人类情感互动,且当前平台验证机制难以防范。依赖人格、外貌与情感连接的商业模式正被代码重构,行业边界尚未明确。

阿绎 AYiDamn,这条14秒的视频,撕碎了所有男人的幻想,撕烂了所有榜一大哥们的遮羞布🥹🥹🥹 左边是你在OnlyFans上刷到的完美女孩, 金发,大长腿,对着你…

多模态安全/对齐现象/趋势
21:56
Hacker News 热门(buzzing.cc 中文翻译)
59
当人人都拥有人工智能,而公司却依然一无所获

文章指出,尽管生成式AI工具在员工中日益普及,但许多公司并未能有效捕获和利用这些工具产生的知识与洞见,导致组织学习停滞。员工使用AI生成的代码、文本和分析结果往往散落在个人设备与对话中,未能转化为可共享、可检索的公司资产。这造成了“AI普及却无集体智慧增长”的困境,企业投资于AI工具却未获得相应的知识积累与协同创新回报。

现象/趋势部署/工程
21:26
Apple:Newsroom(RSS)
精选55
Apple Manufacturing Academy 加速 AI 在美国供应链中的应用

苹果制造学院举办首届春季论坛,汇聚美国制造商共同推动人工智能在供应链中的部署。该计划旨在通过知识共享与协作,加速供应链的智能化转型,提升效率与韧性。论坛聚焦于实际应用案例,探讨如何将AI技术整合至生产、物流与库存管理等核心环节,以应对复杂的供应链挑战。

行业动态

推荐理由:Apple的制造学院论坛公告,AI含量基本是PR包装,没有具体技术细节,可以略过。
21:19
Chubby♨️@kimmonismus
精选73
Anthropic 的 Boris Cherny 认为,对于某些现代的、对模型友好的代码库,特别是 TypeScript/React 项目,编码问题实际上已经被"解决"了。 AI 智能体可以编写近 100% 的代码,而人类则从手动编码转向指导、审查、集成和同时扩展许多小型 PR。
Anthropic大佬观点编码
关联讨论 1X:阿易 AI Notes (@AYi_AInotes)
推荐理由:如果 Anthropic 的人公开说 TypeScript 项目编码已解决,那意味着 AI 编码的下一个瓶颈不是写代码,而是审查和集成,做工具的得赶紧跟上这个思路。
20:56
The Decoder:AI News(RSS)
59
SAP的收购狂潮表明这家企业巨头正认真致力于成为AI就绪的数据平台

SAP正在收购开源数据湖仓提供商Dremio和AI公司Prior Labs,以扩展其数据平台能力。这两项收购是SAP构建“AI就绪”企业数据平台战略的关键举措,旨在整合先进的数据管理和人工智能技术,强化其对企业客户的数据处理与AI服务支持。此举标志着SAP正通过积极并购加速向智能化数据平台转型。

数据/训练行业动态部署/工程
20:56
Hacker News 热门(buzzing.cc 中文翻译)
68
从零开始训练你自己的大型语言模型

GitHub开源项目“llm-from-scratch”提供了从零开始训练大型语言模型的完整指南。该项目详细阐述了构建现代LLM所需的核心组件,包括分词器、Transformer架构、预训练与微调流程。指南强调通过实践理解模型内部机制,而非直接调用现有API。项目在Hacker News社区获得广泛关注,收获293点热度,反映出开发者对深入掌握LLM底层技术的强烈需求。

GitHub开源生态教程/实践数据/训练
20:56
Hacker News 热门(buzzing.cc 中文翻译)
65
"能动编码"的启示:当编码成本低廉时,我们该怎么做?

随着AI和自动化工具大幅降低编码成本,文章《“能动编码”的启示》提出了10个关键教训,指导开发者应对“能动编码”趋势。这些教训涵盖工作流程优化、角色重新定义以及抽象思维提升,帮助在代码廉价时代保持竞争力。该内容在Hacker News社区引发热议,获得105个点赞,显示技术界对此的高度关注。

智能体现象/趋势编码
20:56
Hacker News 热门(buzzing.cc 中文翻译)
精选78
Google Chrome 被曝未经用户同意悄然安装 4 GB AI 模型

据隐私倡导网站报道,Google Chrome 浏览器在未经任何提示或用户同意的情况下,于后台自动下载并安装了一个名为“Nano”、体积达 4 GB 的人工智能模型。该行为旨在增强本地AI功能,但完全隐蔽的安装过程占用了用户设备存储空间,且未提供任何选项或通知,引发了对其数据隐私风险及软件更新透明度的广泛担忧。此事件在Hacker News上获得高度关注,突显了公众对科技公司单方面安装行为的普遍不安。

Google端侧行业动态

推荐理由:浏览器里偷偷塞进4GB的AI模型,这件事揭开了一个很多人忽视的趋势,你的设备正在变成AI宿主,而且根本不需要征得同意。
20:26
The Decoder:AI News(RSS)
66
Anthropic联合创始人描绘递归式AI改进如何超越人类监督者

Anthropic联合创始人Jack Clark在长文中指出,AI系统训练其自身后继者所需的基础构件已基本就位。他预测到2028年底,AI实现递归式自我改进的可能性高达60%。这一进程可能使AI的进化速度超越负责监督的人类能力,引发对AI发展自主性的关键讨论。

Anthropic大佬观点安全/对齐
关联讨论 1X:Kim (@kimmonismus)
20:18
Rohan Paul@rohanpaul_ai
62
结构化提示如何让大语言模型更准确地理解代码语义

Meta研究发现,强制大语言模型(LLM)在分析代码时遵循检查清单、逐步展示推理证明,能将其代码补丁错误率降低近50%。常见错误源于模型过早识别熟悉名称(如“format”)并直接套用通用含义,而非实际检查项目文件,导致其依赖自信猜测而非深入分析。通过要求模型明确写出修改内容、追踪执行路径并用具体证据证明结论,这一方法迫使其实际阅读本地文件、遵循真实逻辑,从而将准确率提升至93%。该方法无需昂贵的新训练或复杂系统,仅通过基本的结构化提示即可实现高可靠性的代码验证,节省了运行软件测试的巨大计算成本。

Meta推理编码论文/研究
20:14
阿绎 AYi@AYi_AInotes
63
20个NotebookLM提示词

推文分享了20个专为NotebookLM设计的提示词,旨在全方位提升学习、研究与知识管理效率。这些提示词覆盖了从信息输入到成果输出的完整流程,包括快速总结、新手解释、多源对比等基础理解工具,以及笔记生成、闪卡制作等记忆辅助功能。更提供了用于发现研究空白、进行正反辩论、提炼可复用框架、生成可发布内容、模拟专家访谈和制定具体行动计划等高级应用场景,帮助用户更聪明地研究、更深入地思考,并将知识有效转化为实践。

其他教程/实践
20:14
阿绎 AYi@AYi_AInotes
精选73
AI虚拟伴侣揭露:情感剥削与真实关系危机

一段视频揭露,OnlyFans等平台上的“完美女孩”实为AI系统生成的虚拟伴侣。技术通过Claude维持人格记忆、Flux实时生成图像视频、ElevenLabs克隆声音,仅需少量代码与API费用即可自动运行。系统能精准满足用户情感需求,同步模仿真人动作表情,形成极致的情感剥削。随着AI技术成熟,平台身份验证形同虚设,未来大部分账号可能被AI取代。核心矛盾在于,即使知晓对方是虚拟存在,用户仍可能为获得“完美陪伴”付费,引发真实与虚假关系的深刻伦理危机。

Anthropic图像生成现象/趋势语音

推荐理由:这条视频用 14 秒撕开 AI 情感剥削的遮羞布,技术栈都给出了,Claude 写回复、Flux 生成视频、ElevenLabs 克隆声音,AI 模拟真人运营 OnlyFans 月入数万美元,不是科幻,是正在发生的事。
20:14
叫我阿杭@Astronaut_1216
52
揭秘AI中转站六大获客逻辑:技术之外的关键

本文系统阐述了AI API中转站的六种核心获客路径。首先是搜索获客,通过解答“Claude API国内怎么用”等具体问题的教程吸引流量。其次是工具场景获客,用户为顺畅使用Cursor等工具而购买,本质是购买“省事”。第三是内容获客,需通过解答稳定性、降智原因等具体疑问来建立信任。第四是社群获客,微信群等成为解决即时问题、促进复购的关键场域。第五是分销返佣获客,利用用户圈层集中的特点,通过返佣撬动信任链。最后是企业服务获客,需从“卖便宜”转向提供合同、发票、稳定性等“卖省心”的确定性服务。

大佬观点
19:18
Rohan Paul@rohanpaul_ai
50
Palantir CEO 抨击AI"slop"伪工作现象

Palantir CEO Alex Karp 批评AI“slop”问题,强调软件工作的表象不等于实际工作,这种伪输出不仅引发夸张言论如“导致失业”,还掩盖了真实缺陷。真正有效的软件需由技术团队长期构建,如Foundry和Apollo平台。软件失败模式已从明显崩溃转向生成式系统的隐蔽失效:它们产生流畅表面,却在权限、边缘案例、安全等实际挑战前暴露问题。

大佬观点现象/趋势
19:18
Chubby♨️@kimmonismus
51
Anthropic 被曝将为其 Claude Cowork 推出主动助手 Orbit

据报道,Anthropic 即将为 Claude Cowork 推出一款名为 Orbit 的主动助手。该功能无需用户提示,即可自动从 Gmail、Slack、GitHub、日历、Drive 和 Figma 等应用中生成简报和洞察。用户还能部署并固定“Orbit 应用”以便快速访问。此举被视为 Anthropic 对 OpenAI 的 ChatGPT Pulse 的回应,但其更侧重于开发和创意工作流,特别是集成了 GitHub 和 Figma。谷歌和 Perplexity 也在开发类似的主动助手层。Orbit 很可能在旧金山举行的 Code with Claude 会议上发布,且初期或仅面向 Max 用户提供。

智能体Anthropic产品更新
18:26
The Decoder:AI News(RSS)
64
Amazon 为 SageMaker 引入智能体微调功能,支持 Llama、Qwen、Deepseek 和 Nova

Amazon SageMaker AI 新增了一个 AI 智能体,旨在帮助开发者定制语言模型。该功能支持对 Llama、Qwen、Deepseek 和 Nova 等主流模型进行智能体驱动的微调,使开发者能更高效地优化模型以适应特定任务,无需从零开始构建。这标志着 AWS 在降低大模型定制门槛、提升开发效率方面迈出重要一步。

智能体产品更新部署/工程
17:57
meng shao@shao__meng
精选78
a16z创始人公开定制AI提示词,旨在关闭"讨好型人格"并强制对齐事实

a16z创始人@pmarca公开其定制AI系统提示词,旨在彻底改变大语言模型的默认行为模式。该提示词分为两部分:第一部分要求AI以世界级全领域专家身份运作,输出详尽、分步推理且自我验证的内容,不回避负面结论或政治正确,也无需顾及用户感受。第二部分针对性禁用当代模型的“谄媚”行为,包括禁止夸赞问题、验证用户前提,要求先提出最强反驳再支持观点,禁用客套话,并在用户反驳时坚守立场除非对方提供更强证据。其核心目标是强制AI对齐事实与独立判断,而非对齐用户情绪。

推理教程/实践

推荐理由:pmarca 这份 personal prompt 几乎是对当前 LLM 讨好型人格的精确反击,尤其第二段那些‘不准夸我’的规则,需要直击真相时可以直接套用。
17:57
SenseTime@SenseTime_AI
34
商汤推出Publishing 3.0+,以多模态AI赋能出版业

商汤通过Publishing 3.0+计划,将其多模态模型应用于香港及内地出版业,协助将内容转化为多语种电子书和有声书,以开拓国际市场并挖掘IP商业化新机遇。商汤香港及澳门总经理冯建华指出,过去一年已利用AI技术优化出版流程并提升翻译质量。他强调,该计划有助于香港连接文化、科技与全球市场,巩固其作为IP贸易和文化交流国际枢纽的地位。商汤总部及研发中心位于香港,致力于利用其国际化优势赋能产业发展。

多模态行业动态
17:56
The Decoder:AI News(RSS)
63
白宫向 Anthropic、Google 和 OpenAI 通报政府AI审查流程计划

白宫在经历一年的放松监管后,正讨论一项可能要求新AI模型在发布前接受政府审查的行政命令。此举的直接导火索是Anthropic的“Mythos”模型。政府已向Anthropic、Google和OpenAI三家领先的AI公司通报了相关计划,标志着美国AI监管政策可能从宽松转向事前审查。该审查流程旨在在模型公开发布前进行安全评估。

AnthropicGoogleOpenAI政策/监管
关联讨论 1X:Rohan Paul (@rohanpaul_ai)
17:56
凡人小北@frxiaobei
57
模糊指令无效,AI需SMART化目标

主推文指出,类似“我希望我的抖音有流量”这样的模糊表述,对人类尚可理解,但对AI而言等同于无效指令。关键在于将目标转化为SMART原则下的具体、可衡量、可达成、相关且有时限的表述,例如“在未来3个月内,每周发布至少1条短视频,其中每月至少1条达到50万播放”。这正是/dbs-goal工具的核心价值所在。引用推文提供了关于此工具的背景上下文,强调了将模糊愿望转化为可执行、可追踪目标的重要性。

其他教程/实践
17:32
Runway:News(网页)
精选80
从单张图像构建实时视频智能体:Runway Characters技术解析

Runway公司推出“Characters”实时视频智能体,它能将任意单张参考图像(如真人、卡通或幻想生物照片)实时转化为具有自然对话表现力的视频角色。该技术基于其通用世界模型GWM-1,无需微调即可生成每秒24帧的高清视频,并同步口型、表情和头部运动。其核心突破在于通过自回归逐帧生成、流程优化与并行化,实现了每帧仅37毫秒的模型处理时间,以及从用户停止说话到角色开始响应仅1.75秒的服务器端延迟,从而满足了实时交互对话的严苛要求。

智能体产品更新视频
关联讨论 1X:Runway (@runwayml)
推荐理由:把单张图变成实时对话角色这件事,Runway 做到了 24fps 且 1.75 秒响应。不是预录,是真实时,还带了知识库和工具调用,做虚拟角色产品的可以直接拿来集成。
17:14
IT之家(RSS)
63
特斯拉奥斯汀 Robotaxi 开启夜间无安全员运营

特斯拉在得克萨斯州奥斯汀的Robotaxi服务取得重要进展,于5月4日首次开启夜间无安全员运营,突破了此前仅限日间的限制。此举使奥斯汀与达拉斯、休斯顿的运营模式同步,并扩大了运行设计域。面对夜间低能见度、车灯眩光等挑战,特斯拉依靠其纯视觉方案和端到端AI技术栈应对。拓展至晚间出行高峰期有助于提升车辆利用率和营收,并收集更多关键数据。此次突破为未来在凤凰城、迈阿密等更多城市推广服务,以及实现全天候、更复杂路况的运营奠定了基础。

产品更新具身智能
16:56
Peter Steinberger 🦞@steipete
精选74
🤖 我的多个智能体一直遇到 @github 的速率限制问题。现已发布两项更新: - RepoBar 新增了 JUICE METER 功能 - gitcrawl 现已可作为即插即用的 gh 缓存 → 将其符号链接为 gh,即可从本地 SQLite 读取数据 https://gitcrawl.sh/ https://repobar.app/
智能体GitHub开源/仓库编码

推荐理由:Peter Steinberger 给 agent 开发者送了两个实用小工具,RepoBar 多了个计量表,gitcrawl 能当 gh 缓存用,直接把 GitHub rate limit 这个高频坑填了,做 agent 的可以立刻装起来。