4月29日
03:07
Rohan Paul@rohanpaul_ai
62
谷歌退出美军无人机集群竞赛,科技巨头军事AI立场仍存分歧

彭博社报道,谷歌在入围后决定退出美国国防部一项价值1亿美元的无人机集群竞赛。该项目旨在将语音指令转化为对自主无人机群的机器指令。谷歌的退出并非由于技术能力不足,而更多源于公司内部对愿意承担的国防工作类型设定了限制。这一事件凸显了大型科技公司在军事人工智能应用上仍然存在深刻分歧。

Google安全/对齐行业动态
02:36
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
43
AI生成内容三年席卷三分之一网站

截至2025年中,已有约三分之一的网站内容由AI生成,而在三年前这一比例近乎为零。斯坦福AI研究员Jonáš Doležal指出,互联网在短短三年内经历了由人类主导到AI定义重大部分的急速转变,其速度令人震惊。相关背景信息显示,AI生成内容已在文章、视频、音乐及广告等多个领域占据显著比例,例如近半数歌曲、多数平台头部频道及广告内容已由AI创作,标志着数字景观正在被AI快速重塑。

安全/对齐现象/趋势
02:35
阿绎 AYi@AYi_AInotes
57
Claude接入八大创意工具,AI进入原生协作时代

Claude宣布接入Blender、Adobe、Autodesk等八个创意行业核心工具,标志着AI应用从聊天框生成转向深度嵌入专业工作流。用户可直接在软件内部调试场景、批量修改对象或编写脚本,处理重复性任务。这代表AI竞争焦点已从模型规模转向与普通人工作流的无缝融合,对创作者而言,掌握这类连接器比追逐新模型更具实际价值。

AnthropicMCP/工具产品更新
关联讨论 2X:Rohan Paul (@rohanpaul_ai)Anthropic:Newsroom(网页)
02:35
02:35
02:18
Suno@suno
精选70
如何在60秒内制作伴奏音轨。
多模态教程/实践

推荐理由:虽然只是 Suno 的官方教程,但这 60 秒的视频把生成伴奏这件事儿讲得明明白白,对于想快速出 demo 的音乐创作者来说,是个能立刻用上的实用技巧。
02:11
02:10
宝玉@dotey
68
多校联合综述提出统一框架,厘清"世界模型"概念割裂问题

针对“世界模型”概念在强化学习、视频生成等不同社区含义割裂的问题,一篇由港科大、新加坡国立、牛津等多所高校联合发表的综述提出了“能力等级×领域法则”的二维统一框架。能力分为L1预测器、L2模拟器和L3进化器;领域涵盖物理、数字、社会和科学世界。综述发现,当前视频生成模型物理一致性差,LLM社会模拟存在行为偏差,而L3能力在自动化科学实验中最成熟。论文最后指出,神经网络隐式表示的规则在需要自我修正的L3阶段可能成为障碍,并引发了对世界模型终局形态的思考。

具身智能现象/趋势论文/研究
02:07
Chubby♨️@kimmonismus
54
NVIDIA发布Nemotron 3 Nano Omni,专为智能体感知层设计

NVIDIA推出Nemotron 3 Nano Omni模型,其定位并非通用聊天机器人,而是作为智能体系统中的轻量级感知模块。该模型采用30B-3B混合专家架构,在处理视觉、音频和文本多模态输入时,吞吐量可比同类开源全模态模型提升高达9倍。它旨在充当多智能体栈中的“眼睛和耳朵”,负责感知屏幕、文档和音频等信息,并将结构化上下文传递给如Nemotron Super(执行)和Ultra(规划)等推理层,从而优化大规模、高频率调用的智能体工作流。模型完全开源,现已登陆Hugging Face。

智能体开源生态模型发布
01:40
宝玉@dotey
66
活用AI Agent特性,让ChatGPT自行验证迭代任务

以ChatGPT、Claude Web为代表的工具已超越传统聊天机器人,成为具备虚拟运行环境和工具调用能力的AI Agent。利用这一特性,用户可以让AI在执行任务时自行进行验证和迭代,而非仅进行对话。例如,在要求其生成或优化图像提示词时,可指令AI先自行验证并根据结果迭代改进,用户最终验收迭代后的成果,这种方法通常能获得更优的结果。

智能体MCP/工具教程/实践
01:40
宝玉@dotey
53
AI终端工具Warp客户端正式开源,推行"人管方向,AI干活"新模式

现代终端工具Warp宣布将其客户端代码在GitHub上以AGPL协议开源,OpenAI为创始赞助商。Warp核心特色是深度集成AI,允许用户用自然语言生成命令。此次开源的独特之处在于其“AI优先”的社区贡献流程:由Warp自研的AI平台Oz负责执行写代码、测试等具体工作,社区成员主要进行方向决策与验证,旨在探索未来软件开发新模式。同步更新包括支持更多开源模型、可定制化界面及配置文件同步功能。创始人表示,AI Agent的爆发是促使其开源的关键,希望结合广泛贡献者与AI代理打造更优产品。需注意,服务端代码仍保持闭源。

开源/仓库编码部署/工程
01:37
Rohan Paul@rohanpaul_ai
51
Actian发布VectorAI DB:专为边缘环境设计的向量数据库,助力企业RAG部署

根据Menlo Ventures数据,51%的企业AI生产部署采用RAG技术,而仅9%主要依赖微调。Actian推出的VectorAI DB是一款专为云访问受限、延迟高或风险大的边缘环境设计的向量数据库。它支持在本地、边缘或物理隔离网络中运行RAG流水线、语义搜索和实时AI智能体,核心优势包括数据保留在内部网络、原生集成LangChain/LlamaIndex、实时索引更新以及混合搜索功能。该产品已通过黑客马拉松验证,应用于海事AI、设备端治疗师等场景,现正式向公众开放。

检索增强产品更新部署/工程
01:35
阿绎 AYi@AYi_AInotes
66
蚂蚁发布Ling-2.6-1T模型,以token效率革新生产级AI

蚂蚁集团AGI团队发布Ling-2.6-1T模型,其核心创新在于聚焦token效率而非参数规模。该模型采用MoE架构,每次推理仅激活7.4B参数,结合Linear Attention与Multi-Token Prediction技术,在保持接近GPT-5.4非推理水平的高智能同时,将token成本降至可比模型的四分之一。在Artificial Analysis评测中以极低消耗获得高分,并在SWE-bench等硬核Agent场景领先。该模型专为处理海量真实生产请求设计,旨在为高频Agent应用提供高效、低成本的解决方案,并通过免费API策略加速生态布局,预示AI竞赛重心正向真实生产成本效率转移。

阿绎 AYi后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和 官…

智能体模型发布部署/工程
01:11
凡人小北@frxiaobei
59
我的AI搭档Finn:从直接使用Agent到智能工作流管理的转变

作者不再直接与多个AI Agent交互,而是通过核心AI搭档Finn来管理整个工作流。具体流程是:先在Codex中将单个Agent或技能调试稳定,然后交由OpenClaw平台运行,后续基本无需干预。用户只需向Finn提出需求,由其协调其他Agent执行,避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具,并通过白名单、审计和能力边界限制确保安全。例如,处理年度烂账的流程被调试为固定技能后,Finn能自动填表、定时盘点并发送邮件,成为集私人助理、财务总监和技术总监于一身的角色。

智能体MCP/工具教程/实践
01:00
OpenRouter@OpenRouter
精选66
NVIDIA NemotronTM 3 Nano Omni 已在 OpenRouter 上线。 这是一个用于智能体工作流的开源 30B-A3B 多模态模型:文本、图像、视频和音频输入 → 文本输出,拥有 256k 上下文窗口和高效的 MoE 架构,适用于计算机使用、文档和音视频推理。
智能体产品更新多模态

推荐理由:Nemotron 3 Nano Omni 是 NVIDIA 在开源多模态模型上的新动作,30B 参数 MoE 架构、256k 上下文、四模态输入,做 Agent 工作流的开发者值得试一下,尤其文档和音视频推理场景。
00:41
向阳乔木@vista8
68
OpenAI研究员离职观点:后训练前沿与AI依赖风险

基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。

大佬观点安全/对齐现象/趋势