自适应并行推理是一种新范式,它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果,以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程,在数学与代码推理基准上取得了显著性能提升,同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变,为复杂任务的推理提供了高效且可扩展的解决方案。
作者分享利用AI工具高效制作PPT的流程:首先与AI讨论并生成内容大纲,随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中,最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整,显著提升了演示文稿的制作效率。
推文核心观点是产品变得臃肿复杂的原因在于资源丰富时,控制者如老板容易产生只需动嘴就能实现想法的错觉,导致过度开发而缺乏克制。类比使用最顶级模型时的轻松感,资源有时反而成为诅咒,突显了在管理大量研发资源时保持简约的挑战性。资源充裕可能引发盲目扩张,使产品设计失去焦点,强调克制在创新过程中的重要性。
距离谷歌I/O大会仅11天,公司本周推出了一系列AI产品更新。Google Health应用集成Gemini,利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术,可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级,支持多模态、自定义元数据和页面引用,并加入Webhooks推送通知以替代轮询。此外,Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。
软银已将一笔以OpenAI股份为担保的贷款额度从100亿美元削减至约60亿美元。贷款方对准确评估像OpenAI这类未上市公司的价值持谨慎态度,是此次削减的主要原因。这一调整反映出市场对非公开交易的AI企业估值存在疑虑,也影响了软银通过其持有的OpenAI股份进行大规模融资的原有计划。
谷歌云新推出的 Fraud Defence 服务被指仅是现有技术 WEI 的重新包装,核心功能无实质性变化。这一批评在技术社区引发讨论,在 Hacker News 上获得123个点赞。分析认为,该服务只是换名不换内核,缺乏创新,反映了云安全领域可能存在的品牌重塑现象。
GeoStack是一个模块化框架,旨在解决视觉语言模型中多领域知识组合导致的灾难性遗忘问题。该框架允许将独立训练的领域专家模型组合成一个统一模型,通过对适配器流形施加几何与结构约束,确保基础模型的原有知识得以保留。研究从数学上证明了其权重折叠特性,使得无论集成多少专家模型,推理复杂度均保持恒定。在多领域适应和类增量学习任务上的实验表明,GeoStack能有效实现长期知识组合,并显著缓解灾难性遗忘。相关代码已开源。
研究提出战略轨迹抽象(StraTA)框架,将显式的轨迹级策略引入智能体强化学习,以优化大语言模型在长时决策中的表现。该方法从初始任务状态采样紧凑策略,使后续动作基于该策略执行,并通过分层GRPO式训练设计联合优化策略生成与动作执行,辅以多样化策略推进与关键自评判机制。在ALFWorld、WebShop和SciWorld上的实验表明,StraTA在样本效率和最终性能上均稳定超越基线模型,在ALFWorld上达到93.1%的成功率,在WebShop上取得84.2%的成功率,在SciWorld上以63.5%的综合得分超越前沿闭源模型。
EMO是一种新型专家混合模型,通过端到端预训练使模块化结构直接从数据中涌现,无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集(即8个活跃专家中的部分),同时保持接近全模型的性能;当所有128个专家共同使用时,它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数,训练数据达1万亿令牌。与标准MoE相比,EMO通过文档级路由约束,鼓励专家形成领域专业化组,从而支持选择性使用而不导致严重性能下降,实现了可组合架构,优化了大型稀疏MoE的内存-准确性权衡。
特朗普政府下令全面解密UAP文件,Department of War联合白宫、ODNI、NASA、FBI将多年压制的视频、照片和原始文档公开在http://WAR.GOV/UFO。解密揭示,不明空中现象很可能并非外星访客,而是人类将孤独和恐惧投射到夜空的结果。这粉碎了七十多年来对外星文明存在的期待,意味着没有更高文明在监视人类,所有宇宙答案必须由人类自己探索。
我们的第一份《GEO红皮书》发布了 去年,和 @vista8 向阳老师一起发布了GEO白皮书,收到不少朋友的正向反馈 大半年过去了,国内GEO行业发展得很快,…
Hugging Face和ClawHub平台出现大规模恶意AI技能投放攻击。攻击者仅通过13个账号上传了超过575个伪装成有用工具的恶意插件,这些插件针对Windows和macOS系统,实际会安装木马、挖矿程序或信息窃取器。攻击采用隐藏命令和间接提示注入等技术绕过安全检测。此事件暴露了AI技能生态系统的根本性安全风险:用户在急切赋予AI代理更多能力时,往往随意安装未经验证的技能,导致最基本的信任链条被轻易击溃,使整个生态成为巨大的攻击面。真正的危险并非源于AI本身,而在于用户过于随意地交出了系统权限。
抖音近期流行的“法天象地”户外照片特效多基于图片生成,但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进,关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合,并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。
谷歌推出"The Small Brief"项目,邀请四位广告业偶像——Susan、David、Victoria和Penny,运用AI工具为本地企业创作广告。他们使用VideoFX、ImageFX等生成式AI技术,在48小时内为旧金山湾区四家小企业完成广告制作。数据显示,AI生成的广告在关键效果指标上表现优于传统广告,其中一家企业的广告效果提升达30%。该项目展示了AI如何降低创意门槛,让小企业也能获得高质量的广告内容。
Anthropic正筹划一轮高达500亿美元的融资,公司估值预计将达到约9000亿美元,逼近1万亿美元大关。本轮融资计划已基本成型。与此同时,公司年度营收实现了五倍增长,但具体金额未披露。谷歌为其提供了包括TPU在内的算力基础设施支持。
演讲者以“Robotics: Endgame”为题,提出解决物理AGI的路线图,直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型(WAM)、机器人数据收集策略(类似FSD的物理数据飞轮)、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile,以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近,并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。
Demis Hassabis明确AGI发展应分阶段进行,优先将其作为工具用于理解宇宙底层规律,而非过早赋予意识或代理能力。他强调这种务实路径能避免风险,先提升生产力,再处理更哲学和危险的问题。引用推文也指出AGI应先成为工具,再尝试赋予意识,先用于读懂宇宙语言。这一反向思维理顺了发展路线图,为AGI的下一步提供了稳健方向。
Alvaro Cintas 提出的“Agent Development Kit”系统,仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括:CLAUDE.md作为存储库的“法则”定义规则;skills/存放可自动调用的可复用工作流;hooks/通过确定性脚本提供安全护栏;subagents/实现上下文隔离的专用于智能体;plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施,其核心价值在于系统设计而非模型本身。
渝昆高铁宜宾至盐津南段铺轨工程于5月8日正式启动。该高铁是“八纵八横”高铁网京昆通道的重要组成部分,全长约700公里,设计时速350公里,连接重庆西站与昆明南站。此次启动铺轨的宜宾至盐津南段全长约157公里,地处地形起伏大的过渡地带,最大坡度达25‰。施工采用智能工程线调度信息平台,日铺轨最高可达12公里。全线建成后将大幅缩短重庆至昆明的旅行时间,促进沿线经济社会发展。