5月9日
01:27
BAIR:Berkeley AI Research Blog
精选64
自适应并行推理:高效推理扩展的新范式

自适应并行推理是一种新范式,它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果,以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程,在数学与代码推理基准上取得了显著性能提升,同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变,为复杂任务的推理提供了高效且可扩展的解决方案。

推理现象/趋势部署/工程

推荐理由:模型自己决定何时并行、开几个线程,这篇BAIR博客把Multiverse和ThreadWeaver的系统设计掰开了讲,做推理系统和RL的同学应该看看。
01:26
向阳乔木@vista8
61
AI辅助快速制作PPT的实战方法

作者分享利用AI工具高效制作PPT的流程:首先与AI讨论并生成内容大纲,随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中,最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整,显著提升了演示文稿的制作效率。

图像生成教程/实践
01:26
向阳乔木@vista8
22
资源诅咒:产品臃肿源于老板视角与克制之难

推文核心观点是产品变得臃肿复杂的原因在于资源丰富时,控制者如老板容易产生只需动嘴就能实现想法的错觉,导致过度开发而缺乏克制。类比使用最顶级模型时的轻松感,资源有时反而成为诅咒,突显了在管理大量研发资源时保持简约的挑战性。资源充裕可能引发盲目扩张,使产品设计失去焦点,强调克制在创新过程中的重要性。

大佬观点现象/趋势
00:54
00:47
Hacker News 热门(buzzing.cc 中文翻译)
35
Google Cloud Fraud Defence 不过是 WEI 的换汤不换药

谷歌云新推出的 Fraud Defence 服务被指仅是现有技术 WEI 的重新包装,核心功能无实质性变化。这一批评在技术社区引发讨论,在 Hacker News 上获得123个点赞。分析认为,该服务只是换名不换内核,缺乏创新,反映了云安全领域可能存在的品牌重塑现象。

Google安全/对齐现象/趋势
5月8日
23:35
Berryxia.AI@berryxia
10
特朗普政府解密UAP文件,外星人幻想破灭

特朗普政府下令全面解密UAP文件,Department of War联合白宫、ODNI、NASA、FBI将多年压制的视频、照片和原始文档公开在http://WAR.GOV/UFO。解密揭示,不明空中现象很可能并非外星访客,而是人类将孤独和恐惧投射到夜空的结果。这粉碎了七十多年来对外星文明存在的期待,意味着没有更高文明在监视人类,所有宇宙答案必须由人类自己探索。

其他行业动态
23:35
Berryxia.AI@berryxia
66
作者免费发布《GEO红皮书》,旨在整治GEO行业黑帽手段、割韭菜等乱象。基于前沿论文、生成式AI法规和实战经验,红皮书系统拆解55种GEO风险,提供自查清单和治理框架,帮助中小企业在AI时代规范营销,促进行业回归理性。

姚金刚我们的第一份《GEO红皮书》发布了 去年,和 @vista8 向阳老师一起发布了GEO白皮书,收到不少朋友的正向反馈 大半年过去了,国内GEO行业发展得很快,…

搜索教程/实践
23:33
歸藏(guizang.ai)@op7418
精选72
抖音"法天象地"特效:从图片生成到视频优化的突破

抖音近期流行的“法天象地”户外照片特效多基于图片生成,但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进,关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合,并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。

图像生成教程/实践视频

推荐理由:歸藏把抖音上火的“法天象地”从静态图片升级成视频,并且直接给了优化过的提示词,想做同款短视频的可以直接抄。
22:50
Jim Fan@DrJimFan
精选79
机器人终局:物理AGI路线图与LLM类比

演讲者以“Robotics: Endgame”为题,提出解决物理AGI的路线图,直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型(WAM)、机器人数据收集策略(类似FSD的物理数据飞轮)、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile,以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近,并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。

具身智能大佬观点

推荐理由:Jim Fan 这 20 分钟把机器人做成了 LLM 的平行故事,从 World Action Models 到 Dexterity Scaling Law,信息密度大到建议 0.5 倍速,做硬件的该换地图了。
20:33
Berryxia.AI@berryxia
63
Demis Hassabis:AGI应先作工具,再考虑意识

Demis Hassabis明确AGI发展应分阶段进行,优先将其作为工具用于理解宇宙底层规律,而非过早赋予意识或代理能力。他强调这种务实路径能避免风险,先提升生产力,再处理更哲学和危险的问题。引用推文也指出AGI应先成为工具,再尝试赋予意识,先用于读懂宇宙语言。这一反向思维理顺了发展路线图,为AGI的下一步提供了稳健方向。

DeepMind大佬观点安全/对齐
20:33
Berryxia.AI@berryxia
精选71
别自己瞎折腾Claude Code 了!

Alvaro Cintas 提出的“Agent Development Kit”系统,仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括:CLAUDE.md作为存储库的“法则”定义规则;skills/存放可自动调用的可复用工作流;hooks/通过确定性脚本提供安全护栏;subagents/实现上下文隔离的专用于智能体;plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施,其核心价值在于系统设计而非模型本身。

智能体Anthropic教程/实践编码

推荐理由:Alvaro 这个5文件夹系统把 Claude Code 从聪明助手变成了可复制的开发团队,skills 和 hooks 的设计尤其有启发性,用 Claude Code 的人可以直接抄作业。
19:20
IT之家(RSS)
59
斯坦福 AI 教授安杰尼 · 米达:若想让美国人接受数据中心,企业得先学会共情

斯坦福AI教授安杰尼·米达指出,美国科技公司需以共情和透明沟通应对数据中心建设阻力。越来越多地方社区因担忧电费上涨、环境影响和生活质量下降而反对新建数据中心,皮尤报告显示43%受访者认为数据中心推高了其电费账单。米达强调,科技公司应清晰说明数据中心对社区的实际影响与建设目的,主动倾听社区意见,否则将面临重大阻力。部分政界人士已提议暂停新项目审批。他认为,在基础设施扩张中平衡技术需求与社区关切,通过类似“营养成分标签”的透明信息缩小分歧,是推动AI发展的关键。

现象/趋势部署/工程
18:49
向阳乔木@vista8
32
GEO行业乱象丛生,《红皮书》助力企业理性营销

作者与姚老师继年初发布《GEO白皮书》后,观察到行业在2025年出现严重变质,黑帽GEO手段泛滥、服务商良莠不齐、虚假承诺盛行,甚至被央视315点名。为促使行业回归理性,帮助中小企业有效利用AI进行营销,他们结合前沿学术论文、相关法规及自身实战经验,整理发布了《GEO红皮书》。该书旨在揭露黑帽GEO手法、提供服务商甄别指南,并给出风险自查清单,以协助企业规避陷阱,目前可免费获取。

其他搜索现象/趋势
18:44
meng shao@shao__meng
12
创业起点新潮流:从车库到法国城堡

创业起点正突破传统的“车库”模式。@dottxtai 团队选择在法国城堡开启创业,引发对多元创业场所的讨论。中国创业者常从共享办公空间、居民楼或别墅起步。推文引用 @remilouf 的观点,认为车库创业已显乏味,城堡等独特地点为创业故事注入新意。这反映了创业文化中对环境创新性与象征意义的日益重视。

其他
17:26
-Zho-@ZHO_ZHO_ZHO
52
AI图像生成未达设计标准,保罗·兰德阐释设计本质

推文引用设计师保罗·兰德的观点,指出仅将视觉元素进行美观排列不等于好的布局,这是对平面设计师职能的误解。作者借此解释当前AI图像生成技术为何尚未达到真正的设计标准。兰德强调,设计超越表面的视觉组合,涉及更深层的构思与判断,而这正是当前AI所缺乏的核心能力。

图像生成大佬观点
17:21
ginobefun@hongming731
60
语音AI成为主交互界面,AI智能体系统自主性增强

OpenAI发布GPT-Realtime-2等实时语音模型,将高级推理能力引入语音交互,推动其从辅助转向核心界面。ElevenLabs年收入达4亿美元,并强调情绪智能与音频水印。Anthropic因80倍增长面临算力挑战,与SpaceX合作获取大规模计算能力,同时升级Claude托管智能体,使其具备自我改进与多智能体协作能力。行业趋势显示,AI正从工具演变为能自主运行的智能体系统,这给GitHub等基础设施带来了新的负载压力。

智能体AnthropicOpenAI现象/趋势
17:21
ginobefun@hongming731
46
语音AI模型显著提升,编程范式加速变革

BestBlogs 周刊 #94|语音 AI 突围 本周主线:OpenAI 发布了三个实时语音模型,GPT-Realtime-2 实测通话成功率从69%提升到95%。ElevenLabs 年收入4亿美元,下一个方向是情绪智能。Anthropic 增长80倍,算力成为核心瓶颈。 同时 AI 编程范式加速:Claude Code 创作者日均150个PR,GitHub 被 AI 流量压到86%可用性。 播客和图文都已上线 ↓

AnthropicOpenAI现象/趋势编码
17:15
小互@xiaohu
58
Claude开发者大会展示Cardputer实体交互设备

Cardputer是Anthropic在Claude开发者大会上推出的售价29.9美元的实体设备,通过WiFi连接电脑,支持键盘输入问题由Claude处理并显示结果、语音对讲经STT/TTS转换交互,以及作为Claude实体宠物显示动态像素动物,还可接入OpenClaw平台扩展语音功能。

Anthropic教程/实践端侧语音
16:23
Hugging Face:Blog(RSS)
精选70
在AMD ROCm平台微调临床问答模型MedQA:无需CUDA

一篇博客介绍了在AMD ROCm开源计算平台上微调临床问答AI模型MedQA的实践。该工作成功摆脱了对英伟达CUDA生态的依赖,证明了在AMD GPU上高效运行并适配医疗领域大模型的可行性。此案例源于Lablab.ai与AMD联合举办的开发者黑客松,为在非CUDA环境中进行AI训练提供了具体的技术参考。

Hugging Face教程/实践数据/训练

推荐理由:如果你手头只有AMD显卡却想跑医疗AI微调,这篇官方教程把ROCm实操流程讲透了,填补了生态里一个不小的空缺。
15:23
15:16
IT之家(RSS)
63
新研究点破 AI 生图弱点:透视线和阴影最容易露馅

《科学》最新研究指出,AI图像生成器虽已修复畸形手指等早期缺陷,但在光照、阴影、反射和透视几何上仍存在明显破绽。研究者指出,鉴别重点已转向“物理规则是否合理”。AI生成的图片因色彩鲜艳、戏剧感强,更接近大众对现实的想象,故易于传播。论文推荐通过检查“消失点”来鉴别:现实中平行线应汇聚于同一点,若图像中线条无法合理相交,则空间关系不成立。此方法同样适用于分析反射与阴影的平行光透视规律。

图像生成安全/对齐教程/实践
15:14
向阳乔木@vista8
精选71
Codex Chrome插件安装使用注意事项

安装Codex Chrome插件需注意:确保Codex为最新版本并使用官方订阅登录,第三方API模式不支持。插件安装对网络节点有要求,部分区域(如香港)可能无法使用。建议将Chrome设为默认浏览器以便引导。安装后,需在对话中通过“@ Chrome”指令调用。若连接失败,可尝试重启电脑。

智能体教程/实践部署/工程
关联讨论 11X:OpenAI (@OpenAI)X:OpenAI Developers (@OpenAIDevs)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)IT之家(RSS)
推荐理由:向阳乔木第一时间踩坑Codex Chrome插件,总结的四个坑都很具体,尤其第三方API不支持插件这点没试过的肯定会踩,想用电脑操作的先看这个能省半小时。
13:43