AIHOT

4月30日

20:10

Berryxia.AI@berryxia

姚老师于GitHub开源一款AI教程生成工具。用户只需输入主题并提供参考资料，该工具即可以资料为核心，自动补充高质量素材并过滤低质信息，生成系统性的定制教程。教程支持PDF、Word和HTML格式输出，内容按章节组织，并能根据章节特点自动生成并插入图表。其设计融入了《课程营销学》的底层逻辑，排版借鉴了kami风格，确保了质感与规范。文末附有基于实际文章的生成示例。

姚金刚：开源一个教程Skill 打磨了十几版，效果还不错，已推到GitHub 如果想在五一假期高质量充电，或随时给自己生成一份定制高质量教程欢迎下载基本逻辑： …

开源/仓库教程/实践

20:10

Emad@EMostaque

你使用常规思维还是扩展思维来处理 GPT 5.5 Pro

OpenAI大佬观点

19:11

歸藏(guizang.ai)@op7418

Codex成功创建了类似《杀戮尖塔》的完整游戏关卡演示，细节精细，除声音外近乎完美。演示中的主要场景和角色素材由GPT-Image生成，其余素材由开发者自行收集。项目方宣布，安装包将于今晚或明天发布，同时整个代码将开源。

歸藏(guizang.ai)：太猛了，Codex 做类《杀戮尖塔》游戏完整关卡演示！现在非常细了，除了没有声音以外，其他的都相当完美了！主要的场景和角色素材是 GPT-Image 生…

OpenAI开源/仓库编码

19:10

阿绎 AYi@AYi_AInotes

LMArena文本榜显示，百度文心5.1 Preview以1476分位列国内第一、全球前十五，成为榜单中唯一国产模型，排名超过GPT-5.5等。尽管当前AI热点集中于Agent、多模态等领域，但DeepSeek V4与文心5.1 Preview仍以文本为核心。文章强调，文本能力是大模型的基础，代码、推理等多模态能力均从中"生长"，文本差距直接决定上层能力水平，因此仍是衡量模型差距的关键分水岭。

Berryxia.AI：今天看到一条容易被刷掉的消息，但越想越觉得有意思。 LMArena 文本榜最新更新，文心 5.1 Preview 拿下 1476 分，国内第一，全球前十五唯一…

DeepSeek评测/基准

18:10

Berryxia.AI@berryxia

文心5.1 Preview登顶国内文本榜，揭示文本能力仍是AI模型关键分水岭

文心5.1 Preview在LMArena文本榜以1476分位列国内第一，是全球前十五名中唯一的国产模型，排名超越GPT-5.5与DeepSeek-V4-Pro。尽管AI领域热点转向Agent与多模态，但DeepSeek V4与文心5.1等旗舰模型仍以文本为核心。作者强调文本能力是大模型的地基，代码、推理等多维度能力均由此衍生，地基差异直接影响上层性能，因此文本仍是模型拉开差距的关键分水岭。引用推文显示，文心5.1在数学、法律与政府、商业管理及软件服务等类别表现突出。

大佬观点推理模型发布

17:41

向阳乔木@vista8

开发者利用Codex成功生成了一个类《杀戮尖塔》游戏的完整关卡演示。该演示目前已经相当完善，主要缺陷仅在于缺少声音。演示中的核心视觉素材，如主要场景和角色，是由GPT-Image生成的，其余素材则由开发者自行补充。这一成果展示了AI在游戏内容生成方面的强大潜力。

OpenAI图像生成现象/趋势

17:10

歸藏(guizang.ai)@op7418

Codex展示了其强大的游戏开发能力，仅根据"制作类似《杀戮尖塔》的中国风格游戏"的简单指令，便自主完成了从代码编写到素材整合的完整可玩关卡。主要场景和角色素材由GPT-Image生成，其余素材由Codex自行寻找。最终成果是一个除声音外相当完善的游戏演示，凸显了AI在理解复杂指令并执行完整项目上的巨大潜力。

歸藏(guizang.ai)：我操，Codex 太牛逼了！自己给我做了一个类似于《杀戮尖塔》的爬塔游戏，从代码到素材全是自己搞。我就跟他说了一个要做类似《杀戮尖塔》的游戏，要中国风格…

OpenAI图像生成教程/实践编码

17:09

Rohan Paul@rohanpaul_ai

Sam Altman： "曾几何时，我们常常嘲笑那些只有想法、需要技术人员来实现的'点子王'。但现在，那些真正深刻理解用户却完全不会编程的人，我想资助这些人。"

OpenAI大佬观点现象/趋势

16:39

Rohan Paul@rohanpaul_ai

移除人为瓶颈，实现AI完全自主以提升效率

Andrej Karpathy指出，要最大化利用现有AI工具，关键在于将自身从交互循环中移除，避免成为持续提示的瓶颈。他主张构建完全自主的系统，通过最大化token吞吐量来实现高效率运作。核心目标是提升个人杠杆率：仅需偶尔投入极少量的token，就能驱动系统自动完成大量工作，从而使人从重复性操作中解放出来，专注于更高层次的决策与设计。

智能体大佬观点现象/趋势

16:09

SemiAnalysis@SemiAnalysis_

GB300 NVL72 在 DeepSeek-V4 Pro 上性能超 B200 6.5 倍

在 DeepSeek-V4 Pro 1.6T 模型上，采用机架级解耦设计的 GB300 NVL72 系统性能达到 B200 的 6.5 倍。这一高吞吐配置得益于 DeepSeek-AI 的 MegaMoe 内核，该内核将专家分派、专家组合及 GEMM 运算完全融合并重叠至单一内核中。性能突破由 Radixark、LMSYS 和 NVIDIA AI 的工程师团队快速实现。CoreWeave 为此项开源性能优化贡献了临时的 GB300 NVL72 机架资源，使整个社区受益。

DeepSeek推理评测/基准

16:09

meng shao@shao__meng

OpenAI 把 Responses API 提速 40%：为什么 Agent 时代，API 本身成了瓶颈？

OpenAI 最新工程博客指出，随着 GPT-5/5.2 及 Codex-Spark 等模型推理速度大幅提升（目标超1000 TPS），传统请求-响应 API 框架的固定开销成为 Agent 工作流的主要瓶颈。为此，OpenAI 为 Responses API 引入了 WebSocket 模式，通过保持长连接、在内存中缓存对话状态和已渲染 token，实现了跨工具调用的状态复用，避免了每次交互都重复预处理完整历史。此举使端到端延迟降低最多 40%，让 Codex-Spark 能稳定实现 1000 TPS 并峰值达 4000 TPS，显著提升了 Vercel AI SDK、Cline 和 Cursor 等集成的体验。

智能体OpenAI教程/实践部署/工程

16:09

DogeDesigner@cb_doge

OpenAI拥有所谓的人类强化学习，这相当于说他们有一大批人员查看ChatGPT的输出，然后判断其是否合适。本质上他们是在训练AI撒谎。 - Elon Musk

OpenAI大佬观点安全/对齐

16:09

Chubby♨️@kimmonismus

在Anthropic对其网络安全模型Mythos保持低调之际，OpenAI正抓住机会推出GPT-5.5-Cyber。该前沿网络安全模型将在未来几天内向关键网络防御者开放。OpenAI计划与整个生态系统及政府合作，建立可信访问机制，以快速帮助保护企业和基础设施安全。虽然该模型的全面推广范围和开放程度尚不明确，但此举已为OpenAI创造了积极声量，并形成了与Anthropic差异化的市场定位。

AnthropicOpenAI安全/对齐现象/趋势

15:39

向阳乔木@vista8

姚老师开源了一个名为"教程Skill"的AI工具。该工具允许用户输入任意主题和参考资料，AI会以参考资料为核心，自动补充高质量素材并过滤低质量信源，最终生成系统性的深度定制教程。教程内容按章节组织，AI能根据内容特点自行画图并插入相应模块。工具融合了《课程营销学》的底层方法论，并借鉴了kami的排版设计，最终可输出PDF、Word和HTML三种格式的文档，方便学习使用。项目已发布在GitHub上。

GitHub教程/实践

14:40

Berryxia.AI@berryxia

免费自定义工具监控标的更新，替代昂贵商业软件

作者推荐一种自定义工具，用于监控关注标的（如招标信息）的更新并自动推送通知。相比商业工具“招标助手”的高昂价格，自制工具更具自定义性和便利性，且完全免费。基于引用推文中@berryxia提供的文章，该工具附有详细教程，用户可免费注册和使用，实现高效信息追踪。

智能体教程/实践

14:37

阿绎 AYi@AYi_AInotes

Cursor推出Agent Kanban：看板即编程，开发者退居监控者

Cursor推出的Agent Kanban并非完整产品，而是一个鼓励开发者自行搭建的参考实现。其核心变革在于改变了开发者与代码的交互模式：从亲自编写，到用prompt指挥AI，如今演变为将任务抛入看板，由Agent自主认领、执行并更新状态，开发者则退居幕后监控进度，使任务待办列表本身成为一种“编程语言”。尽管当前原型存在运行时限、失败率等限制，且缺乏结果审核机制，但其关键启示在于促使开发者重新思考：为何还要亲自处理那些机械、可被清晰描述的重复杂任务。

智能体现象/趋势编码

13:37

阿绎 AYi@AYi_AInotes

内容运营和生图生视频通常依赖多个工具，但GPT Image 2的出现使旧工作流过时。作者尝试使用flowith，发现它能将提示词直接转化为完整输出：生成多个瑜伽动作分镜，并整合分镜图与人物图生成图片，再通过可灵模型制作视频，全部在一个工具内完成。Agent模式支持联网，能自动生成日期准确的海报日历。flowith作为一站式生图agent，简化了工作流，提高了效率。

铁锤人：做内容运营，生图生视频，你现在还在跑好几个工具吗？被朋友拉去做瑜伽图，搭了无数工作流 GPT Image 2 出来后，发现全废了得重新规划一套，但这几天…

智能体图像生成教程/实践视频

13:37

阿绎 AYi@AYi_AInotes

作者对当前同质化的SaaS开发感到倦怠，质疑为何"独立开发"总被默认为做软件。他列举了销售Notion模板、壁纸等非软件产品获得可观收入的例子。受此启发，他将自身营销经验应用于音乐赛道，启动实验项目"Milo Ever"。仅用一周时间，他便创作并发布了全新AI音乐专辑《The Small World to Remember》。该专辑包含12首关于童年记忆的歌曲，旨在探索独立开发的更多可能性，并已通过此前发行的AI音乐专辑获得了超过6400美元的收入。

Luo说不啰嗦：从上海 Let's Vision 2026 回来之后，我整整一个月几乎没写代码了。不是因为忙，是突然就觉得这件事没那么有意思了。这几年我反复经历一个…

多模态现象/趋势

13:09

Sam Altman@sama

对齐失败

Anthropic产品更新大佬观点安全/对齐

13:09

Ethan Mollick@emollick

微软和OpenAI在同一时间拥有完全相同的模型，却用它们做出了如此不同的事情，这真的很有趣。这是一个罕见的纯粹实验：一家无名初创公司和全球最大企业之一提供完全相同的产品。

MicrosoftOpenAI大佬观点

12:39

Nathan Lambert@natolambert

推文指出，当前AI访问权正被企业和政府双重控制：企业通过高价订阅实现软性垄断，而政府则以安全为由限制Mythos等系统的使用范围，且未给出清晰解释。这种控制将导致权力急剧集中，可能催生反乌托邦社会。作者认为，推动开源模型能力紧追闭源模型，是减少政治博弈和权力集中的关键途径。

Anthropic安全/对齐开源生态行业动态

12:39

Demis Hassabis@demishassabis

相当不错… 😀🚀

Google其他

12:15

宝玉@dotey

OpenAI调查模型为何频说"哥布林"与"小精灵"

OpenAI技术博客深入调查了其模型（从GPT-5.1到GPT-5.4）输出中“goblin”和“gremlin”等奇幻生物词汇异常激增的现象。根源在于ChatGPT的“Nerdy”性格定制功能：其奖励模型在训练中无意间高奖励了包含此类词汇的“俏皮”表达。尽管该性格仅占全部回复的2.5%，却贡献了超66%的“goblin”出现次数，并通过强化学习的反馈循环污染了模型的整体输出，形成了“tic词”。OpenAI已下架该性格并调整训练数据，但此案例揭示了微小的奖励信号在AI训练中可能被意外放大和泛化的核心难题。

OpenAI安全/对齐数据/训练论文/研究

12:09

Nathan Lambert@natolambert

Demis是"你最信任哪位CEO来掌管AGI"这个问题唯一可接受的答案（在Anthropic/OpenAI上市之前尤其如此，谷歌已上市是重要的制衡因素）

DeepMind大佬观点安全/对齐

12:09

Greg Brockman@gdb

一个关于有趣 ML 调试的故事

OpenAI大佬观点

12:09

Ethan Mollick@emollick

我认为Gemini聊天机器人具备了成为有用工具的所有要素，但难以将其整合起来。它似乎仍然不清楚自己能创建哪些文件，也不明白其工具之间如何协同工作。它还经常显得"气馁"，宁愿放弃而不是寻找新的解决方案。

Google大佬观点

12:09

Demis Hassabis@demishassabis

还不错… 🚀

Google其他

11:45

宝玉@dotey

极简线条与色彩点缀的插画提示词

该推文赞赏一个用于生成极简风格插画的提示词。其核心要求是：用干净纤细的线条描绘主体，整体采用黑白或低饱和色调，仅在局部添加鲜明色彩作为焦点。画面强调大量留白与精致构图，追求现代杂志编辑般的简洁、优雅高级感，并避免复杂背景或写实元素。推文引用的“Minimal Line + Color Accent Illustrations”模板也体现了同样的极简美学。

图像生成教程/实践

11:44

Eric@ericmitchellai

你可以说团队真正进入了 goblin模式来解决这一个

其他

11:44

DogeDesigner@cb_doge

我对像Google、Gemini、OpenAI和Meta这样的公司有一个担忧，即它们并非在最大限度地追求真相。它们的人工智能正在迎合政治正确，并被训练去说谎。对人工智能来说最安全的是最大限度地追求真相，即使真相不受欢迎。

大佬观点安全/对齐

11:43

Tibo@thsottiaux

OpenAI现象/趋势

11:42

dax@thdxr

厌倦了这些错误信息，所以我们制作了一个视频来揭示 anthropic 与 opencode 争议背后的真相

Anthropic大佬观点编码

11:42

OpenAI@OpenAI

我们正在谈论哥布林。 https：//openai.com/index/where-the-goblins-came-from/

OpenAI其他

11:40

Berryxia.AI@berryxia

以邮件为入口，让AI代理自动化处理招投标信息

作者分享了一个将AI代理（“龙虾”）融入实际工作流的案例。核心在于利用ClawEmail为AI代理提供一个可编程的邮箱接口，使其能通过邮件接收和处理指令。结合XCrawl（网页抓取工具）获取公开的招投标公告信息，并整合飞书进行结果同步。这一组合解决了教育行业投标信息分散、需人工频繁刷网站的问题，实现了从信息发现到整理分发的自动化。关键在于，AI工具的价值不在于其模型本身多强大，而在于能否无缝嵌入现有、稳定的工作流（如邮件），从而真正提升效率。

智能体MCP/工具教程/实践

11:40

Berryxia.AI@berryxia

利用AI与邮箱构建自动投标监控系统，实现高效工作流

作者结合ClawEmail、XCrawl等工具，为公司商务助理开发了一套自动投标监控系统。该系统能自动抓取招标公告，筛选出苹果、Mac或服务器相关项目，并结构化提取关键信息，随后自动通知同事并更新飞书表格。全程零配置，仅需会发邮件即可驱动，体现了邮箱作为AI时代低门槛、高效工作流入口的价值。

智能体MCP/工具教程/实践

11:39

OpenAI Developers@OpenAIDevs

在Codex中进行哥布林最大化

OpenAI其他

11:38

Ethan Mollick@emollick

高级AI模型网络安全风险引担忧，监管缺失致企业决策各异

基于现有信息，Mythos是一款在网络安全方面表现优异的高级通用AI模型，并非专业网络安全模型。出于对网络安全风险的担忧，Anthropic将其设为受限制模型并引起政府关注。而即将或已达到相同能力阈值的OpenAI和Google，可能因不同的风险评估或对自身防护措施的自信，做出不同的发布决策。目前，模型网络安全风险程度完全依赖企业自我报告，缺乏外部监管。这引发了Anthropic是否因自我限制而处于竞争劣势，以及其他公司会否面临类似限制的疑问，当前局势尚不明朗。

Anthropic大佬观点安全/对齐政策/监管

11:37

叫我阿杭@Astronaut_1216

我好奇现在你们做内容还在一天用五个小时写口播稿然后出视频都不用AI吗？

现象/趋势视频

11:36

ChatGPT@ChatGPTapp

"向下向下前往哥布林镇去吧，我的小伙子！" - 《霍比特人》，JRR 托尔金【引用 @OpenAI】：我们在谈论哥布林。 https：//openai.com/index/where-the-goblins-came-from/

OpenAI安全/对齐现象/趋势

11:13

Tibo@thsottiaux

关于OpenAI的许多事情可以通过一个认识来理解：我们很多人都相信，我们可以同时深切关怀、做出人生中最好的工作，并且享受乐趣。这里没有妖怪可看。

OpenAI其他