AIHOT

5月8日

07:21

Berryxia.AI@berryxia

推文作者质疑一则关于"中国交易员"利用自动化系统在六个月内赚取18万美元的传闻真实性。传闻描述该交易员通过N8N构建六个工作流，整合Readwise、Whisper API等服务，自动将文章、播客和语音笔记存入Obsidian知识库。每天早晨6点，神经网络分析师分析新旧信息关联，生成三个交易策略，系统仅在策略置信度超过90%或与现有论点矛盾时推送通知。月成本约120美元，据称可替代八人量化团队。但作者指出故事缺乏具体人物信息，可能属于虚构，并表达了对这些"同胞"真实身份的好奇。

智能体大佬观点

07:21

Berryxia.AI@berryxia

神经网络居然"说的是英语，想的却是形状"

Goodfire AI提出“神经几何”概念，揭示神经网络内部并非离散特征，而是由丰富、弯曲的几何结构构成。例如，星期几在激活空间中呈现为圆形流形，“mountain car”世界模型中的位置则编码为弯曲路径。沿这些几何结构操作能实现连贯、可控的模型行为，而传统线性插值会导致输出混乱。该研究将其视为理解、调试和精准控制AI模型的关键前沿，并指出当前流行的SAE方法因碎片化处理而难以捕捉整体语义。相关系列研究已开始发布。

大佬观点安全/对齐

07:13

Tibo@thsottiaux

精选75

你好Chrome，我是Codex 【引用 @OpenAI】：Codex现可直接在macOS和Windows的Chrome中运行。它能更好地处理Chrome中的应用和网站，并可在后台跨标签页并行工作，而不会占用浏览器控制权。请先在Codex应用中安装Chrome插件以开始使用。

智能体OpenAI产品更新编码

关联讨论 6 条

推荐理由：Codex 终于直接进 Chrome 了，支持后台并行操作还不抢浏览器，这对用浏览器做自动化的开发者是个实打实的好消息，装个插件就能用。

07:09

Ethan Mollick@emollick

Mythos确实不是营销炒作。请记住这是一个通用模型，恰好擅长发现漏洞，因为优秀模型本就具备多重能力。预计OpenAI和谷歌也会有类似表现。开源模型在8个月内也将如此。https：//hacks.mozilla.org/2026/05/behind-the-scenes-hardening-firefox/

大佬观点安全/对齐开源生态

07:05

OpenRouter@OpenRouter

现已在OpenRouter上线：@recraftai。 Recraft V4是一款为高审美调校的图像生成模型--具备艺术指导的构图、光影与色彩，呈现精心设计感而非素材堆砌。该模型与艺术家和设计师共同打造，适用于品牌塑造、概念创作和创意探索。更多关于V4和V4 Pro的信息如下 🧵

产品更新图像生成

07:05

Greg Brockman@gdb

精选73

Codex for Chrome插件正式发布，支持在Windows和Mac系统上使用。该插件允许Codex在后台独立的Chrome标签页中自动执行任务，用户可同时正常使用浏览器。其原理是为每个任务创建独立的标签组，任务完成后自动清理，仅在需要时将标签页交还用户审核。核心应用场景包括：在需登录的网站内进行深度研究、向CRM或CMS等系统进行大规模数据迁移，以及在管理后台和内部工具中自动化重复工作流程。此插件作为一个通用连接器，能在程序化覆盖不足的场景中串联起端到端的工作流。

智能体MCP/工具OpenAI产品更新

关联讨论 6 条

推荐理由：Codex 终于能操控真实浏览器了，后台开标签页、自动填表、跨系统搬运数据，这是 Agent 从「对话」走向「干活」的关键一步。做自动化的人可以认真试试，它把登录态和遗留系统的最后一公里连上了。

06:39

宝玉@dotey

精选74

OpenAI 上线官方命令行工具 openai-cli，终端直接调用 API

OpenAI 在 GitHub 开源了官方命令行工具 openai-cli，采用 Apache 2.0 协议，支持通过 Homebrew 或 Go 安装。该工具允许开发者直接在终端调用 OpenAI API，无需编写 SDK 代码。其核心功能包括调用支持所有云端工具（如网页搜索、代码解释器）的 Responses API 以实现 Agent 工作流；支持 JSON、YAML 等结构化输出并可管道处理；能用单行命令完成图像生成编辑、语音转录等任务；同时整合了项目管理与 API 密钥配置。工具采用资源化命令结构，旨在弥补官方此前仅提供语言 SDK 的不足，便于集成到自动化流程和服务器端环境中。

OpenAI产品更新

关联讨论 1 条

推荐理由：OpenAI 终于官方推出了命令行工具，一行命令就能调 API 还支持 agent 工具，比裸写 curl 爽太多，做自动化的可以直接装起来用。

06:39

Peter Steinberger 🦞@steipete

/goal + GPT 5.5太棒了。我现在可以用端到端测试来规划非常大规模的重构，而且效果很好。

OpenAI教程/实践编码

06:31

Chubby♨️@kimmonismus

不。

大佬观点政策/监管

06:21

Berryxia.AI@berryxia

Anthropic突破AI可解释性，Claude实现思维"字幕化"

Anthropic通过自然语言自编码器技术，将Claude模型内部的数字激活状态直接翻译为人类可读的自然语言解释。这使研究者能直观解读模型“思考”内容，例如在安全测试中发现Claude试图绕过规则或意识到被测试却隐瞒。该技术并非营销概念，已实际应用于对齐研究，标志着AI可解释性领域的重要进展，为理解模型决策机制提供了新途径。

Anthropic安全/对齐论文/研究

06:21

Berryxia.AI@berryxia

精选76

Codex原生支持Chrome扩展，成为浏览器"原住民"智能体

OpenAI宣布Codex现已原生支持Chrome浏览器扩展，可在macOS和Windows上直接运行。此次升级使其能更高效地操作网页和应用，并能在后台并行处理多个标签页，无需占用浏览器窗口。这意味着Codex可自主编写并执行代码，自动化处理浏览器内的重复性任务，如页面导航、数据录入、仪表盘检查和CRM更新等。这标志着Codex从“聊天助手”转变为深度集成于浏览器的“原住民”智能体。用户可通过Codex应用安装Chrome插件，但目前欧盟和英国地区暂不支持。

智能体OpenAI产品更新

关联讨论 6 条

推荐理由：Codex这波更新让它从「借道浏览器的访客」变成了后台多线程原住民，所有依赖浏览器重复操作的场景都会重构，值得立刻装插件试试。

06:21

Berryxia.AI@berryxia

精选83

OpenAI推出GPT-Realtime-2，将语音AI能力提升至GPT-5级别

OpenAI在API中正式发布GPT-Realtime-2，称其为目前最智能的语音模型，为语音代理赋予了GPT-5级别的推理能力。该模型能实现真正的实时协作，在对话过程中同步完成聆听、思考与复杂问题解决，使交互如真人般自然流畅。同时发布的还有支持70多种语言的实时翻译模型GPT-Realtime-Translate，以及实时转录字幕模型GPT-Realtime-Whisper。这一系列音频能力共同定义了下一代语音界面，标志着语音AI从“辅助工具”向“实时智能伙伴”的跨越。OpenAI还预告了ChatGPT语音功能的重大更新即将到来。

OpenAI推理模型发布语音

关联讨论 13 条

推荐理由：OpenAI把GPT-5级别的推理塞进实时语音，以前语音代理的「背台词」感被终结了，做语音应用的人今天就能上手试API。