AIHOT

AI HOT

4月17日

12:59

Greg Brockman@gdb

正是那些微小的细节

其他

09:58

karminski-牙医@karminski3

一条推文分享了被称为"年度最佳Cursor教程"的趣事。其中引用的对话显示，用户@ProbiusOfficial起初误以为Cursor界面中央的空白区域是"没用的区域"，适合用来看视频，随后被其他用户纠正"那他妈是编辑框"。该对话以幽默方式凸显了用户对AI代码编辑器Cursor界面设计或功能的不熟悉，主推文则将此互动作为反面或调侃性质的"教程"进行传播。

探姬 | Hello-CTF 🚩：欸我发现cursor中间这个没用的区域刚好可以拿来看番欸！：那他妈是编辑框我去，不早说！ https://t.co/ah6t17A1ee

其他编码

08:00

宝玉@dotey

GitHub Copilot 里面 Opus 4.7 居然是 7.5x，Opus 4.6 是 3x

Anthropic编码行业动态

05:28

宝玉@dotey

Codex 现在能做类似 Cowork 的事，还不像 Cowork 那样被沙盒限制，能做的事很多，能力挺强

OpenAI教程/实践编码

03:44

Rohan Paul@rohanpaul_ai

Marc Andreessen：风险投资最严重的错误是错过一个异类，而不是在失败的投资上亏损。一次糟糕的投资可能损失数百万；错过一个谷歌规模的公司则可能造成数十亿美元的机会成本。

大佬观点行业动态

03:41

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

两个月后。二。

其他安全/对齐

03:26

SemiAnalysis@SemiAnalysis_

能给我来个咔啾吗！

其他

01:45

宝玉@dotey

请问有没有好用的 Codex 的 Ralph 循环？类似于 Claude Code 的 Ralph Wiggum 插件 https：//github.com/anthropics/claude-code/blob/main/plugins/ralph-wiggum/README.md 用过 oh my codex，它给我装了一堆 MCP，还魔改了我的 Codex 自定义指令，我个人很不喜欢这样。

智能体教程/实践编码

4月16日

13:40

Boris Cherny@bcherny

感谢@AcquiredFM邀请我参加Unplugged节目！玩得非常开心

Anthropic大佬观点

12:38

SemiAnalysis@SemiAnalysis_

需要明确的是，英伟达不是一辆车

行业动态部署/工程

08:11

宝玉@dotey

精选74

使用 Claude Code：会话管理与 100 万上下文【译】

Anthropic 为 Claude Code 推出 /usage 更新，核心在于管理 100 万词元上下文窗口以避免性能衰减。文章介绍了关键策略：开启新会话适用于新任务；使用“回溯”功能从历史节点重启以高效纠错；“压缩”功能自动总结历史，“清空”则需手动提炼要点；当工作产生大量中间结果时，使用“子智能体”在独立上下文中执行并仅返回结论更佳。目前，掌握这些决策是引导 Claude 产出高质量结果的关键。

AnthropicMCP/工具教程/实践编码

推荐理由：这是 Anthropic 官方写的 Claude Code 上下文管理手册，100 万窗口不是让你一股脑塞进去就行，回溯、压缩、子智能体这些操作的使用时机才是真正的生产力分水岭，用 Claude Code 的人应该打印出来贴在显示器旁边。

07:46

Thariq@trq212

精选72

使用 Claude Code：会话管理与百万级上下文窗口的策略

Claude Code 的百万级上下文窗口在支持长任务的同时，也带来了“上下文腐化”的风险，即模型性能可能在处理约30-40万token后开始下降。因此，有效的会话管理至关重要。关键策略包括：开启新任务时建议新建会话；对于关联任务可酌情保留上下文以提升效率；善用 `/rewind` 回退功能而非直接纠正错误，是维护上下文清洁的核心习惯。用户在每个对话轮次后，应根据情况选择继续、回退、新建会话、压缩或使用子代理。

智能体教程/实践编码

推荐理由：Claude Code 1M 上下文听着爽，但 context rot 在 300k 就开始咬你了。这篇把 rewind、compact、subagent 三个操作的使用时机讲得极清楚，是目前最实用的 Claude Code 上下文管理指南，重度用户必读。

02:07

DogeDesigner@cb_doge

Gemini和Claude挂了。 Grok正常运行。😎

xAI行业动态

4月15日

23:42

Chubby♨️@kimmonismus

嘿 @AnthropicAI ，Opus 4.7 和费率重置怎么样？：）

Anthropic行业动态

23:42

Ethan Mollick@emollick

大佬观点现象/趋势

23:39

dax@thdxr

当克劳德看到我的提示时

智能体教程/实践编码

11:58

dax@thdxr

我想我们应该启动一个OpenSesame项目

开源生态编码行业动态

10:05

Epoch AI@EpochAIResearch

@NBCNews 关于我们近期人工智能使用情况的调查： https：//www.nbcnews.com/tech/tech-news/ai-job-work-replace-task-help-rcna267238

现象/趋势行业动态

4月14日

19:26

Chubby♨️@kimmonismus

让我们期待今天的"土豆卫星"时刻。

其他

17:26

Eric@ericmitchellai

仅仅通过非常努力就获得了惊人的阿尔法收益

智能体大佬观点编码

15:33

宝玉@dotey

精选72

为什么你的"AI优先"战略可能大错特错？

文章指出，盲目追求“AI优先”战略可能是错误的，真正的瓶颈在于软件工程基础。如果自动化测试、CI/CD流程、A/B测试与监控、任务管理和系统架构等基础不扎实，AI的效能将无法释放。真正的“AI优先”应是一种推动必要工程改进的意识和动力，促使企业夯实基础，从而释放AI的生产力。

智能体大佬观点现象/趋势部署/工程

推荐理由：宝玉把一篇「AI First」的英文长文拆成了工程落地清单，不是喊口号而是列了五条前置条件和三个不适合的场景，做产品或带团队的人拿来对照自己的现状，比读原文有用。

05:25

Rohan Paul@rohanpaul_ai

能动性远胜于智能

智能体大佬观点

04:25

swyx 🐣@swyx

顺便说一句，全球约80%的智能体和AI工程都集中在这3平方英里的区域内

大佬观点现象/趋势

04:25

swyx 🐣@swyx

如果你想提升写作水平，Anh是我在开发工具HN社区中认识的最稳定输出的高手之一，她刚刚开源了她的写作技能模板供你使用！【引用 @byAnhtho】：http：//x.com/i/article/2043500390885494784

开源/仓库教程/实践

03:56

DogeDesigner@cb_doge

Grok 4.20 正在碾压 BridgeBench。🔥 速度排名第一推理排名第一幻觉控制排名第一击败了 GPT-5.4、Claude Opus 4.6、Gemini、Qwen 等模型。

xAI行业动态评测/基准

03:25

Rohan Paul@rohanpaul_ai

Marc Andreessen：原始智力可能是领导力最差的资质--这彻底改变了我们思考AI的方式。 "如果领导者的智商与追随者相差超过一个标准差，那将是一个真正的问题。"

大佬观点现象/趋势

4月13日

14:11

DogeDesigner@cb_doge

这张照片是上周在火星拍摄的。

其他

09:19

DogeDesigner@cb_doge

埃隆·马斯克："传统媒体从不提及南非的白人种族灭绝，因为这不符合他们关于白人可能成为受害者的叙事。"

其他

08:51

DogeDesigner@cb_doge

到了这个地步，传统媒体已经毫无可信度可言。

其他

08:39

DogeDesigner@cb_doge

当特朗普总统指出南非白人农民及其家庭所遭受的种族主义时。

其他

02:26

DogeDesigner@cb_doge

其他

01:39

DogeDesigner@cb_doge

"左派的目标是摧毁我的影响力。所以他们无情地推送关于我的负面宣传，并忽略任何积极的内容。他们是邪恶的。" 一 Elon Musk

其他

4月12日

23:39

DogeDesigner@cb_doge

Anthropic的Claude Opus正在下滑。最新基准测试显示，其准确率在短短几天内从83.3%降至68.3%。这在编码过程中的幻觉率出现了大幅飙升。 Grok 4.20仍保持第一的位置。未被超越。

现象/趋势评测/基准

4月11日

03:36

François Chollet@fchollet

对称性在物理学中如此重要的原因在于，对称性是一种高效的压缩算子。如果一个系统在某种对称性下保持不变，你只需解释它的一个轴向。科学模型代表着通过符号逻辑对宇宙内部冗余的系统性利用。

大佬观点

4月9日

00:00

SemiAnalysis@SemiAnalysis_

Cameron Quilici 和 Bryan Shan 坐下来讨论 InferenceX 以及 SemiAnalysis 正在进行的工作。

行业动态部署/工程

4月8日

06:30

Haider.@haider1

我仍然无法释怀看看这些基准测试结果： > swe-bench 已验证：mythos 93.9% vs opus 4.6 80.8% > swe-bench 专业版：mythos 77.8% vs opus 4.6 53.4% > swe-bench 多语言版：mythos 87.3% vs opus 4.6 77.8% > swe-bench 多模态版：mythos 59.0% vs opus 4.6 27.1% > terminal-bench 2.0：mythos 82.0% vs opus 4.6 65.4%

现象/趋势编码评测/基准

4月3日

16:39

karminski-牙医@karminski3

精选72

Gemma4有8个模型，选哪个？一文看懂！

Google发布的Gemma4系列开放权重模型包含多个版本，选型需结合场景。带“-it”后缀为指令微调版，开箱即用；不带后缀为基座模型，供自行微调。其中，A4B指激活参数量为4B，E4B则采用逐层嵌入技术，以内存换取计算量，优化移动端性能。选型建议：综合性能与速度选26B-A4B；追求最佳代码或任务效果选31B；开发本地全模态应用选E4B；资源受限设备体验可选E2B，但输出质量有限。

Google开源/仓库教程/实践端侧

推荐理由：Gemma 4 一口气出了 8 个变体，本地部署的人最怕选错模型白折腾，这篇把选型逻辑拆得明明白白，从龙虾助手到树莓派都有对应方案，抄作业就行。

3月22日

05:41

Eric@ericmitchellai

提交，执行

智能体教程/实践编码

3月20日

03:44