4月19日
4月18日
11:02
宝玉@dotey
69
两小时激辩:黄仁勋为什么不怕 TPU、不怕华为、不怕出口管制?

黄仁勋在接受专访时,将Nvidia的使命定义为“输入是电子,输出是Token”。他阐述了公司“少做,但每件事都独一无二”的哲学,因此不做云服务、不押注特定赢家。他认为供应链瓶颈最多持续两三年,真正的长期制约是能源政策。针对竞争,他指出专用芯片在跨云可移植性和广泛适用性上不及Nvidia的通用加速计算平台。对于出口管制,他认为中国已拥有足够的7nm产能和能源,限制反而会加速其芯片自主化,使美国失去第二大科技市场。

AnthropicOpenAI大佬观点行业动态
4月17日
12:59
08:00
03:41
03:26
4月16日
13:40
12:38
08:11
宝玉@dotey
精选74
使用 Claude Code:会话管理与 100 万上下文【译】

Anthropic 为 Claude Code 推出 /usage 更新,核心在于管理 100 万词元上下文窗口以避免性能衰减。文章介绍了关键策略:开启新会话适用于新任务;使用“回溯”功能从历史节点重启以高效纠错;“压缩”功能自动总结历史,“清空”则需手动提炼要点;当工作产生大量中间结果时,使用“子智能体”在独立上下文中执行并仅返回结论更佳。目前,掌握这些决策是引导 Claude 产出高质量结果的关键。

AnthropicMCP/工具教程/实践编码

推荐理由:这是 Anthropic 官方写的 Claude Code 上下文管理手册,100 万窗口不是让你一股脑塞进去就行,回溯、压缩、子智能体这些操作的使用时机才是真正的生产力分水岭,用 Claude Code 的人应该打印出来贴在显示器旁边。
07:46
Thariq@trq212
精选72
使用 Claude Code:会话管理与百万级上下文窗口的策略

Claude Code 的百万级上下文窗口在支持长任务的同时,也带来了“上下文腐化”的风险,即模型性能可能在处理约30-40万token后开始下降。因此,有效的会话管理至关重要。关键策略包括:开启新任务时建议新建会话;对于关联任务可酌情保留上下文以提升效率;善用 `/rewind` 回退功能而非直接纠正错误,是维护上下文清洁的核心习惯。用户在每个对话轮次后,应根据情况选择继续、回退、新建会话、压缩或使用子代理。

智能体教程/实践编码

推荐理由:Claude Code 1M 上下文听着爽,但 context rot 在 300k 就开始咬你了。这篇把 rewind、compact、subagent 三个操作的使用时机讲得极清楚,是目前最实用的 Claude Code 上下文管理指南,重度用户必读。
02:07
4月14日
20:00
Cursor Blog
精选62
多智能体系统将GPU内核性能提升38%

我们与NVIDIA合作,利用自主运行的多智能体系统,在为期三周内对235个真实CUDA内核进行了优化。该系统从零开始构建并优化Blackwell GPU内核直至汇编级别,实现了38%的几何平均速度提升,其中63%的问题超越基线,19%实现超2倍优化。这些内核直接影响AI训练与推理效率,传统上需资深工程师耗时数月乃至数年的优化工作,该系统在数周内即自主完成,并能探索更广阔解决方案空间,突破了人工逐项优化的限制。

智能体现象/趋势编码部署/工程

推荐理由:Cursor 把自家多 Agent 系统拉去优化 CUDA 内核,38% 的 geomean 提速不算炸裂,但真正值得看的是它证明了 Agent 可以在无人干预下跑三周啃硬骨头,这对做 Agent 产品的人是个强信号。
19:26
17:26
15:33
宝玉@dotey
精选72
为什么你的"AI优先"战略可能大错特错?

文章指出,盲目追求“AI优先”战略可能是错误的,真正的瓶颈在于软件工程基础。如果自动化测试、CI/CD流程、A/B测试与监控、任务管理和系统架构等基础不扎实,AI的效能将无法释放。真正的“AI优先”应是一种推动必要工程改进的意识和动力,促使企业夯实基础,从而释放AI的生产力。

智能体大佬观点现象/趋势部署/工程

推荐理由:宝玉把一篇「AI First」的英文长文拆成了工程落地清单,不是喊口号而是列了五条前置条件和三个不适合的场景,做产品或带团队的人拿来对照自己的现状,比读原文有用。