AIHOT

5月1日

09:15

宝玉@dotey

Demis Hassabis认为当前AI范式（预训练+RLHF+思维链）可能是AGI架构的一部分，但仍有50%概率需要一两个关键突破，未解决持续学习、长程推理和记忆等问题。他指出，百万token上下文窗口处理实时视频仅够20分钟，现有方法如同“用胶带糊住”。AlphaGo时代的技术正被重新引入基础模型以推动进步。智能体尚处实验阶段，投入产出比不匹配。完整虚拟细胞等科学突破还需约10年，关键瓶颈是活细胞成像技术。

智能体DeepMind大佬观点推理

09:15

宝玉@dotey

这不就是 claude code 的 /btw 吗？为啥要用个新名字叫 /side ！

大佬观点

09:13

Marc Andreessen 🇺🇸@pmarca

推文指出，社会在4-5年内从对气候变化的世界末日式恐慌转向几乎无人关注，这种转变揭示了过度炒作风险的危害。虽然围绕气候变化形成的末日论调显得荒谬，但问题并未真正消失。这一教训对当前关于AI风险的讨论具有警示意义：过度渲染AI的 apocalyptic 风险可能导致公众疲劳，反而忽视实际存在的长期挑战。风险沟通需要避免陷入短期恐慌与长期漠视的循环。

大佬观点安全/对齐

09:10

ginobefun@hongming731

AI时代软件开发、商业逻辑与工程实践的根本性转变

Andrej Karpathy提出软件3.0时代，编程核心转向上下文工程，并区分了Vibe Coding与Agentic Engineering两种开发姿态。OpenAI总裁Greg Brockman指出，算力套利是商业模式，人类注意力已成为新瓶颈，并估算AGI进程已完成八成。Anthropic的Claude Code团队则将Prompt Caching提升为核心工程纪律，通过优化prompt布局和更新机制，将缓存命中率作为关键SLA监控，以控制成本并保证系统性能。

智能体OpenAI现象/趋势编码

09:10

ginobefun@hongming731

软件3.0与AI编程进展摘要

Karpathy提出软件3.0概念，编程核心从写代码转向提供上下文，并区分Vibe Coding与Agentic Engineering两种模式。OpenAI总裁Brockman将AGI瓶颈从算力移至人类注意力，估计已完成80%。Anthropic分享Claude Code实战，以Prompt Caching命中率为SLA监控，将“上下文即新代码”转化为工程纪律。

智能体AnthropicOpenAI大佬观点

09:10

Berryxia.AI@berryxia

Geometry成为AI建筑关键层，OpenGeometry打通文本到CAD全流程

推文指出，Geometry（几何）已成为AI在建筑领域缺失的关键层。@Bootsblac开发的OpenGeometry项目，实现了从文本或平面图到最终渲染的完整流程贯通，使得精确控制成为可能。其核心能力包括：直接从文本或平面图生成精确的BREP CAD模型；利用Three.js进行实时渲染，并由Google AI驱动，形成端到端的全流程。该项目已完整开源，可供使用。

多模态开源/仓库开源生态

08:45

Orange AI@oran_ge

结构，是我最近思考最多的词元

作者以“结构”为核心，系统阐释了其在产品、AI Agent、大模型、人际关系及公司组织中的决定性作用。做产品是设计引导用户的“河床”；开发Agent是构建管理上下文的框架；训练大模型实为提取语料中的“结构能”。人与公司的效率同样取决于结构能量。作者指出，当前一些大厂的AI转型仅“加石头”而不变革组织架构，尤其由中层主导改革存在根本矛盾。最终强调，改变命运需从改变底层结构开始。

智能体大佬观点

08:45

Nathan Lambert@natolambert

下次蒸馏 OpenAI 模型时，我会特别注意放大妖精。

OpenAI大佬观点

08:44

elvis@omarsar0

DeepSeek-V4-Pro 在智能体编码任务中表现惊艳

测试者使用 DeepSeek-V4-Pro 在 Pi 编码智能体上构建了一个 LLM 知识库，对其开箱即用的表现感到震撼。这是首个在推理能力上媲美 Claude 和 Codex 的开源权重模型，且成本效益高，支持 100 万上下文长度。该模型无需复杂配置即可在基础框架中直接运行，擅长智能体编码和知识密集型推理任务，能跨公司文档、论坛、论文和代码库进行多步骤研究、代码生成与上下文推理。其高效运行得益于 Fireworks 的市场最快推理速度及混合注意力设计，将 KV 缓存降至 10%，推理计算量减少近 4 倍，实现了快速且低成本的实践部署。

智能体DeepSeek开源生态推理