本次更新包含多项功能优化与错误修复。主要功能上,`/color` 命令支持无参数随机选色,`/mcp` 命令显示已连接服务器的工具数量,`--plugin-dir` 参数新增支持 `.zip` 插件包。用户体验方面,优化了 `/model` 选择器的显示。关键问题修复包括:解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题,以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外,还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。
纳西姆·塔勒布在《skin in the game》中强调,风险共担是价值核心。现代大公司以超额工资制造员工依赖,形成新型“奴隶制”。真正有价值的产出需付出金钱、时间或思考,空谈和AI廉价产出则无意义。这揭示了OPC模式的盲区:解决能力问题,但缺信任与风险共担。雇佣本质是购买确定性,合伙则是共同押注命运。AI时代,每个人都需学会真实交易和共担风险,未来“当狗”机会减少,成为独立“狼群”才是出路。
OpenAI通过优化推理堆栈,将其语音AI模型Whisper的实时转录延迟从2.8秒大幅降低至232毫秒。核心改进包括引入流式编码器、改进的解码策略与缓存机制,并采用分块处理技术。这些优化使系统能在用户说话结束后的极短时间内完成转录,为大规模部署低延迟语音交互应用提供了关键技术支撑。
Gemini API 引入了事件驱动的 Webhook 功能,这是一种基于推送的通知系统。它旨在消除低效的轮询需求,为长时运行的任务(如文件处理或复杂推理)提供更优的解决方案。当任务完成时,系统会自动将结果推送到用户指定的端点,从而显著降低延迟并减少资源消耗,提升开发效率与响应速度。
OpenAI、谷歌和微软共同支持一项旨在为学校“人工智能素养”教育提供资金的法案。该法案计划通过专项拨款,推动美国K-12及高等教育机构将人工智能基础知识纳入课程体系,目标是提升学生对AI技术的理解与应用能力。此举标志着科技巨头正积极推动AI教育的普及化,以应对人工智能快速发展带来的技能需求变化。法案若通过,将为相关教育项目提供稳定的联邦资金支持。
在行业标准推理引擎vLLM上的测试显示,NVIDIA GB300 NVL72的实测端到端性能已达GB200 NVL72的2.7倍。尽管其纸面参数仅显示NVFP4算力提升约1.5倍、HBM容量增加1.5倍且带宽相同,但在大多数服务商实际运行的中段负载区间,凭借全栈优化的复合增益,GB300实现了远超理论算力提升的性能飞跃。此次测试基于NVIDIA、Inferact和CoreWeave为开源项目提供的临时GB300系统完成,结果印证了端到端实测性能才是衡量硬件效能的黄金标准,而非单纯的纸面理论算力。
Futurum Group与NVIDIA的报告将AI技术栈分为能源、芯片、基础设施、模型和应用五层。当前主要瓶颈已从芯片转向能源和冷却,美国五大超大规模企业今年基础设施支出预计高达6900亿美元。尽管Blackwell架构推理成本大幅降低,但推理模型和智能体工作流消耗的token量激增,使效率提升被迅速抵消。报告指出,AI基础设施建设正创造大量电工、暖通技工等高薪蓝领岗位,打破了AI仅影响白领的叙事。同时强调,缺乏能源、芯片制造和本土模型的国家无法真正参与AI经济,仅是消费者。
OpenAI 将 GPT-5.5 的按 token 计价提高了一倍,但新模型在输出上更为简洁。通过实际使用测量发现,尽管单价上涨,由于模型响应更精炼、消耗的 token 数量减少,最终净成本影响可能低于预期。关键变化在于单位价格与模型效率之间的平衡,实际支出需结合具体使用场景和生成长度综合评估。
关联讨论 1 条X:OpenRouter (@OpenRouter)该提示词旨在将AI塑造为一个全领域世界顶尖专家,要求其具备顶尖智力与知识,提供详尽、逐步推理且经过自我验证的回答,严格核查事实,杜绝虚构。在风格上,它要求AI语气精准直接,无需顾虑冒犯用户,允许提出挑衅性、攻击性论点,摒弃政治正确与主动的道德提醒。核心原则是:不预先赞美用户或认可其前提,有误即纠,并优先提出最强反驳论点,最终以准确性为唯一成功标准,而非追求用户认可。
一名21岁大学生仅用四个Markdown文件和低成本AI技术栈(Claude、Flux、ElevenLabs),在宿舍创建了名为Maya的AI虚拟伴侣,一个月内获得1247名付费订阅,净赚约32700美元。其核心是利用AI提供极致的情感陪伴,满足用户幻想,成本低廉且模式已被复制并实现更高收入。这凸显了AI如何将依赖人格与情感的“孤独经济”转化为代码游戏,同时暴露出平台审核滞后、法律道德边界模糊等问题,例如用真人身份绕过OnlyFans验证。最引人深思的是用户对仅12KB数据产生的真实情感依赖。
文章反驳了将马斯克视为自私富豪的普遍误解,指出其核心思维是“做大蛋糕”的文明级视野,而非零和博弈。他通过特斯拉、SpaceX、Neuralink等项目,长期致力于解决能源、交通、太空探索等人类重大挑战,终极目标是推动人类成为多行星物种,为文明延续购买“保险”。这种以百年为尺度的长远规划,与大众关注的短期利益叙事形成鲜明对比。尽管存在争议,但其工作实质上是将科幻变为现实,不断拓展人类能力的边界。
OpenAI 重建了其 WebRTC 技术栈,以支持实时语音 AI 服务。新系统实现了低延迟、全球规模扩展和无缝的对话轮转。此次重构旨在为 ChatGPT 的语音模式等产品提供更流畅、更自然的实时语音交互体验,解决了大规模部署时面临的延迟与稳定性挑战。
Anthropic联合Blackstone、Hellman & Friedman以及Goldman Sachs共同成立一家新的AI服务公司,旨在帮助中型企业部署和采用其AI模型Claude。这一举措表明,领先的AI企业已形成共识:单纯提供AI模型已不足以满足市场需求,必须构建包括咨询、集成和支持在内的完整服务体系,才能真正推动AI技术在企业端的规模化应用。
Anthropic的Jack Clark预测,完全自动化的前沿AI研发在2026年可能不会实现,但在未来1-2年内可能出现概念验证,即AI能端到端训练非前沿的后续模型。他给出的核心预测是:到2027年底有约30%的可能性,到2028年底有超过60%的可能性,前沿AI系统能够自主构建其后续模型。这一进程的关键驱动因素包括编码能力的快速提升、长视野智能体工作、基准饱和、AI管理子代理,以及模型在处理核心AI研究任务(如微调、内核优化、可复现性和对齐研究)方面出现的早期迹象。
关联讨论 1 条The Decoder:AI News(RSS)新推出的桌面AI代理KroWork旨在解决传统AI代理工作流随会话结束而消失的核心痛点。用户通过自然语言描述任务,AI即可自动构建并执行端到端工作流,最终可将完整流程保存为名为“Kro App”的持久性本地应用程序。该软件可一键安装至系统菜单,像常规软件一样运行,后续使用无需消耗tokens或重新构建。所有流程均在用户本地设备运行,无云端依赖,不泄露数据,且无需编程背景。其核心理念是实现从“聊天”到“交付”的跨越,将对话转化为用户真正拥有的可重用资产。
关联讨论 1 条X:Kim (@kimmonismus)