DeepMind CEO Demis Hassabis在AI Ascent 2026上明确将AGI实现时间定于2030年,并指出AI将极大加速药物发现、材料科学等“慢科学”领域,把研发周期从数年压缩至数天。他强调,未来1-2年是关键拐点,真正改变世界的将是AI推动科学迭代速度的指数级加速,而非AGI降临的瞬间。
一款名为“xbox-mac-ctrl”的开源工具,可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放(全屏、快进、音量调节),并操作微信读书、浏览器及任意Mac软件(如Tab切换、滚动翻页)。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现,旨在满足躺卧时遥控刷小说、看视频的需求,并鼓励开发者fork以适配Switch手柄等其他硬件。
DeepSeek v4 Pro还是可以的。 几轮对话,实现一个工具,用xbox手柄控制电脑应用和浏览器。 当遥控器,躺床上刷小说和看视频。
前几周在 x 上,有篇文章已经完全证实了, token 中转就是背后换模型,以次充好,挂着羊牛卖狗肉,骗用户,大几十万阅读,似乎人人皆知了。 现在简中推,到处…
Sam Altman批评一些CEO宣称AI将导致大规模失业的言论是“不懂人情”。他引用案例指出,GPT-5.5的Codex版本能将耗时数周的工作压缩至一小时,但结果却是使用者“前所未有的忙碌”。AI并未消灭工作,而是极大提升个人产能,使功能开发和试错速度呈指数增长,导致拥抱AI者因生产力暴增而承担更多任务,其野心也随之扩张。当前AI时代的核心分化在于“善用AI者”与“拒绝AI者”之间不断扩大的效率鸿沟。真正的淘汰风险在于旁观而非主动利用工具。
对话中提到使用OpenClaw时,初期不应先计较成本,而应全力探索其能力边界与可能场景,甚至不惜高投入。这种思维同样适用于创业与工程化:先通过大量实践摸清所有模式、陷阱与机会,将工具或业务转化为可重复执行的系统。只有在完整认知边界后,再回头优化时间、经济与认知成本,此时的决策才是基于已验证的系统,而非模糊想法。核心在于“先探索,后优化”,以实现规模化路径。
针对AI编程工具常犯的“默默假设”、“过度自信”和“无效重构”等问题,一份名为CLAUDE.md的文档被整理出来,旨在为AI设定工程纪律。其核心四条原则是:编码前先思考并澄清歧义;优先用最简代码实现需求;仅修改与需求直接相关的代码;为任务设定明确、可验证的目标。这套规则旨在约束AI行为,使其更接近靠谱工程师的作风,解决其“太积极、太爱脑补、太喜欢顺手优化”的痛点。
关联讨论 1 条X:阿易 AI Notes (@AYi_AInotes)作者指出,尽管AI将彻底改变教育已是事实,学生普遍使用ChatGPT、Claude等工具进行研究与写作,但当前教育体系仍停留在20世纪模式。核心矛盾并非是否该使用AI,而是如何将其整合进教育,避免将思考过程完全外包给机器。教育必须重新设计,在利用AI提升学习效率与生产力的同时,坚守培养学生批判性思维与自我反思能力的根本目标。学术界需就如何正确融合AI展开紧迫而严肃的讨论。
一段13秒的可视化视频直观揭示了神经网络的工作机制。左侧9个波形代表虚拟生物的感官输入,中间动态变化的光点与连线模拟神经元与权重的计算过程,右侧13个数值输出觅食、逃跑等决策。这生动演示了前向传播如何将数据转化为行动,体现了深度学习层层提取特征的本质:底层感知碎片,高层组合意义。当今复杂的AI系统与此原理相同,仅规模存在量级差异。视频中出现的“自杀”选项,直观成为AI可能学习极端行为及对齐问题的视觉隐喻。
借助Algrow的MCP平台,Claude现已能直接分析YouTube等平台的视频内容,自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设,第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具,并预示视频研究Agent时代的开启。目前处于免费试用阶段,未来订阅定价亲民。
说个冷知识: 抖音上 99% 教 AI 的博主,根本没有Claude Code 和OpenAI 200美金的订阅账号
杨立昆在达沃斯论坛上尖锐指出,基于LLM构建智能体是“灾难的配方”,因其缺乏世界模型和因果性,无法可靠预测行动后果,导致现有框架陷入不断修补的困境。他长期主张,实现AGI需依靠JEPA架构和世界模型,让AI先理解物理规律。其团队最新论文通过SIGReg正则化器解决了JEPA的表征坍缩问题,使得小型世界模型能在单GPU上快速训练,隐空间天然编码物理规律,在机器人规划中效率远超大型模型。这并非否定生成式AI,而是为智能体发展开辟了更高效、更接近物理现实的新路径:未来智能体将是“懂物理的小世界模型”与“大语言接口”的结合。
全网都在吹的LeCun新论文,90%的解读都是错的。 他们说生成式AI是死路,说过去三年花的几百亿全白费了,说15M参数的小模型就能吊打万亿大模型。 这些全…
GPT Image 2 Prompt 用于创建一个儿童图画书的内页,主题为OpenAI的故事,以多页形式呈现。提示指定内页采用垂直格式、暖色调背景和多面板布局。插图风格为手绘儿童书风格,融合软质水粉、彩色铅笔和蜡笔纹理,强调可见纸张纹理、自然草图线条和圆润迷人角色。文本布局模仿真实图画书,关键词可能用颜色高亮,并包含小手绘装饰元素。整体设计旨在通过视觉叙事展现OpenAI的历程。
摩根大通公开了其内部多智能体系统Ask David的完整架构,该模式在投资研究领域已得到验证。其核心与当前主流Agent架构高度一致:由一个监督智能体进行整体编排,多个专业子智能体分别处理检索、结构化数据和分析等任务,在最终输出前使用LLM-as-judge进行反思与质量把关,并引入人工干预作为最后一道准确性保障。这一模式在多个领域反复出现,表明可落地的多智能体系统的关键在于清晰的分工、监督、反思与人工兜底形成的闭环,而非简单堆叠模型,对企业级Agent开发具有重要参考价值。
本周,DeepMind、Anthropic、Alibaba等实验室的论文共同显示,AI智能体正从聊天机器人转向可工程化、可审计的生产力系统。Agentic Harness Engineering将智能体支架转化为可观测的工程闭环,提升性能且优化可跨模型迁移。Alibaba的AgenticQwen-30B-A3B通过并行强化学习飞轮,在低激活参数下实现接近大模型的工具使用能力,重塑成本。RecursiveMAS革新多智能体通信,大幅降低消耗并提升效率。这些进展标志智能体系统正从实验阶段走向生产级工程,其工程化可能成为AI落地关键。
Anthropic CEO断言AI将在一年内完成所有代码编写。他指出,像Claude这样的AI系统已通过海量文本掌握了编程知识,而人类通常需花费数年学习。这意味着编程技能本身不再是核心竞争力,最难的技能已被AI掌握。未来的关键差距在于能否高效配置和运用这些“无所不知”的工具,而目前多数人尚未开始认真使用。因此,未来程序员的竞争力将转向善于“指挥”AI生成代码,而非亲自编写。
DeepMind CEO Demis Hassabis指出,最前沿的大模型(如Gemini)表现出“锯齿状智能”。他以与Gemini下棋为例,说明模型能通过思维链发现问题并搜索更好方案,但最终仍会执行明显的错误决策。这揭示了AI智能并非平滑提升,而是在某些方面敏锐,另一些方面存在严重缺陷。Hassabis认为,真正的突破或许不在于让模型更聪明,而在于如何打磨这种不均衡的智能,使其成为可靠工具。这一观点挑战了AI将线性逼近完美智能的常见叙事。
多数公司无法有效利用AI,核心障碍并非技术,而是企业自身目标模糊、战略混乱且缺乏清晰的业务流程描述。AI擅长执行明确指令,但大多数公司处于“混乱黑盒”状态,无法清晰定义目标、工作流与衡量指标。只有少数具备高度自我认知和组织纪律的公司能真正借助AI提升竞争力。企业应首先审视自身是否具备让AI有效协助的清晰内部状态,而非盲目追求技术应用。
作者指出欧洲正犯下急需纠正的严重战略错误,导致竞争力下降与生活质量结构性下滑。核心批评聚焦于能源政策存在根本缺陷,且缺乏可信解决方案。在科技与经济层面,欧洲缺乏雄心与清晰规划:既无解决能源问题的可靠战略,也未大力建设支持AI发展的数据中心,更无培育全球性科技公司的计划。尽管欧盟委员会试图微调AI法案,但这几乎是唯一迎合企业需求的让步。相比之下,中美在核能、太阳能及储能领域大力投入,而欧洲的应对方式却显得摇摆、模糊且极不严肃。