阿里巴巴云ClawTalks系列最新一期将聚焦企业级AI智能体的规模化安全挑战。会议将探讨如何识别针对AI智能体的现实攻击路径,并缓解来自第三方技能和未授权访问的风险。核心内容将介绍阿里巴巴云的7项端到端防护安全最佳实践,并通过Agent Security Center的现场演示,展示如何即时发现、映射并保护智能体资产。本期主题旨在融合前沿AI与企业级安全防护。
AI代理经济需要开放的支付通道,正如互联网依赖HTTP协议。OKX推出首个跨链开放标准Agent Payments Protocol(APP),为AI代理之间的支付与商业交互提供基础框架。OKX与AlibabaCloud的合作从云基础设施与AI领域进一步延伸,共同构建代理经济的金融层。作为APP创始合作伙伴,双方认为AI时代刚刚起步,开放支付通道将激发代理生态的创新潜力。
商汤科技与NCS集团合作,参与了新加坡的“Jom AI @ Tampines”社区倡议。该平台旨在共同构思和开发智能AI解决方案,以提升居民在生活、工作、娱乐和通勤方面的体验。商汤科技亚洲业务集团副总裁周文浩表示,公司支持新加坡国家AI战略,致力于通过部署AI技术赋能老年人和弱势群体,帮助他们将科技融入日常生活,从而为AI驱动的未来创造更安全、便捷和高效的环境。新加坡社会及家庭发展部长马善高对合作双方推动社区AI民主化的努力给予了认可。
For AI PhDs aiming for industry, paper count matters, but only up to a point. …
大多数营销人员仅用AI润色文案,而高价值用法在于将Claude深度嵌入工作流。Anthropic增长营销成员分享了五大应用场景:1)作为思考伙伴,在撰写报告前梳理框架、对齐方向;2)通过Claude Cowork自动化数据报告生成,节省重复劳动;3)利用Claude Code让非技术人员快速构建内部工具;4)通过Skills功能将机构知识编码为可复用的标准化资产;5)使用Claude Design将创意快速转化为视觉稿,减少沟通损耗。这些方法旨在提升决策质量、自动化流程并降低协作成本,其方法论可迁移至其他AI智能体。
打算把我做的所有产品的订阅方案取消,已经付款订阅的用户我会返还对应的消费额度,以后我的所有 vibe 产品都不设置 pro 等各种等级方案,所有功能免费对所有用…
Demis Hassabis预测AGI将在2030年左右到来,科技创业者必须提前将其纳入长远战略规划。当前底层架构需攻克持续学习与长期推理两大难题,智能体被视为通向AGI的必经之路,但受限于持续学习能力难以适应复杂环境。模型生态上,大小模型协同运作成为趋势,蒸馏技术使轻量级模型以低成本达到高性能,端侧模型降低成本并保障隐私,未来与云端超大模型协同构建理解物理世界的基础设施。
Codex已从编码助手快速进化为软件工程智能体,OpenAI内部将其定位为能在读取-规划-执行循环中运行测试并协调子智能体的系统。最新AI Engineer的Full Workshop讲解了子智能体并行执行、插件生态扩展、Guardian安全门控与MCP集成,以及Codex获得300万周活跃用户背后的工程基础,展示了其在软件工程领域的应用潜力和发展进展。
DeepMind联合创始人Demis Hassabis指出,实现AGI不能仅依赖预训练和RLHF,必须补足持续学习与长程推理能力,并将时间节点锁定在2030年前后。同时,AI代理的自动化交付链条正在快速构建:OpenAI Codex已升级为高活跃度的并行工程平台,能自动分解任务;Cloudflare与Stripe合作推出新协议,使AI代理能自主完成开户、支付、部署等全流程,实现无人值守的软件交付。
推文演示了将Gmail作为AI Agent任务入口的实用场景:用户可将bug报告邮件一键分享至Google Chat并@AI助手Uma,由其自动接管。技术链路整合Gemini Flash Lite与新版Cursor SDK,驱动Cloud Agents自动读取邮件、查询代码、分析问题并生成修复方案,结果流式返回聊天界面。这实现了从手动复制粘贴到一键自动执行的转变。文中强调,Cursor SDK的发布里程碑式地将生产级编程能力转化为可任意嵌入的基础设施,使同一智能体能集成于CI流水线、自动化脚本等各处,其能力与编辑器内体验完全一致,正推动开发者角色向指挥AI转型。
我等了整整一年的东西,终于来了, Cursor今天正式发布了它的SDK, 这回可远不只是又一个编程工具的小更新, 可以说是人类历史上第一次, 把生产级的编程能力…
关联讨论 2 条X:阿易 AI Notes (@AYi_AInotes)X:宝玉 (@dotey)在OpenAI与马斯克的诉讼中,马斯克作为第一证人出庭,反驳了OpenAI律师出示的2022年短信证据。他指出,作为501(c)(3)非营利组织,法律上本不允许存在股权,此举反而暴露了OpenAI从公益向商业转型的争议。同时,萨姆·阿尔特曼曾声明个人无股权,但后续被揭露存在利益关联。一年前,马斯克开价974亿美元收购OpenAI遭萨姆拒绝,后者选择坚持AGI使命。如今,诉讼持续、年烧钱超150亿美元,非营利转营利的争议不断,萨姆的抉择成败待时间验证。
补充一个关键时间点,马斯克是本次审判的第一证人,作证了近两个小时,明天还会继续出庭,后续的证词可能会爆出更多OpenAI内部的黑料。 而一年前的今天,马斯克开…
开源项目Beads旨在解决AI Agent处理长任务时的信息丢失问题。它摒弃了传统无结构的Markdown记忆方式,转而采用结构化任务管理。其底层使用支持分支、合并和版本回溯的Dolt数据库,允许多智能体并发写入且避免冲突,保持任务历史可追溯并支持远程协作。项目还设计了上下文压缩机制,通过“语义记忆衰减”将关闭任务压缩为摘要以节省上下文空间。它主要服务于AI编程Agent,也适用于任何需要在多次AI会话间维持任务连续性的场景。
GPT-5.5因推理能力增强,提示词应转向精确定义结果、约束与停止条件,而非详细规定流程。相比前代,需采用更简短的结果导向提示,并重新评估推理强度需求。关键新增点包括显式人格设定与检索预算。指南强调不应直接迁移旧提示,避免限制模型搜索空间。此外,还涉及利用Preamble改善响应感知、设定停止条件、控制输出格式等实用技巧。
文章借波士顿道路源于牛径的典故,引出“最小阻力之路”概念,比喻人常受家庭、社会等外在结构驱使,陷入被动循环。作者指出,专注于“解决问题”的思维会强化结构性冲突,导致努力无效。真正的转变在于从“逃离现状”转向“创造愿景”,通过建立清晰愿景与准确现实认知,形成结构性张力。这种创造源于爱而非恨,是主动的“基本选择”。最后,文章将“结构”思维延伸至产品、AI、人际关系与组织等领域,强调改变命运的关键在于重塑内在与外在的河床结构。
为应对互联网被AI生成内容污染的问题,研究者提出“低背景标记”设想,计划训练仅使用历史文本的复古模型。团队集结了包括GPT-1/2开发者在内的专家,通过训练复古OCR模型处理旧书籍、报纸等资料,并利用礼仪手册、词典等结构化历史文本合成RLHF数据。为确保数据纯净,他们开发了基于文档n-gram的时代错位分类器,精心筛选了数千亿1931年前的公共领域标记进行训练。最终发布了130亿参数的Talkie模型,旨在探索语言模型的泛化能力。然而,该模型在发布后表现出强烈的种族偏见倾向,引发了新的伦理担忧。
@vista8 Deepseek的速度绝对是一大未被完全发掘的优势. 试了v4flash之后我把所有不涉及复杂推理的llm api调用全切到flash了. 速度…
在2014年的对话中,Marc Andreessen向Sam Altman揭示了风险投资的残酷逻辑:每年约4000家可投资公司中,仅约200家获得顶级风投注资,而其中仅有15家能实现1亿美元收入,它们贡献了当年风投行业几乎全部的回报。因此,投资者评估初创企业时,主要不是看其是否全面可靠,而是寻找能否让其跻身那极少数赢家的“不对称优势”,例如产品病毒式传播、精准的市场时机或创始人非凡能力等。在幂律分布主导的行业里,“全面优秀”远不如“在决定性方面卓越”。对创业者而言,关键在于展示能显著改变概率的独特突出优势,因为平庸在风投领域几乎注定失败。
Google Gemini迎来重磅更新,用户现可在聊天中通过一句话指令,直接生成并下载Docs、Sheets、Slides、PDF等主流办公文件,无需手动复制排版。该功能支持含LaTeX公式的学术文档、表格和图表,且免费向全球Gemini App用户开放。这标志着AI从输出文字的“对话时代”,迈向了直接产出可交付生产力资产的“交付时代”。Google凭借与Workspace生态的深度集成,实现了降维打击,对依赖AI生成文档的初创公司构成巨大压力,并推动行业竞争焦点转向直接产出可用成果。
关联讨论 4 条X:Gemini (@GeminiApp)X:Testing Catalog (@testingcatalog)X:Josh Woodward (@joshwoodward, Google Labs VP)X:Sundar Pichai (@sundarpichai)研究机构SemiAnalysis近日宣布引入名为MERLIN的Agentic研究总监及其团队。该团队能快速覆盖公司、财报和金融建模,启动分析仅需数分钟,远快于通常所需的15小时。同时,Agentic会议总监Claudia可即时处理海量会议资料并提供摘要;竞争分析研究员Snoopz则擅长搜集公开信息构建产品数据库与路线图。据其最新播客透露,整合这些AI智能体后,SemiAnalysis的人均Token使用效率已达Meta的两倍,实现了显著的“TokenMogging”效能提升。
研究发现,当语言模型面对困难问题时,其内部“脑活动”会收缩到更少的路径中。模型在感到困惑时会压缩内部思考,表现为从广泛分散的神经元激活,坍缩为最终处理层中高度集中的信号。这是因为系统放弃了稳健的分布式记忆,将计算强制压缩到狭小的专门空间以应对陌生挑战。关键在于,这种收缩效应可被量化为一个原始数值,从而无需猜测问题对AI是否过难。通过读取此内部信号,便能自动为系统提供恰如其分的“垫脚石”以辅助其解决问题。
Moonlake发布3D Agent,这是一个AI驱动的工具,能像专业技术艺术家一样从单张图片生成带关节、可编辑的3D资产和大型场景(包含数百物体)。它支持从零建模,自动处理独立部件和关节绑定,无需预设规则,并能重建完整可编辑的室内或室外场景。通过原生集成Blender,该工具实现了真实工作流的自动化,简化3D创作过程。
OpenAI在发布GPT-5.5后推出官方提示词指南,核心主张是摒弃冗长指令。指南指出,新模型具备更强推理能力,用户只需清晰描述期望结果、成功标准和限制条件,过细的步骤规划反而会限制模型搜索空间,导致输出僵化。关键建议包括采用简短的角色、目标等模块化提示;为搜索设定“检索预算”以控制成本;在创意写作中严格区分事实与虚构。这标志着提示词范式从“详细过程控制”转向“结果导向”。
NVIDIA在季度财报电话会议中宣布,其AI业务年化收入已突破370亿美元,同比增长123%。公司指出,当前正处于一个关键的平台转型期,技术栈正从由终端用户驱动的工作负载,转向由终端用户和AI智能体共同驱动。这一根本性转变将推动整个科技栈的变革,扩大市场总规模,并重塑全球经济的价值创造模式。为把握此机遇,NVIDIA正专注于两大核心任务:提供强大的AI基础设施和解决方案,以赋能所有企业在这一智能体计算时代实现成果最大化。