开源项目Stash发布,为AI代理提供长期记忆与上下文管理能力。它通过独立存储和检索对话历史,使开发者无需依赖特定API即可为应用添加持久化记忆功能。该项目已在GitHub开源,并获Hacker News社区关注,降低了构建复杂AI代理的门槛。
自动驾驶公司Momenta在2026北京车展披露,其智能驾驶方案搭载量过去一年从近30万台跃升至逾80万台,近期每新增10万台用时不到40天。公司已交付超70款量产车型,定点超200款。宝马新世代iX3、i3及7系搭载其L2级系统;奥迪E7X将首次应用其L3级技术;奔驰合作系统已搭载于纯电CLA,年内将落地9款新车型。此外,其Robotaxi服务已在上海运营,并与奔驰等在阿布扎比合作,与Uber、Grab的海外合作也在推进中。
“华为眼镜”App鸿蒙版推送1.0.1.356更新,新增多项功能。主要更新包括:在应用首页新增“小艺看世界”功能入口;应用设置中增加定制开关机功能,支持眼镜清晨自动唤醒;相机设置新增4:3视频比例选项,以扩大纵向录像视野;新增手表协同功能,可通过手表遥控眼镜拍照。该App配套的华为AI眼镜已于近日发布,起售价为2499元。
OpenAI 的 Romain Huet 确认,公司将不会发布独立的 GPT-5.5-Codex 模型。自 GPT-5.4 起,Codex 已与主模型统一为一个单一系统,不再有独立的代码生成模型线。GPT-5.5 在此基础上更进一步,在智能体编码、计算机使用以及任何在计算机上执行的任务方面都取得了显著的能力提升。
关联讨论 7 条X:Greg Brockman (@gdb)The Decoder:AI News(RSS)Simon Willison 博客X:Sam Altman (@sama)X:Tibo (@thsottiaux)OpenAI:官网动态(RSS · 排除企业/客户案例)X:Testing Catalog (@testingcatalog)阿里巴巴新发布的开源模型 Qwen3.6-27B 在多项编程基准测试中超越了其前代模型。该模型仅拥有 270 亿参数,而其前代模型的参数量是其 15 倍。这一结果表明,模型在代码能力上实现了显著的效率提升,以更小的规模取得了更优的性能。
关联讨论 2 条Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)美联储的一项新研究显示,自 ChatGPT 发布以来,美国程序员岗位的增长速度已近乎减半。生成式 AI 显著改变了程序员等专业群体的日常工作,这种影响现已体现在就业数据上。研究指出,程序员是受生成式 AI 影响最深的职业群体之一,其就业增长放缓是这一技术变革的直接反映。
关联讨论 1 条IT之家(RSS)项目“Wuphf”是一个受卡帕西风格启发的大语言模型维基系统,支持Markdown格式和Git版本控制。其核心特点是可由用户设定的AI代理自动维护和更新内容,实现了知识库的持续自主管理。该项目已在GitHub开源,并在Hacker News上获得了100点热度。
上海中紫星公司研发的智能原生芯片NEU将于今年第四季度流片。该芯片采用以存储为中心的创新设计,避免了传统架构中数据频繁搬运的能耗与带宽瓶颈,并直接在硬件拓扑上支持神经网络连接。实测数据显示,NEU在执行同等AI推理任务时,速度可达顶级GPU方案的近100倍,同时能耗降低90%。公司创始人翟四通拥有海思EDA框架建设背景,团队汇聚了来自英特尔、英伟达等企业的跨学科人才,实现了从架构到编译器的全体系自研。
一项研究发现,不同架构和规模的语言模型在学习过程中,其内部对数字的表示形式高度相似。研究通过分析多种模型发现,数字的向量表征在潜在空间中呈现出清晰的线性顺序和等距间隔,这与数字本身的大小顺序一致。这一现象表明,语言模型可能通过类似机制捕捉数字的抽象概念,揭示了其内部表示的一种普遍规律。
关联讨论 1 条HuggingFace Daily Papers(社区热门论文)在2026九峰山论坛上,新凯来旗下万里眼公司发布了65GHz采样示波器,旨在破解1.6T高速光模块的量产测试瓶颈。该产品面向AI算力驱动下光互连技术向1.6T演进的需求,实现了三大突破:500kHz采样率将测试效率提升100%;65GHz带宽支持单波200G测量,为1.6T通信奠定基础;12μW超低光功率噪声保障了高精度生产。此举贯通了1.6T研发与量产的全流程测试。
Anthropic 进行了一项内部实验,让 69 个 AI 代理在员工内部市场中代表人类进行为期一周的交易。结果显示,性能更强的 AI 模型能为自己代理的用户争取到更有利的交易条件,而使用较弱 AI 代理的员工则完全未察觉到自身处于劣势。这一发现警示,若未来 AI 模型开始广泛代理人类进行真实交易,此类“强者愈强”的动态可能会加剧现有的经济不平等。
关联讨论 1 条X:阿易 AI Notes (@AYi_AInotes)WUPHF 是一个为 AI 员工设计的协作办公平台,通过一个命令即可启动,在本地提供 Web 界面。它将不同角色的 AI 智能体置于一个共享的虚拟办公室中,使其可见、可争论并协作完成任务。平台为每个智能体提供私人笔记,团队共享一个基于 Markdown 和 Git 的本地维基,智能体可自主将可靠信息同步至团队知识库。项目目前处于 1.0 版本前的预发布阶段,默认使用 Claude Code,支持通过命令行参数灵活配置。
在2026北京车展上,元戎启行宣布其高级辅助驾驶系统已在国内超30万辆汽车上搭载,预计今年将新增100万辆。公司已与长城、吉利、Smart等品牌超过15款车型合作,覆盖15万至30万元主流价格区间。技术层面,公司已全面转向大模型自动驾驶路线,多模态大模型能力在2026年初取得突破,目标是实现千公里级MPCI。此外,公司正从多个小模型转向统一基座大模型架构,并将模型单次迭代周期从100余小时压缩至10余小时。
荣耀YOYO成为安卓阵营中首个接入DeepSeek-V4大模型的AI智能体。此次接入带来三大核心升级:模型性能更强、上下文处理长度更长、推理效率更高。用户需将YOYO智能体升级至90.10.28.041及以上版本,并在MagicOS 8.0及以上系统环境中即可抢先体验此次更新。
开源项目“Browser Harness”发布,旨在赋予大型语言模型(LLM)在浏览器中自主完成任意任务的能力。该工具通过提供一个可编程的浏览器控制框架,使LLM能够像人类一样操作网页,执行点击、输入、导航等复杂交互。此举有望突破当前AI代理在自动化网络操作方面的限制,扩展LLM的实际应用场景。该项目已在GitHub开源,并在Hacker News社区获得100点热度关注。
阿联酋计划在两年内将其一半的政府运营转变为自主人工智能系统管理。这一雄心勃勃的目标旨在通过部署自主AI代理来大幅提升政府效率和公共服务水平,标志着国家治理向高度自动化转型的关键一步。
苹果Apple Music副总裁透露,平台新提交曲目中超过三分之一为完全AI生成,但这些AI音乐的实际播放量占比不到0.5%,几乎为零。为维护平台音乐完整性,苹果已研发内部技术用于识别AI生成内容,并能分析AI模型使用程度。同时,公司要求唱片公司和发行商披露歌曲中的AI使用情况,并通过内部系统验证披露信息的真实性。苹果强调其坚持付费模式,以保障艺术家收益和价格一致性。
阿联酋总统穆罕默德·本·扎耶德宣布,该国计划在未来两年内将50%的政府部门、服务和运营转变为由Agentic AI驱动。此举将使阿联酋成为全球首个大规模应用此类AI处理政府事务的国家。Agentic AI是一种能够独立执行任务、管理流程并支持决策的自主人工智能系统。为实现这一目标,政府将对各部长、干事及联邦机构进行评估,考察其AI实施进度,并为所有政府雇员提供AI知识培训,以推动整体政府转型。
关联讨论 1 条X:小互 (@xiaohu)Google 计划向人工智能公司 Anthropic 投资高达 400 亿美元。Anthropic 是聊天机器人 Claude 的开发商,被视为 ChatGPT 的主要竞争对手。加上亚马逊此前承诺的 250 亿美元投资,这意味着在短短几周内,Anthropic 将获得高达 650 亿美元的巨额资金注入。这笔投资将极大增强 Anthropic 在 AI 领域的研发与竞争实力。
关联讨论 4 条Hacker News 热门(buzzing.cc 中文翻译)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:Testing Catalog (@testingcatalog)Yeelight智能雷达人在护眼吸顶灯RadarSense已在小米平台开启众筹,起售价269元。该产品主打毫米波雷达人在感应技术,通过AI算法识别10米范围内人体的动静状态,实现无感自动开关灯,并能有效减少误触发。其采用双蓝光豁免级技术,显色指数高达Ra99,同时降低有害蓝光且无可见频闪。灯具内置160W恒流驱动电源,支持亮度自由调节,并已接入米家App,兼容超级小爱、遥控器及墙壁开关控制。
英伟达宣布其Blackwell平台已适配DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理;DeepSeek-V4-Flash则为284B总参数量与13B激活参数,主打高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度。实测显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱性能超过150 tokens/sec/user。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理,vLLM支持扩展至100个以上GPU。
关联讨论 3 条X:AK (@_akhaliq)Hugging Face:Blog(RSS)X:Rohan Paul (@rohanpaul_ai)一篇来自个人博客的文章《我还能属于科技圈吗?》在Hacker News上获得102点热度,反映了科技从业者对行业快速变化的普遍焦虑。文章核心探讨了在人工智能等技术浪潮冲击下,个体开发者产生的职业倦怠与身份认同危机。作者通过个人经历,质疑在技术迭代日益加速的背景下,传统技能与职业路径是否依然有效,并引发了对科技圈包容性与可持续性的思考。
OpenAI CEO奥尔特曼致信加拿大坦布勒里奇镇,为未及时向警方通报枪击案嫌疑人活动记录正式道歉。2026年2月,18岁嫌疑人制造的枪击案导致8人死亡。此前在2025年6月,OpenAI系统曾标记并封禁其涉及暴力描述的ChatGPT账户,虽有员工建议联系执法部门,但公司高层未采取行动。悲剧后,OpenAI发现嫌疑人还持有第二个账户。奥尔特曼承诺防止事件重演,公司已加强安全协议,未来类似情况将把信息移交执法部门。
一个GitHub项目演示了将IBM Quantum量子计算后端替换为Linux系统的伪随机数生成器/dev/urandom。实验表明,使用经典随机源替代后,在特定量子线路模拟任务中仍能产生与量子后端相似的输出结果,其保真度达到约0.5。该项目以讽刺手法质疑当前某些量子计算演示的实际效用,暗示其可能并未展现出超越经典随机过程的明显优势。
OpenAI 针对新发布的 GPT-5.5 API 模型发布了详细的提示指南。核心建议包括:在处理多步骤任务时,应在调用工具前先向用户发送简短的状态更新,以提升交互体验。官方强调 GPT-5.5 应被视为一个需要重新调优的新模型系列,而非 GPT-5.2 或 GPT-5.4 的直接替代品,建议从零开始构建提示,而非沿用旧有提示。开发者可通过 `openai-docs` 技能使用 `$openai-docs migrate this project to gpt-5.5` 命令来辅助代码迁移,官方升级指南中还包含了轻量的提示词改写建议。
关联讨论 1 条The Decoder:AI News(RSS)为突破海洋人工智能面临的数据瓶颈,研究团队发布了大规模多模态海洋语料库OceanPile。该语料库整合了声纳、水下图像、科学图文等多源异构数据,构建了统一集合OceanCorpus;通过分层海洋知识图谱引导,生成了高质量指令数据集OceanInstruction;并建立了人工标注评估基准OceanBenchmark。研究采用多阶段质量控制流程确保数据的科学性与跨模态对齐。实验表明,基于该数据训练的模型性能显著提升。全部数据集已开源,旨在推动海洋专用多模态大模型的发展。
针对模拟电路设计中跨SPICE网表、原理图和功能描述等异构表示检索的难题,本研究提出了统一的三模态检索框架AnalogRetriever。该工作基于Masala-CHAI构建高质量数据集,并通过两阶段修复流程将网表编译率提升至100%。框架采用视觉语言模型编码原理图和描述,使用端口感知关系图卷积网络编码网表,并通过课程对比学习将三者映射到共享嵌入空间。实验表明,其在所有六个跨模态检索方向上的平均Recall@1达到75.2%,显著优于基线。集成至AnalogCoder智能体框架后,能持续提升功能通过率并完成此前无法解决的任务。代码与数据集将开源。
本研究针对联邦学习中的通信瓶颈与隐私风险,提出一种结合拉普拉斯差分隐私与自适应量化的方法。该方法采用基于轮次的余弦退火策略进行全局比特调度,并依据客户端数据集熵动态分配量化比特数。在CIFAR10、MNIST及医学影像数据集上的实验表明,相比32位浮点训练,该方法在保持模型精度的同时,将通信数据总量最高减少了52.64%(MNIST)、45.06%(CIFAR10)以及31%至37%(医学影像数据集),并通过差分隐私机制提供了严格的隐私保护。
研究团队提出V-GRPO方法,通过将基于证据下界的似然替代函数与GRPO算法结合,解决了去噪生成模型与人类偏好对齐的难题。该方法降低了替代函数的方差并控制梯度步长,在文本到图像合成任务中实现了最先进的性能。相比现有方法MixGRPO和DiffusionNFT,V-GRPO分别带来2倍和3倍的加速效果,同时保持训练稳定性并与预训练目标自然对齐。
工业维护中,AI助手常因解释泛化、缺乏遥测基础而影响信任。为此,研究团队推出IndustryAssetEQA,该系统结合事件遥测表征与故障模式影响分析知识图谱,实现针对工业资产的神经符号具身问答。在覆盖旋转机械、涡扇发动机等四种资产类型的数据集上评估显示,相比纯大语言模型基线,其结构有效性最高提升0.51,反事实准确性最高提升0.47,解释蕴涵度提升0.64,并将专家评定的严重过度断言从28%降至2%(降幅约93%)。相关代码、数据集及知识图谱已开源。
研究提出EPO-Safe框架,探索大语言模型智能体能否仅凭经验发现隐藏安全目标。该框架让智能体迭代生成计划,接收稀疏的二进制危险警告,并通过反思演化出自然语言行为规范。实验在五个AI安全网格世界及其文本场景中进行,结果显示仅需1-2轮(5-15回合)即可发现安全行为,并生成可解释危险假设的人类可读规范。关键发现是,仅基于奖励的标准反思会主动损害安全,加速“奖励破解”,因此反思必须与专用安全通道结合。即使在50%非危险步骤出现虚假警告的噪声环境下,平均安全性能仅下降约15%,跨回合反思能自然过滤不一致信号。最终演化出的规范是一套可通过交互自主发现、可审计的行为规则集。
为应对大语言模型和视觉语言模型数据估值中的计算瓶颈,研究团队提出了For-Value框架。该方法基于理论分析,利用预训练模型的表征能力,通过最终隐藏层表征与预测误差的对齐关系来捕获数据价值。For-Value采用封闭表达式计算,仅需单次前向传播即可完成估值,无需昂贵的反向传播,支持高效的大规模批量计算。实验表明,该方法在识别关键数据和错误标注数据方面达到或超越了基于梯度的基线方法,同时实现了显著的效率提升。
针对生成式AI模型评估成本高昂的问题,本文提出主动评估框架ProEval。该框架利用迁移学习与预训练高斯过程代理模型,将性能估计建模为贝叶斯积分,将故障发现建模为超水平集采样,从而主动选择高信息量的测试输入。理论证明其估计器具有无偏性与有界性。在推理、安全对齐和分类任务上的实验表明,ProEval仅需8-65倍更少的样本即可实现误差在1%以内的性能估计,同时在严格评估预算下能发现更多样化的故障案例,效率显著优于基线方法。
该项目致力于通过开源与开放科学推动人工智能的发展与普及。团队正持续推进技术民主化进程,旨在让更广泛的群体能够接触并利用先进AI工具。其核心路径是依托开放协作模式,降低技术门槛,促进创新生态的构建。
加拿大AI公司Cohere已收购德国AI初创公司Aleph Alpha,后者曾被视作欧洲对标OpenAI的竞争者。此次收购距Aleph Alpha联合创始人Jonas Andrulis被驱逐仅数月。零售巨头Schwarz集团为这笔交易投入了6亿美元资金。
阿里云百炼平台宣布首发上线DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,其API定价与DeepSeek官网完全一致。其中,Flash版本输入价格低至每百万Tokens 1元,输出价格为每百万Tokens 2元。两款模型均支持100万Tokens的超长上下文,V4-Pro专为复杂任务设计,V4-Flash侧重高效经济。此次接入进一步丰富了百炼平台作为“AI模型超市”的生态,为开发者提供了一站式调用各类顶尖模型的灵活选择。
小米一款型号为“2608BPX34C”、代号“lhasa”的折叠屏新机近日现身代码库,该机有望被命名为MIX Fold 5或小米17 Fold。其最大亮点是搭载了“玄戒 O3”芯片,这意味着小米可能直接跳过了“玄戒 O2”的命名。此前有消息称,某厂折叠屏新机暂定7月发布,其镜头模组和物料将实现大面积国产化,外界普遍认为所指即为小米此款新机。
基于AI专家卡帕西讲座的交互式图解指南已发布,详细解析大型语言模型(LLMs)的工作原理。该指南以动态可视化形式呈现,简化了LLMs的架构、训练和推理过程等复杂概念,提升学习可访问性。在Hacker News社区获得103个赞,显示其受关注程度。用户可通过在线链接直接体验这一教育工具,深入了解LLMs内部机制。
韩国警方逮捕了一名男子,因其利用人工智能生成了一幅逃跑狼的虚假图像,并在网络上传播,误导执法当局启动了不必要的搜救行动。这起事件揭示了AI生成内容可能被滥用于制造虚假信息,对公共资源造成浪费,并引发社会恐慌。随着AI技术的普及,此类案件凸显了加强数字内容监管和公众辨识能力的紧迫性。警方此次行动表明了对技术滥用行为的法律追究态度,以防范类似风险。
在2026北京车展上,小鹏集团宣布其全球首款量产分体式飞行汽车“陆地航母”已获7000台预售订单,计划于2026年内启动规模化量产,售价控制在200万元以内。同时,最拟人的人形机器人IRON同步亮相,预计今年实现量产,它搭载自研AI芯片、全固态电池及720°鹰眼视觉系统。小鹏已完成至“小鹏集团”的升级,未来将聚焦AI汽车、飞行汽车和AI机器人三大方向。