AMD近日发布了四年来首款采用PCIe AIC形态的Instinct MI350P加速卡,主要面向现有数据中心基础设施升级。该卡采用新封装,规格相较MI350X大幅缩减:XCD芯片数量减半至4个,HBM3E内存降至4堆栈144GB,性能下降约50%,晶体管数量减少约60%。产品采用双槽全高全长设计,最大功耗600W,支持无风扇被动散热。
瑞莎在2026高通AI开发者日前夕,预热了两款基于高通硬件平台的飞牛fnOS NAS新品。其中,DragonStation定位高性能全闪存产品,搭载具备“超大核”CPU的Arm SoC,提供6个M.2 SSD盘位,支持10Gb网络,并能通过内置加速卡本地运行120B参数的AI模型。另一款DragonBay面向主流用户,提供4个存储位,其内部结构设计留有后续扩展空间。两款新品将在本月末于深圳举行的活动中正式亮相。
OpenAI 发布三款集成于Realtime API的实时语音模型,旨在解决语音交互中的延迟、打断处理和多语言支持难题。其中,GPT-Realtime-2具备GPT-5级推理能力,可在对话中进行推理、调用工具并处理打断,音频输入输出分别按每百万Token 32美元和64美元计费。GPT-Realtime-Translate支持70种输入语言同步翻译为13种输出语言,每分钟0.034美元。GPT-Realtime-Whisper提供低延迟流式转录,每分钟0.017美元。这些模型为开发复杂语音助手、实时翻译和转录应用提供了底层技术支持。
关联讨论 13 条OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)软银正与英伟达和富士康磋商,评估在日本本土制造AI服务器的可行性。该计划首先通过组装外购组件建立生产系统,目标是在2029年前逐步掌握完整的AI服务器制造流程。软银将打造配备高级GPU的高性能服务器,此蓝图已纳入公司中期经营计划,预计最快将于下周正式公布。软银CEO孙正义已向OpenAI投资超过300亿美元,显示出其在大型语言模型竞争中的全力投入。
昆仑芯(北京)科技股份有限公司已于2026年5月7日启动科创板上市辅导,辅导机构为中金公司。该公司前身为百度智能芯片及架构部,百度目前持股57.67%为控股股东。此前,昆仑芯已于2026年1月向港交所提交上市申请。中银国际报告评估其估值应处于300亿至1000亿港元区间的头部,对百度估值贡献约500亿港元。受分拆消息影响,百度港股曾单日上涨约9.35%。昆仑芯专注于AI芯片研发,产品主要面向数据中心与云计算场景。
苹果候任CEO约翰·特努斯明确公司AI战略核心:不追求技术营销噱头,专注以技术提升实际用户体验。在iOS 27预计带来重大AI更新的背景下,特努斯强调苹果不会单纯“发布技术”,而是确保AI功能切实改善产品体验,用户无需知晓功能是否由AI驱动,只需感受产品是否好用。这一立场直指当前科技行业为追赶浪潮而匆忙发布未经验证技术的痛点。
美国科技企业Cloudflare宣布裁员20%,涉及超过1100名员工,以推动公司向AI优先运营模式转型。公司CEO表示,此举并非仅为降本增效,而是为适应智能体时代重构公司架构。数据显示,Cloudflare的AI使用量在三个月内激增超过600%,公司内部日常运营已广泛依赖AI智能体对话。截至去年底,公司全职员工数为5156人,预计此次裁员将产生1.4亿至1.5亿美元的相关费用。
Claude 发布 v2.1.133 版本,新增多项配置与优化。主要新增 `worktree.baseRef` 设置以选择工作树分支基础,引入 `sandbox.bwrapPath` 等设置允许指定自定义二进制路径,并添加 `parentSettingsBehavior` 键供管理员控制设置合并策略。功能上,钩子现在可接收活动努力级别信息,Bash 工具命令可读取相应环境变量。此外,改进了焦点模式行为,并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题,包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。`claude --help` 现已列出远程控制选项,VSCode 扩展也修复了相关错误。
央视曝光宣称能“边行驶边充电”的电动自行车增程器存在安全隐患且无效。中国车企正加速布局加拿大电动汽车市场,比亚迪、吉利、奇瑞等瞄准每年4.9万辆的进口配额。鸿蒙智行智界V9将于5月15日上市,预售价39.98万元起。比亚迪大唐EV预售订单已突破10万台。理想设计团队否认MEGA设计失败,其CEO李想呼吁行业共同推广5C增程技术以缓解充电压力。此外,消息称苹果本月或将完成iPhone 18 Pro系列的OLED面板审批。
OpenAI与博通联合研发AI芯片项目“Nexus”陷入僵局。博通要求微软承诺采购首批芯片约40%的产能,才愿为首期建设出资。项目首期需1.3吉瓦算力,成本约180亿美元;总规模达10吉瓦,旨在2030年前上线以减少对英伟达依赖。OpenAI视自研芯片为降低运营成本关键,但微软尚未同意采购。若微软采购未达标,OpenAI需自行寻找其他买家。此前OpenAI与英伟达的类似千亿美元合作也已无果。
据报道,iOS 27系统将对Siri进行彻底重构,其底层将基于谷歌Gemini构建,交互模式将从指令式转变为类似ChatGPT的对话模式。新版Siri将与备忘录应用深度整合,用户可通过“把这个加到新备忘录”等语音指令,直接将AI生成的内容自动、完整地保存至备忘录,解决手动复制粘贴导致的流程繁琐和格式错乱问题。此外,Siri还能利用大语言模型能力,高效梳理信息并创建特定主题的备忘录。
Simplex 通过整合 ChatGPT Enterprise 和 Codex 来提升软件开发效率。该方案显著缩短了软件设计、构建和测试所需的时间,同时实现了 AI 驱动工作流程的规模化应用。这一变革旨在优化开发周期,利用先进的语言模型技术加速产品交付。
GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流,定位了效率低下的环节,并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用,直接提升了工作流的经济性与运行效率。
OpenAI为ChatGPT推出“可信联系人”功能,以应对对话中的自残风险。当系统检测到成年用户对话涉及相关内容时,会鼓励用户联系他人,并自动向其预设的联系人发送简短的电子邮件、短信或推送通知提醒,以促进沟通。通知不包含具体对话细节以保护隐私。该功能采用自动审核与人工复核结合,触发提醒的对话会交由人工安全团队处理,官方承诺对此类通知进行人工审核并力求在一小时内完成。此前,OpenAI曾因被指控鼓励用户自杀而面临诉讼。
据报道,苹果内置摄像头的AirPods已进入设计验证测试(DVT)阶段,最快有望于今年9月作为其首款AI可穿戴设备发布。该产品左右耳机配备低分辨率摄像头,用于捕捉环境视觉信息,以支持升级版Siri实现视觉问答等功能。其整体外观类似AirPods Pro 3,但耳机柄因容纳摄像头而加长。产品原计划2026年发布,因Siri升级延迟而推迟,此次升级得益于与谷歌Gemini的技术合作。苹果还在探索其导航提醒等用途,并为缓解隐私担忧内置了数据上传指示灯。
据彭博社记者马克·古尔曼爆料,苹果正在开发两款智能穿戴设备。一款是尺寸类似AirTag的吊坠配件,可夹在衣物或作为项链佩戴,配备常开摄像头和麦克风,依赖连接iPhone及iOS 27版Siri进行语音交互与数据处理,无屏幕和投影仪,项目仍处早期,可能于2027年发布。另一款是计划在2026年底或2027年初推出的智能眼镜,内置摄像头、扬声器和麦克风,支持拍照、通话及Siri通知,并与Apple Intelligence整合优化导航等功能,采用自主设计的塑料镜框,但第一代不配备AR显示功能。
据报道,OpenAI在推进其最新项目时,面临一个核心的财务运营问题:尚未确定具体的支付模式与资金解决方案。这一情况揭示了即便在技术快速发展的前沿,AI巨头在将宏伟蓝图转化为可持续商业实践的过程中,仍可能遭遇基础性的挑战。当前阶段的关键矛盾聚焦于“如何支付”,而非“能否实现”,这或许预示着行业在追求能力突破的同时,必须更扎实地构建其经济模型。
OpenAI扩展了网络安全领域的可信访问计划,推出了GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型。此举旨在帮助经过验证的网络安全防御者加速漏洞研究,并加强对关键基础设施的保护。新模型将为安全专业人员提供更强大的AI工具支持。
该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。
Anthropic公司发布了一项名为“自然语言自编码器”的研究,旨在将Claude模型的内部思维过程转化为人类可读的文本。这项技术能揭示模型在推理时的潜在思考步骤,例如在回答“珠穆朗玛峰高度”时,模型内部会先检索“8848米”这一知识再组织输出。该方法提升了AI的可解释性,有助于研究者理解并改进大语言模型的决策机制。相关论文和详细信息已在Anthropic官网公布。
关联讨论 2 条X:Anthropic (@AnthropicAI)Anthropic:Research(发表成果 · 网页)2025年10月,Anthropic公司开源了AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。近日,Petri升级至3.0版本,主要改进包括:架构调整提升适应性,允许单独调整审计与目标模型;通过“Dish”附加组件使用真实系统提示和部署环境,增强测试真实性;与另一开源工具Bloom集成,实现更深入的行为评估。为确保独立性与公信力,Petri的开发已移交非营利组织Meridian Labs。
Cloudflare向全球团队发送内部邮件,宣布公司迎来一个重大时刻。公司秉持透明度这一核心价值观,决定直接向外界同步这一关键信息。此举标志着Cloudflare在战略发展上迈出了重要一步,旨在为未来构建更坚实的基础。
AI生成的低质量内容正严重损害在线社区生态。这类被称为“AI垃圾”的内容充斥网络,导致社区讨论质量下降、用户参与度锐减。文章指出,一个原本活跃的技术社区因大量AI生成帖子的涌入,其高质量讨论帖数量在半年内下降了约40%,用户平均停留时间也大幅缩短。这种现象不仅稀释了有价值的信息,还加剧了信息噪音,使寻找真实、有用内容的难度增加,最终可能摧毁依靠用户贡献和互动维系的社区基础。
作者开发了一个名为“GitHub Repo Stats”的在线工具,用于解决GitHub移动端网站不显示仓库提交次数的问题。用户只需输入GitHub仓库的URL或“foo/bar”格式的仓库ID,该工具便会通过REST或GraphQL API获取并展示仓库的关键统计数据,其中首要指标就是提交总数。工具已提供实际示例,如查看simonw/datasette和simonw/llm这两个仓库的详细数据。
Simon Willison 为配合其“氛围编码”macOS演示工具,快速开发了一个名为“Big Words”的网页工具。该工具通过URL参数(如文本、渐变、大小)动态生成可自定义的幻灯片页面,解决了演示工具仅能嵌入URL内容的需求。用户可双击页面访问设置表单,自由调整文本内容、颜色、背景(支持纯色或渐变)、字体、字重、大小等多种视觉选项。所有设置均可生成一个特定的URL以便保存和分享,从而快速创建用于演示的文本幻灯片。
llm-gemini 0.31 版本发布,其中集成的 `gemini-3.1-flash-lite` 模型已结束预览状态,转为正式可用。该模型自三月份预览以来,其核心功能与特性未发生变化。此次更新标志着 Google 的 Gemini 系列模型在轻量级高性能路径上迈出了稳定的一步。
当前AI智能体的开发过度依赖提示工程,导致系统复杂且脆弱。文章主张智能体应转向采用编程中的控制流结构,如条件判断、循环和函数调用,以实现更可靠、可维护的决策与行动序列。这一转变能减少提示长度和调试负担,提升智能体处理复杂、多步骤任务的能力,是构建下一代实用AI助手的关键。
这份指南提供了审查由AI代理生成的pull requests的实用方法,重点包括审查时应关注的代码变更点、问题常见隐藏位置(如逻辑错误或安全漏洞),以及如何在代码合并前捕捉技术债务。它通过具体步骤帮助开发者系统评估自动化提交,确保代码质量,避免缺陷流入生产环境。指南强调主动审查策略,以应对AI代理在软件开发中日益普及的趋势。
Anthropic在15个月内估值从10亿飙升至300亿美元,但其企业价值与未来收入之比仅为17倍,远低于增长更慢的Palantir(49倍)。这一估值折扣主要源于四大因素:极高的资本密集度(如年成本达62亿美元的GPU协议)、未来盈利能力不明(可能成为软件公司或资本密集型公共事业)、收入增长的波动性,以及外生的政治与监管风险。市场正通过折扣来反映这个高速变化领域的不确定性。
OpenAI发布了三款新型语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。其中,GPT-Realtime-2具备与GPT-5相匹配的实时推理能力,旨在实现更流畅、智能的实时对话交互。GPT-Realtime-Translate支持超过70种语言的实时翻译,而GPT-Realtime-Whisper则专注于实时语音转写功能。这一系列模型标志着OpenAI在实时音频处理和交互领域的重要进展,有望显著提升跨语言沟通和语音应用的体验。
关联讨论 13 条OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI Developers (@OpenAIDevs)X:宝玉 (@dotey)X:OpenAI (@OpenAI)X:Testing Catalog (@testingcatalog)X:Kim (@kimmonismus)X:Greg Brockman (@gdb)X:Sam Altman (@sama)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)X:邵猛 (@shao__meng)X:Tibo (@thsottiaux)X:Eric Mitchell (@ericmitchellai)DeepSeek 4 Flash 本地推理引擎正式发布,这是一个专为苹果 Metal 框架优化的开源项目。它允许开发者在配备 Apple Silicon 芯片的 Mac 上高效运行 DeepSeek 4 模型,实现本地离线推理。引擎通过 Metal Performance Shaders 显著提升了计算性能,降低了延迟与内存占用。该项目已在 GitHub 开源,并在 Hacker News 上获得了关注。
OpenAI开始在ChatGPT中测试广告功能,旨在支持其免费服务的持续运营。测试强调广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性。该举措配套严格的隐私保护措施,并确保用户对广告体验拥有控制权。
Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。Claude能在四大微软应用间保持连续对话上下文,实现跨文件智能协作。例如,在Outlook中分类邮件并起草回复,在Excel中调整数据后,PowerPoint图表和Word文档会自动同步更新。企业管理员可通过微软管理中心统一部署,并配置OpenTelemetry进行全流程监控。该套件支持通过Claude账户或现有LLM网关访问,Microsoft 365 Copilot用户也可在Excel和PowerPoint中直接调用Claude。
关联讨论 2 条X:Claude (@claudeai)X:宝玉 (@dotey)研究人员提出文本条件联合嵌入预测架构(TC-JEPA),通过引入图像描述文本作为条件信息来降低掩码特征预测中的视觉不确定性。该方法采用细粒度文本调节器,对输入文本标记计算稀疏交叉注意力,从而调制预测的图像补丁特征。与基于掩码特征预测的I-JEPA相比,TC-JEPA能够学习到语义更丰富的视觉表征,解决了原有方法因视觉不确定性导致的语义学习不足问题。
Mozilla利用Claude Mythos Preview模型,成功定位并修复了Firefox中的数百个安全漏洞。此前AI生成的漏洞报告多为低质量信息,但随着模型能力提升及技术方法改进,报告质量发生显著变化。修复的漏洞包括一个存在20年的XSLT漏洞和一个长达15年的`<legend>`元素漏洞。值得注意的是,许多自动化攻击尝试已被Firefox现有的深度防御机制拦截。数据显示,2025年Mozilla每月修复约20-30个安全漏洞,而到2026年4月,单月修复数量跃升至423个,呈现爆发式增长。
研究发现,部分已发布的模型存在有限的意外对思维链(CoT)进行评分的情况。团队已修复受影响的奖励通路,并确认没有明确证据表明模型的可监控性因此下降。这表明当前强化学习训练中对CoT的意外评分影响有限,且修复后未对监控能力产生负面影响。
受人工智能芯片需求激增影响,主板市场正经历严重供应短缺,导致销量急剧下滑。行业数据显示,主板销量已下降超过25%,主要因芯片制造商将产能优先转向利润更高的AI芯片,限制了消费级主板核心组件的供应。华硕预计2025年将少售出500万块主板,技嘉、微星和华擎等其他主要厂商的销量也预计将显著减少。这一趋势反映出AI产业对传统PC硬件供应链造成的挤压效应。
Chrome浏览器近日从其帮助文档中撤回了关于“设备端AI不会将数据发送至Google服务器”的声明。这一修改表明,谷歌可能调整了其设备端AI功能的隐私数据处理政策,相关AI功能在本地处理数据时,或许仍存在将某些数据发送至服务器的可能性。该变动引发了技术社区的关注,在Hacker News上获得了超过100的讨论热度。
ChatGPT 推出了一项名为“可信联系人”的可选安全功能。当系统检测到用户存在严重的自残风险时,该功能会主动通知用户预先设定的一位可信联系人。这项更新旨在通过社交支持干预,为面临心理健康危机的用户提供额外安全保障。