针对缺乏标注基准的语言、领域或监管场景,本文提出“无基准比较性安全评分”框架,明确了基于场景审计作为部署证据的合约条件。该方法依赖固定的场景包、评分准则等要素,并通过工具有效性链替代真实标签验证,包括对安全与篡改版本的响应灵敏度、目标驱动方差的主导性及重复运行的稳定性。工具SimpleAudit在挪威语安全包上验证有效。实际案例表明,模型安全性取决于具体场景类别和风险度量,因此需完整报告评分、差异、临界率等多维度信息,而非简化为单一排名。
迎广科梵特 covalent 工作站全塔台式机箱已在京东开启预约,售价999元。这款机箱专为AI与高性能计算设计,采用全塔结构,提供钢板或强化玻璃侧板选项。它支持EEB和EATX主板,可容纳多张大型显卡,兼容420mm一体式水冷,预装4颗CV140风扇。存储方面支持安装3颗3.5英寸或6颗2.5英寸硬盘,并内置风扇集线器、快拆侧板等模块化设计,满足高扩充与散热需求。
铭凡发布了全球首款无风扇5盘位全闪AI NAS产品S5。该产品采用第三代英特尔酷睿处理器,通过CNC铝合金机身、处理器热管及厚实的散热鳍片实现完全被动散热。其最高配备16GB LPDDR5X-7200内存,提供5个PCIe Gen4 M.2 SSD盘位,最大并发速度达10.8GB/s。外部接口丰富,包括10GbE和2.5GbE网口、USB-A、HDMI 2.1、双雷电4接口,并集成了Wi-Fi 7无线模块。
铭凡发布了面向极客的高端全闪AI NAS S7。该产品基于MS-03迷你主机工作站打造,搭载第三代英特尔酷睿Ultra 386H处理器,最大亮点是可容纳7块PCIe 4.0 NVMe SSD(包括4块x2和3块x4规格),并配备NAS状态副屏。接口配置豪华,提供2个40Gbps USB4(雷电4)、2个10Gbps SFP+光口、1个10Gbps RJ45和1个2.5Gbps vPro RJ45网络接口。设备运行铭凡自有操作系统MinisCloud。
《科学》最新研究指出,AI图像生成器虽已修复畸形手指等早期缺陷,但在光照、阴影、反射和透视几何上仍存在明显破绽。研究者指出,鉴别重点已转向“物理规则是否合理”。AI生成的图片因色彩鲜艳、戏剧感强,更接近大众对现实的想象,故易于传播。论文推荐通过检查“消失点”来鉴别:现实中平行线应汇聚于同一点,若图像中线条无法合理相交,则空间关系不成立。此方法同样适用于分析反射与阴影的平行光透视规律。
荣耀MagicOS五月更新正式推送,覆盖多款机型。核心更新包括:新增对AirPods的互联支持,可实现快速连接与电量查看;新增文件夹自动命名、动态壁纸通透模式及AI记账功能。YOYO助手升级AI情报官、过敏提醒等功能。系统层面优化了多音量面板动效,新增充电分离、截屏纯净模式、AI变声及游戏脚步声增强。互联生态扩展至长城魏牌V9X车机一碰投屏及荣耀视频一碰传。此外,相机构图引导、图库AI电影追色等多项体验也得到更新。
OpenAI发布三款实时语音模型。核心GPT-Realtime-2首次集成“GPT-5级推理”能力,支持复杂对话推理、并行调用工具及纠错,上下文窗口扩展至128K。GPT-Realtime-Translate支持70多种语言的实时翻译,能适应说话节奏并处理专业词汇。GPT-Realtime-Whisper则为低延迟场景提供流式语音转文字服务。
安装Codex Chrome插件需注意:确保Codex为最新版本并使用官方订阅登录,第三方API模式不支持。插件安装对网络节点有要求,部分区域(如香港)可能无法使用。建议将Chrome设为默认浏览器以便引导。安装后,需在对话中通过“@ Chrome”指令调用。若连接失败,可尝试重启电脑。
关联讨论 10 条X:OpenAI (@OpenAI)X:OpenAI Developers (@OpenAIDevs)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)开发者借助Cursor赠送的额度,花费约100美元和两天时间创建了Owl Eyes工具。该工具监控全球141个App Store区域的价格变动,核心功能包括比较ChatGPT和Claude等服务的地区价格、发现限免应用、追踪汇率差异及设备差价,并支持价格提醒。项目揭示数字产品的全球定价差异可达30%-70%,指出利用国家、汇率和定价层差异可能比寻找优惠券更能节省开支。
Anthropic正式推出适用于Excel、PowerPoint和Word的Claude,并面向所有付费用户公测Outlook版。该AI助手能跨Microsoft 365应用协同工作,如在Outlook中分类邮件并起草回复,在Word处理附件,在Excel分析数据,再于PowerPoint生成演示文稿。所有操作无需用户重复解释上下文,更改可在并排打开的文档间自动同步,对话记录随文件持久保存。付费用户现可通过Microsoft管理中心部署使用。
据《金融时报》报道,人工智能公司Anthropic计划今年夏季进行大规模融资,以扩展计算能力。此轮融资额最高可达500亿美元,融资前估值预计达9000亿美元,完成后公司估值将接近1万亿美元,从而超越竞争对手OpenAI目前约8520亿美元的估值。公司年化收入预计很快将超过450亿美元,较去年底大幅增长。投资者意在为其年底可能的IPO提前建立持仓,但具体条款尚未最终确定。
OpenAI为Chrome浏览器推出Codex扩展,将AI深度集成至浏览器工作流。该扩展允许Codex在浏览器内直接执行任务,如测试Web应用、读取多标签页上下文及调用开发者工具,旨在处理依赖实时页面状态和多标签信息的复杂连续工作。OpenAI强调扩展不会接管浏览器控制权,用户保有完全控制。目前Codex周活用户已超400万,较年初增长8倍,其应用正从代码辅助扩展至更广泛的日常浏览器任务。
关联讨论 10 条X:OpenAI (@OpenAI)X:OpenAI Developers (@OpenAIDevs)X:Testing Catalog (@testingcatalog)X:宝玉 (@dotey)X:Berry Xia (@berryxia)X:Greg Brockman (@gdb)X:Tibo (@thsottiaux)X:小互 (@xiaohu)X:邵猛 (@shao__meng)X:歸藏 (@op7418)法国检方于5月8日再次传唤埃隆·马斯克及X平台前CEO琳达·亚卡里诺,要求二人就针对X的初步刑事指控作出回应。此次调查已升级为正式刑事程序,涉及算法偏见、违反通信保密、传播儿童色情内容以及Grok聊天机器人制作深度伪造图像等多项指控。马斯克此前未出席自愿问询,美司法部拒绝配合并指责法方调查具政治动机。法国检方强调,调查旨在确保X在法运营遵守当地法律,若被传唤人未到案,将面临缺席指控。
在NAVIGATE 2026峰会上,新华三发布了面向万亿级大模型的全系列超节点UniPoD S80000,覆盖32卡至1024卡,最高可扩展至16384卡,提供一站式智算解决方案。同时,围绕“AI in ALL”战略,推出了一系列全栈新品,包括:高密全液冷整机S90000,实现1U 6CPU业界最高密度;单芯片102.4T智算交换机,大幅提升带宽与利用率;AI原生存储X20000系列,单节点带宽达200GB/s;新一代AI智能云,支持超大规模纳管;业界最高性能AI防火墙M9000-X;以及凝聚了23年运维经验的灵犀运维智能体。
CoreWeave发布2026财年第一财季报告,营业总收入达20.78亿美元,同比大幅增长111.61%。然而,公司归母净利润亏损7.40亿美元,同比亏损扩大134.92%。尽管利润端承压,经营现金流大幅改善至29.84亿美元。公司收入积压订单高达994亿美元,并与Meta签署了价值210亿美元的新合作协议。为支持算力扩张,公司获得了英伟达20亿美元投资及85亿美元贷款融资。
最新一期Lex Fridman访谈了 VLC 播放器开发者,还有FFmpeg的核心贡献者。 有些冷知识很有趣,比如: VLC 最早是为在校园网播放卫星电视信…
ZAYA1-8B 是一个新发布的开源人工智能模型,在数学计算任务中性能与 DeepSeek-R1 相当。该模型的活跃参数数量少于10亿,突显了在保持高性能的同时实现更高参数效率的突破。这一进展意味着模型在计算资源和存储需求上更为高效,可能降低部署成本并加速推理过程,为资源受限环境提供实用解决方案。ZAYA1-8B 的开发展示了在AI模型优化领域的重要进步,其开源性质有望推动进一步研究和应用。
我想用这个做个Voice Agent 能行吗? 直接给我进行问答和做一些定向的检测和人物啊! 有没有玩过的朋友?
中国移动发布移动模型服务平台MoMA,接入超过300款业界主流AI模型,包括自研“九天”及DeepSeek、通义千问等。平台基于国产算力部署自研推理引擎,通过智能路由与资源调度,实现单位Token成本降低约30%,资源占用率下降50%以上。其智能路由引擎支持成本、效果、均衡三种优先策略,并能实现故障秒级切换。平台还提供“机密模型”服务,通过硬件隔离技术保障政务、金融等高安全需求场景的数据安全。
Mozilla在Firefox浏览器中整合了Claude Mythos预览版,以增强其安全性。这一集成主要带来了内存安全方面的关键改进,通过先进的内存分配器与漏洞缓解技术,旨在显著降低浏览器遭受内存相关攻击的风险。该更新是Firefox持续强化安全架构的一部分,目前已在预览版本中提供测试。
针对多模态领域泛化评估标准不统一的问题,研究团队推出了首个统一基准MMDG-Bench。该基准涵盖动作识别、故障诊断和情感分析三大任务的六个数据集,系统评估了六种模态组合和九种方法在多种场景下的性能。基于大规模实验得出关键结论:现有专用方法相比基线提升有限;无单一方法能持续领先;当前性能与理论上限差距显著;三模态融合未稳定优于双模态;所有方法在数据损坏和模态缺失时性能均大幅下降,部分还损害了模型可信度。
针对世界行动模型(WAMs)执行固定预测动作、缺乏实时验证的问题,本研究提出一种自适应执行框架。该框架通过轻量级验证器FFDC,联合推理预测动作、视觉动态、真实观测与语言指令,以评估剩余动作序列的可信度,从而根据预测与观测的一致性动态调整执行的动作块大小。该方法在保持长时程执行效率的同时,提升了机器人在接触密集或困难阶段的响应能力。实验表明,其在RoboTwin基准上显著减少了模型前向传递与执行时间,并提高了任务成功率。
Ramp Labs在Ramp Sheets的Spreadsheet Agent中深度集成了Fast Ask检索子代理,解决了传统表格Agent因读取范围不当导致的效率低下和成本高昂问题。该子代理能自动导航并读取最相关数据范围,仅返回精炼答案,减少上下文污染与token消耗。其基于开源Qwen3.5-35B-A3B模型,通过与Prime Intellect合作进行RL后训练优化。实际应用中,它消除了主代理17.8%的无效工具调用,延迟接近Claude Haiku 4.5,准确率比Claude Opus 4.6高4个百分点,实现了更快、更准、更经济的系统性能。
卧槽!GPT每天有惊喜啊! 星巴克领Trae 的咖啡羊毛,顺手搞了个提示词! 发现好用啊!! 搞了几个案例是真的nice哦~ 有喜欢想要的🙋
据科技媒体挖掘三星One UI 9早期固件代码,发现其正在开发一款名为Driving Insights的AI驾驶助手应用。该应用利用手机传感器和AI算法,精准追踪用户的加速、转弯、刹车等驾驶行为数据,旨在帮助用户了解并改善驾驶习惯。应用支持连接车载蓝牙后自动记录行程,并可生成个性化驾驶周报,通过三星Now Brief推送。周报会基于数据分析提供反馈,如评价驾驶风格保守或动态,并在长途驾驶后提醒用户注意休息,防止疲劳驾驶。
索尼Xperia 1 VIII手机最新渲染图曝光,确认将采用全新方形相机模组,并提供黑曜石、董青石、石榴红及天然金四种配色。新机预计于2026年5月20日发布。核心配置包括6.5英寸120Hz OLED屏幕、高通第五代骁龙8至尊版芯片及12GB内存,并保留3.5mm耳机孔与双卡支持。影像系统方面,长焦镜头可能从上一代的连续光学变焦改为传统的4800万像素潜望式镜头,支持固定的3倍光学变焦。
商汤科技在新加坡MTX-Millipol TechX展览中展示了其前沿的视觉AI创新,旨在提升城市安全与智能化水平。其解决方案基于SenseFoundry单体算法模型生产平台和由SenseNova驱动的多模态视频理解智能体,涵盖从火灾检测到交通事故监测等公共安全领域。公司表示将与新加坡合作伙伴紧密协作,共同加速数字化转型,构建开放、包容且繁荣的本地AI生态系统。
Codex推出/side功能,允许用户在AI执行主要任务时,无需中断当前进程即可开启新对话窗口处理突发问题,如登录或点击操作。该功能支持在/side窗口运行期间继续开启新的/side对话,实现多话题并行插入,但并行窗口数量上限尚未明确。