5月1日
21:15
HuggingFace Daily Papers(社区热门论文)
50
Instruction-Guided Poetry Generation in Arabic and Its Dialects

研究团队针对阿拉伯语诗歌创作,构建了一个大规模、高质量的指令数据集,涵盖现代标准阿拉伯语及多种方言。该数据集支持根据风格、韵律等预设条件进行诗歌写作、修订、续写以及诗歌分析任务。通过在大型语言模型上微调该数据集,实验表明模型能有效生成符合用户要求的诗歌,这一结果已通过自动评估和阿拉伯语母语者的人工评估得到验证。相关数据和代码已开源。

数据/训练论文/研究
21:10
Cloudflare Blog
精选64
Introducing Dynamic Workflows:可随租户流转的持久执行功能

Dynamic Workflows 是一个函数库,支持将持久执行实时路由至租户提供的代码。该库基于 Dynamic Workers 构建,使平台能够以近乎零闲置成本为数百万个独特工作流提供服务。它允许平台根据租户需求动态分配执行资源,实现了工作流与特定租户代码的即时绑定,大幅降低了多租户场景下的运营开销和资源浪费。

产品更新部署/工程

推荐理由:这个库解决的是 AI 代理平台的多租户持久化执行难题,Cloudflare 把动态路由和按需分配做到了几乎零闲置成本,做 Agent 平台的应该认真看看。
20:11
IT之家(RSS)
40
全国首支机器人交警中队在杭州正式上岗,能提醒违章、为游客指路

全国首个交通管理机器人中队“杭警智行”于“五一”假期首日在杭州正式上岗。首批15台机器人部署在西湖景区周边、湖滨商圈及延安路、西湖大道等主干道沿线,覆盖多个重要交通节点。它们主要承担非机动车和行人违法劝导、交通指挥、游客问路指引等任务,与路面警力协同作战以提升管理效能。机器人已全面接入大语言模型,在断桥、动物园等景区路口可通过语音提问提供路线规划,在钱江路、延安路等路段则重点监控违法行为。

具身智能行业动态
20:11
IT之家(RSS)
42
安克首款神经网络存算一体 AI 音频芯片"ANKER Thus"5 月 22 日发布,同期推出旗舰耳机产品

安克将于5月22日发布其首款神经网络存算一体AI音频芯片“ANKER Thus”。该芯片采用CPU与存储合一的架构,旨在提升算力,以实现端侧实时音频AI功能。同期,安克将推出搭载此芯片的旗舰耳机产品。根据海报信息,该耳机为入耳式设计,充电盒外观圆润,且正面可能配备一块屏幕,具体规格尚未公布。

产品更新端侧语音
19:17
Hacker News 热门(buzzing.cc 中文翻译)
精选76
Grok 4.3

x.ai 正式发布了 Grok 4.3 模型,开发者可通过官方文档获取详细信息。该模型在 Hacker News 社区获得关注,相关帖子收获了 100 点热度。此次发布标志着 Grok 系列模型的持续迭代更新。

xAI多模态推理模型发布
关联讨论 1X:OpenRouter (@OpenRouter)
推荐理由:xAI 的 Grok 4.3 如期而至,性能和对标都写在文档里了,想了解最新大模型实力的开发者值得花五分钟看一眼。
19:11
IT之家(RSS)
52
浙江杭州为具身智能机器人立法,今起正式施行

全国首部具身智能机器人领域地方性法规《杭州市促进具身智能机器人产业发展条例》于5月1日正式施行。该条例率先对“具身智能机器人”作出明确定义,填补了概念空白,并明确了产业与监管边界,旨在推动创新资源向算法、感知等核心技术集聚。条例同时支持关键部件研发与平台建设,并推动机器人在应急救援、医疗康养等公共场景落地。目前杭州已集聚机器人相关企业700余家,2025年该产业集群产值达1068亿元。

具身智能政策/监管
18:47
The Decoder:AI News(RSS)
58
GPT-5.5 在网络攻击测试中与 Claude Mythos 匹敌,英国 AI 安全研究所发现

英国 AI 安全研究所评估发现,OpenAI 的 GPT-5.5 成为第二个能够自主完成完整网络攻击模拟的 AI 模型。其表现与 Anthropic 的 Claude Mythos 几乎持平,后者目前仍仅限小范围使用。GPT-5.5 现已通过 ChatGPT 和 API 向公众广泛提供。

AnthropicOpenAI安全/对齐评测/基准
关联讨论 2Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)
18:11
IT之家(RSS)
54
麦肯锡:我们的客户在 AI 上每投入 1 美元,就能获得 3 美元回报

麦肯锡最新研究显示,AI投资正为企业带来显著财务回报。在一批表现最优的公司中,AI投资平均每投入1美元可获得约3美元回报。研究基于对20家全面应用其“Rewired”转型框架企业的分析,该框架强调通过优化人才、运营、技术和数据将数字化投资转化为业务价值。大多数公司在投入AI一至两年后开始看到现金流回报,而真正的利润提升通常还需两到四年,平均核心利润可提高约20%。约三分之二的成功公司将AI应用集中在三个或更少的关键领域,而非全面铺开。

现象/趋势行业动态
17:47
The Decoder:AI News(RSS)
57
Google Deepmind的"AI协诊医生"在盲测中击败GPT-5.4,但仍落后于经验丰富的医师

Google Deepmind正在开发一款“AI协诊医生”系统以辅助医生诊疗。在模拟研究中,该系统表现优于GPT-5.4,但仍未达到经验丰富医师的水平。研究同时指出,类似ChatGPT语音模式的技术目前尚无法胜任严肃任务,更难以应用于医疗咨询场景。这项进展揭示了AI在专业医疗辅助领域的当前能力边界与发展潜力。

DeepMindGoogle推理论文/研究
17:11
IT之家(RSS)
53
微软 Word 上线"律政助手"智能体:能理解复杂法律文档、识别合同风险

微软在Word中推出面向法律工作的Legal Agent智能体,旨在帮助法律专业人士自动化处理审阅合同、生成红线修改稿等重复性工作。它能分析协议内容,识别风险与义务,并根据内部标准提出修改建议。该功能内置红线修改引擎,可稳定处理文档格式与修订痕迹,并保留完整的谈判过程记录。目前,Legal Agent已通过美国Frontier计划在Windows桌面版Word的Copilot智能体菜单中提供。

Microsoft产品更新行业动态
17:11
IT之家(RSS)
40
微信公布2026年4月朋友圈热度谣言,含"电动车淘汰赛"等

微信安全中心公布2026年4月朋友圈十大谣言。其中包括“全国开展电动车淘汰赛”实为自媒体拼接旧闻;四川泸州“楼房倒塌”视频系AI伪造,发布者被罚;深圳“八万床位空置”纯属失实;网传“医院取消24小时值班”为政策曲解,并无新规。此外,“黑猪治沙”、“养老金重新核算”及“厂房大火”等信息也均被证实为谣言。这些不实信息多为博取流量,相关造谣传谣者已被依法处置。

其他
17:11
IT之家(RSS)
3
关注俞浩享8折,追觅S60 Pro旗舰扫地机器人3398元起新低

追觅S60 Pro旗舰扫地机器人推出限时优惠。关注俞浩社交媒体可享8折,水箱版原价4599元,京东国补后叠加“以旧换新”最低3398元;上下水版最低3869元。该产品具备33000Pa吸力、4700Pa高压活水洗、双目视觉避障(成功率99.2%)、9.75cm超薄机身、4cm越障及仿生机械臂贴边清洁(覆盖率99.9%)等功能。基站支持100℃高温洗拖布、自动集尘等,并接入大模型支持方言控制。

具身智能行业动态
17:11
IT之家(RSS)
42
马斯克旗下公司"肥水不流外人田"?特斯拉去年从 SpaceX 和 xAI 获得超 5 亿美元

监管文件显示,特斯拉2023年向马斯克旗下的SpaceX和xAI销售产品及服务,共获得约5.73亿美元收入,主要包括向xAI销售电池系统及向SpaceX销售车辆。此外,特斯拉还向这两家公司投资了20亿美元并支付了咨询服务费。马斯克持续整合其旗下公司业务,引发了投资者对资源转移和潜在利益冲突的担忧,并引发了关于未来可能进一步合并的讨论。

xAI行业动态
16:47
The Decoder:AI News(RSS)
51
Mistral 新旗舰模型 Medium 3.5 将聊天、推理和代码功能整合为一体

Mistral 发布其新旗舰模型 Mistral Medium 3.5,它将此前独立的聊天、推理和代码生成模型合并为一个单一产品。同时,该公司为其编程工具 Vibe 增加了异步云代理功能,并为聊天产品 Le Chat 引入了新的智能体模式。

智能体推理模型发布编码
16:11
IT之家(RSS)
58
OpenAI 总裁布罗克曼:AI 帮你编写的代码占比已从二成猛增至八成

OpenAI总裁布罗克曼指出,AI编程工具进步显著,已从辅助角色转变为主导力量。仅去年12月,AI辅助编写代码的比例就从20%跃升至80%。OpenAI的Codex平台现已能支持“任何使用电脑工作的人”。布罗克曼强调,人类仍需对合并的代码负责,应避免盲目使用或完全拒绝AI生成代码。行业趋势显示,谷歌内部目前75%的新代码由AI生成并交由人工审核,Meta和Anthropic也报告了类似进展。Anthropic CEO预测,未来一年内AI可能编写绝大部分甚至全部代码。

OpenAI现象/趋势编码
16:11
IT之家(RSS)
29
装机工具 Rufus 4.14 发布:新增静默安装,可禁用 Copilot 等预装提速 Win11 启动

装机工具Rufus发布4.14正式版,新增无人值守静默安装模式,可自动部署至首个检测到的磁盘,提升装机效率。新版本支持在安装时禁用Teams、Outlook、Copilot等预装应用,以减少后台资源占用,加快Windows 11系统启动速度,尤其适合低配硬件。此外,本次更新修复了创建Windows To Go启动盘时因新版BCDBoot导致的错误,解决了Windows 11 25H2版本的兼容性问题,并修正了本地账户首尾空格引发的创建失败问题。

其他
15:11
IT之家(RSS)
61
目标内存速率 12800 MT/s,固态技术协会 JEDEC 宣布 DDR5 MRDIMM 关键进展

固态技术协会(JEDEC)宣布了DDR5 MRDIMM标准的多项关键进展。其正式发布了JESD82-552标准(DDR5 MDB02数据缓冲器),并预告将推出JESD82-542标准(DDR5 MRCD02寄存时钟驱动器),以通过多路复用秩技术提升内存带宽,解决传统DIMM的瓶颈。此外,委员会正开发目标速率达12800 MT/s的Gen 2 DDR5 MRDIMM原卡设计,Gen 2模块标准接近完成,并已启动Gen 3标准的开发工作,旨在满足AI与云计算对极高内存带宽的需求。

数据/训练行业动态部署/工程
15:11
IT之家(RSS)
57
扎克伯格致 Meta 员工:公司追踪电脑操作,是因为你们比外包普通员工聪明

Meta公司CEO扎克伯格在全员会议上解释,公司通过内部系统追踪员工的鼠标移动、击键等电脑操作,旨在利用这些数据训练AI模型,以在AI竞争中取得优势。他声称Meta员工平均智力高于外包普通员工,因此其操作数据更具价值。该计划名为“智能体转型加速器”,员工无法选择退出,引发了关于员工正无偿训练可能取代自身岗位的AI、以及职场信任与同意权的争议。Meta声明数据仅用于模型训练,并设有安全保护措施。

Meta数据/训练行业动态
14:14
HuggingFace Daily Papers(社区热门论文)
62
Claw-Eval-Live:面向动态真实工作流的实时智能体基准

Claw-Eval-Live 是一个用于评估工作流智能体的实时基准,它将可定期刷新的公共需求信号层与可复现的时间戳快照相分离。该基准基于当前版本中 ClawHub Top-500 技能构建了 105 项涵盖商业服务与本地工作空间修复的受控任务。评估过程全面记录执行轨迹、审计日志、服务状态与运行后产物,并综合使用确定性检查与结构化大模型评判。在对 13 个前沿模型的公开统一测试中,领先模型仅通过 66.7% 的任务,无一达到 70%。失败多集中于人力资源、管理及多系统业务工作流,而本地修复任务相对容易但仍有提升空间。结果表明,工作流智能体评估需同时基于新鲜的外部需求与可验证的智能体执行动作。

智能体论文/研究评测/基准
14:11
IT之家(RSS)
51
三星官宣停产 LPDDR4/X 内存,产能聚焦 LPDDR5/X 与 HBM 等 AI 需求产品

三星官方已确认停产LPDDR4与LPDDR4X内存,并将产能全面转向LPDDR5、LPDDR5X及HBM等面向AI需求的高利润产品。AI浪潮正驱动内存市场,三星2026年第一季度利润同比飙升约50倍,但供应仍远不能满足需求,预计2027年供需缺口将进一步扩大。这一转型将影响消费市场,入门级手机将被迫采用成本更高的LPDDR5内存,可能导致终端产品价格上涨。

端侧行业动态
14:11
IT之家(RSS)
46
韩投称 AI 企业已锁定长期内存订单:即便市场短缺缓解,价格仍维持高位

韩国投资证券研报指出,即便内存芯片短缺问题缓解,其价格短期内也不会显著下降。AI超大规模企业已锁定长期内存产能订单,这将延长当前的内存超级周期,预计价格在未来一段时间内持续高位运行。扩大内存容量可提升GPU利用率,降低单个Token处理成本,因此AI公司愿意高价采购。目前DRAM价格同比已涨3倍,但GPU效率提升带来的回报更高。同时,HBM和DRAM的产能紧张意外推高了NAND芯片需求,其价格优势在高压需求下保持了市场弹性。

推理数据/训练行业动态
13:11
IT之家(RSS)
57
挑战台积电 CoWoS:蒲得宇称英特尔 EMIB 技术良率达 90%

广发证券分析师蒲得宇发布研报指出,英特尔代工业务取得关键突破,其2.5D先进封装技术EMIB良率达到90%,已为AI数据中心芯片做好准备。该技术良率与FCBGA相当,但互连密度更高。其高性能版本EMIB-T集成了TSV,当前已支持大于8倍光罩尺寸,能在封装内容纳12个HBM芯片和超过20个桥接。英特尔计划到2028年将EMIB-T扩展至大于12倍光罩尺寸,以容纳超过24个HBM裸片和38个以上桥接,进一步提升封装能力。

行业动态部署/工程
12:14
HuggingFace Daily Papers(社区热门论文)
63
ExoActor:以第三人称视频生成为可泛化交互式人形控制

人形机器人流畅的富交互行为建模是一大挑战。ExoActor提出新框架,利用大规模视频生成模型的泛化能力,将任务指令与场景上下文输入,通过第三人称视频生成技术合成隐含机器人、环境与物体协调交互的合理执行过程,再将其转化为可执行的人形机器人行为序列。实验表明,该端到端系统能泛化至新场景且无需额外真实数据收集,为建模富交互行为提供了可扩展路径,有望推动通用人形智能发展。

arXiv具身智能论文/研究
12:14
HuggingFace Daily Papers(社区热门论文)
61
基于验证推理的强化学习在图像编辑中的应用

针对图像编辑中缺乏通用奖励模型的问题,本研究提出Edit-R1框架。该框架构建了一个基于思维链的推理奖励模型,通过将编辑指令分解为多项原则进行细粒度评估,生成可解释的奖励信号。为训练此模型,研究采用监督微调进行“冷启动”,并引入群体对比偏好优化算法,利用人类成对偏好数据强化模型。实验表明,该推理奖励模型在编辑任务上超越了Seed-1.5-VL等视觉语言模型,且性能随参数规模从3B增至7B持续提升。最终,该框架成功提升了如FLUX.1-kontext等下游图像编辑模型的效果。

arXiv图像生成论文/研究
11:20
xAI:News(网页)
精选60
自定义语音与语音库

xAI于2026年4月30日推出自定义语音和语音库功能。用户可通过约1分钟录音快速克隆声音,并在Grok文本转语音及语音代理API中即时使用,整个过程仅需2分钟。语音库提供集中管理平台,内置语音已超80种,支持28种语言。为确保安全,系统采用两阶段验证,包括实时转录匹配和说话人嵌入确认,以防止未经授权的克隆。这些功能适用于品牌代理、内容创作、无障碍辅助、多语言团队及游戏娱乐等多种场景,且使用自定义语音无需额外费用。

xAI产品更新语音

推荐理由:xAI 这波‘声音克隆+管理’的更新很实用,安全验证做得细,创作品类和品牌方应该会喜欢,对开发者来说是个加分项,但不是那种能改变格局的大招。
11:14
HuggingFace Daily Papers(社区热门论文)
58
World2Minecraft:占据驱动的仿真场景构建

具身智能需高保真仿真环境,但现有平台存在数据污染和灵活性限制。本研究提出World2Minecraft系统,基于3D语义占据预测将真实场景转换为结构化Minecraft环境,以支持视觉语言导航等任务。然而,重建质量受限于占据预测模型的数据稀缺和泛化能力不足。为此,团队开发了低成本、自动化数据采集流程,构建大规模定制化数据集MinecraftOcc,包含100,165张图像来自156个精细室内场景。实验表明,该数据集有效补充现有资源并对前沿方法构成显著挑战,提升了占据预测精度,同时凸显World2Minecraft作为可定制、可编辑平台对个性化具身AI研究的价值。

具身智能数据/训练论文/研究
11:14
HuggingFace Daily Papers(社区热门论文)
68
PhyCo:学习生成运动中的可控物理先验

现代视频扩散模型擅长外观合成,但物理一致性不足,如物体漂移、碰撞不真实。PhyCo框架引入连续、可解释且基于物理的控制,整合三个核心组件:包含超过10万条模拟视频的大规模数据集,系统改变摩擦、恢复系数等属性;基于像素对齐物理属性图的ControlNet,对预训练扩散模型进行物理监督微调;以及VLM引导的奖励优化,通过微调视觉语言模型评估视频并提供可微分反馈。该方法使模型能通过调整物理属性生成物理一致且可控的视频,无需推理时模拟或几何重建。在Physics-IQ基准测试中,PhyCo显著提升物理真实感,人类研究证实其控制更清晰、更忠实。

多模态视频论文/研究
11:14
HuggingFace Daily Papers(社区热门论文)
57
MoCapAnything V2:面向任意骨骼的端到端运动捕捉框架

MoCapAnything V2 提出了首个完全端到端的单目视频运动捕捉框架,用于驱动任意骨骼。该框架将视频到姿态、姿态到旋转两个模块设计为可学习且联合优化,解决了传统分解流程中旋转模糊与不可微逆运动学带来的限制。通过引入目标资产的参考姿态-旋转对与休息姿态,明确定义了旋转坐标系,将旋转预测转化为条件良好的问题。模型直接从视频预测关节位置,无需依赖网格中间表示,提升了鲁棒性与效率。实验表明,该方法在多个数据集上将旋转误差从约17度显著降低至约10度,在未见骨骼上可达6.54度,且推理速度比基于网格的方法快约20倍。

多模态视频论文/研究
11:14
HuggingFace Daily Papers(社区热门论文)
58
InteractWeb-Bench:多模态智能体能在交互式网站生成中摆脱盲目执行吗?

本文针对非专业低代码用户指令模糊、质量低的现实瓶颈,提出了首个多模态交互式网站生成基准InteractWeb-Bench。该基准通过四类用户智能体与基于人物角色的指令扰动,系统模拟了包含模糊、冗余和矛盾在内的多样化用户行为,并提供了一个支持澄清、实现、验证和提交统一行动的交互式执行环境,以实现迭代式意图细化与代码合成。大量实验表明,当前前沿的多模态大语言模型智能体仍受困于“盲目执行”模式,在意图识别与自适应交互方面存在明显局限。

智能体多模态编码论文/研究
11:11
IT之家(RSS)
55
苹果 FY2026Q2 研发支出 114 亿美元创新高,同比增长 34% 加码 AI

苹果2026财年第二财季研发支出达114亿美元,创历史新高,同比增长34%。自2022年约60亿美元起,其研发投入持续陡峭攀升,本季度首次突破百亿美元大关。公司CEO蒂姆·库克表示正大幅增加AI研发投入,资金重点用于产品与服务的全栈AI建设,且研发费用增速远超公司整体增速。然而,与同期Alphabet的170亿美元、Meta的176亿美元研发支出相比,苹果在绝对投入规模上仍存差距,于AI竞争中面临追赶压力。

端侧行业动态
11:11
IT之家(RSS)
34
流畅度最高提升 30%:华硕 ROG Xbox Ally X 掌机"自动超分"功能预览上线

微软面向Xbox Insider成员,在ROG Xbox Ally X掌机推出“自动超分”功能预览版。该AI技术类似DLSS/FSR,通过调用锐龙AI Z2 Extreme处理器的NPU,将720P等低分辨率游戏画面实时提升至1080P或更高,性能最高可提升30%,建议在帧率低于60fps的游戏中使用。功能支持DirectX 10及以上游戏,可按游戏单独开关。同时,微软优化了底座连接体验,连接电视时可自动转移画面并支持VRR,并改进了手柄配对、光标导航及震动反馈等交互细节。

产品更新其他端侧
10:14
HuggingFace Daily Papers(社区热门论文)
52
规模化合成计算机:用于长周期生产力模拟

研究团队提出“规模化合成计算机”方法,以创建包含真实文件夹层级与丰富文件内容(如文档、表格)的可扩展计算机环境。基于每个合成计算机,系统运行长周期模拟:一个代理设定符合用户身份、需耗时约一个月完成的多项专业任务目标;另一代理则扮演用户,通过导航文件系统、与模拟协作者协作、生成专业文件等方式持续工作直至目标达成。初步实验中,团队创建了1000个合成计算机并运行模拟,每次模拟平均需超过8小时代理运行时间、跨越2000多个回合。模拟产生的丰富经验学习信号显著提升了代理在生产力评估中的表现,该方法有望扩展至数百万甚至数十亿合成用户世界,为长周期生产力场景中的智能体自我改进与强化学习提供基础。

智能体数据/训练论文/研究
10:14
HuggingFace Daily Papers(社区热门论文)
56
异构科学基础模型协作

本研究提出Eywa异构智能体框架,以扩展语言中心的大模型系统至更广泛的科学基础模型。该框架通过为领域专用基础模型增加语言模型推理接口,使语言模型能指导非语言数据模态的推断,从而让预测性基础模型参与高层推理与决策。Eywa可作为单智能体流程的直接替代,或嵌入现有多智能体系统,并支持基于动态规划的跨模态任务协调。实验覆盖物理、生命及社会科学领域,结果表明Eywa能提升涉及结构化与领域专用数据的任务性能,并通过与专用模型的协作减少对纯语言推理的依赖。

智能体多模态论文/研究
10:14
HuggingFace Daily Papers(社区热门论文)
62
视觉生成的新时代:从原子映射到智能体世界建模的演进

当前视觉生成模型在写实性、指令跟随等方面进展显著,但在空间推理、长程一致性与因果理解上仍面临挑战。研究主张从外观合成转向智能视觉生成,即生成基于结构、动态和因果关系的合理内容。为此提出了一个五级分类体系,标志着从被动渲染器到交互式、世界感知生成器的根本转变。关键技术驱动力包括流匹配、统一的理解-生成模型、数据策展与后训练等。现有评估常因过度强调感知质量而高估进展,忽视了结构与时序缺陷。结合基准评测与真实场景测试,该路线图为推进下一代智能视觉生成系统提供了以能力为中心的视角。

智能体图像生成多模态论文/研究
10:14
HuggingFace Daily Papers(社区热门论文)
56
表征弗雷歇损失用于视觉生成

本研究提出FD-loss,通过将弗雷歇距离(FD)估计所需的大规模样本量与梯度计算的小批量解耦,首次将其有效优化为训练目标。该方法在不同表征空间中对基础生成器进行后训练,能持续提升样本视觉质量,并在Inception空间下使单步生成器在ImageNet 256x256上达到0.72的FID。FD-loss无需蒸馏或对抗训练,即可将多步生成器转化为高性能单步模型。研究同时发现,仅依赖Inception FID可能误导质量评估,因此提出了多表征度量指标FDr^k。这项工作推动了分布距离在生成模型的训练与评估中的进一步探索。

arXiv图像生成数据/训练论文/研究
10:14
HuggingFace Daily Papers(社区热门论文)
69
Intern-Atlas:面向AI科学家的方法论演化图谱研究基础设施

针对现有以文档为中心的研究设施无法显式表征方法演进关系的问题,本文提出了方法论演化图谱Intern-Atlas。它从超103万篇AI论文中自动识别方法实体,推断其谱系关系与关键创新瓶颈,构建了一个包含941万余条有证据支撑语义边的可查询因果网络。研究还设计了自引导时序树搜索算法以追溯方法演进链条,经验证与专家标注结果高度一致。该图谱支持想法评估与自动生成等下游应用,为自动化科学发现提供了基础数据层。

智能体数据/训练论文/研究
10:14
Claude Code:GitHub Releases(RSS)
精选55
Claude Desktop v2.1.126 版本更新

本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 `claude project purge` 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 `allowManagedDomainsOnly` 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

AnthropicMCP/工具产品更新编码

推荐理由:这是 Claude Code 一次‘生活质量’大更新,OAuth、Windows 权限、流超时等痛点都被修了,如果你在用 Claude Code,今天就该升级。
10:11
IT之家(RSS)
61
"AI 抓虫能手":Claude Security 公测上线,基于 Opus 4.7 发现漏洞

Anthropic 面向所有 Claude Enterprise 用户开放 Claude Security 公测版。该工具基于 Claude Opus 4.7 模型,企业只需指向 GitHub 仓库即可启动代码安全扫描。它通过理解代码逻辑与数据流进行推理,以发现复杂漏洞,并经过多阶段验证以降低误报率,漏洞按实际可利用性评定严重级别。其前代模型曾在开源代码库中发现数百个隐藏数十年的漏洞。公测版支持周期性扫描、限定扫描目录、结果导出以及实时推送至 Slack 等平台。目前该工具仅支持 GitHub 仓库。

Anthropic产品更新安全/对齐
10:11
IT之家(RSS)
55
马斯克结束 OpenAI 案作证:奥尔特曼曾向我保证维持非营利

埃隆·马斯克已结束针对OpenAI诉讼案的法庭作证。他指控OpenAI及其联合创始人萨姆·奥尔特曼等人曾以保障AI安全的非营利承诺,获得其3800万美元捐款与支持,随后却转为营利实体谋利。马斯克证称奥尔特曼曾保证组织将保持非营利性质,但承认自己未详细阅读2017年关于结构转型的条款清单。他在质询中强调,目前的营利实体已占据原非营利组织绝大部分价值。奥尔特曼与布罗克曼全程在场旁听。

OpenAI行业动态
09:10
IT之家(RSS)
31
苹果 AirPods Ultra 耳机曝光:配红外摄像头,强化 Siri 交互

彭博社透露苹果计划推出名为“AirPods Ultra”的新旗舰耳机,定位高于AirPods Pro 3(国行1899元)。其最大亮点是内置红外摄像头,用于配合iOS 27的新版Siri提供环境视觉信息,强化AI交互。交互方式将移除压感柄,改为摄像头识别的手势控制。音频方面预计搭载全新H3芯片,以降低延迟、提升音质并为AI功能提供算力。该产品可能于2026年秋季与iPhone 18系列一同发布。

多模态行业动态