4月24日
20:00
OpenRouter:Announcements(RSS)
精选55
Agent SDK:在 OpenRouter 上构建多轮智能体工作流

OpenRouter 发布 Agent SDK,其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型,使开发者能够便捷地构建复杂的多轮交互智能体应用。

智能体MCP/工具产品更新

推荐理由:OpenRouter 把多轮 agent 编排封装成一个 callModel 函数,300+ 模型统一调用,做 agent 产品的人可以少写不少胶水代码,但本质上是工程封装而非技术突破。
20:00
OpenRouter:Announcements(RSS)
53
使用 Agent SDK 构建你自己的 Harness

Anthropic 发布了 Agent SDK,开发者可利用 `create-agent-tui` 和 `create-headless-agent` 技能,在几分钟内搭建个性化的编码智能体。该 SDK 支持两种模式:一是提供终端用户界面的交互式代理,二是无界面的“headless”代理,便于集成到自动化脚本和流水线中。这显著降低了为特定编码任务定制 AI 助手的门槛。

智能体产品更新编码
19:19
The Decoder:AI News(RSS)
49
Anthropic 确认 Claude Code 存在问题并承诺实施更严格的质量控制

Anthropic 确认其编程助手 Claude Code 出现质量问题,用户反馈其性能下降。公司已识别并修复了三个独立的错误源。为应对此次问题,Anthropic 承诺未来将执行更严格的质量控制措施,以保障产品输出的稳定性和可靠性。

Anthropic产品更新编码
19:17
HuggingFace Daily Papers(社区热门论文)
58
基于结构化运动描述的无编码器人体运动理解

本文提出结构化运动描述(SMD)方法,通过基于规则的确定性转换,将人体关节位置序列转化为描述关节角度、部位运动及整体轨迹的结构化文本。该表示使大型语言模型(LLM)能直接运用其预训练知识进行运动推理,无需学习专用的运动编码器或对齐模块。SMD在运动问答(BABEL-QA达66.7%,HuMMan-QA达90.1%)和运动描述(HumanML3D上R@1为0.584)任务上均超越现有最佳方法。其实用优势包括:同一文本输入经轻量级LoRA适配即可跨多种LLM使用,且其人类可读的表示支持可解释的注意力分析。

多模态数据/训练论文/研究
19:08
IT之家(RSS)
43
英特尔合作开发 ZAM 内存获日本政府补贴:号称功耗比传统 HBM 低约 40%,目标 2029 年左右实现量产

软银旗下SAIMEMORY与英特尔正合作开发面向AI的下一代内存技术ZAM。该技术采用垂直架构与非接触式层间互连,宣称相比传统HBM内存功耗降低约40%,并具备更高密度和带宽。项目已获得日本政府NEDO的研发补贴,计划在2027财年前投入约80亿日元开发原型,目标在2029年左右实现量产。若成功,ZAM有望与HBM竞争,降低AI数据中心成本并缓解供应瓶颈,但目前技术仍处早期原型阶段。

行业动态部署/工程
19:08
IT之家(RSS)
50
美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练

美团新一代基础大模型LongCat-2.0-Preview已开放邀请测试,其总参数规模突破万亿,采用混合专家架构,整体能力被认为对标GPT-4。关键突破在于该模型完全基于国产化算力集群训练完成,标志着美团在此领域取得领先。此前,美团创始人王兴已披露公司持续投入数十亿美元保障算力供应。去年9月,美团曾开源基于相同架构、拥有5600亿参数的首款自研大模型LongCat-Flash。

开源生态数据/训练模型发布
19:08
IT之家(RSS)
39
Perplexity CEO 阿拉温德:AI 不会颠覆 iPhone,反而会强化其"数字护照"地位

Perplexity首席执行官阿拉温德·斯里尼瓦斯表示,AI不会颠覆iPhone,反而会随着AI能力增强,进一步强化iPhone作为用户“数字护照”的地位。他指出,苹果凭借其独有的生态系统、芯片与硬件优势,以及用户信任,构建了坚固的护城河。即使Siri改进缓慢,iPhone仍能持续成功,因为它整合了银行卡、通行证、健康记录、FaceTime、iCloud照片等众多核心生活功能。

大佬观点现象/趋势
19:08
IT之家(RSS)
44
消息称北京地区大疆门店将全面下架无人机产品,DJI Care 邮寄新机需市外收货地址

受北京市无人机新规影响,大疆在北京地区的门店将于5月1日前全面下架所有无人机产品,线上线下渠道均停止销售。消费者未来无法在京直接购买无人机,损坏后可通过DJI Care寄修服务维修,但修复后的无人机只能邮寄至北京市外的地址,需用户自行取回。此举引发消费者对携带与维修无人机的普遍担忧。

政策/监管行业动态
18:08
IT之家(RSS)
31
标致时隔三年重回北京车展,狮锐 & 琉明纯电概念车及雪铁龙 ELO 概念车首发亮相

标致在北京车展全球首发了Concept 6狮锐与Concept 8琉明两款纯电概念车。狮锐为猎装轿车,琉明为大型SUV,均基于全新纯电平台开发,搭载激光雷达与多摄像头系统以支持高阶智能驾驶,并采用发光狮标、线控方向盘等设计。两款车型将由武汉工厂生产,计划于2027年量产上市,将引领品牌下一代纯电设计。同属Stellantis集团的雪铁龙ELO概念车也在此次车展完成了亚洲首秀。

行业动态
18:08
IT之家(RSS)
39
摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配

摩尔线程与智源FlagOS合作,成功为MTT S5000 GPU完成了DeepSeek-V4-Flash模型的Day-0适配。该模型采用混合专家架构,总参数量284B,并首次运用“FP4+FP8”混合精度策略。MTT S5000 GPU凭借原生FP8支持及内置硬件级FP8 Tensor Core,能将数据位宽减半,显著降低显存带宽压力并提升计算吞吐量。双方团队通过编译优化与自动调优,重点攻克了FP8算子与Sparse Attention算子,实现了高效适配。

产品更新开源生态部署/工程
18:08
IT之家(RSS)
25
Zondision 发布 ZIMO1 裸眼 3D 显示器:光场原理,内置 3D 芯片

Zondision发布ZIMO1裸眼3D显示器,采用光场原理并内置专用3D处理芯片。该显示器配备27英寸4K面板,刷新率为60Hz,亮度达450nits,覆盖100% sRGB色域。其双眼追踪速率达120Hz,兼容OpenXR API及多数主流沉浸式输入设备,支持2D转3D内容工具,可与虚幻、Unity、Blender等软件及多平台游戏协同工作。

产品更新其他
18:08
IT之家(RSS)
33
阿维塔发布声明公开驳斥 AIGC 假图,保留追究法律责任权利

阿维塔科技法务部发布声明,驳斥近期网络流传的利用AIGC技术生成的虚假品牌图片,确认为虚假信息。公司强调从未制作或授权此类内容,虚假图片严重侵害品牌声誉并误导用户,保留对相关转载传播行为追究法律责任的权利。作为长安汽车、华为与宁德时代联合打造的高端智能电动汽车品牌,阿维塔呼吁用户及媒体以官方信息为准,不传谣、不信谣,共同维护清朗网络空间。

现象/趋势行业动态
17:08
IT之家(RSS)
37
腾讯面向汽车行业发布全场景智能体开放平台,可化身专属 AI 导游、提供选品下单取餐全链路服务等

腾讯正式发布面向汽车行业的“出行全场景智能体开放平台”。该平台围绕通勤、出游、娱乐等高频率场景,提供开箱即用的智能体产品,例如随行点单智能体可完成从选品、下单到取餐的全链路服务;随行向导智能体能化身专属AI导游,并新增车队协同管理功能。底层技术方面,平台升级了端云协同座舱大模型架构,端侧采用0.8B轻量化VLM模型确保毫秒级响应,云端则率先接入混元最新大模型Hy3 preview。目前腾讯已服务超过100家车企及出行科技公司。

智能体行业动态部署/工程
17:08
IT之家(RSS)
30
抖音持续治理色情低俗导流行为,配合有关部门再抓捕三名犯罪嫌疑人

抖音近期配合有关部门抓捕三名犯罪嫌疑人,持续打击色情低俗导流行为。平台发现两类突出违规:一是购买账号发布低俗内容,为第三方色情应用导流;二是利用隐晦暗语分享“AI制作大尺度内容”教程并进行违规导流。近两周已处置相关违规内容3000余条。今年以来,平台针对AI生成色情低俗内容已处置4.2万条,处罚账号1.4万个。抖音表示将持续升级技术识别能力,打击各类新型违规。

安全/对齐行业动态
17:08
IT之家(RSS)
37
MINIX 发布英伟达 Jetson Thor 平台 GenAI 迷你主机,搭载双万兆网口

硬件制造商MINIX于4月23日发布了两款基于英伟达Jetson Thor平台的GenAI迷你工作站T4000/T5000。该系列产品搭载Arm Neoverse-V3AE CPU和英伟达“Blackwell”GPU,配备最高128GB LPDDR5X统一内存,具备高达2070 TFLOPS的FP4稀疏算力,可支持70亿至700亿参数的大语言模型本地推理。主机尺寸紧凑,内置双涡轮风扇散热,预装1TB PCIe Gen4固态硬盘,并提供了双10GbE万兆网口、Wi-Fi 6E、蓝牙5.3、多个HDMI和USB接口等丰富的外部连接选项。

产品更新端侧部署/工程
16:08
IT之家(RSS)
63
超万名员工用上 GPT-5.5,黄仁勋敦促英伟达内部全员使用 OpenAI Codex

英伟达宣布内部已部署由 OpenAI GPT-5.5 驱动的 Codex 工具,运行于 GB200 NVL72 系统,超 10000 名员工在工程、营销等多个团队使用。该系统带来显著效率提升:每百万 token 成本降低 35 倍,每兆瓦每秒 token 输出量增加 50 倍。调试工作从几天缩短至几小时,复杂实验可一夜完成。CEO 黄仁勋敦促全员使用,称其标志着 AI 时代的到来。

OpenAI编码行业动态
16:08
IT之家(RSS)
32
宝马基于千问大模型推出座舱智能体,新世代 BMW iX3 长轴距版首搭

宝马在北京车展推出基于阿里巴巴千问大模型定制的座舱智能体,包括“用车专家”“出行伙伴”和“百科达人”三个AI智能体。这些智能体从传统语音助手的被动响应升级为主动决策,能精准处理复杂出行需求。首款搭载车型为新世代BMW iX3长轴距版,全新BMW 7系随后跟进。“出行伙伴”支持自然语言复合需求,即时生成个性化行程方案;“用车专家”深度集成20万条宝马专业知识库,提供真人顾问级解答。车展上,宝马集团展示16款新车型,其中4款全球首发、8款中国首发。

智能体端侧行业动态
16:08
IT之家(RSS)
43
Claude Code 产品负责人 Cat Wu:人们对 AI 高速发展感到焦虑

Anthropic 公司 Claude Code 产品负责人 Cat Wu 指出,AI 领域的激烈竞争导致各大公司以前所未有的速度发布新功能,功能领域也高度重叠,这使用户产生了焦虑和错失恐惧症,感觉必须每日关注更新才能跟上节奏。她透露,仅今年前三个月 Anthropic 就推出了超过 45 项新功能。然而,快速发布也引发了问题,例如近期用户抱怨 Claude Code 回应质量下降,公司否认故意降质并已发现三个潜在问题。Cat Wu 希望未来能打造更“减压”的产品,帮助用户轻松学习,而非在快速迭代中疲于追赶。

Anthropic大佬观点现象/趋势
16:08
IT之家(RSS)
28
英特尔副总裁:E 核游戏性能不弱,表现不如 AMD 只是因为软件未针对其 CPU 优化

英特尔副总裁罗伯特·霍尔洛克表示,英特尔与AMD在PC游戏性能上的差距主要源于软件优化不足,而非硬件缺陷。他指出,关闭能效核(E核)对游戏性能的影响微乎其微,仅约1%。部分游戏和引擎因未针对混合架构优化,导致核心调度出错,可能损失10%-30%的性能。他强调,若软件优化到位,英特尔CPU的游戏性能有望接近或超越AMD Ryzen X3D系列。

其他行业动态
16:08
IT之家(RSS)
51
小马智行宣布 Robotaxi 成本降至 23 万元内,2026 北京车展首发 L4 级无人轻卡

在2026北京车展上,小马智行宣布其2027版L4级Robotaxi整车总成本将降至23万元以内,低于入门级特斯拉Model 3,并计划推出海外版本以实现千台以上部署。公司预计到2026年,其Robotaxi将落地全球超20座城市,总规模突破3000台。同时,小马智行发布了全球首款全车规、全冗余的L4级无人驾驶轻卡,该车型单公里货运成本比人工降低40-50%,货箱容积是低速无人配送车的2.6倍。

具身智能行业动态部署/工程
16:08
IT之家(RSS)
55
华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务

DeepSeek-V4预览版正式上线并开源。华为云宣布首发适配,在其MaaS平台上为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。该服务通过适配分层注意力压缩机制、提供多种昇腾高性能融合算子等优化,支持原生100万Token长上下文的高性能推理。V4系列包含1.6万亿参数的旗舰版Pro和2840亿参数的经济型Flash两个MoE架构版本,均原生支持100万Token上下文。新技术大幅降低了长上下文下的计算和显存需求。官方表示V4-Pro体验优于Anthropic Sonnet 4.5,但仍落后于GPT-5.4等前沿闭源模型。

DeepSeek产品更新部署/工程
15:08
IT之家(RSS)
65
特斯拉赛博无人驾驶电动车 Cybercab 在北美投产:无需方向盘、踏板、后视镜

特斯拉宣布其AI驱动的无人驾驶电动车Cybercab在北美正式投产。该车型最大特点是完全取消了方向盘、踏板和后视镜,专为自动驾驶设计。首辆无方向盘版本已于今年2月下线,连续量产于本月启动,目前生产线同时制造无方向盘和带方向盘的两种版本。马斯克将其定位为特斯拉未来的核心走量车型。不过,完全无监督的自动驾驶技术尚未攻克,其FSD功能时间表曾多次延迟。

具身智能行业动态部署/工程
15:08
IT之家(RSS)
34
火山引擎发布新一代汽车 AI 解决方案,豆包大模型搭载超 700 万辆车

在北京车展上,火山引擎发布了基于Agentic AI架构的新一代汽车AI解决方案,包含AI座舱套件和豆包座舱助手两大方案。新方案通过一个AI大脑深度联动整车功能域,实现了感知、推理、执行、记忆、学习的一体化闭环,颠覆了上一代架构。其中,AI座舱套件支持车企灵活配置,豆包座舱助手则为完整产品级交付,将于年内量产。目前,搭载豆包大模型的智能汽车已超700万辆,覆盖50多个品牌,日均完成超3000万次座舱交互。

智能体产品更新部署/工程
15:08
IT之家(RSS)
57
华为:昇腾超节点系列产品全面支持 DeepSeek V4

华为宣布其昇腾超节点全系列产品已全面支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术,实现了高吞吐、低时延的推理部署。具体性能上,DeepSeek V4-Pro模型在8K输入下,单卡解码吞吐达4700TPS,时延约20ms;V4-Flash模型单卡吞吐为1600TPS,时延约10ms。此外,昇腾A3超节点系列也全面适配,并提供训练参考实现;基于64卡配置,V4-Flash模型在8K/1K场景下单卡吞吐超过2000TPS。

DeepSeek产品更新部署/工程
15:08
IT之家(RSS)
55
陈立武:AI 推理趋势利好英特尔,CPU 与 GPU 配比从 1:8 迈向 1:1

英特尔CEO陈立武指出,AI工作负载正从训练转向推理,这显著提升了CPU的重要性。CPU与GPU的配比已从过去的1:8收紧至约1:4,未来有望进一步趋向1:1的平衡。在推理场景中,CPU在任务编排和控制调度方面更具优势。行业数据显示,AI智能体时代每吉瓦所需的CPU核心数可能从3000万激增至1.2亿,增长4倍。受此推动,英特尔第一季度数据中心与AI部门营收同比增长22%,达到51亿美元。

行业动态部署/工程
15:08
IT之家(RSS)
31
北京现代艾尼氪金星全球首秀,全新 IONIQ V 首发亮相北京车展

在2026北京车展上,北京现代艾尼氪金星(IONIQ V)概念车全球首秀,标志着IONIQ品牌正式进入中国市场。该品牌未来在华车型均以行星命名,并由中国设计团队原创打造。IONIQ V基于E-GMP纯电平台,支持纯电/增程双动力,具备800V快充能力。其车身尺寸为长4900mm、宽1890mm、高1470mm,轴距2900mm,内饰配备27英寸超薄4K大屏。车辆在智能化层面融合了Momenta、高通芯片、宁德时代电池及文心大模型等技术。此外,现代汽车计划将中国生产的汽车出口至中东、英国等市场。

其他行业动态
14:45
Hacker News 热门(buzzing.cc 中文翻译)
56
Show HN: Agent Vault - 面向代理的开源凭证代理和存储库

Infisical团队开源了Agent Vault,这是一个专为AI代理设计的凭证代理与存储库。该项目旨在安全地管理AI代理在运行时所使用的API密钥、数据库密码等敏感凭证,防止其直接暴露在代码或环境中。Agent Vault作为代理与外部服务之间的中间层,集中处理身份验证,从而提升安全性并简化凭证管理流程。该项目已在GitHub发布,并在Hacker News上获得了101点关注度。

智能体开源/仓库部署/工程
14:08
IT之家(RSS)
47
小米支付服务 Skill 上线:开发者三步可完成接入,支持微信支付、支付宝等

小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。

MCP/工具产品更新部署/工程
14:08
IT之家(RSS)
53
寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行

寒武纪宣布已完成对深度求索最新开源模型DeepSeek-V4的Day 0适配,模型发布当日即可稳定运行。适配针对其285B和1.6T两个版本,代码已开源。通过自研高性能算子库对模型新结构进行专项加速,并在vLLM推理框架中全面支持5D混合并行、低精度量化等技术,以优化词元吞吐和端到端推理效率。同时,深度挖掘硬件特性以最小化通信开销,提升分布式推理性能。DeepSeek-V4拥有百万字上下文,能力领先,现已开放体验和API调用。

DeepSeek开源生态行业动态部署/工程
13:45
Hacker News 热门(buzzing.cc 中文翻译)
69
TorchTPU:在谷歌级规模下原生运行 PyTorch 于 TPU 上

谷歌发布了 TorchTPU,使 PyTorch 能够原生在 TPU 上运行,并实现谷歌级规模的计算。这一变化让开发者无需大幅修改代码即可利用 TPU 的高性能硬件,显著提升了 PyTorch 在大型模型训练和推理任务中的效率与可扩展性。此举标志着 PyTorch 与谷歌定制硬件生态的深度集成,为人工智能研究与开发提供了新的强大基础设施。

Google产品更新开源生态部署/工程
关联讨论 1Google Developers Blog(RSS)
13:08
IT之家(RSS)
38
中国首台原生开发 Robotaxi 原型车吉利 EvaCab 北京车展首秀,全球首搭 2160 线数字化激光雷达

吉利汽车在北京车展发布中国首款原生开发Robotaxi原型车Eva Cab。该车基于全域AI 2.0技术体系打造,搭载全球首个量子级AI电子电气架构EEA 4.0,并采用量子加密技术保障安全。其核心亮点是全球首搭2160线数字化激光雷达,具备每秒2592万点的成像能力,最远探测距离达600米。车辆同时配备L4级自动驾驶软件方案千里浩瀚G-ASD。曹操出行深度定制版计划于2027年量产并投入商业化运营。

产品更新具身智能部署/工程
12:23
Simon Willison 博客
41
Millisecond Converter

Simon Willison 发布了一个名为 Millisecond Converter 的在线工具,专门用于将 LLM 报告的提示持续时间从毫秒自动转换为更易读的秒和分钟单位。该工具解决了用户需要手动进行时间单位换算的不便,可通过特定网址直接访问,并被归类为实用工具类别。

其他部署/工程
12:19
Anthropic:Newsroom(网页)
精选59
Anthropic与NEC合作,共建日本最大AI工程团队

Anthropic与NEC达成战略合作,旨在打造日本规模最大的AI原生工程团队。NEC将成为Anthropic在日本的首个全球合作伙伴,为集团全球约3万名员工部署Claude AI工具。双方将针对金融、制造和地方政府等领域,联合开发安全的行业专用AI解决方案,并将Claude集成到NEC的安全运营中心及下一代网络安全服务中。NEC内部将设立卓越中心,通过技术培训构建AI工程团队,并广泛应用Claude Code等工具。目前,全球员工的工具部署与行业解决方案的联合开发已同步启动。

智能体Anthropic行业动态

推荐理由:NEC 三万人上 Claude,是 Anthropic 在日本市场拿下的最大企业单子,信号意义大于产品本身。做 To B 的可以观察日本企业 AI 采购节奏,但对普通开发者没什么可抄的。
12:17
HuggingFace Daily Papers(社区热门论文)
54
UniGenDet:一个用于协同进化图像生成与生成图像检测的统一生成-判别框架

研究提出UniGenDet框架,首次将图像生成与生成图像检测任务置于统一的生成-判别架构中进行协同进化。该框架设计了共生多模态自注意力机制和统一微调算法,使生成任务能提升真实性判别的可解释性,同时真实性标准指导生成更高保真度的图像。通过检测器引导的生成对齐机制促进信息交换,在多个数据集上的实验表明,该方法取得了最先进的性能。代码已开源。

图像生成安全/对齐论文/研究
12:17
HuggingFace Daily Papers(社区热门论文)
49
TingIS:企业级场景下从嘈杂客户事件中实时发现风险

TingIS 是一个面向企业级事件发现的端到端系统,旨在从高噪声、高吞吐的客户事件中提取可操作风险情报。其核心是多阶段事件链接引擎,结合高效索引与大型语言模型,仅依据少量多样描述即可稳定合并与提取事件。系统集成级联路由机制实现精准业务归属,并采用融合领域知识、统计模式和行为过滤的多维降噪管道。在生产环境中,TingIS 每分钟处理超 2000 条消息,P90 警报延迟为 3.5 分钟,高优先级事件发现率达 95%。真实数据基准测试表明,其在路由准确性、聚类质量与信噪比上均显著优于基线方法。

智能体论文/研究部署/工程
12:17
HuggingFace Daily Papers(社区热门论文)
50
面向生成式AI时代可泛化作者归属的可解释解耦表征学习

针对作者风格与文本内容纠缠导致模型泛化能力差的问题,本文提出可解释作者身份变分自编码器(EAVAE)框架。该框架通过架构设计分离风格与内容表征,先以监督对比学习预训练风格编码器,再结合变分自编码器微调。其核心创新是一个新型判别器,既能区分表征是否属于同一作者或内容源,又能生成自然语言解释以增强可解释性。实验表明,EAVAE在Amazon Reviews等多个数据集上实现了最先进的作者归属性能,并在M4数据集的少样本AI生成文本检测任务中表现优异。代码与数据已开源。

安全/对齐数据/训练论文/研究
12:17
HuggingFace Daily Papers(社区热门论文)
50
可信需验证:DAVinCI框架--语言模型声明推理的双重归因与验证

针对大语言模型存在事实错误与幻觉的问题,本文提出了DAVinCI双重归因与验证框架。该框架首先将模型生成的声明归因于内部组件和外部来源,随后利用蕴含推理和置信度校准进行验证。在FEVER等数据集上的评估表明,DAVinCI将分类准确率、归因精确率、召回率和F1分数提升了5-20%。研究通过消融实验分析了关键组件的影响,并发布了可集成至现有LLM流程的模块化方案。该框架为构建可审计、可信赖的AI系统提供了可扩展路径。

检索增强安全/对齐论文/研究
12:09
Simon Willison 博客
38
重磅来袭

本期邮件通讯内容包含:4只骑自行车的鹈鹕、1只骑电动滑板车的负鼠、最多5只携带火腿无线电并隐藏在人群中的浣熊。此外还收录了5篇博客文章、8个链接、3条引用,并发布了《智能体工程模式指南》的新章节。所有内容已同步推送至订阅者邮箱。

智能体大佬观点
12:08
IT之家(RSS)
22
深蓝全新纯电轿跑 L06 Max 发布:售价 12.59 万元起

深蓝汽车发布全新中型纯电轿跑L06 Max,提供560Max和670Max两款配置,限时到手价分别为11.89万元和12.89万元。新车核心亮点包括:首次在中国品牌量产车型中搭载调节频率达1000次/秒的磁流变底盘;采用7700T一体化压铸技术提升车身刚性;CLTC最高续航670公里,支持3C超充。智能方面搭载DEEPAL AD Pro辅助驾驶系统,并率先接入DeepSeek大模型提供AI语音交互,主打高“质价比”。

其他行业动态
11:17
HuggingFace Daily Papers(社区热门论文)
55
快慢之间:学习视频中的时间流

本研究将时间作为可学习的视觉概念,开发了用于推理与操控视频时序的模型。通过自监督学习,模型能利用视频的多模态线索检测速度变化并估计播放速率。基于此,我们从真实世界视频中构建了最大的慢动作数据集。利用该数据,我们进一步开发了具备时序控制能力的模型,包括按指定速度生成运动的“速度条件视频生成”,以及将低帧率模糊视频转换为高帧率清晰序列的“时间超分辨率”。这项研究将时间确立为视频学习中一个可操控的感知维度,为时序可控的视频生成、时间取证检测及理解事件演变的世界模型开辟了新途径。

多模态视频论文/研究