AIHOT

AI HOT

4月16日

00:07

AK@_akhaliq

连续对抗流模型 paper： https：//huggingface.co/papers/2604.11521

图像生成数据/训练论文/研究

00:07

AK@_akhaliq

ClawGUI 一个用于训练、评估和部署GUI智能体的统一框架论文： https：//huggingface.co/papers/2604.11784

智能体论文/研究部署/工程

00:07

AK@_akhaliq

KnowRL 通过强化学习与最小充分知识指导来提升大语言模型的推理能力论文： https：//huggingface.co/papers/2604.12627

推理数据/训练论文/研究

00:07

AK@_akhaliq

重新思考大型语言模型的在线策略蒸馏现象学、机制与方案论文： https：//huggingface.co/papers/2604.13016

数据/训练论文/研究

00:07

AK@_akhaliq

Habitat-GS 一种采用动态高斯泼溅的高保真导航模拟器论文： https：//huggingface.co/papers/2604.12626

具身智能论文/研究部署/工程

4月15日

00:03

AK@_akhaliq

QuanBench+ 一个用于基于LLM的量子代码生成的统一多框架基准测试论文： https：//huggingface.co/papers/2604.08570

编码论文/研究评测/基准

00:03

AK@_akhaliq

过去并未过去记忆增强的动态奖励塑形论文： https：//huggingface.co/papers/2604.11297

数据/训练论文/研究

00:03

AK@_akhaliq

Transformers中的注意力下沉关于其利用、解释与缓解方法的研究综述论文： https：//huggingface.co/papers/2604.10098

推理论文/研究部署/工程

00:03

AK@_akhaliq

OmniShow 统一多模态条件以生成人物-物体交互视频论文： https：//huggingface.co/papers/2604.11804

多模态视频论文/研究

4月14日

09:32

AK@_akhaliq

Matrix-Game 3.0 具备长时记忆的实时流式交互世界模型论文： https：//huggingface.co/papers/2604.08995

具身智能多模态论文/研究

01:16

AK@_akhaliq

WildDet3D 在野外扩展可提示的3D检测论文： https：//huggingface.co/papers/2604.08626

Hugging Face具身智能论文/研究

01:16

AK@_akhaliq

FORGE 面向制造场景的细粒度多模态评估论文： https：//huggingface.co/papers/2604.07413

多模态论文/研究评测/基准

01:16

AK@_akhaliq

用于引导知识密集型推理的过程奖励智能体 paper： https：//huggingface.co/papers/2604.09482

智能体推理论文/研究

8月28日

03:56

Hao AI Lab@haoailab

游戏强化学习训练能否提升LLM通用任务能力？

研究探讨了基于强化学习的LLM游戏后训练能否泛化到其他任务。在相同任务族内（如6×6推箱子泛化至8×8版本），训练带来了高达56%的性能提升。但在跨领域任务中，效果有限或不稳定：Blocksworld有小幅提升，WebShop有约6%但不稳定，GSM8K则无改善。研究团队为此提出了GRL框架，这是一个以智能体为中心的多轮强化学习框架，旨在高度定制LLM与环境的交互，以系统研究泛化能力。

智能体开源/仓库论文/研究

8月22日

03:16

Hao AI Lab@haoailab

【Lmgame Bench】 🤔 是否曾想过如何在 Lmgame-Bench 中评估不同游戏，甚至添加自己的游戏，却不知从何入手？我们已让运行评估和集成新游戏变得极其简单。我们最新的博客将引导您了解 Lmgame Bench 的几个关键功能，包括： - 智能体与环境设置。 - 单命令单智能体与多智能体评估。 - 模型与游戏框架支持。您可以通过我们的博客了解更多 👉https：//lmgame.org/#/blog/lmgame_use

智能体论文/研究评测/基准