AIHOT

4月24日

08:00

HuggingFace Daily Papers（社区热门论文）

为冻结大语言模型学习证据高亮（Learning Evidence Highlighting for Frozen LLMs）

HiLight 是一个证据强调框架，它将证据选择与推理过程解耦，专门用于服务参数冻结的大语言模型。该框架训练一个轻量级的“强调执行器”，在不改动原始上下文的前提下，仅围绕关键证据片段插入最少量的高亮标记，从而避免压缩或重写输入可能导致的证据丢失或扭曲。随后，冻结的“求解器”模型基于被强调的输入进行下游推理。该方法将高亮视为弱监督决策问题，仅利用求解器的任务奖励通过强化学习优化执行器，无需证据标注，也无需访问或修改求解器。在序列推荐和长上下文问答任务中，HiLight 的性能持续优于基于提示和自动提示优化的基线方法。学习到的强调策略能够零样本迁移到未见过的、或大或小的求解器模型家族，包括基于 API 的求解器，这表明执行器捕捉到了真实且可复用的证据结构，而非对单一骨干模型过拟合。

检索增强推理论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

AgentSearchBench：一个面向真实场景的AI智能体搜索基准

研究团队推出了AgentSearchBench，这是一个用于评估真实场景下AI智能体搜索能力的大规模基准。该基准从多个提供方收集了近10,000个真实世界智能体，将智能体搜索形式化为可执行任务查询和高级任务描述下的检索与重排序问题，并利用基于执行结果的性能信号来评估相关性。实验表明，语义相似性与智能体实际性能之间存在持续差距，暴露了仅基于描述进行检索和重排序方法的局限性。研究进一步证明，轻量级的行为信号（包括执行感知探测）能显著提升排序质量，凸显了将执行信号纳入智能体发现过程的重要性。相关代码已开源。

智能体GitHub论文/研究评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

dWorldEval：基于离散扩散世界模型的可扩展机器人策略评估方法

研究团队提出dWorldEval，一种基于离散扩散世界模型的可扩展机器人策略评估框架。该方法将视觉、语言和机器人动作等多模态数据映射到统一的令牌空间，通过单一Transformer去噪网络进行建模，并引入稀疏关键帧记忆以保持时空一致性。模型在推理时联合预测未来观测和任务进度令牌，当进度值达到1时自动判定任务成功。实验表明，dWorldEval在LIBERO、RoboTwin及多项真实机器人任务上显著优于WorldEval、Ctrl-World和WorldGym等现有方法，为构建大规模机器人评估的世界模拟器提供了新的架构范式。

具身智能论文/研究部署/工程

06:15

OpenAI：Alignment 研究博客（RSS）

精选58

开源可监控性评估

研究团队开源了论文《Monitoring Monitorability》中的数据集与代码，并分享了一种针对噪声主导干预评估实例的新过滤策略。这一举措旨在提升AI系统监控能力的评估透明度与可复现性，为社区提供了可直接使用的工具和方法。新提出的过滤策略能有效识别并处理评估过程中噪声干扰严重的实例，有望提高评估结果的准确性与可靠性。

OpenAI安全/对齐论文/研究

推荐理由：OpenAI 把自家对齐监控的评测数据集和代码全开源了，做 AI 安全评估的团队可以直接拿来用，但对普通开发者来说门槛还是偏高。

4月23日