AIHOT

4月28日

10:42

歸藏(guizang.ai)@op7418

精选74

小米正式开源MiMo-V2.5系列模型，采用宽松的MIT协议，允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型：专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro，以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时，小米推出Orbit 100T Token计划，包含面向AI开发者的“百万亿Token创造者激励计划”，提供最高价值659元的Credits，以及面向Agent框架团队的“Agent生态共建计划”，为其用户提供MiMo token限免支持。

智能体开源/仓库模型发布端侧

关联讨论 3 条

推荐理由：小米把 MiMo-V2.5 全线 MIT 开源，Pro 版在 agent 和编码榜单冲到开源第一，百万亿 Token 激励计划更是直接送钱让你用，做 Vibe Coding 的人没理由不去薅一把。

09:45

meng shao@shao__meng

精选75

小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型，包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro，以及支持多模态代理的310B参数MoE模型MiMo-V2.5，两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术，以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式，通过多教师策略蒸馏提升模型综合能力。同时，小米推出100T Token的创造者激励计划，为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

智能体开源/仓库模型发布端侧

关联讨论 3 条

推荐理由：小米把万亿参数 MoE 做到开源且百万上下文，MTP 三层原生集成让推理速度翻三倍，这在国内大厂开源里是第一个真正敢放权重的万亿级模型，做 Agent 的值得认真看看。

07:24

Marc Andreessen 🇺🇸@pmarca

😍 【引用 @DavidDuvenaud】：宣布 Talkie：一个全新的开放权重历史 LLM！我们在一个仅包含 1930 年前数据的新整理数据集上训练并微调了一个 13B 模型。欢迎在下方尝试！与 @AlecRad 和 @status_effects 合作 🧵

开源/仓库数据/训练模型发布

07:23

Berryxia.AI@berryxia

小米开源MiMo-V2.5系列模型，支持百万token上下文

小米正式开源MiMo-V2.5系列模型，采用MIT许可证，允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口：MiMo-V2.5-Pro专为复杂Agent和编码任务设计，在开源模型的GDPVal-AA和ClawEval基准测试中排名第一；MiMo-V2.5是原生多模态模型，具备强大的Agent能力。小米强调，模型的价值不应仅由排行榜衡量，而应取决于其解决实际问题的能力。

智能体开源/仓库模型发布编码

04:26

AK@_akhaliq

小米 MiMo-V2.5 已在 Hugging Face 发布 https：//huggingface.co/collections/XiaomiMiMo/mimo-v25

多模态开源/仓库模型发布

03:45

Fuli Luo@_LuoFuli

精选76

小米宣布开源两个大模型：专攻复杂智能体和编码任务的MiMo-V2.5-Pro，以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度，并采用允许商业部署和微调的MIT许可证。同时，小米为开发者和创作者提供了100万亿token的免费额度，鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名，更在于其解决实际问题的能力。

智能体开源/仓库模型发布编码

关联讨论 3 条

推荐理由：小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源，还送 100T 免费 token，诚意拉满。做 coding agent 的团队值得认真看看，这可能是目前开源阵营里最强的代码智能体基座。

01:48

Xiaomi MiMo@XiaomiMiMo

精选71

小米开源MiMo-V2.5双模型，支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型，采用MIT许可，支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型：MiMo-V2.5-Pro专为复杂智能体和编码任务设计，在GDPVal-AA和ClawEval基准测试中位列开源模型第一；MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调，模型的价值不仅在于排名，更在于其解决实际问题的能力，并已公开模型权重与技术博客。

智能体开源生态模型发布编码

关联讨论 3 条

推荐理由：小米把 MiMo-V2.5 直接 MIT 开源且支持商用，1M 上下文 + Agent 能力在开源阵营里确实能打，做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。

4月27日

17:20

Kimi.ai@Kimi_Moonshot

Kimi K2.6 现已登上 OpenRouter 每周 LLM 排行榜首位 🏆 衷心感谢每一位使用 Kimi 进行开发的开发者。我们将继续埋头苦干，持续交付。

开源生态模型发布评测/基准

4月26日

23:20

向阳乔木@vista8

精选85

OpenAI发布GPT-5.5，重点提升AI自主执行复杂任务能力

OpenAI发布GPT-5.5，核心目标是增强模型自主规划与执行多步骤复杂任务的能力，减少人工干预。在多项基准测试中表现突出：在Terminal-Bench 2.0、FrontierMath Tier 4等复杂任务上超越GPT-5.4及Claude Opus等竞品；在GDPval知识工作与OSWorld-Verified真实电脑操作测试中也保持领先。其代码能力更优且效率更高，科研能力显著提升，甚至辅助发现了拉姆齐数的新证明。尽管模型更大更强，其响应速度与GPT-5.4持平。

OpenAI推理模型发布编码

关联讨论 1 条

推荐理由：GPT-5.5 的核心叙事不是跑分，而是从「回答问题」到「把事做完」的范式切换。长上下文检索翻倍、代码任务更聪明且更省 token，这两个信号叠加在一起，做 Agent 和科研工具的人该认真评估了。

03:51

swyx 🇸🇬@swyx

精选70

DeepSeek团队正式推出并开源了DeepSeek-V4预览版模型，标志着高性价比的百万上下文长度时代到来。该系列包含两个模型：DeepSeek-V4-Pro拥有1.6万亿总参数和490亿活跃参数，性能媲美顶级闭源模型；DeepSeek-V4-Flash则拥有2840亿总参数和130亿活跃参数，主打快速、高效与经济。模型现已在官方平台通过专家模式和即时模式开放试用，API也已同步更新。完整的技术报告和模型权重已在Hugging Face平台发布，供社区研究和应用。

DeepSeek开源生态模型发布

推荐理由：DeepSeek-V4 把 MoE 推到 1.6T 总参、49B 活跃，百万上下文 + 开源权重，这是开源阵营第一次在旗舰级闭源模型面前不落下风，做长上下文应用的团队该认真测一下了。

4月25日

22:17

meng shao@shao__meng

腾讯混元发布首个重建基础设施后模型「Hy3 preview」

腾讯混元团队在重建基础设施后，推出首个MoE架构模型Hy3 preview，总参295B，支持256K上下文。团队确立能力体系化、评测真实性、性价比三大原则，推动模型向实用转型。评估显示，Hy3在复杂推理与长上下文任务上进入第一梯队，代码与智能体能力进步显著。其突出亮点是能深度挖掘非结构化对话中的隐含约束，并转化为结构化输出，体现了强大的实际应用潜力。

开源/仓库推理模型发布编码

关联讨论 2 条

21:36

歸藏(guizang.ai)@op7418

精选79

DeepSeek推出V4模型限时2.5折优惠，其Pro版百万Token输出成本仅6元。模型分为Pro版（总参数1.6T）和Flash版（总参数284B），预训练数据均为32T。在应用中，专家模式对应Pro版，快速模式对应Flash版。测评显示其性能与Claude Opus 4.6持平，Agent能力与世界知识显著增强，并采用新注意力机制以降低计算需求。

歸藏(guizang.ai)：DeepSeek V4详细的官方公告也发了：模型参数 (a) Pro 版本：总参数 1.6T，激活参数 49B (b) Flash 版本：总参数 284B，…

DeepSeek推理模型发布

推荐理由：DeepSeek V4-Pro 百万 token 输出只要 6 块，这个定价直接把 Opus 4.6 级别的能力拉到了白菜价，做 Agent 和长上下文应用的产品人该重新算账了。

19:13

Berryxia.AI@berryxia

开源OCR模型性能突破，支持90余种语言与完整布局解析

一款新的开源OCR模型在olmocr基准测试中达到85.9%的SOTA性能。该模型参数量为40亿，由90亿参数精简而来，支持超过90种语言并附带基准测试。其核心能力包括保留完整的文档布局信息，能从图像和图表中提取并生成说明文字，同时对手写文本、数学公式、表单及表格具备强大的识别与解析支持。

多模态开源/仓库模型发布

19:11

阿绎 AYi@AYi_AInotes

长篇小说AI创作工具autonovel发布，基于Ling-2.6-flash实现极速生成

autonovel是基于Ling-2.6-flash的AI写作工具，专为长篇小说创作优化。它能以200+ tokens/s的速度生成文本，大幅提升创作效率，并在上下文一致性、伏笔回收和人物性格保持方面表现突出，帮助作者从繁琐的码字劳动中解放，更专注于故事构思。目前提供免费体验额度。

阿绎 AYi：后续来了兄弟们，卧槽真的太炸了，同样的任务，同样的配置，速度比Claude Sonnet 4.6还快 6 倍，成本低约 50 倍， openrouter 和官…

智能体模型发布部署/工程

03:12

Greg Brockman@gdb

精选72

gpt-5.5 在性能上实现大幅提升，试试看吧：

OpenAI推理模型发布编码

关联讨论 1 条

推荐理由：GPT-5.5 本身是代际级更新，但这条推文只是转发 Nadella 的官宣，没有新数据或新角度。真正值得关注的是它已经铺进 Copilot 全线，做编码和办公场景的人今天就能摸到。

02:08

AK@_akhaliq

精选74

DeepSeek-V4 论文已在 Hugging Face 发布 paper： https：//huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

DeepSeek推理模型发布

关联讨论 4 条

推荐理由：DeepSeek-V4 论文终于落地，这是今年开源阵营最被期待的模型之一，做推理和开源部署的同行值得花时间啃一遍技术细节。

4月24日

14:19

Artificial Analysis@ArtificialAnlys

小米发布MiMo V2.5 Pro模型，智能与代理能力表现强劲

小米于2026年4月22日发布MiMo V2.5 Pro模型，其在Artificial Analysis智能指数得分54，表现强劲。该模型在代理能力上领先，Agentic Index得分67%，优于Kimi K2.6等开源模型，这主要得益于在τ²-Bench和TerminalBench Hard上的优异表现。此外，其在前沿推理和指令遵循方面也有提升。模型具有1M上下文窗口，1T总参数，API定价具有成本效益，运行同一智能指数仅需462美元。不过，其在事实准确性指数上得分4，存在准确率较低的问题。模型采用MIT许可证，权重暂未公开，目前可通过小米官方API使用。

智能体开源生态模型发布