AIHOT

4月28日

10:47

Simon Willison 博客

介绍 talkie：一个源自1930年的130亿参数复古语言模型

Nick Levine、David Duvenaud 和 Alec Radford 发布了 talkie，这是一个基于1931年前历史英文文本训练的130亿参数语言模型。其基础版本在2600亿token的已过版权数据上训练，而指令微调版本则用于驱动聊天界面。该版本借助Claude等现代模型生成合成数据进行训练，可能导致年代错位的知识污染。项目旨在探索此类模型预测未来、超越知识截止点进行发明等能力，并希望最终构建一个完全由复古模型自举的训练流程。模型采用Apache 2.0许可。

开源/仓库数据/训练模型发布端侧

10:47

Hacker News 热门（buzzing.cc 中文翻译）

Talkie：一款诞生于1930年的13B复古语言模型

Talkie是一款参数规模为130亿的复古风格语言模型，其设计灵感源于1930年代的语言特征与表达方式。该模型通过模拟特定历史时期的语料与文风，在文本生成中呈现出独特的复古韵味。项目已在官网发布，并在Hacker News社区获得102点热度关注。这一尝试展示了语言模型在风格化与历史语境模拟方面的技术拓展。

开源/仓库数据/训练模型发布

4月27日

19:20

IT之家（RSS）

精选74

阿里：视频生成模型 HappyHorse1.0 开启灰测，千问 App 首发支持 15 秒多镜头叙事

阿里巴巴视频生成模型 HappyHorse1.0 开启灰度测试，支持生成15秒多镜头叙事视频，具备多画幅适配和1080P超分输出功能。官网720P视频生成刊例价为0.9元/秒，千问App上体验价格低至0.44元/秒。大众用户可通过千问App使用，还能创作粤语、英语、法语、韩语等多种语言的剧情短片。该模型此前登顶AI Video Arena排行榜，并将于5月份正式发布商用。

多模态模型发布

关联讨论 1 条

推荐理由：HappyHorse 悄悄登顶 AI Video Arena 后才被阿里认领，这个反转让它不只是又一个视频模型。0.44 元/秒的定价对内容创作者是真金白银的信号，做短视频的值得现在就去千问 App 试一轮。

14:19

IT之家（RSS）

OpenAI 发布 Privacy Filter：1.5B 参数 PII 脱敏模型，Apache 2.0 开源上线

OpenAI开源了15亿参数的PII脱敏模型Privacy Filter，采用混合专家设计，每次仅激活约5000万参数，可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息，在基准测试中F1分数达97.43%。该模型作为本地预过滤层，帮助用户在文本发送至云端AI前脱敏数据，但高敏感场景仍需结合人工审核。

OpenAI开源生态模型发布部署/工程

13:18

IT之家（RSS）

未来三年小米 AI 投入超 600 亿元：MiMo-V2.5 将开源，几乎适配国内所有芯片

小米宣布未来三年在AI领域的投入将超过600亿元。其基座大模型MiMo开始收费后用户留存率超过35%，即将开源的MiMo-V2.5模型在AA智能与Agent指数上位列全球开源大模型并列第一，并几乎适配国内所有芯片。小米首代机器人VLA大模型团队仅用6个月完成开发，并判断机器人的“GPT3时刻”将在未来1-2年到来。在企业效率方面，小米预计通过全面拥抱Agent技术，整体效率将提升500%。此外，小米的智能助理Miclaw未来将与小爱同学全面融合，并贯通人车家全生态设备。

智能体开源生态模型发布

08:00

HuggingFace Daily Papers（社区热门论文）

Nemotron 3 Nano Omni：高效开放的多模态智能模型

Nemotron 3 Nano Omni是该系列最新模型，首次原生支持音频、文本、图像和视频输入。通过架构、训练数据及方法的改进，其在所有模态上的准确性均超越前代Nemotron Nano V2 VL，尤其在真实文档理解、长音视频理解和智能体计算机使用方面表现领先。该模型基于高效的Nemotron 3 Nano 30B-A3B骨干网络，并融入创新的多模态令牌缩减技术，实现了比同类规模模型更低的推理延迟和更高的吞吐量。为促进后续研发，团队发布了BF16、FP8和FP4格式的模型检查点，以及部分训练数据和代码库。

多模态开源生态模型发布

4月25日

20:47

The Decoder：AI News（RSS）

Qwen3.6-27B 在多数编程基准测试中击败了规模大得多的前代模型

阿里巴巴新发布的开源模型 Qwen3.6-27B 在多项编程基准测试中超越了其前代模型。该模型仅拥有 270 亿参数，而其前代模型的参数量是其 15 倍。这一结果表明，模型在代码能力上实现了显著的效率提升，以更小的规模取得了更优的性能。

开源生态模型发布编码

关联讨论 2 条

4月24日

22:17

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/DR-Venus-4B-SFT-GGUF

该项目致力于通过开源与开放科学推动人工智能的发展与普及。团队正持续推进技术民主化进程，旨在让更广泛的群体能够接触并利用先进AI工具。其核心路径是依托开放协作模式，降低技术门槛，促进创新生态的构建。

开源/仓库模型发布端侧

19:08

IT之家（RSS）

美团万亿级大模型 LongCat-2.0-Preview 开放测试，全程基于国产算力集群训练

美团新一代基础大模型LongCat-2.0-Preview已开放邀请测试，其总参数规模突破万亿，采用混合专家架构，整体能力被认为对标GPT-4。关键突破在于该模型完全基于国产化算力集群训练完成，标志着美团在此领域取得领先。此前，美团创始人王兴已披露公司持续投入数十亿美元保障算力供应。去年9月，美团曾开源基于相同架构、拥有5600亿参数的首款自研大模型LongCat-Flash。

开源生态数据/训练模型发布

08:08

IT之家（RSS）

小米发布 MiMo-V2.5-TTS / ASR 语音大模型：通过自然语言调度声音表现

小米发布全链路语音大模型系列MiMo-V2.5，包含TTS（语音合成）与ASR（语音识别）两大核心。TTS系列包含三款模型：基础版内置多款音色并支持精细控制；VoiceDesign版可一句话生成新音色；VoiceClone版能通过少量样本高保真复刻音色。三者均支持通过自然语言指令和音频标签精细调度声音表现，已在小米MiMo开放平台限时免费。ASR模型已正式开源，在中英双语、方言、强噪音及多人对话等复杂场景下的识别性能达到业界领先水平。

开源生态模型发布语音

08:00

Hugging Face：Blog（RSS）

精选78

DeepSeek-V4：智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4，其核心突破在于实现了长达百万token的上下文窗口，并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命，标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体DeepSeek开源生态模型发布

关联讨论 5 条

推荐理由：DeepSeek 把上下文窗口推到百万 token 不稀奇，关键是「agent 能实际用」这六个字。如果实测成立，RAG 的很多工程妥协可以扔掉了，做长文档和复杂 agent 的人该第一时间跑一遍。

4月23日

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

关联讨论 2 条

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。