10月1日
08:00
OpenRouter:Announcements(RSS)
精选60
每月 100 万次免费 BYOK 请求

所有客户每月可免费获得 100 万次“自带密钥”(BYOK)请求。这一政策将 BYOK 功能从付费服务转变为免费提供的基础配额,大幅降低了企业使用自有密钥管理数据安全的技术与成本门槛。免费额度覆盖了绝大多数中小规模企业的典型月请求量。

产品更新部署/工程

推荐理由:OpenRouter 给 BYOK 用户每月免 100 万次请求,对用自己 API key 跑 Agent 的开发者来说是实打实的成本减免,值得顺手薅。
9月29日
16:07
蚂蚁 inclusionAI:GitHub 新仓库
精选58
inclusionAI/dInfer

inclusionAI团队发布了dInfer,一个专为扩散语言模型设计的高效推理框架。该框架旨在解决扩散模型在文本生成领域推理速度慢、资源消耗大的核心挑战。dInfer通过一系列底层优化技术,显著提升了推理效率,能够更快地生成文本,同时降低计算成本,为扩散模型在更广泛的实际应用场景中部署提供了关键技术支持。

开源/仓库推理部署/工程

推荐理由:蚂蚁把扩散语言模型的推理框架开源了,这类模型的推理效率一直是落地瓶颈,做端侧或低成本部署的团队值得看看能不能接上。
8月26日
08:00
OpenRouter:Announcements(RSS)
42
首个图像模型在 OpenRouter 上线

Gemini 2.5 Flash Image Preview 模型已在 OpenRouter 平台正式发布。该模型是首个在该平台上线的图像生成模型,具备当前最优的图像生成能力。其核心特性包括出色的角色一致性和支持多图像输出功能,为开发者与用户提供了新的图像生成工具选项。

产品更新图像生成部署/工程
8月7日
08:00
OpenRouter:Announcements(RSS)
精选66
GPT-5 现已上线

GPT-5 已在 OpenRouter 平台正式推出。该模型具备长上下文处理能力,专门针对复杂推理任务与代码工作流进行了优化。此次发布标志着新一代大语言模型开始接入开放路由网络,为开发者与用户提供更强大的多步骤逻辑处理和编程辅助功能。

产品更新推理编码

推荐理由:OpenRouter 上架 GPT-5 本身不算新闻,但对用 OpenRouter 做多模型路由的开发者来说,这是终于能切到最新旗舰的信号,值得第一时间跑一遍自己的 benchmark。
8月4日
08:00
OpenRouter:Announcements(RSS)
51
为应用添加 Audio Inputs 和 PDF URLs 支持

平台宣布为所有模型的应用新增音频输入与通过URL发送PDF文件的功能。用户现在可以直接使用语音与各类模型(如GPT、Claude、LLaMA)进行交互,同时支持通过链接直接上传PDF文档进行处理。这两项更新旨在提升多模态交互的便捷性,扩展了应用处理非文本输入和数据获取的方式,无需再依赖传统的文件上传步骤。

产品更新多模态部署/工程
7月29日
08:00
OpenRouter:Announcements(RSS)
48
Presets:如何在应用间无缝迁移模型配置

新推出的服务端 Presets 功能实现了模型配置的“一次定制,处处使用”。该功能允许用户将包括模型、参数、提示词和工具在内的完整配置保存为可复用的预设方案,并能通过链接或代码片段跨应用无缝共享。这简化了从开发到生产的工作流,避免了重复配置,提升了团队协作与部署效率。

MCP/工具产品更新部署/工程
7月15日
08:00
OpenRouter:Announcements(RSS)
37
专注隐私的新提供商上线:Venice

专注隐私的AI提供商Venice正式加入OpenRouter平台,并推出了其旗舰模型。该模型主打无审查、功能强大且限制少的特点,旨在为用户提供私密且不受限制的人工智能体验。这一新增服务为寻求高度隐私保护和内容自由度的用户提供了新的选择。

行业动态部署/工程
7月14日
08:00
OpenRouter:Announcements(RSS)
54
在 Cursor 中使用 OpenRouter 模型:以 Moonshot AI 的 Kimi K2 为例

用户现可通过 OpenRouter 灵活的路由服务,在 Cursor IDE 中直接调用 Moonshot AI 最新推出的 Kimi K2 模型。这一集成简化了开发流程,无需复杂配置即可在编码环境中访问高性能大语言模型。OpenRouter 作为统一接口,支持用户便捷切换包括 GPT、Claude、LLaMA 及 Kimi 在内的多种模型,显著提升了 AI 辅助编程工具的可用性和选择自由度。

MCP/工具产品更新编码
7月10日
08:00
OpenRouter:Announcements(RSS)
48
免费服务层更新:持续为所有人提供可访问的AI

平台对其免费服务层进行了重要更新,旨在通过引入新的模型来维持可访问的AI推理能力。此次调整的核心是确保免费服务的长期可持续性,同时继续向广大用户提供AI服务。更新后,用户将能使用到性能更强或更高效的新模型,但部分原有模型的访问权限或速率可能会相应调整。平台承诺,核心目标依然是让每个人都能接触和使用AI技术。

产品更新部署/工程
7月1日
08:00
OpenRouter:Announcements(RSS)
32
新隐写模型:"Cypher Alpha"

一款名为“Cypher Alpha”的新型通用隐写模型现已发布。该模型具备内置的工具调用功能,可供用户免费使用。其核心特性在于“隐写”,即在执行任务时能保持隐蔽性。目前,用户已可尝试体验这一模型。

智能体MCP/工具产品更新
6月26日
08:00
OpenRouter:Announcements(RSS)
50
Introducing Presets: 从仪表板管理 LLM 配置!

OpenRouter 正式上线了 Presets 功能。用户现在可以通过仪表板集中管理 LLM 配置,无需再将参数硬编码在应用程序中。此举旨在将 LLM 逻辑集中化,从而帮助开发者更快地进行迭代,并清理冗余代码,提升开发效率。

产品更新部署/工程
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选73
Claude Desktop推出"桌面扩展"新格式,实现MCP服务器一键安装

Claude Desktop推出了名为“桌面扩展”的新打包格式(.mcpb文件),旨在彻底简化MCP服务器的安装流程。该格式将服务器代码、所有依赖项和配置清单打包成一个ZIP压缩包。用户只需下载.mcpb文件并用Claude Desktop打开点击安装即可完成,无需手动配置环境、安装运行时或处理依赖冲突。此举解决了以往需要开发者工具、手动编辑配置文件和依赖管理等复杂问题,显著降低了非技术用户使用强大本地MCP服务器的门槛。

AnthropicMCP/工具产品更新

推荐理由:MCP 服务器装机从「开发者手动改 JSON」变成「双击 .mcpb 一键安装」,Anthropic 把 MCP 生态的用户门槛砍掉了一大截,做 MCP server 的开发者现在该认真考虑打包分发了。
6月25日
08:00
OpenRouter:Announcements(RSS)
46
Dev & BYOK 更新:Uptime API 与更智能的密钥管理

Anthropic 为其开发者和 BYOK 客户推出两项重要更新。新发布的 Uptime API 允许开发者通过编程接口直接追踪模型运行状态与可用性。同时,BYOK 密钥管理功能得到增强,用户现在可以对密钥设置使用量限制,并创建可测试的密钥,从而实现对加密密钥更精细化的控制与验证。

产品更新部署/工程
6月9日
08:00
OpenRouter:Announcements(RSS)
49
简化我们的平台费用

平台宣布推出更简单、更透明的费用结构。此次调整旨在简化原有收费模式,提升费用透明度,让用户更清晰地理解相关成本。新结构将逐步实施,预计会影响平台上的各项服务收费方式。

产品更新部署/工程
6月4日
08:00
OpenRouter:Announcements(RSS)
52
GIF提示、Omni搜索、工具缓存与BYOK标志

多项新功能正式上线,包括GIF提示支持、Omni全平台搜索、Anthropic工具调用缓存以及自带密钥(BYOK)确认标志。这些更新显著提升了工作流程效率,实现了更智能的工具调用机制,并优化了图像支持体验。用户现可更快捷地生成GIF动图、跨平台检索内容、缓存常用工具以加速响应,并通过BYOK标志明确数据控制权限。

MCP/工具产品更新部署/工程
5月28日
08:00
OpenRouter:Announcements(RSS)
49
新功能发布:推理流、加密货币支付、终端用户ID等

OpenRouter平台上线多项新功能。核心更新包括“推理流”,允许开发者在模型生成完整回复前实时获取并处理中间推理步骤,提升交互应用的响应速度。平台新增加密货币支付选项,支持通过加密货币开具发票。同时引入“终端用户ID”功能,帮助开发者更好地追踪和管理最终用户的使用情况,以保护API速率限制。此外,密钥锁定机制也已上线,增强了密钥管理的安全性。

产品更新部署/工程
5月22日
08:00
OpenRouter:Announcements(RSS)
43
Passkeys、开发者体验升级与TypeScript智能体新指南

Anthropic发布了多项平台更新。用户现可使用Passkeys无密码方式登录以增强账户安全。开发者体验获得升级,包括引入“provider slugs”功能以简化模型调用流程。同时,官方推出了全新的TypeScript智能体构建指南与更新后的文档,旨在帮助开发者更高效地创建基于Claude的AI智能体。

智能体产品更新部署/工程
5月7日
08:00
OpenRouter:Announcements(RSS)
50
新服务商上线:Cerebras登场

专为速度与规模构建的AI服务商Cerebras正式推出。其架构从晶圆级到token处理全程优化,旨在消除内存瓶颈,从而显著提升计算效率与模型训练速度。这一突破使处理超大规模模型成为可能,为AI开发提供新的基础设施选择。

产品更新部署/工程
5月6日
08:00
OpenRouter:Announcements(RSS)
47
Better Insights、Faster Metrics 及全新开发者效率工具发布

平台推出了更深入的使用情况洞察、更精准的性能指标以及一系列新的开发者效率工具。这些更新旨在帮助开发者更快地优化工作流程,提升开发效率。新工具集专注于提供实时、可操作的数据分析,以加速调试与性能改进过程。

产品更新部署/工程
4月28日
08:00
OpenRouter:Announcements(RSS)
41
隐私条款明晰化、新增模型提供商、OAuth升级,以及Gemini获得并行工具支持

本次更新为开发者带来多项体验优化。隐私条款得到进一步明确,增强了数据处理的透明度。平台新增了多个第三方模型提供商,扩展了开发者的选择范围。OAuth 认证服务完成升级,提升了安全性与集成便捷性。此外,Google 的 Gemini 模型现已支持并行工具调用功能,允许模型同时执行多项操作,有望提高复杂任务的处理效率。这些改进共同致力于提升开发者的工作效率与构建体验。

MCP/工具产品更新部署/工程
4月23日
08:00
OpenRouter:Announcements(RSS)
52
Universal PDF Support

OpenRouter现已为平台上的所有模型提供PDF文件处理支持。这项通用功能意味着用户在使用任何模型时,都能直接上传和分析PDF文档。此举消除了以往特定模型才能处理PDF的限制,显著扩展了工具的应用场景,便于用户进行文档总结、信息提取或内容问答等一系列任务。

产品更新多模态部署/工程
4月18日
08:00
OpenRouter:Announcements(RSS)
41
更智能的图表、内联SVG与实时用量统计

OpenRouter平台上线三项核心更新。分析功能推出更智能的交互式图表,支持深入钻取数据。预览体验得到优化,现已支持内联SVG渲染,展示更流畅。平台新增实时用量统计功能,为用户提供即时的成本消耗可见性,便于监控API使用开销。这些改进旨在提升用户在模型使用分析与费用管理方面的操作体验。

产品更新部署/工程
4月10日
08:00
OpenRouter:Announcements(RSS)
53
"隐形"模型:Optimus Alpha

团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略,具体性能指标与架构细节未公开。此举旨在保持技术优势,避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展,但核心改进方向与具体应用场景仍有待后续披露。

智能体产品更新模型发布
4月3日
08:00
OpenRouter:Announcements(RSS)
41
"隐形"模型:Quasar Alpha

公司首次发布了名为Quasar Alpha的“隐形”模型。这一新模型标志着其产品策略的转变,旨在以更隐蔽、不易被察觉的方式运行。Quasar Alpha的推出是其在人工智能模型领域的一次重要迭代,具体性能指标和细节尚未完全公开,但明确指向了增强模型的隐蔽性和适应性。

产品更新模型发布
3月25日
08:00
OpenRouter:Announcements(RSS)
50
告别空转:为所有模型推出 Zero Token Insurance,不再为无效AI响应付费

Anthropic为其AI模型服务推出“零令牌保险”功能,覆盖包括Claude 3和GPT-4在内的所有主流模型。该功能可自动检测并补偿完全无意义、空白或严重错误的响应,用户无需为这些无效输出消耗令牌额度。系统通过实时分析响应结构与语义完整性实现自动判责,补偿令牌将在24小时内返还至账户。早期测试显示,该机制使GPT-4的无效响应计费率降低67%,Claude 3系列模型的空转计费投诉下降82%。

产品更新部署/工程
3月6日
08:00
OpenRouter:Announcements(RSS)
50
Deep Research 与众多新模型上线

首个深度研究工具已通过 OpenRouter API 正式上线,其 API 响应中直接提供完整的引用来源。该工具标志着 OpenRouter 平台功能的重大扩展,为用户提供了集成化的深度研究能力。同时,平台还发布了多款新模型,进一步丰富了其模型生态,可供开发者和研究者直接调用。

产品更新搜索部署/工程
2月12日
08:00
OpenRouter:Announcements(RSS)
47
推出 Nitro 与 Floor Price 快捷筛选功能

OpenRouter 新上线了 Nitro 和 Floor Price 两项快捷排序功能,为用户提供更精细的模型提供商选择控制。Nitro 快捷选项能一键筛选出响应速度最快的模型,而 Floor Price 选项则可立即按最低价格对所有可用模型进行排序。这两项功能旨在帮助用户根据实时需求,在速度与成本之间快速做出权衡,优化使用体验。

产品更新部署/工程
2月4日
08:00
OpenRouter:Announcements(RSS)
36
引入 Cloudflare 作为新提供商

Cloudflare 现已作为新模型提供商上线 OpenRouter 平台,首批支持其新推出的 Gemma 模型以及多款热门的 Llama 系列模型。此次合作扩大了开发者在部署和调用大语言模型时的基础设施选择,可直接通过 Cloudflare 全球网络访问这些模型。

产品更新开源生态部署/工程
1月24日
08:00
OpenRouter:Announcements(RSS)
49
Reasoning Tokens for Thinking Models

研究人员为大型语言模型引入了“推理令牌”概念,这是一种特殊的元数据标记,用于显式标注模型在生成最终答案前的内部推理步骤。该机制允许模型将思考过程分解为多个中间步骤,并以结构化令牌形式输出,使人类能够追溯和分析其逻辑链条。这种方法提升了模型决策的透明度和可解释性,有助于调试复杂任务中的错误,并为评估推理质量提供了新工具。目前已在部分开源模型架构中实现测试。

产品更新推理部署/工程
1月23日
08:00
OpenRouter:Announcements(RSS)
47
通过 API 引入网络搜索功能

Anthropic 宣布通过 API 为其 AI 模型 Claude 提供联网搜索功能。该功能允许开发者在 API 请求中直接集成实时网络搜索结果,确保模型能获取并基于最新信息进行回应。此举旨在提升 Claude 回答的时效性与准确性,使其能够处理需要当前数据支持的查询,例如新闻、股价或体育比分。用户需在 API 调用中显式启用此搜索选项。

产品更新搜索部署/工程
08:00
OpenRouter:Announcements(RSS)
45
Standardized finish reasons

模型现在开始返回标准化的完成原因值,并与OpenAI风格的惯例保持一致。这一变化意味着不同模型(如GPT、Claude、LLaMA)的输出终止原因将采用统一的分类和表述方式,例如“stop”、“length”或“content_filter”,从而提升API调用的可预测性和跨平台兼容性。开发者无需再为不同模型适配各异的终止逻辑,简化了集成与调试流程。

OpenAI产品更新部署/工程
1月1日
08:00
OpenRouter:Announcements(RSS)
32
新年快乐!全新Auto Router登场

2025年初,Auto Router迎来重要升级,同时宣布与NotDiamond建立合作伙伴关系。本次升级聚焦于提升路由效率与响应速度,具体性能指标未公开。合作方NotDiamond将为其提供技术支持,共同优化多模型调用策略,旨在增强复杂任务的处理能力。此次更新标志着Auto Router在智能化调度领域迈出新的实践步伐。

产品更新部署/工程
12月24日
08:00
OpenRouter:Announcements(RSS)
41
Holiday Launches: Web Search & Price Cuts

OpenRouter Chatroom 现已免费提供网络搜索功能。此次更新是假日季发布的一部分,主要包含两项内容:一是开放了网络搜索能力,二是进行了价格下调。用户现在可以在聊天室中直接进行联网查询,而无需额外付费。

产品更新搜索部署/工程
12月20日
08:00
OpenRouter:Announcements(RSS)
45
Bring Your Own API Keys

OpenRouter推出新功能,允许用户绑定自己的提供商API密钥或云服务积分。此举将用户的现有额度与OpenRouter平台相结合,统一管理不同模型(如GPT、Claude、LLaMA)的使用。用户可以在一个界面下集中监控和分析所有API调用情况,优化资源分配与成本控制。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
29
Crypto Payments API

该API首次实现了为任意大语言模型(如GPT、Claude、LLaMA)编写链上支付脚本的功能。它使LLM能够直接发起和处理加密货币支付,标志着AI与区块链交易整合的关键进展。这一工具将自动化支付流程引入LLM应用生态,为开发者提供了标准化的加密支付集成方案。

产品更新部署/工程
12月12日
08:00
OpenRouter:Announcements(RSS)
39
Structured Outputs 与免费的 Gemini Flash 2.0

OpenAI 的 GPT-4o 模型和 Fireworks 模型现已支持结构化输出功能,开发者可以更可靠地获取格式化的 JSON 数据。与此同时,谷歌宣布其 Gemini Flash 2.0 模型转为免费提供,这为开发者和研究者提供了一个新的、无需付费的高性能大语言模型选项。这两项进展旨在降低应用开发门槛,并提升模型响应的可控性与实用性。

产品更新部署/工程
12月6日
08:00
OpenRouter:Announcements(RSS)
33
价格下调与 Llama 3.3 70b

Meta 最新发布了 Llama 3.3 70B 模型,并同步推出了六个不同规格的版本及服务提供商。此次发布伴随着显著的价格下调,旨在提升模型的可及性与市场竞争力。关键变化在于以更低的成本提供强大的 700亿参数模型,具体降价幅度因提供商和版本而异,但整体趋势是大幅降低使用门槛。这一举措预计将推动大语言模型在更广泛场景中的应用与部署。

产品更新开源生态
12月5日
08:00
OpenRouter:Announcements(RSS)
33
Author Pages & Amazon Nova

亚马逊发布了全新的Nova模型家族。此次发布标志着亚马逊在大型语言模型领域推出了新的产品线,旨在增强其AI服务能力。新模型家族预计将在理解能力、生成效率等方面进行关键升级,以应对当前市场上GPT、Claude、LLaMA等模型的竞争。具体性能指标和细节尚未完全披露,但此举明确显示了亚马逊加速布局生成式AI市场的决心。

产品更新部署/工程