平台宣布推出更简单、更透明的费用结构。此次调整旨在简化原有收费模式,提升费用透明度,让用户更清晰地理解相关成本。新结构将逐步实施,预计会影响平台上的各项服务收费方式。
多项新功能正式上线,包括GIF提示支持、Omni全平台搜索、Anthropic工具调用缓存以及自带密钥(BYOK)确认标志。这些更新显著提升了工作流程效率,实现了更智能的工具调用机制,并优化了图像支持体验。用户现可更快捷地生成GIF动图、跨平台检索内容、缓存常用工具以加速响应,并通过BYOK标志明确数据控制权限。
OpenRouter平台上线多项新功能。核心更新包括“推理流”,允许开发者在模型生成完整回复前实时获取并处理中间推理步骤,提升交互应用的响应速度。平台新增加密货币支付选项,支持通过加密货币开具发票。同时引入“终端用户ID”功能,帮助开发者更好地追踪和管理最终用户的使用情况,以保护API速率限制。此外,密钥锁定机制也已上线,增强了密钥管理的安全性。
Anthropic发布了多项平台更新。用户现可使用Passkeys无密码方式登录以增强账户安全。开发者体验获得升级,包括引入“provider slugs”功能以简化模型调用流程。同时,官方推出了全新的TypeScript智能体构建指南与更新后的文档,旨在帮助开发者更高效地创建基于Claude的AI智能体。
专为速度与规模构建的AI服务商Cerebras正式推出。其架构从晶圆级到token处理全程优化,旨在消除内存瓶颈,从而显著提升计算效率与模型训练速度。这一突破使处理超大规模模型成为可能,为AI开发提供新的基础设施选择。
平台推出了更深入的使用情况洞察、更精准的性能指标以及一系列新的开发者效率工具。这些更新旨在帮助开发者更快地优化工作流程,提升开发效率。新工具集专注于提供实时、可操作的数据分析,以加速调试与性能改进过程。
本次更新为开发者带来多项体验优化。隐私条款得到进一步明确,增强了数据处理的透明度。平台新增了多个第三方模型提供商,扩展了开发者的选择范围。OAuth 认证服务完成升级,提升了安全性与集成便捷性。此外,Google 的 Gemini 模型现已支持并行工具调用功能,允许模型同时执行多项操作,有望提高复杂任务的处理效率。这些改进共同致力于提升开发者的工作效率与构建体验。
OpenRouter现已为平台上的所有模型提供PDF文件处理支持。这项通用功能意味着用户在使用任何模型时,都能直接上传和分析PDF文档。此举消除了以往特定模型才能处理PDF的限制,显著扩展了工具的应用场景,便于用户进行文档总结、信息提取或内容问答等一系列任务。
OpenRouter平台上线三项核心更新。分析功能推出更智能的交互式图表,支持深入钻取数据。预览体验得到优化,现已支持内联SVG渲染,展示更流畅。平台新增实时用量统计功能,为用户提供即时的成本消耗可见性,便于监控API使用开销。这些改进旨在提升用户在模型使用分析与费用管理方面的操作体验。
团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略,具体性能指标与架构细节未公开。此举旨在保持技术优势,避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展,但核心改进方向与具体应用场景仍有待后续披露。
公司首次发布了名为Quasar Alpha的“隐形”模型。这一新模型标志着其产品策略的转变,旨在以更隐蔽、不易被察觉的方式运行。Quasar Alpha的推出是其在人工智能模型领域的一次重要迭代,具体性能指标和细节尚未完全公开,但明确指向了增强模型的隐蔽性和适应性。
Anthropic为其AI模型服务推出“零令牌保险”功能,覆盖包括Claude 3和GPT-4在内的所有主流模型。该功能可自动检测并补偿完全无意义、空白或严重错误的响应,用户无需为这些无效输出消耗令牌额度。系统通过实时分析响应结构与语义完整性实现自动判责,补偿令牌将在24小时内返还至账户。早期测试显示,该机制使GPT-4的无效响应计费率降低67%,Claude 3系列模型的空转计费投诉下降82%。
首个深度研究工具已通过 OpenRouter API 正式上线,其 API 响应中直接提供完整的引用来源。该工具标志着 OpenRouter 平台功能的重大扩展,为用户提供了集成化的深度研究能力。同时,平台还发布了多款新模型,进一步丰富了其模型生态,可供开发者和研究者直接调用。
OpenRouter 新上线了 Nitro 和 Floor Price 两项快捷排序功能,为用户提供更精细的模型提供商选择控制。Nitro 快捷选项能一键筛选出响应速度最快的模型,而 Floor Price 选项则可立即按最低价格对所有可用模型进行排序。这两项功能旨在帮助用户根据实时需求,在速度与成本之间快速做出权衡,优化使用体验。
Cloudflare 现已作为新模型提供商上线 OpenRouter 平台,首批支持其新推出的 Gemma 模型以及多款热门的 Llama 系列模型。此次合作扩大了开发者在部署和调用大语言模型时的基础设施选择,可直接通过 Cloudflare 全球网络访问这些模型。
研究人员为大型语言模型引入了“推理令牌”概念,这是一种特殊的元数据标记,用于显式标注模型在生成最终答案前的内部推理步骤。该机制允许模型将思考过程分解为多个中间步骤,并以结构化令牌形式输出,使人类能够追溯和分析其逻辑链条。这种方法提升了模型决策的透明度和可解释性,有助于调试复杂任务中的错误,并为评估推理质量提供了新工具。目前已在部分开源模型架构中实现测试。
Anthropic 宣布通过 API 为其 AI 模型 Claude 提供联网搜索功能。该功能允许开发者在 API 请求中直接集成实时网络搜索结果,确保模型能获取并基于最新信息进行回应。此举旨在提升 Claude 回答的时效性与准确性,使其能够处理需要当前数据支持的查询,例如新闻、股价或体育比分。用户需在 API 调用中显式启用此搜索选项。
模型现在开始返回标准化的完成原因值,并与OpenAI风格的惯例保持一致。这一变化意味着不同模型(如GPT、Claude、LLaMA)的输出终止原因将采用统一的分类和表述方式,例如“stop”、“length”或“content_filter”,从而提升API调用的可预测性和跨平台兼容性。开发者无需再为不同模型适配各异的终止逻辑,简化了集成与调试流程。
2025年初,Auto Router迎来重要升级,同时宣布与NotDiamond建立合作伙伴关系。本次升级聚焦于提升路由效率与响应速度,具体性能指标未公开。合作方NotDiamond将为其提供技术支持,共同优化多模型调用策略,旨在增强复杂任务的处理能力。此次更新标志着Auto Router在智能化调度领域迈出新的实践步伐。
OpenRouter Chatroom 现已免费提供网络搜索功能。此次更新是假日季发布的一部分,主要包含两项内容:一是开放了网络搜索能力,二是进行了价格下调。用户现在可以在聊天室中直接进行联网查询,而无需额外付费。
OpenRouter推出新功能,允许用户绑定自己的提供商API密钥或云服务积分。此举将用户的现有额度与OpenRouter平台相结合,统一管理不同模型(如GPT、Claude、LLaMA)的使用。用户可以在一个界面下集中监控和分析所有API调用情况,优化资源分配与成本控制。
该API首次实现了为任意大语言模型(如GPT、Claude、LLaMA)编写链上支付脚本的功能。它使LLM能够直接发起和处理加密货币支付,标志着AI与区块链交易整合的关键进展。这一工具将自动化支付流程引入LLM应用生态,为开发者提供了标准化的加密支付集成方案。
OpenAI 的 GPT-4o 模型和 Fireworks 模型现已支持结构化输出功能,开发者可以更可靠地获取格式化的 JSON 数据。与此同时,谷歌宣布其 Gemini Flash 2.0 模型转为免费提供,这为开发者和研究者提供了一个新的、无需付费的高性能大语言模型选项。这两项进展旨在降低应用开发门槛,并提升模型响应的可控性与实用性。
Meta 最新发布了 Llama 3.3 70B 模型,并同步推出了六个不同规格的版本及服务提供商。此次发布伴随着显著的价格下调,旨在提升模型的可及性与市场竞争力。关键变化在于以更低的成本提供强大的 700亿参数模型,具体降价幅度因提供商和版本而异,但整体趋势是大幅降低使用门槛。这一举措预计将推动大语言模型在更广泛场景中的应用与部署。
亚马逊发布了全新的Nova模型家族。此次发布标志着亚马逊在大型语言模型领域推出了新的产品线,旨在增强其AI服务能力。新模型家族预计将在理解能力、生成效率等方面进行关键升级,以应对当前市场上GPT、Claude、LLaMA等模型的竞争。具体性能指标和细节尚未完全披露,但此举明确显示了亚马逊加速布局生成式AI市场的决心。