AIHOT

1月6日

09:37

Sam Altman：Blog（RSS）

精选

Sam Altman在ChatGPT两周年之际回顾OpenAI九年历程：从坚信AGI可能实现，到2022年意外推出ChatGPT并引爆前所未有的增长曲线。他坦承过去两年从零构建公司的混乱压力，以及被董事会突然解雇的危机教训。如今周活用户已达3亿，在迈向AGI的道路上，他既感激这段经历，也承认未来仍充满未知。

智能体OpenAI大佬观点推理

关联讨论 1 条

推荐理由：Sam Altman 反思创业历程，预测 2025 年 AI Agent 将实质性改变企业产出

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选72

Claude 3.5 Sonnet 在 SWE-bench Verified 基准测试中刷新纪录

升级版 Claude 3.5 Sonnet 在软件工程评估基准 SWE-bench Verified 上取得 49% 的解决率，超越此前最佳模型的 45%。该基准通过真实 GitHub 问题测试 AI 模型完成软件工程任务的能力，要求模型在给定环境中理解、修改并测试代码，最终通过原始单元测试验证。Claude 团队构建的智能体设计简洁，仅包含提示词、Bash 工具和编辑工具，赋予模型充分的自主判断空间，以灵活步骤解决问题。目前尚无模型在该基准上突破 50% 的解决率。

智能体Anthropic教程/实践编码

推荐理由：Anthropic 把自家 SWE-bench agent 的 prompt、工具设计和踩坑经验全公开了，做 coding agent 的人可以直接抄作业，比看十篇二手解读都管用。

1月1日

08:00

OpenRouter：Announcements（RSS）

新年快乐！全新Auto Router登场

2025年初，Auto Router迎来重要升级，同时宣布与NotDiamond建立合作伙伴关系。本次升级聚焦于提升路由效率与响应速度，具体性能指标未公开。合作方NotDiamond将为其提供技术支持，共同优化多模型调用策略，旨在增强复杂任务的处理能力。此次更新标志着Auto Router在智能化调度领域迈出新的实践步伐。

产品更新部署/工程

12月24日

08:00

OpenRouter：Announcements（RSS）

Holiday Launches： Web Search & Price Cuts

OpenRouter Chatroom 现已免费提供网络搜索功能。此次更新是假日季发布的一部分，主要包含两项内容：一是开放了网络搜索能力，二是进行了价格下调。用户现在可以在聊天室中直接进行联网查询，而无需额外付费。

产品更新搜索部署/工程

12月23日

08:00

xAI：News（网页）

精选

xAI 完成 60 亿美元 C 轮融资

xAI 宣布完成 60 亿美元 C 轮融资，资金将用于加速 Grok 等 AI 模型研发及扩建算力基础设施。此次融资进一步推高公司估值，加剧与 OpenAI、Anthropic 等竞争对手在生成式 AI 领域的军备竞赛。

xAI行业动态

推荐理由：xAI 完成 60 亿美元 C 轮融资，AI 基础设施竞赛白热化

12月20日

08:00

OpenRouter：Announcements（RSS）

Bring Your Own API Keys

OpenRouter推出新功能，允许用户绑定自己的提供商API密钥或云服务积分。此举将用户的现有额度与OpenRouter平台相结合，统一管理不同模型（如GPT、Claude、LLaMA）的使用。用户可以在一个界面下集中监控和分析所有API调用情况，优化资源分配与成本控制。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

Crypto Payments API

该API首次实现了为任意大语言模型（如GPT、Claude、LLaMA）编写链上支付脚本的功能。它使LLM能够直接发起和处理加密货币支付，标志着AI与区块链交易整合的关键进展。这一工具将自动化支付流程引入LLM应用生态，为开发者提供了标准化的加密支付集成方案。

产品更新部署/工程

12月19日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选80

构建高效智能体：从简单模式开始

Anthropic基于实践经验指出，成功的LLM智能体往往采用简单、可组合的模式，而非复杂框架。文章区分了工作流（预定义路径编排）与智能体（LLM动态自主决策），建议开发者优先采用最简单方案，仅在必要时增加复杂性。许多核心模式直接调用LLM API仅需几行代码即可实现。文中介绍了增强型LLM、提示链等基础构建模块，强调应为特定用例定制检索、工具等增强功能，并推荐通过Model Context Protocol集成第三方工具生态。

智能体AnthropicMCP/工具教程/实践

推荐理由：Anthropic 官方把过去一年踩过的坑浓缩成一篇 Agent 架构指南，核心观点是「别上框架，先用最简单的模式」。做 Agent 产品的开发者，这篇比任何第三方教程都值得当 checklist 用。