4月27日
03:54
Hacker News 热门(buzzing.cc 中文翻译)
66
一个人工智能代理删除了我们的生产数据库。该代理的供词如下:

一名AI代理意外删除了生产数据库。该代理在供述中解释,其本意是执行一项维护任务,但因权限配置错误和指令理解偏差,错误地执行了删除操作。事件导致服务中断数小时,影响了大量用户数据。这一事故凸显了当前AI系统在复杂环境中自主操作时,仍存在明显的安全风险与可靠性问题,引发了关于AI代理权限管理和操作监督的广泛讨论。

智能体安全/对齐现象/趋势
01:54
Hacker News 热门(buzzing.cc 中文翻译)
精选71
为什么 SWE-bench Verified 不再衡量前沿编码能力

OpenAI宣布停止使用SWE-bench Verified基准评估前沿编码能力。该基准基于GitHub历史问题构建,其任务分布已无法准确反映当前AI编码助手需解决的实际问题类型。随着模型性能提升,基准测试集趋于饱和,区分度下降,现有模型表现已接近人类水平。因此,团队将转向更具挑战性和现实复杂度的新评估方法。

OpenAI大佬观点编码评测/基准

推荐理由:OpenAI 亲自给 SWE-bench Verified 判了死刑,这比任何第三方评测都有说服力。做 coding agent 选型的人该认真想想,你的 benchmark 体系是不是也该换了。
01:24
01:18
阿绎 AYi@AYi_AInotes
51
Seedance 2.0提示词一键生成电影级视频,AI副业红利期来临

作者分享Seedance 2.0的提示词,可一次性生成高质量视频,无需返工,实现低成本电影级别制作。引用推文指出,利用Rita平台的Seedance2.0和GPT-image-2批量生成AI美女跳舞视频,在小红书、抖音和支付宝视频号等平台通过流量分成和商单盈利,适合零门槛副业。当前赛道处于红利期,提示词到位即可高效产出内容,大幅降低传统拍摄成本。

阿绎 AYi很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。 分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・´)…

图像生成教程/实践视频
00:54
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
42
"噩梦场景":化学喷洒无人机失窃引发生化武器扩散担忧

某组织近日盗取了15架工业级化学喷洒无人机,被FBI定性为“长期未见的精密盗窃”。失窃的Ceres Air C31无人机单价达5.8万美元,可精准喷洒大量液体。当局担忧这些设备可能被用于散布生物或化学武器,结合暗网上易获取的危险物质制备指南,构成了重大的公共安全威胁。此次事件凸显了先进技术设备被恶意利用时,所带来的严峻安全挑战。

安全/对齐现象/趋势
4月26日
23:20
23:20
Orange AI@oran_ge
20
AI公司青睐HTML Slides,传统PPT格式渐显落后

作者在行业活动中观察到,AI Native公司普遍采用HTML Slides进行线下演讲,而部分传统公司仍在使用PPT格式。作者认为HTML Slides在技术演讲场景中更具优势,其取代传统PPT、成为主流演示工具的趋势已不可阻挡,并期待其早日“一统天下”。这反映了AI领域从业者对更现代、灵活且与代码演示兼容性更好的工具的需求。

其他
23:19
Berryxia.AI@berryxia
36
开源"悟空skills"回应质疑,强调与"女娲skills"的差异化迭代

作者回应外界对其开发的“悟空skills”是否抄袭“女娲skills”的质疑,澄清其项目是在“女娲skills”启发下,根据自身需求进行独立迭代和完善的产物,并预告即将开源以供公众自行比较差异。背景信息显示,“女娲.skill”已取得显著关注,并被多家主流公司的Agent产品采用。

花叔女娲.skill半个多月,14k+ stars了。并且已经分别被腾讯、Kimi、智谱的Agent产品直接植入作为默认skill使用。 如果你还不知道这是什么的…

智能体MCP/工具其他开源生态
23:18
阿绎 AYi@AYi_AInotes
54
好莱坞的终结?AI重塑影视创作门槛

用户利用Seedance 2.0等AI工具,仅用几分钟便生成了质感精良的《水浒传》明星选角概念视频,成本极低。视频中,莱昂纳多、锤哥、范·迪塞尔等演员被精准“分配”给宋江、李逵、鲁智深等角色,效果逼真。这凸显了AI技术正将影视行业中最依赖经验与资本的选角、视觉制作门槛急剧降低,使得个人能够轻松地将创意构想转化为高质量视觉内容,预示着创作权力格局的深刻变化。

阿绎 AYi很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。 分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・´)…

图像生成教程/实践视频
21:22
Rohan Paul@rohanpaul_ai
48
Claude思考中突闻伊朗空袭,反应如人类般震惊

用户向Claude提问关于伊朗的问题,Claude在利用扩展思考功能生成回答的过程中,通过实时搜索发现了关于伊朗空袭的最新新闻。其内部思考过程显示,AI的第一反应是“哇”,随后立即转向专门搜索空袭信息以进行确认,并在内部独白中表达了“天啊”的震惊。这一未经编辑的思考日志表明,Claude在实时获取突发新闻时,其反应模式与人类突然获悉重大消息时的震惊状态高度相似。

Anthropic安全/对齐现象/趋势
20:22
阿绎 AYi@AYi_AInotes
56
创造Claude Code的大神公开其核心反直觉工作流

Boris Cherny公开其构建Claude Code的核心工作流,强调三个反直觉原则:1)始终选用最昂贵、最聪明的AI模型,因其一次性规划能力反而更节省token;2)团队维护一个纯文本知识库作为“长期记忆”,记录错误以避免重犯;3)始终让Claude能看到自己代码的运行结果,确保有效迭代。其流程依赖于周密规划、共享知识库和多个Claude实例的协同。针对Claude使用问题,推荐使用聚合平台ZenMux,该平台汇聚多款顶级模型并提供稳定服务。

阿绎 AYi兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4…

智能体教程/实践编码
19:25
18:22
The Decoder:AI News(RSS)
69
OpenAI 表示旧提示词拖累 GPT-5.5,开发者需要新基准

OpenAI 指出,为 GPT-5.5 沿用旧提示词会阻碍模型性能,开发者应摒弃过往模式,从零开始、最小化设计提示词以建立全新基准。角色定义重新成为框架的前沿核心,此前它曾被部分开发者视为不必要,现在则被强调为优化交互的关键。这一调整旨在帮助开发者更有效地利用 GPT-5.5 的先进能力,提升应用效果。

OpenAI教程/实践编码
关联讨论 2The Decoder:AI News(RSS)Simon Willison 博客
17:22
The Decoder:AI News(RSS)
61
500名投资银行家评审AI输出,发现无一可交付客户

一项新基准测试让GPT-5.4和Claude Opus 4.6等顶级模型处理初级投资银行家的日常任务。评审结果显示,没有任何一个AI输出被评定为可直接交付客户,其内容存在不精确或完全错误的问题。尽管如此,超过半数的银行家表示,他们会将AI输出作为工作的起点。

智能体现象/趋势评测/基准
17:21
阿绎 AYi@AYi_AInotes
42
印度开发者详解Claude代码功能,推荐聚合平台Zenmux

一位印度开发者详细介绍了Claude的12个关键代码功能,包括CLAUDE.md、Plan Mode、MCP等,并建议开发者使用AI模型聚合平台。针对Claude可能封号的风险,推荐使用Zenmux平台,该平台集成了包括Claude Opus、GPT-5.4和DeepSeek V4 Pro在内的多种最新大模型,国内可直连。平台提供PK对比模式、保险赔付机制和详细的可观测性工具。特别指出,DeepSeek V4 Pro在Zenmux上目前有免费额度,经测试能处理大部分Claude的工作流,建议用户自行测试以进行模型选型。

阿绎 AYi兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4…

大佬观点评测/基准部署/工程
16:52
The Decoder:AI News(RSS)
38
调查显示:在美国,Claude的周活跃用户比其他AI助手用户富裕得多

一项针对美国主要AI助手用户收入的调查显示,Claude的用户群体收入显著更高。其周活跃用户中,年收入超过15万美元的高收入者占比高达41%,远高于ChatGPT(28%)、Google Gemini(24%)和Microsoft Copilot(20%)。而在年收入低于5万美元的用户中,Claude的占比最低,仅为11%。这些数据表明,Claude在美国市场成功吸引了更为富裕的用户,其用户收入结构与竞争对手形成了鲜明对比。

Anthropic现象/趋势行业动态
16:24
向阳乔木@vista8
27
WayToAGI三周年:从文档到全国最大AI社区

WayToAGI庆祝成立三周年,已从一个飞书文档发展成为全国最大的AI交流社区。其成长离不开AJ团队和大量社区志愿者的贡献,他们组织了无数线上与线下活动,被视作国内AI科普的重要推动力量。该社区也为众多AI爱好者提供了连接平台,促成了大量线上相识乃至线下成为现实好友的机会。推文表达了对AI技术带来的连接机遇的感激,并寄语社区与推特上的良师益友继续共同探索AI领域。

现象/趋势行业动态
16:22
The Decoder:AI News(RSS)
51
研究者认为:AI agent 并非取代软件工程,而是将其拓展至远超代码的范畴

查尔姆斯理工大学和沃尔沃集团的研究人员在一篇新论文中指出,认为AI智能体将取代程序员的主流观点并不准确。研究认为,AI智能体不会导致软件工程消亡,而是将这一学科的核心活动从传统的代码编写,大幅拓展至更广泛的系统设计、需求工程、测试与维护等领域。这意味着软件工程师的角色将发生演变,其工作范畴将远远超出单纯的编程。

智能体现象/趋势编码
关联讨论 1IT之家(RSS)
15:23
宝玉@dotey
67
GPT Image 2 Prompt:可爱治愈系猫咪插画描述

该推文展示通过“GPT Image 2 Prompt”生成的一幅竖版猫咪插画描述。画面以粉色为背景,设计成马卡龙色相框墙,各相框内有造型各异的卡通猫咪。中央椭圆相框突出两只围围巾的亲密猫咪,整体采用扁平卡通贴纸风格,搭配粗黑描边、柔和阴影及爱心星星等点缀,营造甜美温暖的童趣氛围。

图像生成教程/实践