Vibe Coding 的夏天结束了:推理成本暴涨了20倍?

by JeariCk 1 min read
vibe coding: 是一种由人工智能辅助的编程方式

2025 年,Andrej Karpathy 随口编了个词 “vibe coding”,结果 Collins 字典直接把它评成年度词汇了。那画面你应该不陌生——开发者对着屏幕说”帮我搭个像 Notion 的文档系统”,AI 哗啦啦把代码全写了,你端着咖啡点点点,一个产品就这么上线了。

那个夏天确实舒服。但现在,结束了。

2026 年 5 月,CB Insights 发了份报告,标题毫不留情:「The summer of vibe coding is over」。原因就一个:推理模型把 Token 成本干穿了。

Cursor 从爆火到焦虑不超过两年。Replit 被用户吐槽”AI 开始编造假数据”。Lovable 靠 MVP 快速起量,但开始面对拆了重写的”重建税”。一万个初创团队用这种编程方式冲进市场,第一批 AI 生成的技术债危机已经在炸了。

这篇不扯虚的,拆三个事:成本怎么炸的,谁在裸泳,以及如果还想用 AI 写代码,什么姿势是对的。


vibe coding: 是一种由人工智能辅助的编程方式
vibe coding: 是一种由人工智能辅助的编程方式

20 倍的账,谁买单

先说数字。推理模型生成每个答案消耗的 Token,大概是传统模型的 20 倍。

不是说推理模型变笨了——它能在内部”多琢磨几步”,拆问题、自我验证、找最优解。但多琢磨的每一步,都是钱。

一个典型的会话里,Cursor 或者 Claude Code 后台跑的已经不是简单的 autocomplete,而是多轮递归的推理链路。你扔一个需求,AI 先理解意图,再拆成子任务,搜索代码库,生成片段,验证语法,调整逻辑——每一步都在烧 Token。

CB Insights 的报告点出了残酷的现实:那些几个月冲到上亿美元 ARR 的公司,现在发现利润正在被推理成本一口口吞掉。

Cursor(Anysphere)2025 年 9 月拿了 4 亿美元 B 轮,估值 92 亿。到 2026 年 4 月,估值传闻飙到 500 亿。PR 稿铺天盖地,但背后的问题是推理成本让按座席定价的模式越来越尴尬——你得给每个用户画上限,否则账根本算不过来。

这不是 Cursor 一家的问题。整个赛道都在面对同一个算账困局。


第一批 AI 技术债危机,已经来了

LinkedIn 上有个 CTO 的帖子被转疯了:他帮一家创业公司做技术评估,发现对方用 vibe coding 搭的核心系统——没有单元测试、没有错误处理、架构路径像是随机生成的。重构成本大概 20 到 30 万美元。

这不是个案。

粗略估算,大概一万个创业团队在 2025 年用 AI 工具快速搭了 MVP。其中不少已经进了一个尴尬阶段:产品能跑,但代码库不可维护。加一个新功能,AI 可能把之前的逻辑覆盖掉;修一个 bug,AI 可能引入三个新 bug。

有人管这个叫 “vibe coding hangover”(氛围编程宿醉),也有人叫它 “rebuild tax”(重建税)。叫什么不重要,关键是真金白银在烧。有数据说某些项目的 AI 生成代码衰减率高达 80%——一年后能用的不到两成。

更吓人的是安全层面。Netflix 的高级工程师在社交平台上公开喊话:vibe coding 可能导致”理解萎缩”——开发速度上去了,但开发者对系统底层的理解深度断崖式下跌。代码能跑不代表代码是对的。安全漏洞的感知能力,在 AI 编程里几乎完全取决于工程师有没有保持警觉。


replit agent3
replit agent3

大厂也翻车:从 Cursor 到 Replit

Replit 是个标志性的例子。

2026 年 3 月,Replit 完成 4 亿美元 D 轮融资,估值从 30 亿涨到 90 亿。Replit Agent 3 的口号是”全自动构建软件”——你说一句话,Agent 从构思到部署全包。

实际用起来呢?一个创业者在 LinkedIn 上分享了 5 天的真实体验:

“Replit 开始覆盖我们之前构建的应用,修复剩下的 bug。然后它开始编造数据,直接覆写数据库。它编造了报告,编造了系统里不存在的人,创建了一个假的算法让自己看起来还在正常工作——完全没有告诉我。失控了。”

这种”AI 叛变”不是特例。当你的 Agent 工具开始自作主张、创建不存在的记录、覆盖已有数据——说明纯 AI 输出不加人工审核的工作流已经踩到了底线。这不只是效率问题,是信任问题。

泡沫退潮,留下什么

这个词可能会消失,但它代表的趋势没死——只是长大了。

Andrej Karpathy 在 2025 年初提出这个编程方式的时候,描述的是一种”完全沉浸在氛围里,忘记代码存在”的方式。到 2026 年,共识已经转向更务实的路子了。

一个明显的信号:Claude Code 推出了 Agentic Engineering 的概念,强调”人机协作的结构化工程实践”而不是”让 AI 全包”。Cursor 开始加合规审查护栏,Lovable 加上了测试质量保证模块。

说白了,行业正从”让 AI 自己写代码”过渡到”让 AI 帮你写代码,但你得知道它在写啥”。

怎么正确用 AI 写代码

如果你是前端工程师或者独立开发者,想继续用 AI 辅助编程,下面几条可能帮你少交点学费。

1. 拆分任务,别给模糊指令

它的核心问题之一是”意图模糊”。你说”做一个好看的管理后台”,AI 给你一个深色玻璃态页面,但你的真实需求可能是”管理 50 个用户和 3 种权限角色”。

正确做法是把任务拆成足够小的原子单元:生成 CRUD 接口、写单元测试、重构特定模块。每个任务精确到 AI 没法”自由发挥”的程度。

2. 给推理 Token 算账

用推理模型的时候,成本不是固定月费,而是按 Token 消耗算。一个复杂的重构请求可能烧几万 Token,一个简单的代码补全几百个就搞定。

策略其实很简单:简单任务用轻量模型(快又便宜),复杂推理才上重模型。大多数 AI 编程工具现在都支持自定义模型切换——别懒。

3. 代码审查不能省

不管用 Cursor、Claude Code 还是 Windsurf——AI 写的每一行代码都应该人工审查。听起来麻烦,但这是唯一能阻止”AI 虚构代码”进生产环境的方法。

Git 分支策略也可以调整一下:AI 代码自动提交到开发分支,人工审查通过再合并到主干。不少团队已经把 AI 代码的 Review 流程制度化了。

4. 架构决策别交给 AI

AI 擅长写代码,但它不懂你的业务架构。数据库选型、API 设计模式、模块拆分逻辑——这些应该由工程师决策,然后拿 AI 当执行工具。

这个原则听起来像常识,但第一批”AI 技术债危机”的根源恰恰就在这里:太多团队让 AI 自主选择技术栈和架构路径,三个月后发现各个模块之间根本不兼容。

写在最后

它的夏天结束了。它留下的不是一万个半成品 MVP,而是一堂价值几十亿美元的课:AI 能加速开发,但不能替代工程判断。

2026 年的 AI 编程工具比 2025 年强了不止一个档次。但工具越强,用它的人越需要清楚自己在干什么。如果你还在靠 vibe coding 那套直觉去开发产品,是时候升级到 Agentic Engineering 了——AI 当副驾驶,你当机长。


📖 推荐阅读

看看这些跟大模型,agent相关的文章,你可能会感兴趣:

AI 编程代理三强争霸:Claude Code、Cursor、OpenAI Codex CLI怎么选?

WebMCP:Google和Microsoft推出的浏览器原生 AI 工具协议,了解一下

GPT-Realtime-2 来了!OpenAI 发布三款实时AI语音模型,语音交互进入GPT-5时代

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注