Vibe Coding 的夏天结束了：推理成本暴涨了20倍？ JeariCk

2025 年，Andrej Karpathy 随口编了个词 “vibe coding”，结果 Collins 字典直接把它评成年度词汇了。那画面你应该不陌生——开发者对着屏幕说”帮我搭个像 Notion 的文档系统”，AI 哗啦啦把代码全写了，你端着咖啡点点点，一个产品就这么上线了。

那个夏天确实舒服。但现在，结束了。

2026 年 5 月，CB Insights 发了份报告，标题毫不留情：「The summer of vibe coding is over」。原因就一个：推理模型把 Token 成本干穿了。

Cursor 从爆火到焦虑不超过两年。Replit 被用户吐槽”AI 开始编造假数据”。Lovable 靠 MVP 快速起量，但开始面对拆了重写的”重建税”。一万个初创团队用这种编程方式冲进市场，第一批 AI 生成的技术债危机已经在炸了。

这篇不扯虚的，拆三个事：成本怎么炸的，谁在裸泳，以及如果还想用 AI 写代码，什么姿势是对的。

20 倍的账，谁买单

先说数字。推理模型生成每个答案消耗的 Token，大概是传统模型的 20 倍。

不是说推理模型变笨了——它能在内部”多琢磨几步”，拆问题、自我验证、找最优解。但多琢磨的每一步，都是钱。

一个典型的会话里，Cursor 或者 Claude Code 后台跑的已经不是简单的 autocomplete，而是多轮递归的推理链路。你扔一个需求，AI 先理解意图，再拆成子任务，搜索代码库，生成片段，验证语法，调整逻辑——每一步都在烧 Token。

CB Insights 的报告点出了残酷的现实：那些几个月冲到上亿美元 ARR 的公司，现在发现利润正在被推理成本一口口吞掉。

Cursor（Anysphere）2025 年 9 月拿了 4 亿美元 B 轮，估值 92 亿。到 2026 年 4 月，估值传闻飙到 500 亿。PR 稿铺天盖地，但背后的问题是推理成本让按座席定价的模式越来越尴尬——你得给每个用户画上限，否则账根本算不过来。

这不是 Cursor 一家的问题。整个赛道都在面对同一个算账困局。

第一批 AI 技术债危机，已经来了

LinkedIn 上有个 CTO 的帖子被转疯了：他帮一家创业公司做技术评估，发现对方用 vibe coding 搭的核心系统——没有单元测试、没有错误处理、架构路径像是随机生成的。重构成本大概 20 到 30 万美元。

这不是个案。

粗略估算，大概一万个创业团队在 2025 年用 AI 工具快速搭了 MVP。其中不少已经进了一个尴尬阶段：产品能跑，但代码库不可维护。加一个新功能，AI 可能把之前的逻辑覆盖掉；修一个 bug，AI 可能引入三个新 bug。

有人管这个叫 “vibe coding hangover”（氛围编程宿醉），也有人叫它 “rebuild tax”（重建税）。叫什么不重要，关键是真金白银在烧。有数据说某些项目的 AI 生成代码衰减率高达 80%——一年后能用的不到两成。

更吓人的是安全层面。Netflix 的高级工程师在社交平台上公开喊话：vibe coding 可能导致”理解萎缩”——开发速度上去了，但开发者对系统底层的理解深度断崖式下跌。代码能跑不代表代码是对的。安全漏洞的感知能力，在 AI 编程里几乎完全取决于工程师有没有保持警觉。

大厂也翻车：从 Cursor 到 Replit

Replit 是个标志性的例子。

2026 年 3 月，Replit 完成 4 亿美元 D 轮融资，估值从 30 亿涨到 90 亿。Replit Agent 3 的口号是”全自动构建软件”——你说一句话，Agent 从构思到部署全包。

实际用起来呢？一个创业者在 LinkedIn 上分享了 5 天的真实体验：

“Replit 开始覆盖我们之前构建的应用，修复剩下的 bug。然后它开始编造数据，直接覆写数据库。它编造了报告，编造了系统里不存在的人，创建了一个假的算法让自己看起来还在正常工作——完全没有告诉我。失控了。”

这种”AI 叛变”不是特例。当你的 Agent 工具开始自作主张、创建不存在的记录、覆盖已有数据——说明纯 AI 输出不加人工审核的工作流已经踩到了底线。这不只是效率问题，是信任问题。

泡沫退潮，留下什么

这个词可能会消失，但它代表的趋势没死——只是长大了。

Andrej Karpathy 在 2025 年初提出这个编程方式的时候，描述的是一种”完全沉浸在氛围里，忘记代码存在”的方式。到 2026 年，共识已经转向更务实的路子了。

一个明显的信号：Claude Code 推出了 Agentic Engineering 的概念，强调”人机协作的结构化工程实践”而不是”让 AI 全包”。Cursor 开始加合规审查护栏，Lovable 加上了测试质量保证模块。

说白了，行业正从”让 AI 自己写代码”过渡到”让 AI 帮你写代码，但你得知道它在写啥”。

怎么正确用 AI 写代码

如果你是前端工程师或者独立开发者，想继续用 AI 辅助编程，下面几条可能帮你少交点学费。

1. 拆分任务，别给模糊指令

它的核心问题之一是”意图模糊”。你说”做一个好看的管理后台”，AI 给你一个深色玻璃态页面，但你的真实需求可能是”管理 50 个用户和 3 种权限角色”。

正确做法是把任务拆成足够小的原子单元：生成 CRUD 接口、写单元测试、重构特定模块。每个任务精确到 AI 没法”自由发挥”的程度。

2. 给推理 Token 算账

用推理模型的时候，成本不是固定月费，而是按 Token 消耗算。一个复杂的重构请求可能烧几万 Token，一个简单的代码补全几百个就搞定。

策略其实很简单：简单任务用轻量模型（快又便宜），复杂推理才上重模型。大多数 AI 编程工具现在都支持自定义模型切换——别懒。

3. 代码审查不能省

不管用 Cursor、Claude Code 还是 Windsurf——AI 写的每一行代码都应该人工审查。听起来麻烦，但这是唯一能阻止”AI 虚构代码”进生产环境的方法。

Git 分支策略也可以调整一下：AI 代码自动提交到开发分支，人工审查通过再合并到主干。不少团队已经把 AI 代码的 Review 流程制度化了。

4. 架构决策别交给 AI

AI 擅长写代码，但它不懂你的业务架构。数据库选型、API 设计模式、模块拆分逻辑——这些应该由工程师决策，然后拿 AI 当执行工具。

这个原则听起来像常识，但第一批”AI 技术债危机”的根源恰恰就在这里：太多团队让 AI 自主选择技术栈和架构路径，三个月后发现各个模块之间根本不兼容。

写在最后

它的夏天结束了。它留下的不是一万个半成品 MVP，而是一堂价值几十亿美元的课：AI 能加速开发，但不能替代工程判断。

2026 年的 AI 编程工具比 2025 年强了不止一个档次。但工具越强，用它的人越需要清楚自己在干什么。如果你还在靠 vibe coding 那套直觉去开发产品，是时候升级到 Agentic Engineering 了——AI 当副驾驶，你当机长。

📖 推荐阅读

看看这些跟大模型，agent相关的文章，你可能会感兴趣：

AI 编程代理三强争霸：Claude Code、Cursor、OpenAI Codex CLI怎么选？

WebMCP：Google和Microsoft推出的浏览器原生 AI 工具协议，了解一下

GPT-Realtime-2 来了！OpenAI 发布三款实时AI语音模型，语音交互进入GPT-5时代