
2026年过去的这小半年,全球的AI爱好者们都经历了一场前所未有的“体感断层”。
人们最先看到的,是技术的极致繁荣。
随着Claude、GPT、GLM等推理模型的加速迭代,原本枯燥的编码过程被名为Vibe Coding(氛围编程)的新范式取代。
无论以前是不是开发者,都无需纠结于每一行语法,只要在大脑中构筑出逻辑的氛围,剩下的琐事就全都可以交给各种智能体(Agent)代劳。
但好景不长,就在人们为专业门槛近乎消失而狂欢时,商业逻辑开始上演急速坍塌。
内有智谱,外有Anthropic,这些AI模型厂商在短短一个月内集体上演了一场价格的“背刺”。
无限量套餐关停、低价引流套餐被清理,甚至部分厂商试图将准入门槛直接拉高五倍。
在这场算力与资本的拉锯战中,舆论一度将矛头指向Vibe Coding的低效,嘲讽人们正在挥霍昂贵的算力。
然而真相更加残酷。
那些最初接纳不成熟技术、用时间和精力给AI喂养稀缺数据的先行者,正在被迫给整个行业的低效架构和商业投机买单。
01
Vibe Coding:一场被诅咒的生产力革命
自从Vibe Coding出现,编程门槛被大幅降低,人们总是笑称曾经被认为最不可能失业的程序员如今反倒成了最先失业的群体。
不过,斯坦福大学最新的一篇论文《SWE-chat: Coding Agent Interactions From Real Users in the Wild》直接揭露了Vibe Coding繁荣的假象。
就像人们想象的那样,Vibe Coding确实已经走入很多人的生活。
论文通过对6000多个真实编程会话的追踪发现,Vibe Coding是目前编程行业绝对的主流,在41%的会话中,AI编写的代码量已经超过99%。
然而,这种全自动的模式不仅有代价,而且高得吓人。
由于Agent需要不断地在环境中进行“反思→重试→工具调用”的循环,其消耗的token数量是传统人机协作模式的3倍。

这还没完,更扎心的问题在于,AI产出的代码中有56%最终会被丢进垃圾桶,根本无法通过人类的审核进入提交记录。
因此,一个直观的现实摆在眼前:
提供模型和算力的厂商,后台每天有超过一半的算力都是在做无用功。
如此低下的代码利用率,可能会让圈外人误以为Vibe Coding是开发者们偷懒的捷径。
不过,数据已经证明这反而是一种更高强度的脑力博弈。
毕竟,使用过Vibe Coding的人不得不品尝的一环就是和AI吵架。
在44%的交互轮次中,用户都在进行高频的纠错、修正和指令回推。
这就是那些先行者们的生存现状:为了享受AI瞬间生成上千行代码的快感,就得化身专家级别的挑刺者,在海量的垃圾代码中寻找那个符合逻辑的宝箱。
这种逻辑不仅谈不上轻松,反而因为需要不断纠正AI的幻觉而变得极度消耗精神。
02
Coding Plan:AI厂商的噩梦
当Vibe Coding的低效碰上昂贵的算力成本,原本看似美好的订阅制服务瞬间就变成了AI厂商的财务噩梦。
作为国内编程领域的佼佼者,智谱这家上市仅仅四个月的企业做出的政策变动极具代表性:
1月21日,智谱发布公告称Coding Plan启动限售。

面对GLM-4.7带来的用户激增,智谱承认算力紧张,将每日销售量直接砍掉80%,试图通过物理层面上的限流保证用户体验。
2月12日,智谱宣布对Coding Plan进行价格调整。

伴随GLM-5的发布,价格整体上浮30%以上,承诺老用户价格不变。
3月15日,智谱允许老用户开启自动续订功能,该活动于3月31日结束。
4月22日,智谱宣布强制关停老套餐。

短短四个月内频繁的运营策略调整,加上订阅用户经历“错误代码429”、高峰时期限速、并发和卡顿等问题,瞬间引起了老用户的愤怒。
尽管算力紧缺、token涨价这些因素客观存在,但智谱理应提早确定销售配额和价格策略。
这种从“拥抱开发者”到“防御性收割”的转折,也表明智谱必须面对一个残酷的事实:
在现有的Vibe Coding模式下,老用户只要每天保持高频的模型调用,其消耗的token成本已经足以让厂商亏损。
这种针对低客单价用户的精准打击,本质上就是在清理那些投入产出比极低的引流流量。
事实上,订阅服务涨价和速度受限绝非上述企业独有的现象,而是国内AI企业的“通病”。
无论是猛烈还是温和的涨价,AI巨头们已经都不愿意再为不能盈利的token兜底。
目光放到大洋彼岸,Anthropic的灰度测试更是让人无语。
为了承载Claude Code带来的长程Agent消耗,Anthropic竟然试图将订阅服务的起步价从20美元直接提升到100美元。
事情发生后瞬间引爆众怒,短短一天后Anthropic便在舆论压力下撤回了这一决策。
尽管这些事情看起来无比荒唐,但也释放出了一个明确的市场信号:
真正的智能体编程,真实的价格水位线就在每个月100美元附近。
03
被推高的硬件价格
令人担忧的是,这些变化的发生,连半年还不到。
为什么Vibe Coding的价格从“人人都是程序员”瞬间变成“连AI巨头都扛不住?”
事实上,其中存在一个从软件缺陷到硬件溢价的恶意传导链条。
话题要从年初的OpenClaw谈起。
以它为代表的智能体代理软件,两个多月前席卷的远不只是开发者的圈子。
铺天盖地的“一键部署”、企业免费上门安装,使得不懂变成的人也能通过简单的指令构建复杂的应用。
然而,此前的文章中我们早已说过,它的底层逻辑并不严谨。
由于缺乏精细的路径规划,一个人类动动手两三秒即可完成的操作,等同于数十轮对话和工具调用。
软件层面的熵增,直接导致了全球范围内的token虚假繁荣。
那些在AI模型上投入上亿却难以回本的厂商等待了许久,终于迎来了一次变现的机会。
在获客初期,为了获得更漂亮的数据,甚至免费指导用户安装这些“高耗能”工具,最终搬起石头砸了自己的脚。
这种低效流量的需求迅速传导至上游,让本就不富裕的高性能计算芯片面临更严重的供需失衡。
激增的推理需求替代了训练需求成为主流,让GPU溢价再次提升一个台阶;与此同时智能体的高频上下文读取使得AI厂商对高带宽内存(HBM)的需求近乎狂热。
而在这个过程中,“硬件税”悄无声息地转嫁了。
当AI厂商在硬件上投入了天文数字后,那些跟风“养虾”的玩家也发现自己Vibe Coding带来的实际代码价值接近于0而纷纷离去,企业无法通过这些短暂的流量弥补成本,只能反过来向最早支持他们的订阅用户吸血。
面对成本危机,市场在2026年也给出了两种不同的生存方案。
前段时间写过的小米token plan一文中,我曾说过市场会给出公平的答案。
算力经济学的逻辑,在Agent时代彻底改写了
从coding plan到token plan的升级,无疑是对“订阅制泡沫”的一次公开处刑。
放弃模棱两可的次数限制、回归最原始的token颗粒度计费,带来的优势则是价格透明。
尽管这种计费方式在诞生初期因价格昂贵而被诟病,但在如今全行业涨价和限流的背景下,反而成为了一种最诚实的商业契约。
夜间的八折优惠则是为了实现峰谷调度,AI算力即将走向“公用事业化”,像电力一样通过价格杠杆来调节。
与之相对的,OpenAI凭借着技术优势依然稳坐钓鱼台。
作为AI时代的先驱者,OpenAI近期仍然保持价格和服务质量的稳定。
这并非因为Sam Altman慈悲为怀,而是因为OpenAI在推理成本优化和付费用户数量上拥有绝对优势。
Codex的用户数量正在高速追赶Claude Code,而模型之间的编程能力差距也正在缩小。
而国内外AI企业同时涨价,对OpenAI来说意味着又一波用户数量的激增,这次Altman恐怕又要开心的“瘫坐在地”了。
因此,这种稳定性也是对二线厂商最沉重的压制:如果你的技术不够领先,你连亏本请用户写代码的资格都没有。
04
先行者不该是这场危机的牺牲品
在这场声势浩大的涨价潮中,最令人心寒的并非价格本身,而是AI厂商对先行者的无情背弃。
而那些已经把Vibe Coding当成生活习惯的开发者,自始至终没有做错任何事。
他们才是智能体进化的核心驱动力。
在AI编程能力还处于婴儿期时,这些先行者忍受着极高的报错率,一遍又一遍地调优指令,在与AI吵架后还得手搓一行行代码来填坑。
这些看似无比低效的交互过程,反而是智能体最稀缺、最真实的RLHF(人类反馈强化学习)养料。
没有这些报错反馈和修复过后的可运行代码,AI编程工具不可能在短短一年内进化到如今的水平。
开发者的时间和金钱,为人类喂养出了更强大的生产力工具。
与此同时,他们也是理性的“守夜人”。
在OpenClaw这种伪需求工具风靡全球时,社区中懂技术的先行者往往在奔走呼吁。
他们警示过架构的安全漏洞、提醒过人们注意高频调用带来的算力成本。
然而,面对获客数据和倾销冗余token的诱惑,AI企业普遍选择装聋作哑。
等到算力红利被消耗殆尽,却掉过头来将刀刃伸向了这些付费意愿最高、对技术最忠诚的核心用户。
先行者们接纳了不完美的技术、贡献了最宝贵的数据,甚至还要在涨价后依然货比三家抢购coding plan套餐,只为了保住已经形成的生产习惯。
这个时候,得到的只是轻飘飘的一句话:
感谢你们帮我们把模型训练完成,现在请交出五倍的过路费,或者把资源让给更有钱的大客户。
我们理解厂商面临的算力成本压力,也理解硬件溢价带来的商业困境。
但如果一个行业解决问题的方式是不断“背刺”核心贡献者,那么眼前的繁荣必然是假象。