今年会·(jinnianhui)金字招牌-平民玩家,开始玩儿不起AI了

2026-05-10 14:57:52

首页财产ai正文 布衣玩家,最先玩儿不起AI了 相识OpenClaw等智能体的事情道理,就能理解token耗损量指数增加,是由于“上下文的无序膨胀”。 2026-04-21 07:48 ·微信公家号:特殊油条豆腐乳儿 AI投资人解读· 2026年4月,智谱海外版月付价格险些翻倍,腾讯云AI算力全线上调5%,阿里云取缔百炼平台基础套餐续费进口。我国日均token挪用量本年三月超140万亿,较2025年末增加40%。· 算力供给极端急急,成本压力沿财产链层层下传,智能体存于token华侈征象。总结:AI财产进入“算力通货收缩”时代,年夜模子及云厂商提价,成本传导至下流。智能体虽鞭策token需求增加,但存于华侈,财产面对算力紧张与成本高问题,将来需优化智能体削减华侈,让用户用患上起。内容由AI天生,仅供参考

2026年4月12日,智谱Coding Plan(海外版)月付价格险些翻倍。

第二天,阿里云公布取缔百炼平台基础套餐的续费进口。

其他厂商并无于涨价上掉队,4月9日,腾讯云AI算力全线上调5%。

这场涨价潮,代表着AI财产正从"流量获客"的互联网时代,迅速滑向"算力通货收缩"的重工业时代。

以前为了吸援用户,年夜模子年夜打价格战。此刻token利用量猛增,从年夜模子到云厂商,都看到了卖token可以或许跑通的盈利模式,也该提价收回此前的成本了。

于汹涌增加的token需求眼前,算力供给极端急急,涨价就顺着财产链不停向下流传导,蒙受成本的终端就是中小型开发者及平凡用户。

智能体撞开了算力闸门

我国日均token挪用量,本年三月已经经跨越了140万亿,比拟2024年头的1000亿增加了1000多倍,比起2025年末的100万亿,三个月内也增加了40%。

近来三个月的猛涨,重要患上益在以OpenClaw为代表的智能体,让它们主动事情要耗损年夜量token,以至在有相称一批人体验了OpenClaw后,大喊token耗损太厉害,快没钱烧了,只好卸载了事。

token耗损量猛增,象征着算力年夜幅耗损,传导到上游就是AI芯片受到哄抢。

按照SemiAnalysis,英伟达H100的一年期租赁合同价格从2025年10月的1.70美元/小时/GPU飙升至2026年3月的2.35美元,涨幅近40%。

上涨的可不只有GPU价格,就连AI办事器调理与推理焦点的CPU也于被抢购,2026年3月下旬,英特尔与AMD接踵通知客户上调处置惩罚器价格,这两家本年办事器CPU产能已经基本售罄。

成本压力沿着"芯片-云厂商-模子厂商-运用厂商-企业客户"的链条层层下传。

Cursor是全世界*的自力AI代码天生平台,2026年2月年化收入冲破20亿美元,看似风景,实则2025年吃亏至少1.5亿美元。

其险些所有收入都被用在挪用Anthropic及OpenAI的模子,毛利率被压缩至使人梗塞的程度。

传统SaaS软件公司毛利率中位数高达77%,此刻AI年夜模子及运用卷死了传统软件公司,可AI运用的平均毛利率仅为25%至60%。

以是年夜模子只能涨价,把成本继承往下流传导,此前价格战给的福利要收回,这一民风也不是海内先最先的。

2026年4月初,全世界领 先的年夜模子厂商,已经经估值数百亿美元的AI巨头Anthropic,忽然堵截定阅用户经由过程OpenClaw品级三方东西接入Claude API的许可。

官方注释直白赤裸,部门重度用户每个月仅付出200美元定阅费,却耗损了价值5000美元的算力资源。

一个OpenClaw代办署理运行一天,暗地里的算力成本于1000至5000美元之间,用户还有是赶早别白嫖自家办事,该去切换至按用量付费的API模式,否则连Anthropic都顶不住。

token华侈惊心动魄

年夜模子涨价,用户肉疼之余也于迷惑,这token就非患上烧这么多吗?

本年3月,就有一名名为shelvenzhou的开发者于GitHub长进行了一项基准测试,记载本身利用OpenClaw处置惩罚一样平常事情的Token耗损轨迹。

第 一轮对于话成本0.0050美元,非常省钱。

第五轮飙升至0.0665美元,不年夜对于劲。

第十轮到达0.13美元,是小我私家意想到了,烧的钱底子不是一点点增加,而是指数级爆炸。

像癌细胞同样,每一一轮破裂都于加快吞噬算力资源。

为何token耗损会跟着对于话次数增多而指数爆炸呢?

相识OpenClaw等智能体的事情道理,就能理解token耗损量指数增加,是由于“上下文的无序膨胀”。

跟着对于话轮次增加,汗青文件、对于话记载不停累积,智能体为了寻觅相干信息,往往只能采纳"宁肯错杀一千"的计谋,把所有文件都读一遍。

用户每一次输入后,Agent甚至可能需要从头计较完备的对于话记载及文件数据。这致使智能体成本指数级增加,正如shelvenzhou测试的那样,第10轮对于话的成本已经是第1轮的26倍。

智慧的你天然会想到,这么多耗损的token里有相称一部门是华侈失了。

《财经》统计,本年一季度,GitHub上有关“Token Waste”(token华侈)的问题,数目冲到了跨越4000多个,比起上个季度增加了快五倍。

全国苦token华侈久矣。

让人人都能用患上起智能体

想要用token少费钱,一个措施是多提供芯片,把芯片成本降下来。

然而国产AI芯片产能仍旧被洽商,3月尾华为昇腾办事器系列也涨价了,910C(A3)1TB内存版本单台年夜概上涨16万至32万元,2TB版本涨幅于32万至48万元之间。

还有有一个措施,就是优化智能体,让它不要再华侈那末多token了。

今朝有个成熟做法是“KV Cache”(键值缓存)技能。

这项技能道理也简朴,模子对于已经计较上下文的成果举行缓存,以避免下次挪用反复计较耗损token。

还有有一个措施,就是做好模子分工,token用于刀刃上。

繁杂计划用旗舰模子包管正确,简朴的高频履行交给轻量模子便可。

OpenAI的Codex进级已经经表现了这类分层逻辑:GPT-5.4卖力计划、协调与终极判定,而GPT-5.4 Mini子智能体则并行处置惩罚代码库检索、年夜文件审视等细粒度使命。

无论哪一种要领,都申明今朝的智能体仍旧处在起步阶段,还有很不可熟,就像一批天不怕地不怕的小马驹,虽然终极能跑到尽头,但历程中会处处乱跑耗损体力。

以是近来harness于AI圈子里火了。

Harness原意是马具,放于这里就是指约束智能体,让它更省力地跑到尽头,这触及到给模子挪用甚么东西、怎样做分层的上下文工程、怎样治理长影象、怎样设计事情流。

从这个意义上说,于智能体从"能跑"进化到"越跑越稳"的harness时代,能做的事情还有有许多。谁能用更少的token完成一样的使命,谁就能于AI财产的残暴洗牌中存活。

token经济的正向轮回不会主动形成,想要用户用患上起,还有是患上削减华侈,让各人都玩起来。

不然,2026年智能体普和年的狂欢,将于算力不足,挤出平凡用户的历程中落幕。

参考资料:

AI涨价潮:智谱海外版“直逼”Claude,阿里云取缔基础套餐,四年前的H100也卖光了 https://mp.weixin.qq.com/s/VJzaTh9rHAawssltU3FaFQ

阿里、腾讯、baidu团体调价,Token第 一股年内狂飙547%,算力涨价潮来了 https://mp.weixin.qq.com/s/s6LoLAD3WvhN1-QdNi_hDg

从“龙虾”到“爱马仕”,Agent越能干Token越花钱 https://mp.weixin.qq.com/s/40lUY9JWuxq6EryEkImK-Q

Elephant走红:AI最先为“Token华侈”算细账 https://mp.weixin.qq.com/s/7e0WXmZl2Ar25vd-RiNHbg

今天,50%的Token正于被华侈 https://mp.weixin.qq.com/s/r7LMwCArMtDfejJbrPJC5w

我国日均Token的挪用量三个月增加超40% 今朝已经超140万亿_媒体聚焦_数字中国设置装备摆设峰会 https://www.digitalchina.gov.cn/2026/xwzx/mtjj/202603/t20260325_5300141.htm

【本文由投资界互助伙伴微信公家号:特殊油条授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下载360浏览器