菜单
首页财产阐发评论ai正文 用不起Token的我,成为了AI时代的下沉市场人群 Token已经经作为“商品”孕育发生价值分层了,那利用它的人呢?也许将来,“下沉市场”人群的界说,也再也不仅限在可否消费患上起实体商品了。 2026-04-19 09:35 ·微信公家号:镜相事情室黄依婷 AI投资人解读· 文章指出,AI需求发作致Token耗损年夜增,而供应受限,价格上涨。以Claude为例,其主力模子排名全世界第一,却对于会员设Token限额,激发用户焦急。模子厂商也因算力成本高而发愁,如智谱CEO张鹏担忧将来算力不足影响行业成长。· 危害提醒:行业竞争激烈,模子及运用侧的涨价可能致使市场份额降落算力成本上涨,可能影响企业盈利能力。总结:AI行业成长迅速,但算力成本上涨及供应受限可能影响其成长。投资者需存眷行业竞争及企业盈利能力,审慎投资。内容由AI天生,仅供参考
2026年,人类于事情上最“豪侈”的消费是甚么?谜底其实不是买一部机能顶配的电脑,或者是置办几身面子的行头,而是可以或许不受限定、不计成当地利用这个世界上*进的AI东西。
这象征着你不消为了节制成本,挖空心思优化提醒词,恐怕弹出一句“今日免费额度已经用完”;也不消再三对于比,舍不患上累到心爱的Claude(由美国AI公司Anthropic开发的年夜语言模子),只能把不那末主要的事情交给更自制、更轻量的模子处置惩罚。
AI固然好用,但每一用一次都对于应着成本,Token(词元)耗损量贵到你有点用不起了。琐屑较量、不寒而栗,成为了如今AI“牛马”们最真正的状况。
这让人想到了二十年前,拨号上彀的时代。那时带宽紧缺且昂贵,开发者为了勤俭网站的带宽耗损,尽可能压缩图片、精简代码,险些不敢上传视频。像马铃薯网如许的视频范畴创业公司是少少数,视频所带来的带宽耗损成为网站运营的成本年夜头。
昨日重现。
于AI财产链条上,算力像水同样自上而下游动。从上游的GPU(图形处置惩罚器)及数据中央出发,经由云厂商、模子厂商,被封装成API(运用步伐编程接口)接口,终极流向开发者及平凡用户,酿成一次次详细的挪用、一个个可以计价的Token。它看似无形,却于每个环节都对于应着清楚的成本,GPU折旧、电力耗损、高带宽存储,终极城市汇总成账单。
此刻,这条水管正于变患上拥挤。一头是需求于发作,多模态、Agent(智能体)等繁杂推理场景让Token耗损量千倍增加,另外一头则是供应仍未解绑,GPU、HBM(高带宽存储器)、电力及数据中央设置装备摆设都存于物理极限,GPU使用率仍处在较低位置。智慧是有价钱的,虽然发作式增加致使Token单价更自制了,但挪用它需要花的钱却愈来愈多。
涨价逐级传导。上游GPU有价无市、算力紧缺,中游云厂商率先调解价格,亚马逊云、google云、baidu云、阿里云等,于已往一个季度接踵上调部门AI相干办事用度,模子厂商也竣事补助周期,腾讯、阿里等接连住手免费公测,提高API挪用价格,此中,腾讯混元年夜模子最高涨价463%。
模子及运用侧的涨价,让算力再也不是独属巨头竞争中的抽象观点,它以Token的情势,给每一个平凡人也上了一堂付费课。就像昔时的流量,以MB(手机上彀流量单元)为单元计价,号主一不留心就会欠费停机。
黄仁勋日条件出的“Token经济学”观点,认为推理已经成为AI最焦点的事情负载,Token则是新的年夜宗商品——尺度化、可计量、可生意业务。由此Token从模子练习的技能副产物,蜕变为驱动数字经济的焦点出产要素。
于黄仁勋看来,“Token”作为商品是有质量的好坏之分的。从免费层到*层,每一百万Token价格从0美元到150美元不等。低时延、高交互的Token(照实时对于话、智能驾驶)需要昂贵算力,订价高;高吞吐、离线处置惩罚的Token(如年夜范围离线推理、批量数据处置惩罚)对于时延不敏感,可以用自制算力出产,订价低。
Token已经经作为“商品”孕育发生价值分层了,那利用它的人呢?也许将来,“下沉市场”人群的界说,也再也不仅限在可否消费患上起实体商品了。
AI利用者,被焦急裹挟
“我莫非不是高贵的会员吗?”3月11日晚,苏玉看着电脑屏幕上跳出的弹窗,有点气愤。弹窗提醒她,本周Token利用量已经到达限额的90%,限额耗损完后将暂停相干模子的利用,直到下周限额更新。
苏玉是某高校于读博士研究生,近来于预备卒业年夜论文。已往三年,google旗下的Gemini、OpenAI旗下的ChatGPT,一直是她的*拍档,她也是这两个“AI长工“的忠厚定阅用户。本年2月中旬,Anthropic旗下的Claude也插手了她的步队,并很快成为她最信托的一个。
“Claude太好用了,东西属性太强了。”苏玉说。她让几款AI运用同时为她梳理、设计研究思绪模子,ChatGPT给出的谜底逻辑不敷周密,Gemini太甚夸诞谄媚,只有Claude,像一名客不雅专业的高级参谋,逐字浏览过客户需求后,才输出了一份真正可以使用、有开导的方案。
免费利用半个多月后,苏玉破费约莫180元人平易近币开通了Claude的月度会员。及Gemini、ChatGPT比拟,Claude非凡之处于在它对于会员也设置了逐日及每一周Token耗损的限额。这实在能理解,按照全世界知名的年夜模子盲测榜单LMArena,截至3月20日,Claude的主力模子Claude-Opus-4-6-thinking排名全世界*。
但苏玉从未感触感染到云云直接的Token限定。*次触发Claude限额机制时是周三,“扎根理论”相识到一半就不克不及再挪用了,那一刻她很有一种“学术阻滞”的无力感。习气了Claude的辅助,她很难再回到最初做科研的状况。她测验考试“手搓”,翻阅最原始的理论册本,但效率极低,有些颠末翻译的资料她也不彻底信赖,“末了我还有是要等Claude恢复利用后复核一遍。”四天时间,她等患上很煎熬。
Claude限用让苏玉异样焦急。于一个周二,苏玉发来一张Claude后台截图,上面显示她本周的限额已经经利用了45%。“这周才已往不到两天!我已经经用患上很节省了,一天只会商一个论文选题,它就到限额了!”苏玉情绪有点瓦解,谁说AI不克不及替换人类?这个AI已经经快比她的导师还有难弄了。

●苏玉的Claude后台。图源:受访者
她已经经养成为了提一个问题就去看一眼后台的习气,恐怕没米下锅。想起之前居然还有及Claude教员唠闲嗑,让它帮本身做PPT,她心里直骂本身华侈。
这类对于“好用的模子”的审慎利用,正逐渐变患上遍及。一名AI影视行业创业者告诉我,他地点团队于利用字节跳动的AI视频模子“即梦”时,会同步接入其他多家模子厂商的API,“效果好的模子确凿更贵,咱们只能于差别模子之间切换,去均衡成本。”
不久前,即梦下调会员积分额度,他一方面感觉很正常,“C端原来就于补助,此刻只是收回一部门”。但另外一方面又为本身的处境担忧,感喟“这下更用不起了”,AI成本上涨,有时辰会直接卡住小创业者的生命线。
终端用户为Token焦急,模子厂商也于为算力成本焦急。
谈和Token挪用量暴增的缘故原由,中国工程院院士王坚此前借用电力的成长做了类比,初期人工智能运用就像是“点电灯”,耗损电量有限。而以OpenClaw(智能体)为代表的新一代运用,则像是开启了“空调”,需要泯灭的电力也愈来愈多。
不外,王刚强调,这类增加不仅象征着运用普和,更象征着单体Token成本的降落。“假如电价不降,老黎民是用不起空调的。”
但比拟初期一问一答的简朴挪用,如今愈来愈多使命经由过程Agent完成。模子需要自行拆解问题、挪用东西、写代码、调试、再批改,一次看似简朴的哀求,暗地里往往对于应的是多轮推理及屡次API挪用,Token耗损呈指数级放年夜,虽然单价降低了,但整体所需要的算力成本更昂扬了。
“模子变动年夜了,推理成本也响应提高了,咱们也但愿把它回归到正常的贸易价值上。持久靠低价竞争,对于整个行业成长其实不利,这也是咱们的一个考量。”智谱CEO张鹏说。近来两个月,智谱三次上调GLM(智谱研发的年夜语言模子)系列模子价格,部门模子价格已经迫近国际头部模子订价程度。
张鹏的另外一个担忧是,“将来12个月面对的*问题可能就是算力。所有的技能,包括智能体框架,让许多人的创造力与效率晋升了10倍。但条件前提是,各人可以或许用患上起来,不克不及由于算力不敷,致使一个问题让Agent思索半天也不给我谜底。”
流动的算力,累加的成本
根据Claude的计较方式,100 Tokens约莫相称在75个英文单词或者50个汉字,而Token输出的价格是输入价格的五倍——这是一个最简朴的换算方式。换言之,AI的每个回覆都要颠末寻思熟虑,后台思索、查询、天生,以致模子幻觉带来的过错耗损的Token,城市被计较于内,终极酿成真金白银的账单。
智能纪元AGI开创人林志佳算过一笔账。他养了四个“龙虾”,有当地部署的,也有云端部署的。以云端部署为例,他按月采办了Coding Plan(AI编码定阅办事),约莫30-40元人平易近币,于3月还有剩9天的时辰,他的Token耗损量还有不到套餐额度的10%——作为媒体人,他对于Token的需求实在其实不年夜。
但根据Token来计费又不太划算。“假如我只是天天早上九点让它给我发条新闻,耗损的Tokens价格年夜概0.9元人平易近币,30天年夜概二十多块钱,已经经跟买Coding Plan的钱差未几了。有时辰还有有损耗、还有有模子更新,光更新就可能要耗损三四块钱的Tokens。”
于差别计费方式之间衡量,险些成为了高频利用者的一样平常,而采办Token破费的一分一厘,终极都指向统一件事——算力,以和暗地里对于应的GPU折旧成本及数据中央的耗电。
GPU成为了一切的出发点,高端芯片的供应决议了整个体系的上限。“除了了给部门客户预留的备用机,其他基本都卖完了,一卡不剩。”优刻患上架构技能中央副总司理刘华说。
GPU之下,还有要搭建起数据中央、收集及存储体系——高速互联、低延迟传输,这些都不是“即插即用”的尺度件。刘华提到,仅收集及存储部门,成本就可能占到总体算力成本的20%摆布。
再下一层,是模子厂商及API办事商。他们把年夜模子部署于这些基础举措措施之上,封装成尺度化接口,供开发者挪用。近两年,这几层脚色最先呈现堆叠,云厂商既卖算力也提供模子API,逐渐成为毗连GPU、模子及开发者的中枢。
算力就如许一层一层向下渗入,最新的变化是于财产的需求端。“之前AI年夜部门是To B于付费,此刻To C端付费也愈来愈普和了。”林志佳说。模子被封装成API,进口被简化,利用门坎降低,小我私家开发者甚至平凡用户,均可以直接挪用底层算力。“此刻基本上刷一刷社交平台,各人就知道怎么用了。”
算力甚至呈现零售化趋向。2024年先后,一些云厂商最先推出GPU“日卡”、轻量级云主机,甚至“一键部署”的体验产物。好比优刻患上面向“养虾户”推出的6.9元体验套餐,素质上更像一张门票,把繁杂的情况配置及算力调理打包好,让用户用极低成本试一次。“许多人实在是来‘排雷’或者者尝鲜的,”刘华说,“各人都有点焦急,怕掉队。”
但门坎降低,其实不象征着成本降落。于刘华看来,“用互联网成长阶段类比,此刻的算力成本毫无疑难还有是于一个成长早期、很贵的阶段。”正由于云云,开发者才会一个钱打二十四个结,平台也不敢容易铺开挪用范围。
即即是头部厂商也于做弃取。OpenAI此前关停视频天生项目Sora,被不少业内子士解读为算力与投入产出之间的衡量,于资源有限的环境下,优先集中到更焦点的模子能力及营业上。阿里巴巴、腾讯、字节跳动等互联网年夜厂,近期对于AI营业做的一系列调解,焦点也是一种算力资源聚焦。
各人都正于意想到一件事:将来拼的不是算力范围,而是算力使用率。算力紧缺带来的连锁效应,是AI时代一场漫长的梅雨,每个身处时代的人城市免不了湿润。
算力流动到结尾发生了甚么
苏玉正于测验考试分配及调理算力资源。
她把差别模子分了层级:ChatGPT用来写公函、收拾简报,Gemini卖力绘图、处置惩罚语言细节,Claude则专门用于最焦点的环节,好比研究框架、思绪设计、长文天职析。如许能包管她的效率及钱包都效果*化。
好比,她近来于处置惩罚一批访谈质料,会先让Claude给出阐发框架,再把这个框架“丢”给Gemini去做初始编码。“我更信赖Claude给的引导性的工具,但细节性的事情可以交给自制一点的模子。”假如Claude不限额,她甚至会停用Gemini。
固然,这其实不是于给Claude打告白,只是苏玉认为本身的需求更合用这一款运用。好用的模子变患上稀缺,而稀缺的资源只会被用于最要害之处。
为了进一步节省,许多用户都及苏玉同样,最先于细节上抠成本。
社交平台上,一度风行升引文言文与AI对于话,由于更短的字数象征着更少的Token。也有人认为,跟风对于AI说“你好”“谢谢”,是否也是一种没必要要的资源华侈?究竟,AI其实不需要情绪价值。
实在许多华侈其实不于用户可控规模内,有时是模子接入及运行方式的问题。
不久前,MiMo年夜模子团队卖力人罗福莉提到,“我没措施严酷计较第三方harness(驾御)接入酿成的丧失,但我近间隔看过OpenClaw的上下文治理,很糟糕糕。于单次用户查询里,它会触发多轮低价值东西挪用,每一轮作为自力API哀求发出,每一个哀求携带的上下文窗口往往跨越 100K Tokens。现实哀求次数是Claude Code原生框架的数倍。折算成API订价,真实成本年夜概是定阅价格的数十倍。”
回到利用问题上,用户自动节省Token,平台也不敢彻底铺开用户范围,这类基在节省成本的“束手束脚”,好比OpenAI正于面对一种抵牾——其于2025年上半年创造了43亿美元的收入,同期,该公司净吃亏高达135亿美元,这象征着OpenAI每一赚一美元,就会丧失三美元。吃亏的年夜头恰是对于算力的投入。
于当下,算力已经经再也不只是有无的问题,而是能不克不及连续用、能用到甚么水平。当AI充足好用,人会缭绕它从头构造事情方式;当Token变患上昂贵而有限,这类新的构造方式自己也会被迫紧缩。
假如将来算力没法真正像电力同样普和,那末AI一定会引起分解,人与人之间的认知差距会进一步拉年夜。好比苏玉,她其实不筹算把本身的AI利用要领彻底分享给身旁人,怎样及Claude教员交互、喂甚么样的语料,这是她的小奥秘,短时间内也是她的竞争力。
假如同事请她保举好用的模子,她会强烈保举Gemini及ChatGPT,“固然,DeepSeek也是个好选择”。苏玉淘气地眨了眨眼。
于“一人公司(OPC)”“超等个别”逐渐风行确当下,如许的“小心计心情”其实不稀有。当AI的好用水平对于应成一个个可以计价的Token,真正拉开差距的,实在是怎样利用它的人。
【本文由投资界互助伙伴微信公家号:镜相事情室授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-今年会·(jinnianhui)金字招牌