菜单
首页财产芯片半导体正文 AI芯片,新混战 2026年春,Anthropic摸索自立设计芯片,AI推理硬件争取战进入新阶段。云巨头、英特尔等纷纷结构,异构组合成主流,混战正酣。 2026-04-15 13:18 ·微信公家号:半导体行业不雅察邵逸琦 AI投资人解读· Anthropic年度营收超300亿美元且用户激增,正摸索自研芯片,凸显AI推理硬件竞争激烈。googleTPU、亚马逊Trainium等已经成熟,CoreWeave作为算力租赁商突起。 · 行业竞争激烈,技能更新快,各公司面对芯片研发高投入、长周期和资金压力等危害。 总结:AI推理市场竞争激烈,各企业纷纷结构。虽有成长机缘,但面对技能、资金等危害。投资时需综合评估各企业技能实力、市场计谋和财政状态,紧密亲密存眷行业动态与竞争格式变化。内容由AI天生,仅供参考
2026年春,AI行业又传出一则重磅动静:据路透社报导,Anthropic正于摸索自立设计芯片的可能性。这家年度化营收已经冲破300亿美元、旗下Claude模子用户激增的AI试验室,正当真思量从算力的消费者,蜕变为算力的界说者。
动静人士坦承,相干规划仍处在初期阶段,公司还没有确定详细方案,也未组建专门团队。Anthropic终极仍可能选择只采购芯片,而非自行设计。但即便只是可能性,也足以申明一些问题。
今朝,Anthropic同时利用google母公司Alphabet设计的TPU张量处置惩罚单位,以和亚马逊的Trainium芯片来开发并运行Claude。就于本周,该公司还有与google和博通签订了一项持久和谈,后者恰是googleTPU的焦点设计撑持方。一边签下百亿级的外部采购和谈,一边暗暗探路自研,这类摆布两手并举的姿态,像极了几年前的Meta及微软,而它们于今天都已经拥有了本身的专属芯片。
设计一款*AI芯片,业内估算约需五亿美元,但于价格以外更值患上存眷的,是Anthropic此举暗地里的行业旌旗灯号。当一家纯模子公司最先当真思索自研硅片,这场关在AI推理的硬件争取战,现实上已经进入了新的烈度。
推理,成为新的主疆场
这两年,AI行业发生了一次巨变,年夜量算力需求从练习侧迅速转向推理侧。
练习阶段,动辄泯灭数周以致数月,需要年夜范围GPU集群并行运算,英伟达于这一侧的统治职位地方已经近乎无可撼动。但推理差别。推理是模子每一一次相应用户哀求时及时发生的计较,它寻求的是低延迟、高吞吐、低能耗,而这些方针,与GPU所擅长的范畴其实不彻底吻合。
按照巴克莱的猜测,到2026年,推理计较需求将占AI总算力需求的70%以上,是练习需求的4.5倍,可以说,将来AI芯片市场的真正决斗就于推理。
英伟达于练习端堆集了十年的护城河,若这条护城河没法延长到推理端,那末整个行业格式就面对重写。正因云云,英伟达于去年年末正式脱手,公布与AI推理芯片草创公司Groq告竣非*许可和谈。Groq开创人兼CEO乔纳森·罗斯、总裁桑尼·马德拉和多名焦点工程师,随即插手英伟达。外媒援引知恋人士的说法,这笔生意业务的对于价约为200亿美元。
英伟达官方说话审慎,夸大只是技能授权加人材引入,而非传统收购。但这类非典型收购的弄法,于硅谷已经经相称遍及,它既能规避繁琐的反垄断审查,又能本色性地将方针技能及焦点团队收入囊中。
Groq的故事原来相称出色。开创人罗斯曾经是googleTPU项目的焦点成员,深知GPU架构于推理场景下的自然局限:数千个并行计较单位、极其繁杂的内存调理逻辑,这些特征于练习时是上风,于推理时反而造成不成猜测的延迟抖动。
也由于云云,Groq选择了一条大相径庭的路:完全取缔硬件层面的调理器,改由编译器于代码阶段就确定每一一比特数据的流转路径,让芯片像一条切确到纳秒的主动化流水线运转。这类架构被定名为LPU,即语言处置惩罚单位,于主流年夜模子的推理测试中,其单词天生速率可达英伟达GPU的十倍以上,而每一token的能耗仅为后者的十分之一。
依附这类*机能,Groq吸引了跨越150万开发者用户,并前后得到思科、三星、贝莱德等*机构的多轮投资,估值一度达69亿美元。然而成也萧何,败也萧何。恰是Groq过在刺眼的推理机能,让它成了黄仁勋眼中最需要被锁定的方针。
外貌上,英伟达收购Groq是于补全推理侧的技能邦畿,而更深切看,这是一次防备性整合,经由过程将最强外部挑战者之一收编进本身的生态,英伟达拿走了那些没有自研芯片能力的二线云厂商及AI软件公司手中的议价筹马。掉去了Groq作为替换选项,那些不肯被英伟达征税的企业,如今面对的选项蓦地收窄。
巨头各自磨刀
然而釜底抽薪的困局,未必会连续过久。
事实上,早于Groq突起以前,各年夜云巨头就已经经于自力经营本身的算力前途。google有TPU,亚马逊有Trainium,微软有Maia,这三条自研线路,如今都已经走到了可以向外兜销的成熟阶段。
google的第七代TPU,代号Ironwood,2025年末正式发布并上市。与前代比拟,其单芯片机能晋升4倍以上,单集群最高可互联9216颗芯片。google对于这一代产物的定位绝不掩饰:推理时代最省钱的贸易引擎。从2015年因内部算力瓶颈被迫自研,到2025年将TPU开放部署到客户自有数据中央,google用十年时间,把一个应急项目打磨成为了战略兵器。Anthropic公布将来Claude系列的练习与部署将利用多达一百万颗TPU,更让Ironwood的贸易价值获得了市场层面的权势巨子违书。
亚马逊走的是另外一条路。AWS持久高度依靠旗下Annapurna Labs自研的芯片,Trainium系列年夜致对于标英伟达GPU,但偏重点于在降低云基础举措措施成本、削减对于外部供给商的依靠。此番AWS与Cerebras签订多年互助和谈,规划将Cerebras的晶圆级引擎WSE芯片引入数据中央,与自研Trainium芯片并行部署,恰是这类自研为主、外采为辅逻辑的详细表现。
AWS的方针很是明确,用Trainium承接低速、低价的推理需求,用Cerebras芯片锁定那些对于延迟极端敏感、愿意为速率付溢价的高端客户。
对于在推理芯片而言,它不像练习芯片那样寻求短时间的速率,其更注重持久的能耗效益。一块英伟达GPU功耗约700瓦,而划一算力的专用推理芯片功耗可节制于200瓦之内,对于在需要数十万片推理芯片支撑的超年夜范围运用,这类差距每一年能带来数亿美元的成本节省。这也是google、亚马逊、Meta等云巨头争相押注ASIC专用芯片的焦点缘故原由之一。
据最新消费吐露,Meta及博灵通成为了1Gw的练习及推理芯片互助和谈,这必将会给本就“杂乱”的推理芯片市场,带来新的催化剂。
异构时代,新同盟突起
假如说云巨头的自研线路是一种有足够资源保障的持久赌注,那末英特尔与SambaNova的联手,则代表了另外一种更具实际感的突围路径。
2026年,SambaNova公布与英特尔推出异构硬件推理方案,采用GPU卖力预填充、英特尔至强6处置惩罚器作为主控与履行CPU、SambaNova RDU卖力解码的三层架构,专为智能体AI事情负载设计。这套方案将在2026年下半年面向企业、云办事商和主权AI项目开放。
SambaNova指出,纯GPU系统擅长并行化的预填充环节,但于出产情况的推理使命中,CPU的东西调理与专用推理加快器的解码效率,才是决议总体速率与成本的要害变量。
而其测试数据显示,英特尔至强6处置惩罚器的LLVM编译速率较基在Arm架构的办事器CPU晋升超50%,向量数据库机能最高快70%,这两个指标,刚好切中代码智能体事情流的焦点机能瓶颈。
英特尔于这场所作中的脚色耐人寻味。曾经经的PC霸主,于GPU时代险些被边沿化出AI芯片主疆场,如今借助至强6的CPU节制调理上风,正于异构推理方案中从头找回存于感。数据中央软件生态以x86架构为基础,也让英特尔从头回到了AI舞台中央。
年夜芯片,突入视野
Cerebras是另外一个值患上零丁书写的名字。
这家专注晶圆级AI芯片的草创公司,曾经于2024年提交IPO申请,随即撤回,本钱市场对于其远景一度疑虑重重。但随后,OpenAI与Cerebras签订了价值超百亿美元的互助和谈,为ChatGPT提供算力,这一动静让Cerebras重回公家视线,也让那些曾经经不雅望的机构从头审阅其技能价值。2026年2月,Cerebras完成10亿美元新一轮融资,总融资额达26亿美元,投后估值约230亿美元。
Cerebras的焦点技能是晶圆级引擎WSE,将整块晶圆作为一颗芯片利用,冲破了传统芯片的物理切割限定,于特定推理使命中的延迟体现极其精彩。据Cerebras声称,其芯片于推理解码环节的速率,最高可达英伟达GPU的25倍。
此番AWS公布与Cerebras签订多年互助和谈,将WSE芯片引入数据中央用在AI推理,标记着这家草创公司完成为了一次要害的身份跃迁,从融资故事,酿成了全世界*云平台的供给商。
AWS选择Cerebras,其暗地里逻辑与OpenAI的选择一脉相承:对于在编程辅助、智能体使命这种对于相应速率极端敏感的场景,每一一毫秒的延迟缩减都直接对于运用户体验及贸易价值,而这刚好是GPU的软肋地点。
对于在Cerebras而言,愈来愈多的人用AI解决愈来愈难的问题,对于速率的需求只会增不会减。若速率自己就是产物价值地点,那末为速率付溢价就是理所固然的贸易举动。这套逻辑,正于愈来愈多的企业端被接管。
CoreWeave,
算力市场的新引力中央
算力争取战的反面,是基础举措措施供应侧的重构。而于这一端,CoreWeave的脚色愈发不成轻忽。
2025年,Meta率先与CoreWeave签订供给和谈,商定于2031年前采购142亿美元的AI算力;近日提交SEC的文件显示,Meta已经追加和谈,将于2032年前分外采购210亿美元的算力。这笔新和谈的插手,将CoreWeave的定单贮备推至878亿美元,此中Meta一家便占去约40%。
CoreWeave的突起,是GPU算力由稀缺商品向基础举措措施蜕变这一历程的缩影。作为纯粹的算力租赁商,它提供的并不是模子能力,而是让模子跑患上起来的底层支撑。于三年夜云巨头以外,AI企业需要一个不绑定平台生态的算力选项,而CoreWeave刚好弥补了这个空白。
2025年整年,CoreWeave实现发卖额51.3亿美元,较上年增加约1.7倍。其数据中央范围已经扩至43座,于用电力容量达850兆瓦。公司配备的约60万张GPU,以英伟达H100、H200为骨干,Blackwell系列占比连续晋升。签约总电力容量则已经达3500兆瓦,这个数字,是其当前于用容量的四倍有余。
然而CoreWeave的扩张逻辑,也恰是其面对的*布局压力地点。为笼罩数据中央扩建成本,公司近日公布定向刊行共计47.5亿美元债券。于手现金不足40亿美元的环境下,要于2026年完成300亿至350亿美元的本钱支出,象征着需要连续依赖外部融资维持高速扩张。CoreWeave的投资方们,显然下注的是算力需求仍将持久高增加这一焦点判定。
混战,仍于继承
Anthropic最先自研芯片,英伟达200亿美元收购Groq,google十年磨一剑将TPU打造成标杆产物,亚马逊将Cerebras引入自派别据中央构建差异化推理组合,英特尔联手SambaNova于异构推理市场争取一席之地等等,这些看似分离的事务,实在都指向了推理这一新疆场。
越多越多人意想到,AI的重心,正于从怎样练习出更好的模子转向怎样以更低的成本、更快的速率推理更多的哀求。这个改变,使患上以前以GPU为焦点的算力系统,最先举行一场声势赫赫的改变。
这一轮竞争,与早年GPU对于CPU的替换其实不不异。那是一场新产物对于旧产物的单向碾压。而今天的推理芯片之争,更像是一个繁杂生态内部的分工重组,没有任何一种架构能独有所有场景,异构组合正于成为主流。GPU处置惩罚高度并行的预填充,专用推理芯片负担解码,CPU卖力调理协调,云端与边沿端各有偏重,每一个环节都有多个玩家竞逐。
这也象征着,胜败远未分晓。
对于Anthropic而言,摸索自研芯片是一种对于算力自立权的自动寻求,也是一张避免被上游供给商裹挟的保险单。但芯片研发的长周期与高投入,象征着这条路走起来其实不轻松。对于英伟达而言,CUDA生态护城河依然深挚,但推理端愈来愈较着的机能-成本缺口,正于成为所有潜于挑战者配合对准的冲破口。对于近似Groq的其他技能竞争者而言,技能*其实不一定转化为贸易胜利,被收购的可能性也于不停增年夜。
阵线已经经拉开,介入者的名单还有于增长。这场AI推理的算力混战,才方才走进它最强烈热闹的章节。
【本文由投资界互助伙伴微信公家号:半导体行业不雅察授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-今年会·(jinnianhui)金字招牌