今年会·(jinnianhui)金字招牌-入口在手,Token我有,豆包千问卡位Agent「开机键」

2026-05-06 15:49:01

首页财产ai正文 进口于手,Token我有,豆包千问卡位Agent「开机键」 字节跳动暂停豆包AI眼镜项目,年夜模子公司做硬件是为于Token耗损链路前端建物理节点,千问与豆包路径差别,竞争本色是卡位Token耗损进口。 2026-04-22 09:37 ·微信公家号:新态度Pro伯克希 AI投资人解读· 字节跳动火山引擎豆包年夜模子日均挪用量超120万亿Token,半年增加4倍。千问选择以眼镜为AI硬件进口,上线“AI服务”能力豆包则经由过程“操作体系级互助”切入AI手机赛道。 · 行业竞争激烈,如Meta智能眼镜市场份额占比高端侧模子能力晋升使硬件对于云端依靠降低,数据获取路径需从头设计。 总结:两家公司基在自身上风结构AI硬件,提早卡位Agent时代Token耗损进口,但面对竞争与技能变化等危害,将来谁能堆集高频运用场景形成用户习气是要害。内容由AI天生,仅供参考

“东西于利用者手中时才成为东西。”海德格尔的这段话,今天用来理解AI硬件一样贴切。

问题于在,年夜模子这只“手”伸出来的时辰,用户毕竟愿意把它握于掌心里(手机),还有是架于鼻梁上(眼镜),亦或者是让它一直贴耳谛听(耳机)?

据《Z Finance》*报导,字节跳动内部决议暂停豆包AI眼镜项目。想要理解这场选择,需要先回覆一个更基础的问题:年夜模子公司为何要做硬件?

据《晚点LatePost》的报导,火山引擎豆包年夜模子日均挪用量已经跨越120万亿Token,半年增加4倍。国度数据局的数据显示,中国日均Token耗损量于一年半内增加约300倍。黄仁勋于GTC 2026的舞台上说,Token将是将来数字世界最焦点的年夜宗商品。

但Token耗损的暴涨,反而袒护了一个更底子的问题,即这些Token从哪里被触发,经由过程甚么界面进入用户的糊口?

已往两年,这个问题的谜底是手机屏幕及对于话框。OpenClaw的爆火将Agent从开发者东西推向公共用户,直接推高了对于“随时随地触发AI履行”这一能力的需求密度。当年夜模子的竞争从天生式问答转向履行使命,履行链路就需要一个更接近用户身体的物理锚点。

豆包选择的落点是操作体系,以“操作体系级互助”模式切入AI手机赛道,经由过程与手机厂商于体系层面互助,得到辨认屏幕UI元素、模仿人工操作的焦点权限;千问选择的是眼镜,千问AI眼镜上线首批“AI服务”能力后,撑持话费充值、扫码骑车、泊车缴费、语音点外卖。这些功效的配合特性是,AI最先于真实世界里把工作做完。

两条路径的素质,是两家公司对于统一个问题给出的差别工程谜底:毕竟改由谁来做Agent履行链路的物理接口。

0一、两种上风的两种延长

年夜模子公司做硬件,现实上是于回覆一个从Token经济学中衍生出来的问题。

已往两年的AI竞争,焦点疆场于模子能力及价格。价格战把Token单价从三年前的高点压低了约300倍。但单价的崩塌没有让AI支出变患上可猜测,缘故原由很简朴:Agent类运用让单次使命的Token耗损从平凡对于话的几十倍起跳。据腾讯科技报导,亚太区电商技能公司Branch8的6人团队,启用Claude Code*个月花了2400美元,颠末八严密集优化才委曲降到680美元。Token支出治理自己已经经酿成了一项需要专门技术的事情。

这个成本布局,于源头上改写了许多AI产物的竞争逻辑。谁把握了Agent的触发进口,谁就把握了Token耗损的源头。而触发进口的密度,取决在装备离用户有多近、启动磨擦力有多低。这是豆包及千问同时转向硬件的真实驱动力:于Token耗损链路的最前端成立一个物理节点。

千问AI眼镜的团队跟踪了一个指标——用户交互轮次,即AI帮忙用户完成事项的频率。夸克眼镜S1上线后,用户交互数对于比第三方手机AI助手运用晋升了约6倍。戴于脸上的AI之以是被挪用患上更频仍,缘故原由于在感知始终于线、启动磨擦力趋近在零。

对于在Agent而言,这类连续于场的交互密度,象征着更富厚的上下文堆集,也象征着更多履行使命的触发时机。

2026年4月,千问AI眼镜初次OTA进级后上线了“AI服务”能力,经由过程接入淘宝闪购、付出宝,撑持话费充值、扫码骑车、泊车缴费、语音点外卖。产物界说由此发生转移:AI从回覆问题,酿成了把工作办完。

豆包确定的路径一样深切,只是标的目的差别。去年12月,豆包AI手机助手以“操作体系级互助”模式进入AI手机赛道,经由过程与手机厂商于体系层面互助,得到辨认屏幕UI元素、模仿人工操作的焦点权限。

实测显示,“比价肯德基套餐并下单发送截图”这一触及三个运用、十二步手动操作的使命,豆包可于后台主动完成,仅付出环节需人工参与,全程耗时较人工操作缩短72%。

今朝,Agent于公共用户中真正形成利用习气还有需要一段时间。豆包及千问此刻的硬件投入,是于为一个还没有到来的需求峰值提早卡位。这是典型的平台逻辑:先占住感知节点,等Agent成熟以后,数据流及挪用量天然会从这个节点涌入。

但平台逻辑有一个条件,装备必需于需求到来以前就已经经于用户身上。这也注释了为何千问要于眼镜以外再结构指环及耳机,究竟单一形态笼罩不了全天候的感知需求,矩阵才能。

豆包与千问的硬件路径,都是从自身焦点上风出发延长的成果,只是各自上风所对于应的*形态差别。

豆包AI眼镜的项目暂停,内部给出的焦点判定也很合理,年夜框、拍摄、语音、翻译,主流范式已经被Ray-Ban Meta同一。2025年,Meta智能眼镜整年销量跨越700万副,全世界市场份额达85.2%。于这个格式下,“能不克不及做”早已经不是问题。

千问的选择,起点一样清楚。阿里的运用生态中,话费充值、外卖点单、泊车缴费,这些淘宝、付出宝的既有能力可以直接接入Agent履行链路,经由过程眼镜从头封装成AI原生交互形态。对于在没有这套生态底座的公司,眼镜只是一个戴于脸上的语音助手;对于阿里来讲,眼镜是买通已经有运用、成立新型触点的实际节点。

豆包深切手机操作体系,是于本身的流量分发能力地带成立Agent进口。千问押注可穿着装备矩阵,是于把阿里的运用生态从头封装成AI原生交互形态。

把时间线拉长来看,今天产物发患上多冷艳、销量跑患上多猛,实在都决议不了结局。两年后,当Agent像收集同样融进事情流,*的护城河只有一条:用户习气了从哪一个进口触发它。

0二、端侧推理怎样转变成本布局

硬件进口的竞争,终极会回到一个更基础的问题上:Token从哪里来,到哪里去,谁来付账。

Token的价格是透明的,但Token里装了几多“智力”,用户无从得悉。4月,AMD AI战略总监Stella Laurenzo基在6852个Claude Code会话的阐发显示,从本年2月下旬最先,Claude Opus 4.6的推理深度年夜幅降落,腾讯科技也报导,“每一次代码编纂前的文件浏览次数”从6.6骤降至2.0,降幅约70%。

这些转变没有于任何显著位置通知用户,年夜量开发者是于代码质量较着降落以后才最先思疑“模子是否是变笨了”。

更隐藏的是缓存掷中率对于现实成本的影响。一名开发者对于Claude Code一周数据的追踪显示,正常环境下91%的Token来自缓存掷中,缓存掷中价格只有尺度输入价格的十分之一。假如缓存全数掉效,Input成本会暴涨到本来的5.7倍。

这个成本布局,是端侧模子价值主意的焦点依据之一。端侧推理一次性部署后,边际成本趋近在零,没有缓存掷中率的不确定性,也没有云端峰值订价的颠簸。对于在频仍触发Agent使命的硬件装备,这个上风会随利用密度的增长而连续放年夜。

googleDeepMind 4月发布的Ge妹妹a 4,从头规定了端侧模子的能力界限。其E2B及E4B模子推理时激活的有用参数目别离仅为20亿及40亿,于LiteRT-LM框架下,可于3秒内处置惩罚超过两个自力技术的4000个输入Token;E2B与E4B原生撑持函数挪用,笼罩Agent事情流所需的焦点推理路径。上下文窗口达128K Token,于不足1.5GB的内存占用下可以完成运行。

这象征着一个可以挪用外部东西、履行多步调计划的端侧Agent,其硬件门坎已经降至现代中端手机的内存余量以内。

千问今朝采用的云端年夜模子加当地轻量智能体的混淆架构,是于当前端侧算力约束下的一个不错的解。据36氪报导,千问于2026年计划的硬件形态除了AI眼镜还有包括AI指环、AI耳机,三种形态笼罩视觉交互、无感佩带及音频交互三个差别维度,形玉成天候的感知矩阵。

这个矩阵的焦点价值于在眼镜捕捉*视角的举动数据流,这些数据反哺千问年夜模子迭代,模子能力晋升后又优化硬件体验,形成闭环。

但Ge妹妹a 4这种模子的呈现,正于缩短这个“当前”的有用期。当端侧模子可以于当地自力完成愈来愈多的Agent使命,云端兜底的须要性于高频轻量场景中会连续降落,Token的耗损路径也会随之转变。

这会对于当前AI硬件的主流云端模式,其一,端侧能力的晋升会降低硬件装备对于云真个依靠,让装备端AI从成本布局上更具竞争力;其二,当用户的Agent使命愈来愈多地于当地完成,依靠数据回流云端来驱动模子迭代的贸易闭环,也需要从头设计数据获取路径。

有几多增量留于云端、有几多转移至当地,将成为整个MaaS贸易模式需要提早应答的布局性问题。

0三、写于末了

当Token耗损从对于话层迁徙到履行层,Agent最先取代人操作运用,这些使命是于云端计费还有是于端侧当地完成?这个问题的谜底,会决议Token的耗损布局,进而影响MaaS营业的收入模子。

火山引擎超百亿元的MaaS营业收入方针已经跟着Seed 2.0、Seedance 2.0等模子发布、OpenClaw爆火上调被提高。阿里建立了ATH事业群,两家公司于云真个Token战役及于硬件真个进口争取,是统一场竞争的两个疆场。谁能于硬件侧成立充足高频的Agent利用习气,谁就于云端MaaS的下一轮增加中盘踞了需求真个自动权。

2026年的AI硬件竞争,外貌上看是眼镜及手机的形态之争,本色上是对于Agent时代Token耗损进口的提早卡位。这场竞争没有快速的结论,由于Agent于公共用户中的真实利用习气还有于形成,端侧模子的能力界限还有于被Ge妹妹a 4这种模子连续推进,云端Token的成本布局还有于被缓存掷中率、推理深度及订价计谋暗暗转变。

《新态度》认为,决议胜败的是谁拥有充足密度及充足高频的运用场景,能让Agent于真实利用中连续堆集上下文、优化履行能力,形成对于用户的理解深度。

这个变量,更多由生态底座决议。千问及豆包的硬件不合,是两个差别生态底座于统一个技能拐点上做出的差别押注,各自都于最擅长之处寻觅谜底。

【本文由投资界互助伙伴微信公家号:新态度Pro授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下载360浏览器