今年会·(jinnianhui)金字招牌-实测DeepSeekV4:天下武功,唯快不破

2026-04-27 10:06:28

首页财产ai正文 实测DeepSeekV4:全国武功,唯快不破 几小时前DeepSeek-V4预览版上线并开源,分Pro与Flash版,撑持百万token超长上下文,运行效率高但缺原生多模态,此时DeepSeek正追求超200亿美元融资。 2026-04-24 16:20 ·微信公家号:字母榜李炤锋 AI投资人解读· DeepSeek-V4预览版上线并开源,Pro与Flash版本撑持百万token超长上下文,处置惩罚超长质料时运行更快、成本更低。此前V3系列已经揭示性价比与利用惯性。 · 今朝V4缺少原生多模态功效,会限定其于部门场景运用。DeepSeek以超200亿美元估值追求融资,V4需鞭策更多贸易化落地,成立用户生态。 总结:V4晋升了开源模子使命底座高度,有投资潜力,但要存眷多模态功效缺掉与贸易化挑战,建议连续跟踪其产物落地进展与市场体现。内容由AI天生,仅供参考

“跳票”许久的DeepSeek-V4,终究来了。

几个小时前,DeepSeek-V4预览版上线并开源。巧的是,险些统一天,OpenAI也推出了GPT-5.5。一个继承讲闭源出产力体系,一个继承讲开源、长上下文及低成本推理。中 美AI财产中流量*的两家基模公司,于统一天相遇。

DeepSeek-V4分为Pro与Flash两个版本,均撑持百万(1M)token超长上下文,总参数范围别离到达1.6T(激活49B)与284B(激活13B)。。

不外,比拟起“1.6T参数”或者者 “百万token上下文”这两个夸张数字,技能文档里的两个十位数更值患上存眷:27%及10%。

按照HuggingFace上V4系列的先容,于100万token上下文场景下,V4-Pro的单token推理FLOPs只有V3.2的27%,KVcache只有V3.2的10%。

翻译成人话就是,于处置惩罚超长质料的场景下,V4不只是“能装患上下”,并且跑患上更快、还有更自制。

这或许是是V4此次更新中最值患上存眷之处。

已往半年,长上下文已经经成为了头部模子的配合卖点。Claude、Qwen、Kimi、GLM都于往长文本、代码堆栈及Agent使命上走,DeepSeek此次把主线放于了长文本场景里最贵的部门:计较及缓存。

略显遗憾的是,V4今朝并无原生多模态功效,这会限定它于一些场景的阐扬。

以是,V4的要害词,其实不是行业内期盼已经久的“新物种”,而是“效率工程”的再进一步。

回首过往也确凿云云,DeepSeek这家公司,一直都不是那种“性感”产物的线路,于Token挪用暴涨的海洋中,V4要撑起的,是这家超等独角兽200亿美元估值的野望。

0一、更快,可是没有原生多模态

身处2026年的今天,年夜模子撑持长上下文已经经不稀奇。可是另外一个问题也随之而来:模子处置惩罚超长文本、超长链路的环境下,还有能不克不及高效地继承事情。

一个模子假如只看几段文字,回覆问题其实不难;但若让它看完备代码堆栈、几十份合同、几个月集会记载,再连续天生、检索、改代码、挪用东西,这个工作的难度会指数级增长。

V4-Pro的单token推理FLOPs只有V3.2的27%,KVcache只有V3.2的10%,正好比照着这个问题的谜底。

前者指向每一天生一个token所需的计较量,后者指向KVcache占用。KVcache可以理解成模子处置惩罚长文本时需要随身携带的“事情影象”。

文本越长,这份事情影象越重;假如每一一步都违着完备包袱走,模子就很难轻盈起来。

以是,全国武功,唯快不破。

这里的快,不是谈天窗口里早几秒回覆,而是长文本使命中的运行效率。吃下1M文本以后以后,模子还有能不克不及跑患上动、跑患上起,能不克不及支撑高频挪用。

这一点于今天上线的GPT5.5中也有所表现,许多ChatGPT用户惊呼,GPT5.5-Thinking的相应速率,快了一不是一星半点。

联合眼下爆火的Agent事情流,这项指标晋升就更为要害。包括OpenClaw于内的体系级Agent东西,于运行使命时,往往需要读文件、查资料、挪用东西、修改代码、生存中间状况,再按照反馈继承下一步。

使命越真实,上下文越长,计较及缓存承担越轻易滚雪球。许多Agent产物今天看起来像将来,一算成本就像灾害。V4假如真能把长上下文下的运行效率压下来,影响的是整个Agent东西链的成本布局。

字母AI也简朴上手体验了一下DeepSeek V4Pro,咱们搭建了一个简略单纯的离线情况,跑了两个切近一样平常用户场景的测试。

起首,咱们给了V4 Pro一组关在MCP、布局化输出、东西挪用、端侧模子及推理办事的质料,让它写一份技能阐发。这个使命重要是磨练,模子能不克不及把一堆观点及名词,收拾成一张清晰的工程图。

V4Pro的体现比力像一个成熟技能编纂。它没有把质料逐条复述,而是捉住了一条主线:Agent的竞争不只是模子参数,而是模子怎样不变接入外部体系。换句话说,模子不克不及只会“想”,还有要能读文件、查数据库、挪用东西、把成果写回营业体系。

它把布局化输出理解成“让模子说出呆板能直接读懂的话”,把MCP理解成“让模子运用更易接外部东西的尺度接口”,这就比纯真注释术语更靠近真实产物。

第二个测试,是让它用Python写一个当地号令行东西,用来治理天天网络的AI行业新闻线索。这个Prompt写的很简朴,只有几个基础的限定前提:不要联网,不挪用API;能新增、查看、筛选、去重、主动打新闻价值分,并导出markdown日报。

V4 Pro直接给出了一个能跑的小东西。

用户可以录入公司、标题、类型、来历、链接、时间、正文及核验状况,步伐会主动计较新闻价值分,再把线索分成“可直接援用”“需要继承核实”“暂不采用”。导出的markdown也会按层级分组,保留公司、标题、类型、分数、来历等维度。

这个测试能申明一个问题:V4 Pro可以把一个相对于繁杂的用意拆成布局、法则及可履行代码,这及DeepSeek已往的用户心智是契合的。

于OpenRouter这种开发者渠道上,DeepSeekV3系已经经证实过本身的性价比及利用惯性。

OpenRouter数据显示,DeepSeekV3系列于2025年token消费跨越7.27万亿,排名第五,仅次在ClaudeSonnet四、Gemini2.0Flash等模子。而直到今天,DeepSeekV3.2的挪用量,依旧于OpenRouter榜单中压倒一切。

这申明用户承认的从来不只是benchmark,而是一个模子于真实事情流里是否不变、自制、高效。

这一点也能够放到Claude身上看。

于各年夜模子能力榜单上,ClaudeOpus4.6及GPT-5.4系列的对于比中,结论其实不老是Claude周全*,甚至于一些常识、推理、速率指标上,GPT-5.4要体现的更好。

但这其实不故障Claude于已往一段时间里继承收割开发者及企业市场。Anthropic 本年 2 月披露,按其时收入节拍折算,公司年收入范围已经到达 140 亿美元;已往三年里,其收入每一年都实现 10 倍以上增加。

以是,想要客不雅对待一个模子的能力,还有是患上放到真实事情流看现实工程体现。

固然,V4也不是没有短板。*的遗憾,是它今朝缺少“原生多模态”的加持。早于发布前,社区对于V4的期待就不只是文本模子。一些媒体此前也曾经报导称,DeepSeekV4规划是一个能处置惩罚图片、视频及文本天生的多模态模子。

缺乏了多模态能力,确凿会带来一个实际问题,一旦触及视觉理解、图表解析、、PPT/网页/软件界面处置惩罚这些场景里,就到了模子的能力界限外。

今天的出产力使命已经经再也不只是“读一段文字”。许多用户真正要处置惩罚的是图片、表格、截图、PDF、网页、视频集会及繁杂软件界面。没有原生多模态,V4仍旧可所以强盛的长使命底座,但还有不是完备的事情进口。

固然,也能够从另外一个角度理解,站于融资及IPO的十字路口,V4起首给母公司解决的是地基问题,而不是建好整栋楼的问题。

0二、走于融资路口的DeepSeek

V4发布的另外一个配景,是DeepSeek融资动静忽然密集起来。

显然,作为中国AI行业的罕见物种, DeepSeek一直不太缺钱。

已往,DeepSeek最有辨识度的标签之一,就是它不像典型AI独角兽那样靠融资叙事往前推。它暗地里有量化资金公司幻方的资金撑持,又有梁文锋如许的旗号性人物,持久以来于业内连结着神秘且专注的形象。

但于近来一段时间,环境最先发生变化。最新报导显示,DeepSeek正于以跨越200亿美元估值追求融资,阿里、腾讯等公司据称正于洽谈投资。详细的数字仍于构和中,但标的目的已经经充足清晰:DeepSeek已经经走到了迎接本钱市场的节点。

而V4,就是这个节点上的一个主要抓手。V4专注在讲效率的逻辑暗地里,现实上是捉住了当前的开发者群体最体贴的部门,可猜测的挪用需求可能被进一步放年夜,进而鞭策更多的贸易化落地。

这也是DeepSeek接下来最难的一关。200亿美元估值要证实的,不只是模子强,而是模子能不克不及转成不变的贸易体系。。

这一点上,竞争敌手们已经经于步履起来。Qwen、GLM、Kimi都于向Agentic Coding、东西挪用及长使命履行挨近,Claude也已经经把企业常识事情及代码事情流做成为了最主要的贸易抓手。

显然,依托V4的能力,Deepseek还有需要更多产物层面的落地。

Agent不是底座模子本身就能跑通,它还有需要阅读器、文件体系、权限体系、企业软件接口、插件生态及产物体验。V4就算解决了地基问题,怎样成立起一套出产力场景的用户生态,是粱文锋及团队接下来要思索的问题。

以是,V4最正确的定位不是,其实不是人们想象中的模子新物种,而是把“开源模子使命底座”晋升到了一个新的高度。

已往,DeepSeek已经经证实了,中国公司可以用更低成本做出强模子。V4要证实的是,于百万上下文、Agent、国产算力及贸易化同时到来的阶段,这套低成本线路还有能不克不及继承建立。

眼下,V4已经经把效率牌打出来了。接下来,DeepSeek要回覆的是,这张牌能不克不及撑起一家200亿美元公司的贸易体量。

【本文由投资界互助伙伴微信公家号:字母榜授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下载360浏览器