今年会·(jinnianhui)金字招牌-DeepSeek 憋了一年半，终于交作业了

2026-04-25 15:46:14

首页财产ai正文 DeepSeek 憋了一年半，终究交功课了今日午时 DeepSeek 发布新模子 V4，机能处在开源领先，撑持百万 token 上下文长度且省钱，虽不撑持多模态，但实力获承认。 2026-04-24 17:35 ·差评夙起、江江 AI投资人解读· DeepSeek V4机能处在开源领先，能与顶尖闭源模子一战，且撑持100万token上下文长度，推理成本低。价格比拟友商上风较着，V4-Pro百万token输出约24元，仅为Claude Sonnet 4.6的四分之一。· 今朝不撑持多模态与世界开始进闭源旗舰模子有3到6个月差距存于人材流掉、国产芯片适配掉败等问题和传说风闻。总结：DeepSeek V4依附机能、成本及价格上风揭示投资潜力，但需存眷其多模态进展、与进步前辈模子的差距和相干危害。内容由AI天生，仅供参考

于训练时长一年半后，今天午时，DeepSeek 终究端上了新模子 DeepSeek V4，还有于文章里直接把压力给到华为及寒武纪。。。

这一次的更新，于机能上实在没太出乎各人的意料，要说吊打 GPT，脚踢 Gemini 也不太可能。

但于开源模子里基本也够了，属在是站于一个开源*，能及*闭源模子一战的职位地方上。

此刻，各人可以直接辞官网上免费试用。直接打开对于话框，不消任何操作就是 V4。

并且假如你想氪金，不论是自制量年夜的 DeepSeek-V4-Flash，还有是价格直接涨了 8 倍的 V4-Pro，均可以直接用上开发者 API。

不外纵然涨价了，它炸了我都夸他响。由于及划一机能的友商比，这价格依旧太喷鼻了。

DeepSeek-V4-Pro 百万 token 输出年夜概 24 块钱，Claude Sonnet 4.6 差未几要 100 块。机能差未几，价格直接打到四分之一摆布，这就很 DeepSeek。

固然，DeepSeek 还有给各人画了个饼，说此次模子的涨价只是暂时的。

等过段时间华为的卡到货了，模子的价格还有会给各人直接打下来。

总的来讲，这两个模子，基本上把 DeepSeek 已往一年半里攒的几个年夜招，一口吻全都给端出来了。

于机能上就不说了，V4 Pro 能及 Claude Opus 4.六、GPT 5.四、Gemini 3.1 Pro 这些闭源*模子打个五五开。

于写代码的出产力测试的情况中，V4 Pro 的能力也处在年夜在 Sonnet 4.5 ，可是小在 Opus 4.6 的阶段。

于常识库的富厚水平，推理能力上也都可以或许年夜幅度*其他开源模子，同时比肩世界*闭源模子。

同时更主要的是，此次 DeepSeek 发出来的两个模子，都能撑持 100 万 token 的上下文长度。

这玩意有啥用呢？

这两个月，甚么小龙虾，爱马仕这种的 Agent 东西是层见叠出。于 Agent 的事情情况里，每一次对于话时所耗损的上下文是个天文数字。

而模子的上下文长度越长，就象征着干活的时辰能记住更多的细节。

以前 Meta 的安全总监就翻过车，由于用的模子上下文长度不敷，触发了 OpenClaw 的主动影象压缩功效。

但一压缩，就把一些要害号令给忘失了，成果就致使了这个安全总监的邮件给 AI 删了一泰半。

而此刻，DeepSeek 把百万上下文酿成了模子的标配，新模子不论是 Pro 还有是 flash，都能撑持百万上下文长度。

这就象征着他俩干活的能力都很强。

咱们也简朴试了一下，给本红楼梦里随意贴了一段三体的科幻小说内容，然后丢给 DeepSeek V4 让它找。

成果用不着几秒，DeepSeek 就找到了异样。

同时及其他模子不太同样的是。

DeepSeek 的百万上下文还有很是省钱。

各人都知道此刻的年夜模子用的都是 transformer 架构，对于话越长，KV Cache（姑且缓存）就越年夜，推理成本也越高，模子也就越费钱。

但此次，DeepSeek V4 直接酿成了超等省钱冠军。

一样带着 100 万 token 的上下文干活，V4-Pro 每一天生一个 token，暗地里的计较量差未几只要本来的四分之一。

模子用来记住前文的 KV Cache，也只剩本来的十分之一。

而此次 DeepSeek 之以是能把成本给打下来，靠的是一套全新的留意力机制。

HybridAttention。

它把已往的 CSA（压缩稀少留意力）及 HCA（重度压缩留意力）这两种技能联合了起来。

前者相称在是一本书写目次，后者相称在是给这个目次里的章节来写择要。

有了目次及择要辅助影象以后，模子于干活的时辰，真正需要计较的压力就降了不少。

同时，他们还有用上了去年搓出来的 mHC 来包管长文本的不变性，用了 Muon 优化器来让模子的参数更不变。。。

于底层及显卡的适配优化上也下了一年夜堆功夫，于英伟达及华为的卡上都测试了本身做的 fine-grained EP，能让模子的推理速率晋升 1.50 到 1.73 倍。

并且还有用上了以前北年夜开源的 TileLang（Tile Language），让模子变患上没有那末依靠老黄的 CUDA。

不外惋惜的是*的错误谬误就是，今朝的 DeepSeek 虽然很强很自制，但此次的 V4 还有是不撑持多模态，也就是还有是看不懂图片。

这块颇有多是它们下一代的方针。

别的，除了了于小字催华为的卡以外，我们还有发明了 DeepSeek V4 的其他一些小彩蛋。

好比说于提到 Agent 能力的时辰，除了了给 Claude Code、OpenClaw 这些名声于外的产物做了优化，还有提到了腾讯的 CodeBuddy 这个突兀的小资格。

这也许及前段时间，腾讯、阿里正于洽谈投资 DeepSeek 的动静，有必然联系关系。

还有有于测试对于比友商的时辰，Kimi K2.6 及智谱 GLM-5.1 的一些能力，DeepSeek 的人没测上，由于友商的 API 忙碌了。。。

智谱官方于不久前，也友爱地回应了：哥们你假如想要，我们*撑持，高速度账号摆设上。

对于了， DeepSeek 还有给造卡的硬件厂商们，提了个建议，那就是别瞎堆带宽，要算好“算力与通讯”的比例，如许才更省电省钱。

而且，DeeSeek 官方也很坦诚，直言今朝及世界*进的闭源旗舰模子，能力上还有是有 3 到 6 个月的差距。

末了，可以说 DeepSeek 这些日子，是遭到了不少的会商及非议的。

人材流掉、国产芯片适配掉败、各类传说风闻真看患上人挺揪心的。

有人说它们是江郎才尽、好景不常。

而 " DeepSeek 新版本下周更新 " 的动静，也都快成为了及贾管帐下周回国同样，成为了科技圈的笑话。

甚至还有有网友做了 AI 梗图，说梁文锋是由于要玩原神，才迟误了 DeepSeek V4。。。。

但玩归玩，笑归笑，别拿你 D 教员恶作剧，DeepSeek 用实力证实，它依旧是阿谁开源的源神。

及华为等国产芯片厂商的互助，也让人看到了我们于AI范畴打破垄断的刻意及实力。

去年 DeepSeek R1 的开源，给全世界的年夜模子带来了年夜推理时代。

而本年的 DeepSeek V4，则是经由过程及华为等国产芯片厂商的互助，让人看到了我们于AI范畴打破垄断的刻意及实力。

“ 不诱在誉，不恐在诽，率道而行，端然正己 ” 这是 DeepSeek 官方今天提到的 16 字真言。

而他们，也确凿做到了。

【本文由投资界互助伙伴差评授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-今年会·(jinnianhui)金字招牌

下一篇：和合共生积极有为——今年会·(jinnianhui)金字招牌诚信至上集团2025年度工作总结会顺利召开