“價(jià)格屠夫”來了！DeepSeek V4把百萬上下文打到2毛，適配華為昇騰，國(guó)產(chǎn)卡將“腰斬”API價(jià)格？

來源于：河北友元管道制造有限公司

發(fā)布時(shí)間：2026-04-26 10:14:58

　　文丨《BUG》欄目周文猛

　　DeepSeek-V4預(yù)覽版本，價(jià)格屠夫終于發(fā)布了。把百萬

　　今日，上下適配昇騰DeepSeek官方宣布：擁有百萬字超長(zhǎng)上下文的文打deepseek-v4-pro和deepseek-v4-flash兩款模型發(fā)布并開源，即日起登錄官網(wǎng)或官方App即可與最新的到毛DeepSeek-V4對(duì)話，探索1M（百萬）超長(zhǎng)上下文記憶的國(guó)產(chǎn)格全新體驗(yàn)，API服務(wù)已同步更新。腰斬

　　據(jù)官方公布基準(zhǔn)測(cè)評(píng)，價(jià)格屠夫在上下文長(zhǎng)度、把百萬知識(shí)、上下適配昇騰推理及Agent等能力上，文打DeepSeek V4性能比肩國(guó)際頂級(jí)閉源模型，到毛達(dá)到國(guó)際開源模型一流水平。國(guó)產(chǎn)格《BUG》欄目對(duì)比發(fā)現(xiàn)，腰斬在API調(diào)用價(jià)格上，價(jià)格屠夫去年以一己之力撬動(dòng)國(guó)內(nèi)大模型行業(yè)降價(jià)的DeepSeek，V4版本再次開出了行業(yè)“最低價(jià)”。

　　“雖然每百萬Tokens調(diào)用價(jià)格國(guó)內(nèi)模型均未下降太多，但超長(zhǎng)上下文長(zhǎng)度及不俗的性能，讓其極具競(jìng)爭(zhēng)優(yōu)勢(shì)！”有業(yè)內(nèi)人士在與《BUG》欄目溝通中感慨：“那個(gè)大模型價(jià)格屠夫，又回來了！”

　　性能比肩頂級(jí)閉源模型，知識(shí)、推理能力領(lǐng)先

　　根據(jù)DeepSeek的官方介紹，V4系列共包括兩個(gè)版本模型：DeepSeek-V4-Pro總參數(shù)1.6T、激活參數(shù)49B，預(yù)訓(xùn)練數(shù)據(jù)33T；DeepSeek-V4-Flash總參數(shù)284B、激活參數(shù)13B，預(yù)訓(xùn)練數(shù)據(jù)32T；兩者均原生支持100萬token上下文。

　　據(jù)DeepSeek披露的基準(zhǔn)測(cè)試數(shù)據(jù)，在知識(shí)與推理類測(cè)試中，DeepSeek-V4-Pro-Max在Apex Shortlist和Codeforces兩項(xiàng)測(cè)試中取得了最優(yōu)性能，超越Claude-Opus-4.6-Max、GPT-5.4-xHigh、Gemin-3.1-Pro-Hight等國(guó)際模型，展現(xiàn)了極強(qiáng)的邏輯與算法能力；在SimpleQA Verified測(cè)試中較Gemini-3.1-Pro-High略有差距但領(lǐng)先于Claude和GPT。

　　在Agentic能力測(cè)評(píng)中，V4、Opus-4.6、Gemin-3.1-pro三款模型在SWE Verified任務(wù)上打成平手，且DeepSeek在Toolathlon任務(wù)上取得了僅次于GPT-5.4-xHigh的水平，在Terminal Bench 2.0上取得了優(yōu)于Opus-4.6的水平，體現(xiàn)了在復(fù)雜指令執(zhí)行與工具調(diào)用場(chǎng)景下的優(yōu)勢(shì)。

　　目前DeepSeek-V4已成為公司內(nèi)部員工使用的Agentic Coding模型，根據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet 4.5，交付質(zhì)量接近Opus 4.6 非思考模式。

　　在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中，DeepSeek-V4-Pro 超越當(dāng)前已公開評(píng)測(cè)的絕大多數(shù)開源模型，取得了比肩世界頂級(jí)閉源模型的成績(jī)。

　　綜合來看，在知識(shí)處理及推理能力上，DeepSeek-v4取得了較國(guó)內(nèi)開源模型全方位領(lǐng)先，比肩國(guó)際的測(cè)評(píng)能力。但在Agentic能力方面，雖然最新的DeepSeek-v4有了不錯(cuò)的提升，但較國(guó)內(nèi)及國(guó)際第一梯隊(duì)的能力并未拉開差距，彼此各有領(lǐng)先。

　　“標(biāo)配”100萬上下文，價(jià)格屠夫“回來了”

　　相比于各項(xiàng)基準(zhǔn)測(cè)試中體現(xiàn)的性能優(yōu)勢(shì)，本次V4發(fā)布最大的特色，莫過于長(zhǎng)文本能力的突破以及API調(diào)用價(jià)格的進(jìn)一步下探。

　　得益于DeepSeek-V4開創(chuàng)的全新注意力機(jī)制，V4通過在token維度進(jìn)行壓縮并結(jié)合DSA稀疏注意力（DeepSeek Sparse Attention），實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力，且相比傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求，將1M（一百萬）上下文變成了DeepSeek所有官方服務(wù)的標(biāo)配。

　　一年前，100萬上下文還是Gemini的獨(dú)家王牌，即使是近期發(fā)布的多數(shù)主流國(guó)產(chǎn)開源模型中，模型上下文的長(zhǎng)度也多位于128K—200K區(qū)間，而DeepSeek直接把百萬上下文從“高端閉源功能”，做成了開源標(biāo)配。

　　在API價(jià)格調(diào)用上，相較于目前GLM-5.1輸入單價(jià)1.3元-2元/百萬Tokens（緩存命中），以及Kimi-K2.6 1.1元/百萬tokens（緩存命中），DeepSeek-v4 -pro及flash兩個(gè)版本，輸入單價(jià)分別為1元/百萬tokens及0.2元/百萬tokens，雖然價(jià)格降幅不大但均為最低，且上下文長(zhǎng)度擴(kuò)展了數(shù)倍。

　　（DeepSeek-v4系列模型API調(diào)用價(jià)格）

　?。↘imi-k2.6模型API調(diào)用價(jià)格）

　?。℅LM-5.1模型API調(diào)用價(jià)格）

　　“DeepSeek-v4此次發(fā)布帶來的性能突破，較DeepSeek-R1發(fā)布時(shí)帶給外界的沖擊要小了一些，各項(xiàng)性能依然處于第一梯隊(duì)，但領(lǐng)先優(yōu)勢(shì)并未完全拉開。”在業(yè)內(nèi)人士看來，“此次V4模型的發(fā)布，更多的在于長(zhǎng)文本能力的提升及價(jià)格的進(jìn)一步下探。”

　　該人士感慨道：“此前DeepSeek-V3及R1模型發(fā)布后，其通過底層技術(shù)創(chuàng)新帶來的性能優(yōu)勢(shì)，直接推動(dòng)整個(gè)國(guó)內(nèi)大模型行業(yè)集體降價(jià)，雖然此次V4版本每百萬Tokens調(diào)用價(jià)格較國(guó)內(nèi)同行并未下降太多，但依然具有競(jìng)爭(zhēng)力，那個(gè)大模型價(jià)格屠夫又回來了！”。

　　“下半年批量上華為算力，Pro價(jià)格會(huì)大幅下調(diào)”

　　值得注意的是，在DeepSeek-v4公布API價(jià)格的信息的最下層位置，官方特別標(biāo)注指出：“受限于高端算力，目前Pro的服務(wù)吞吐量十分有限，預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后，Pro的價(jià)格會(huì)大幅下調(diào)。”

　　這意味著，此次發(fā)布的v4系列模型，已經(jīng)針對(duì)華為昇騰950超節(jié)點(diǎn)完成適配，只要昇騰950上市，廣大用戶便可基于國(guó)產(chǎn)算力用上比肩國(guó)際頂級(jí)閉源模型的DeepSeek-v4。

　　在官方開源的技術(shù)文檔中，DeepSeek也提及了這一點(diǎn)，直言v4已在NVIDIA GPU和HUAWEI Ascend NPUs平臺(tái)上驗(yàn)證了精細(xì)粒度的EP（專家并行）方案，相較于強(qiáng)大的非融合基線，其在通用推理任務(wù)上可實(shí)現(xiàn)1.50-1.73倍的加速效果，而在對(duì)時(shí)延敏感的場(chǎng)景（如RL推演和高速代理服務(wù)）中則可達(dá)到1.96倍的加速效果。

　　而在V4發(fā)布后，華為昇騰也同步宣布“超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型”。據(jù)悉，昇騰950通過融合kernel和多流并行技術(shù)降低Attention計(jì)算和訪存開銷，大幅提升推理性能，結(jié)合多種量化算法，實(shí)現(xiàn)了高吞吐、低時(shí)延的DeepSeek V4模型推理部署。

　　本月上旬，英偉達(dá)創(chuàng)始人黃仁勛在接受Dwarkesh Patel專訪時(shí)曾言：“如果DeepSeek先在華為平臺(tái)上發(fā)布，那對(duì)我們國(guó)家（美國(guó)）來說將是災(zāi)難性的?！痹邳S仁勛看來，雖然DeepSeek是一款開源模型，同樣可被用于英偉達(dá)產(chǎn)品上，但如果DeepSeek專門針對(duì)華為算力進(jìn)行優(yōu)化，在高端算力采購受限等局限下，英偉達(dá)將處于劣勢(shì)。

　　如今看來，雖然DeepSeek也針對(duì)英偉達(dá)算力進(jìn)行了EP方案驗(yàn)證，但黃仁勛擔(dān)心的事情還是發(fā)生了。在業(yè)內(nèi)人士看來，“V4是算力博弈逼出來的產(chǎn)物，在未來一年，國(guó)產(chǎn)大模型跑在國(guó)產(chǎn)卡上，將逐漸成熟?！?/p>

　　多模態(tài)能力仍未出現(xiàn)

　　比較遺憾的是，DeepSeek V4雖然發(fā)布了，但該版本依然是一款純文本模型，沒有太多的文生圖、文生視頻等多模態(tài)能力。這也讓普通用戶快速體驗(yàn)評(píng)測(cè)一款模型，平添了不少難度。

　　畢竟，在大語言模型能力不斷提升、幻覺率逐漸下降的當(dāng)下，常規(guī)、單一的知識(shí)問答，已很難客觀反映一款模型的綜合能力。對(duì)于多數(shù)用戶而言，想要直觀感受V4模型的能力，還得下載并親自用上一陣子。

　　V4系列模型發(fā)布的同時(shí)，近期DeepSeek還曝出了計(jì)劃融資500億元的消息，有接近DeepSeek的知情人士透露，DeepSeek融前估值為3000億元，約合440億美元，目前騰訊控股、阿里巴巴集團(tuán)均正在洽談投資DeepSeek。不過，對(duì)于融資相關(guān)事宜，DeepSeek方面至今未正面回應(yīng)媒體問詢。

　　或許，對(duì)于DeepSeek創(chuàng)始人梁文鋒而言，在全球大模型“智力”增長(zhǎng)放緩，行業(yè)人才競(jìng)爭(zhēng)加劇、行業(yè)多模態(tài)化、Agentic化趨勢(shì)不斷凸顯的情況下，借V4發(fā)布適時(shí)融資壯大實(shí)力，也不失為一個(gè)明智之舉。