來源于:河北友元管道制造有限公司
發(fā)布時(shí)間:2026-04-26 10:14:58
文 丨《BUG》欄目 周文猛 DeepSeek-V4預(yù)覽版本,價(jià)格屠夫終于發(fā)布了。把百萬 今日,上下適配昇騰DeepSeek官方宣布:擁有百萬字超長(zhǎng)上下文的文打deepseek-v4-pro和deepseek-v4-flash兩款模型發(fā)布并開源,即日起登錄官網(wǎng)或官方App即可與最新的到毛DeepSeek-V4對(duì)話,探索1M(百萬)超長(zhǎng)上下文記憶的國(guó)產(chǎn)格全新體驗(yàn),API服務(wù)已同步更新。腰斬 據(jù)官方公布基準(zhǔn)測(cè)評(píng),價(jià)格屠夫在上下文長(zhǎng)度、把百萬知識(shí)、上下適配昇騰推理及Agent等能力上,文打DeepSeek V4性能比肩國(guó)際頂級(jí)閉源模型,到毛達(dá)到國(guó)際開源模型一流水平。國(guó)產(chǎn)格《BUG》欄目對(duì)比發(fā)現(xiàn),腰斬在API調(diào)用價(jià)格上,價(jià)格屠夫去年以一己之力撬動(dòng)國(guó)內(nèi)大模型行業(yè)降價(jià)的DeepSeek,V4版本再次開出了行業(yè)“最低價(jià)”。 “雖然每百萬Tokens調(diào)用價(jià)格國(guó)內(nèi)模型均未下降太多,但超長(zhǎng)上下文長(zhǎng)度及不俗的性能,讓其極具競(jìng)爭(zhēng)優(yōu)勢(shì)!”有業(yè)內(nèi)人士在與《BUG》欄目溝通中感慨:“那個(gè)大模型價(jià)格屠夫,又回來了!” 性能比肩頂級(jí)閉源模型,知識(shí)、推理能力領(lǐng)先 根據(jù)DeepSeek的官方介紹,V4系列共包括兩個(gè)版本模型:DeepSeek-V4-Pro總參數(shù)1.6T、激活參數(shù)49B,預(yù)訓(xùn)練數(shù)據(jù)33T;DeepSeek-V4-Flash總參數(shù)284B、激活參數(shù)13B,預(yù)訓(xùn)練數(shù)據(jù)32T;兩者均原生支持100萬token上下文。 據(jù)DeepSeek披露的基準(zhǔn)測(cè)試數(shù)據(jù),在知識(shí)與推理類測(cè)試中,DeepSeek-V4-Pro-Max在Apex Shortlist和Codeforces兩項(xiàng)測(cè)試中取得了最優(yōu)性能,超越Claude-Opus-4.6-Max、GPT-5.4-xHigh、Gemin-3.1-Pro-Hight等國(guó)際模型,展現(xiàn)了極強(qiáng)的邏輯與算法能力;在SimpleQA Verified測(cè)試中較Gemini-3.1-Pro-High略有差距但領(lǐng)先于Claude和GPT。 在Agentic能力測(cè)評(píng)中,V4、Opus-4.6、Gemin-3.1-pro三款模型在SWE Verified任務(wù)上打成平手,且DeepSeek在Toolathlon任務(wù)上取得了僅次于GPT-5.4-xHigh的水平,在Terminal Bench 2.0上取得了優(yōu)于Opus-4.6的水平,體現(xiàn)了在復(fù)雜指令執(zhí)行與工具調(diào)用場(chǎng)景下的優(yōu)勢(shì)。 目前DeepSeek-V4已成為公司內(nèi)部員工使用的Agentic Coding模型,根據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6 非思考模式。 在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro 超越當(dāng)前已公開評(píng)測(cè)的絕大多數(shù)開源模型,取得了比肩世界頂級(jí)閉源模型的成績(jī)。 綜合來看,在知識(shí)處理及推理能力上,DeepSeek-v4取得了較國(guó)內(nèi)開源模型全方位領(lǐng)先,比肩國(guó)際的測(cè)評(píng)能力。但在Agentic能力方面,雖然最新的DeepSeek-v4有了不錯(cuò)的提升,但較國(guó)內(nèi)及國(guó)際第一梯隊(duì)的能力并未拉開差距,彼此各有領(lǐng)先。 “標(biāo)配”100萬上下文,價(jià)格屠夫“回來了” 相比于各項(xiàng)基準(zhǔn)測(cè)試中體現(xiàn)的性能優(yōu)勢(shì),本次V4發(fā)布最大的特色,莫過于長(zhǎng)文本能力的突破以及API調(diào)用價(jià)格的進(jìn)一步下探。 得益于DeepSeek-V4開創(chuàng)的全新注意力機(jī)制,V4通過在token維度進(jìn)行壓縮并結(jié)合DSA稀疏注意力(DeepSeek Sparse Attention),實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力,且相比傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求,將1M(一百萬)上下文變成了DeepSeek所有官方服務(wù)的標(biāo)配。 一年前,100萬上下文還是Gemini的獨(dú)家王牌,即使是近期發(fā)布的多數(shù)主流國(guó)產(chǎn)開源模型中,模型上下文的長(zhǎng)度也多位于128K—200K區(qū)間,而DeepSeek直接把百萬上下文從“高端閉源功能”,做成了開源標(biāo)配。 在API價(jià)格調(diào)用上,相較于目前GLM-5.1輸入單價(jià)1.3元-2元/百萬Tokens(緩存命中),以及Kimi-K2.6 1.1元/百萬tokens(緩存命中),DeepSeek-v4 -pro及flash兩個(gè)版本,輸入單價(jià)分別為1元/百萬tokens及0.2元/百萬tokens,雖然價(jià)格降幅不大但均為最低,且上下文長(zhǎng)度擴(kuò)展了數(shù)倍。 (DeepSeek-v4系列模型API調(diào)用價(jià)格) ?。↘imi-k2.6模型API調(diào)用價(jià)格) ?。℅LM-5.1模型API調(diào)用價(jià)格) “DeepSeek-v4此次發(fā)布帶來的性能突破,較DeepSeek-R1發(fā)布時(shí)帶給外界的沖擊要小了一些,各項(xiàng)性能依然處于第一梯隊(duì),但領(lǐng)先優(yōu)勢(shì)并未完全拉開。”在業(yè)內(nèi)人士看來,“此次V4模型的發(fā)布,更多的在于長(zhǎng)文本能力的提升及價(jià)格的進(jìn)一步下探。” 該人士感慨道:“此前DeepSeek-V3及R1模型發(fā)布后,其通過底層技術(shù)創(chuàng)新帶來的性能優(yōu)勢(shì),直接推動(dòng)整個(gè)國(guó)內(nèi)大模型行業(yè)集體降價(jià),雖然此次V4版本每百萬Tokens調(diào)用價(jià)格較國(guó)內(nèi)同行并未下降太多,但依然具有競(jìng)爭(zhēng)力,那個(gè)大模型價(jià)格屠夫又回來了!”。 “下半年批量上華為算力,Pro價(jià)格會(huì)大幅下調(diào)” 值得注意的是,在DeepSeek-v4公布API價(jià)格的信息的最下層位置,官方特別標(biāo)注指出:“受限于高端算力,目前Pro的服務(wù)吞吐量十分有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格會(huì)大幅下調(diào)。” 這意味著,此次發(fā)布的v4系列模型,已經(jīng)針對(duì)華為昇騰950超節(jié)點(diǎn)完成適配,只要昇騰950上市,廣大用戶便可基于國(guó)產(chǎn)算力用上比肩國(guó)際頂級(jí)閉源模型的DeepSeek-v4。 在官方開源的技術(shù)文檔中,DeepSeek也提及了這一點(diǎn),直言v4已在NVIDIA GPU和HUAWEI Ascend NPUs平臺(tái)上驗(yàn)證了精細(xì)粒度的EP(專家并行)方案,相較于強(qiáng)大的非融合基線,其在通用推理任務(wù)上可實(shí)現(xiàn)1.50-1.73倍的加速效果,而在對(duì)時(shí)延敏感的場(chǎng)景(如RL推演和高速代理服務(wù))中則可達(dá)到1.96倍的加速效果。 而在V4發(fā)布后,華為昇騰也同步宣布“超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型”。據(jù)悉,昇騰950通過融合kernel和多流并行技術(shù)降低Attention計(jì)算和訪存開銷,大幅提升推理性能,結(jié)合多種量化算法,實(shí)現(xiàn)了高吞吐、低時(shí)延的DeepSeek V4模型推理部署。 本月上旬,英偉達(dá)創(chuàng)始人黃仁勛在接受Dwarkesh Patel專訪時(shí)曾言:“如果DeepSeek先在華為平臺(tái)上發(fā)布,那對(duì)我們國(guó)家(美國(guó))來說將是災(zāi)難性的?!痹邳S仁勛看來,雖然DeepSeek是一款開源模型,同樣可被用于英偉達(dá)產(chǎn)品上,但如果DeepSeek專門針對(duì)華為算力進(jìn)行優(yōu)化,在高端算力采購受限等局限下,英偉達(dá)將處于劣勢(shì)。 如今看來,雖然DeepSeek也針對(duì)英偉達(dá)算力進(jìn)行了EP方案驗(yàn)證,但黃仁勛擔(dān)心的事情還是發(fā)生了。在業(yè)內(nèi)人士看來,“V4是算力博弈逼出來的產(chǎn)物,在未來一年,國(guó)產(chǎn)大模型跑在國(guó)產(chǎn)卡上,將逐漸成熟?!?/p> 多模態(tài)能力仍未出現(xiàn) 比較遺憾的是,DeepSeek V4雖然發(fā)布了,但該版本依然是一款純文本模型,沒有太多的文生圖、文生視頻等多模態(tài)能力。這也讓普通用戶快速體驗(yàn)評(píng)測(cè)一款模型,平添了不少難度。 畢竟,在大語言模型能力不斷提升、幻覺率逐漸下降的當(dāng)下,常規(guī)、單一的知識(shí)問答,已很難客觀反映一款模型的綜合能力。對(duì)于多數(shù)用戶而言,想要直觀感受V4模型的能力,還得下載并親自用上一陣子。 V4系列模型發(fā)布的同時(shí),近期DeepSeek還曝出了計(jì)劃融資500億元的消息,有接近DeepSeek的知情人士透露,DeepSeek融前估值為3000億元,約合440億美元,目前騰訊控股、阿里巴巴集團(tuán)均正在洽談投資DeepSeek。不過,對(duì)于融資相關(guān)事宜,DeepSeek方面至今未正面回應(yīng)媒體問詢。 或許,對(duì)于DeepSeek創(chuàng)始人梁文鋒而言,在全球大模型“智力”增長(zhǎng)放緩,行業(yè)人才競(jìng)爭(zhēng)加劇、行業(yè)多模態(tài)化、Agentic化趨勢(shì)不斷凸顯的情況下,借V4發(fā)布適時(shí)融資壯大實(shí)力,也不失為一個(gè)明智之舉。 責(zé)任編輯:張喬松 










海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP
返回首頁