說起DeepSeek這個模型,最近圈子里頭議論得挺多,尤其是2024年5月它V2版本一上線,就跟打了雞血似的,在開源社區(qū)里攪起不小浪花。
參數(shù)量上百億,推理速度快得讓人眼前一亮,還支持多語言處理,開發(fā)者們上手調優(yōu),很快就拿它搞出了各種應用,從代碼生成到文本總結,都玩得挺溜。
按理說,這玩意兒是中國團隊自研的成果,擱誰身上都得樂呵樂呵,覺得AI領域咱們終于喘了口氣。可仔細一琢磨,專家們直搖頭,說這東西頂多算個安慰獎,遠沒到沾沾自喜的地步。
為什么?因為它再牛,也繞不開底層硬件的硬傷,尤其是高端光刻機這塊兒,缺口大得像個黑洞,DeepSeek的成功反而把這短板給照得清清楚楚。
簡單說,軟件飛得再高,硬件跟不上,終究是空中樓閣。
![]()
DeepSeek牛在哪兒,可為啥還不夠勁兒
DeepSeek的亮點確實不少,先從技術層面扒拉扒拉。它用上了MoE架構,就是混合專家模型那種,參數(shù)雖多,但實際激活的部分少,訓練和推理時省了不少算力,這點在2024年5月的發(fā)布會上就強調了。
基準測試里,它在數(shù)學推理和編程任務上跟一些國際大模型咬得挺緊,比如GSM8K數(shù)據(jù)集得分高,HumanEval上也過八成了。開源后,GitHub倉庫star數(shù)蹭蹭上漲,全球開發(fā)者fork了無數(shù)版本,改造成聊天機器人或者行業(yè)專用工具。
擱在AI熱潮里,這絕對是亮眼的一筆,尤其對中國團隊來說,證明了咱們在算法優(yōu)化和數(shù)據(jù)處理上不輸人。人才儲備擺在那兒,清華北大那些實驗室,早幾年就憋著大招,DeepSeek就是他們集體發(fā)力的結果。
但話說回來,這牛勁兒也有限度。訓練這么個模型,得靠海量GPU集群,算力需求動輒上萬張卡,跑一周兩周的循環(huán)。要是底層芯片性能拉胯,功耗高、效率低,整個過程就得拖后腿。
DeepSeek團隊自己也承認,用的是國產芯片堆出來的集群,但跟國外的NVIDIA A100或者H100比,單卡算力差一截,集群規(guī)模得翻倍才能勉強追上。
這不是小事兒,AI模型的迭代速度,本來就靠算力堆,短板一卡,創(chuàng)新節(jié)奏就亂了套。專家們點明,這模型再好,也掩不住高端芯片的缺位。
![]()
光刻機是芯片制造的核心,EUV那套設備,全球就荷蘭ASML一家獨大,受美國出口管制,中國企業(yè)想買都買不著。中芯國際這些年雖在14納米、7納米上發(fā)力,但5納米以下,良率上不去,成本高得嚇人。
DeepSeek的成功,表面看是軟件勝利,骨子里卻提醒大家,硬件不跟上,AI夢就懸了。別光high在模型輸出上,得想想那些服務器機房里嗡嗡轉的卡片,為什么咱們的還得靠低端湊合。
DeepSeek的開源策略也挺接地氣。它不像某些閉源模型,藏著掖著,DeepSeek直接把權重和代碼甩出來,鼓勵大家改改用用。這在2024年下半年,帶動了不少本土應用落地,比如在電商推薦和醫(yī)療問診上,二次開發(fā)的項目層出不窮。
但這也暴露問題:低端芯片的瓶頸,讓優(yōu)化空間小。開發(fā)者反饋,跑大批量推理時,延遲高,內存溢出頻發(fā),得手動調參省資源。擱國際上看,OpenAI的GPT系列,早用上定制硅了,訓練效率是我們好幾倍。DeepSeek雖打破了“中國AI只能跟風”的說法,但專家直言,這遠沒到顛覆地步。
高端光刻機缺失,直接卡在晶圓刻蝕精度上,納米級誤差一出,芯片密度上不去,AI算力天花板就低了。說白了,這模型是把雙刃劍,亮堂了咱們的潛力,也戳破了硬件的痛點。得加把勁兒,別讓好算法白瞎在爛硬件上。
![]()
光刻機這堵墻,拆了它才算真本事
高端光刻機這事兒,說起來就得從半導體產業(yè)鏈說起。芯片制造像搭積木,光刻是畫圖案那步,EUV技術能搞到7納米以下,精度高到幾納米誤差都不行。
中國這些年砸錢砸人,華為海思、中芯國際帶頭沖,但ASML的壟斷加美國制裁,進口路子堵死,只能自研繞道。2024年,SMEE的28納米光刻機量產了,算個小步,但離EUV還遠著呢。專家分析,這缺口不補,DeepSeek這類模型的規(guī)模化部署就難。
想想看,訓練一個百億參數(shù)模型,得幾百萬GPU小時,要是芯片單價高、性能低,成本得翻天。國家層面,十四五規(guī)劃里芯片是重頭戲,資金投了上萬億,實驗室從上海張江到北京亦莊,到處是攻關隊。
但現(xiàn)實骨感,EUV的核心是光源和鏡頭,中國雖在激光等離子體上試水,但穩(wěn)定性差,曝光時間長,良率低。中芯2024年報顯示,7納米線占產能三成,但5納米還處在驗證,客戶訂單多是低端手機芯片。DeepSeek用上這些,訓練周期拉長,電費水費一大筆。
![]()
專家們常說,這不是錢的事兒,是技術積累。荷蘭ASML花了幾十年,專利上千,中國起步晚,得一步步爬。2025年上半年,相關報道顯示,國產光刻頭路數(shù)在增加,上海微電子的設備進了幾條線,但高端仍靠進口替代品湊。
別小看這差距,AI芯片對算力饑渴,DeepSeek-V3如果要上千億參數(shù),沒強芯片集群,純屬畫餅。光刻機拆墻,得靠產業(yè)鏈齊心,材料、設備、軟件全鏈條補課。擱老百姓眼里,這墻拆了,手機芯片便宜了,AI應用普及了,才是實打實的福利。
國際上,美歐日韓的聯(lián)盟,管制EUV出口,理由是國家安全,但骨子里是卡脖子。中國回應是加大自主,2024年禁了部分稀土出口,反制一波。
但專家提醒,別急血脈僨張,DeepSeek的案例證明,軟件能彎道超車,硬件得實打實堆。光刻這堵墻,高是高,但拆了它,AI才真飛起來。DeepSeek就是個信號,告訴大家,短板不補,模型再多也白搭。
![]()
芯片自主的接力賽,還得跑好下半場
芯片自主這賽道,跑了這么多年,還在半道上。中國從2000年代起步,那會兒中芯國際剛成立,靠代工混飯吃,到現(xiàn)在,華為麒麟9000s、昇騰910B這些,國產化率上七成。2024年,DeepSeek落地后,帶動了算力需求,華為的集群賣得火,數(shù)據(jù)中心訂單爆滿。
但專家敲打,這還不夠,高端缺口大,AI訓練90%靠進口GPU。國家隊發(fā)力,2025年計劃投更多在EUV替代,實驗室數(shù)據(jù)出來了,國產光刻分辨率到20納米,步子穩(wěn)。企業(yè)側,中芯擴產,28納米線滿載,7納米客戶包括小米OPPO這些,手機SoC用得上。
但挑戰(zhàn)多,人才流失、供應鏈斷裂。美制裁下,EDA軟件難搞,Synopsys這些巨頭限售,中國得自建工具鏈,華大九天之類的在填坑。DeepSeek的經驗是,算法能優(yōu)化硬件痛點,但極限在那兒。專家建議,多搞開源生態(tài),吸引全球腦子進來,繞開封鎖。
國際對比,韓國三星也卡在EUV,但他們有美韓同盟,松快點。中國靠內循環(huán),韌性強,但速度慢。2025年下半年,報道說中芯5納米試產,良率破四成,算進展。華為AI芯片迭代,910C版算力上petaflops,配DeepSeek,推理快一倍。但光刻不破,規(guī)模化難。
![]()
回過頭,DeepSeek這事兒,擱2025年看,已是老黃歷,但教訓新鮮。它證明中國AI有底子,算法人才全球前排,但高端光刻機缺失,像隱形枷鎖,鎖住潛力。
專家觀點直白,這模型不能讓我們high過頭,得把勁兒使在硬件上。產業(yè)鏈補課,從上游硅料到下游封裝,全線并進。2025年數(shù)據(jù),國產芯片市場份額破30%,AI專用芯出貨百萬片,DeepSeek生態(tài)里頭,用國產集群的占比升到六成。
未來咋辦?多國際合作,繞開敏感區(qū),學以色列那種小國模式,專注 niche 領域。老百姓視角,芯片好了,手機不貴,智能家居不卡,生活實惠。DeepSeek是起點,晶圓是終點,清醒一躍,跨過去才算贏家。這路長,但咱們有耐心,有隊伍,步步為營,總有那天。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.