DeepSeek更新“前夜”,有些問題得提前理一理
4月10日,據多位知情人士向《創智記》透露,DeepSeek創始人梁文鋒在內部溝通中首次明確了V4的發布節奏——備受期待的新一代旗艦大模型DeepSeek V4計劃于4月下旬正式與公眾見面。
鳳凰網科技就此消息向DeepSeek方面詢問,截至發稿未取得回應。
此前,DeepSeek剛剛完成版本更新。首次在模式上進行分層,推出了快速和專家兩個模式。在點擊開始入口處,原本“體驗DeepSeekV3.2”的字樣也消失不見了。
優等生DeepSeek的煩惱
DeepSeek V4的撲朔,建立在一個復雜的背景之上。
2025年初,R1的發布,曾經是國內大模型創企揮之不去的“陰影”。用了半年時間,這些曾經的明星企業才憑借新的旗艦模型回到公眾視野,或上市、或開啟新一輪融資。
在成名前,梁文鋒曾與少部分VC進行過會談,但據當時與其有過接觸的人士向鳳凰網科技表述,梁文鋒的本意也不是融資,而是看看機構的風格。
《晚點LatePost》也在報道中寫道,梁文鋒曾在會面中提出類似OpenAI與微軟投資協議的回報上限條款,但無機構接受,此后再無投資人會面。
2025年成名后,DeepSeek的風格是更加對內收斂,一些原本在社交媒體更新的員工賬號開始停更。
據《晚點LatePost》報道,DeepSeek不加班,他們不打卡、沒有明確的績效考核,平日多數成員會在下午6點至7點左右離開公司。
但隨著智譜、MiniMax等公司上市后激增的市值,DeepSeek的估值問題正成為內部壓力點。DeepSeek員工對手中未定價的期權有了更多疑問,梁文鋒近期開始考慮公司估值的問題。
除此之外,從2025年秋天起,梁文鋒開始更多提及“產品化和商業化”。在公開的招聘信息中,官方HR也表述有產品、設計、數據百曉生等崗位開放。甚至是職能崗也在擴充, 早在2025年11月,DeepSeek還開放過行政招聘,據相關人士表述“是因為團隊大了,需要更多的行政伙伴”。
變化之下,可能讓拖延數月的V4存在諸多變數,但其掀起的熱潮不會遷移。
OpenRouter平臺數據顯示,2026 年 2 月,中國大模型在 OpenRouter 上周調用量首次超過美國模型,這一態勢一直持續到3月。本周,排在前五位的模型,依舊有三個來自中國,分別是排名第一的DeepSeek V3.2和排名第二的MiniMax M2.7和第四的MiniMax M2.5。
毫無疑問,DeepSeek V4的到來,有望延續這份優勢。
V4算不算DeepSeek的分水嶺?
把R1和V4放在一起看,這個變化的輪廓會變得更清晰。
R1的突破是范式性的——它在學術層面開創了“純強化學習激發推理能力”的新路徑,論文登上Nature封面,以586萬美元的成本實現了對標GPT-4的性能,徹底改變了全球對中國AI模型的認知。
Hugging Face在“DeepSeek時刻一周年”回顧中指出,R1“降低了技術與應用門檻,不僅是中國AI發展的轉折點,更在全球范圍內引發了開源模式的深刻變革”。
V4的戰略意義截然不同。它不再回答“中國能不能做出世界級模型”,而是在回答兩個更具體的問題:“中國AI能不能在算力封鎖下持續進化”,以及“大模型能不能變成能賺錢的企業級產品”。
所以,V4算不算DeepSeek的分水嶺?
如果說R1是DeepSeek在“純推理”路線上站住腳、打響全球名聲的第一槍,那么V4就是DeepSeek證明自己不只是“技術奇才”、而是能在中國AI產業生態中找到不可替代位置的標志性產品。
R1的意義在于“做了一件別人覺得中國公司做不了的事”。V4的意義在于“在一個被封鎖的環境中,自己鋪了一條能走下去的路”。
與此同時,站在學術界,新的風向也在產生。DeepSeek的使命一度是探索未知,追求AGI。
去年底,姚順雨、林俊旸、楊植麟、唐杰等人在清華同臺,探討的是底層范式的話題。在海外,Yann LeCun言稱LLM是“死胡同”,Jim Fan說“視覺是連接大腦、運動系統和物理世界的最高帶寬通道”。甚至一些觀點認為,追求AGI的重任或許該落在世界模型身上了。
敏感的VC,是最早嗅到市場風向的人。頗為巧合的是,代表世界模型陣營的李飛飛和楊立昆,均剛剛完成10億美元級別的新融資,國內代表生數科技4月10日也剛剛官宣獲得了A++輪融資,融資金額近20億人民幣。
就目前披露的信息而言,DeepSeek選擇的仍然是基于LLM架構的優化和工程化落地。而V4最核心的突破是集中在這三件事上:萬億參數MoE架構、原生多模態能力和國產芯片適配。
對于DeepSeek來說,在算力和資金都存在約束的情況下,把資源投向架構效率和國產化適配,比追逐一個距離產品化還很遙遠的范式,更務實、更符合它“少花錢辦大事”的底色。
值得注意的是,DeepSeek并非完全沒有多模態的積累。此前開源的DeepSeek-OCR系列已經展示了將視覺作為文本壓縮媒介的探索,通過將文本以圖片方式輸入,極大減少token消耗。
但這些探索的方向仍然是“優化文本模型的效率和成本”,而不是“構建對物理世界的理解和預測”。
如果拉長時間線來看,DeepSeek的這條“分水嶺”可能還有更深的一層含義——它不是一條岔路,而是一道選擇題:在中國AI產業的現實土壤上,是追隨“世界模型”的范式革命,還是在現有架構上把工程優化和自主可控做到極致?
當然,如果DeepSeek未來真的在視覺和空間推理上投入更多資源,以它的架構創新能力,切入“輕量級世界模型”領域并非不可能。但在當下,V4的任務很清楚:在中國AI產業最需要的方向上,交出一份能打的答卷。
這個選擇是否成立,不需要等太久。4月下旬V4正式發布后,市場的反饋會給出最誠實的答案。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
2026十大科技趨勢
2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!
[詳細]
做AI時代“價值貢獻者”:中興通訊如何以“連接 + 算力”雙輪驅動?
今年三月發布的財報顯示,2025年中興通訊營收1339億元,同比增長10.4%,歸母凈利潤56.2億元,業績非常亮眼。在這份財報的背后,是中興通訊加大智算業務投入,形成了覆蓋“基礎設施—平臺—應..[詳細]
專家談6G:空天地一體化,正邁入全新高速發展期
在2026年3月舉行的西班牙巴塞羅那MWC大會上,不少廠商已經開始談論6G愿景,那么業界對于6G究竟有哪些設想?4月21-23日,2026全球6G技術與產業生態大會將在南京召開,全球頂尖學術力量與產業..[詳細]
智能手機砍單瞄準中低端型號,多重因素收窄市場預期
智能手機砍單瞄準中低端型號,多重因素收窄市場預期[詳細]
中國Token調用量全球登頂,正在快速徹底甩開美國
我國的AI大模型在近來的周調用量上,已經連續第五周超越美國。截至2026年4月6日,根據最新數據,從3月30日至4月5日這一周里,中國AI大模型周調用量是12.96萬億Token,環比增長31.48%,而美國..[詳細]
低空產業發展將呈現三階段發展態勢
隨著新一輪科技革命和產業變革深入發展,低空經濟作為一種新興經濟形態,通過重大技術突破和創新應用開拓新產業、新模式、新業態,逐步成為加快建設現代化經濟體系、增強我國國際競爭力的關..[詳細]
直擊數智化創新一線:探訪河南向新之力
數智浪潮奔涌向前,創新動能生生不息。近日,飛象網記者跟隨“數智河南 多彩中原”河南新質生產力主題媒體探訪活動趕到鄭州、開封等地,直擊數智化創新一線。從農業生產到鄉村管理,從文旅產..[詳細]
敲開蘋果護城河,安卓廠商聚焦兼容蘋果生態
要說蘋果iPhone的優勢在哪?很多用戶最舍不得拋棄的一點莫過于與Mac、iPad設備的優秀生態兼容性,無論是一點即傳的AirDrop,還是隨時自動同步iCloud,這一生態能力某種程度上也成為蘋果維持..[詳細]
6G要爆發?原型機密集發布,6G三大技術集體亮相
2026年以來,全球6G發展加速駛入快車道,6G的標準制定、原型研發、技術突破、產業規劃等均取得標志性進展。3GPP已啟動6G標準起草工作,進入規范制定關鍵窗口;ITU也發布相關報告,明確6G關鍵..[詳細]
三大運營商2025年報:營收穩中有進 算力等新興產業成效顯現
近日,中國移動、中國電信、中國聯通三大電信運營商2025年年度報告已全部對外披露。作為我國數字經濟發展的“國家隊”與主力軍,三大運營商在2025年頂住行業競爭加劇、傳統業務增長趨緩等多..[詳細]













