DeepSeek 簡介
DeepSeek(深度求索)是一家專注於人工通用智能(AGI)的中國科技公司,成立於2023年7月17日,總部位於杭州,並由知名私募巨頭「幻方量化」孵化支持。其目標是開發能廣泛學習、解決複雜問題的通用人工智慧模型,並透過開源技術與數據蒸餾等核心方法,推動高效、低成本的AI應用。
重大發展事件
技術突破與產品發布
- 2023年11月
- 發布首款開源模型 DeepSeek Coder,免費供商業使用,奠定技術開放基礎。
- 2024年1月
- 推出670億參數的 DeepSeek LLM,性能直逼GPT-4,並發布專注代碼生成的 DeepSeek-Coder。
- 2024年5月
- 發布 DeepSeek-V2,採用混合專家架構(MoE),顯著降低訓練成本,觸發中國AI模型價格戰,迫使騰訊、阿里巴巴等巨頭降價競爭。
- 2024年12月
- 推出 DeepSeek-V3,以6710億參數在55天內完成訓練,成本僅558萬美元,性能媲美GPT-4o和Claude 3.5 Sonnet。
- 2025年1月
- 發布 DeepSeek-R1 推理模型,在數學與編程任務表現超越OpenAI的o1模型,運行成本僅為對手2%,引發矽谷科技股暴跌(市值蒸發近1兆美元)。
- 開源多模態模型 Janus Pro,在圖像生成基準測試中擊敗Stable Diffusion和DALL-E 。
國際合作與爭議
- 2025年1月31日:R1模型登陸NVIDIA平台,獲亞馬遜、微軟接入,卻同步面臨美國指控「技術盜取」及網絡攻擊(如DDoS攻擊)。
- 2025年2月:澳大利亞以「安全風險」為由禁止政府設備使用DeepSeek;美國商務部考慮擴大對華晶片出口限制(如輝達H20晶片)。
媒體評論與影響
- 技術顛覆與市場衝擊
- 美國矽谷最初讚譽DeepSeek-R1的突破性表現,但隨後指控其「蒸餾技術」不當使用OpenAI數據。業界專家指出,「蒸餾」是AI領域常見做法,且DeepSeek透過開源模式反哺全球生態,凸顯技術競爭力的本質差異。
- 美國創投家馬克·安德森(Marc Andreessen)將DeepSeek崛起形容為AI領域的「斯普特尼克時刻」,暗示其可能動搖美國技術霸權。
- 開源 vs. 閉源之爭
- DeepSeek的開源策略被視為打破西方閉源壟斷的關鍵。例如,其模型可於本地設備離線運行,難以被技術封鎖。加州大學柏克萊分校研究員指出:「開源模型的低成本與高性能,可能重塑AI產業生態」。
- 前Google執行主席施密特(Eric Schmidt)呼籲美國擁抱開源生態,認為「閉源與開源需互補,而非對立」。
- 地緣政治與監管反應
- 美國政府以「國家安全」為由啟動調查,並醞釀加強晶片出口管制;歐洲多國則對DeepSeek啟動資安審查。
- 德銀分析師認為,DeepSeek的技術普及可能成為「積極的供應衝擊」,促進全球生產力增長,但同時威脅美國技術優勢與美元地位。
總結
DeepSeek以技術創新與開源生態快速崛起,其低成本、高性能的模型不僅衝擊全球AI市場,更引發技術霸權與地緣政治的角力。儘管面臨國際封鎖與爭議,其開放策略仍被視為推動AGI發展的關鍵動力。未來,這場「中美AI競賽」的走向,將取決於技術創新與國際合作能否突破政治壁壘