人物關(guān)系
- 梁文鋒
- 中國
- 1985年 [1]
- 浙江大學(xué) [1]
- DeepSeek [2]
杭州幻方科技有限公司 [2] - DeepSeek創(chuàng)始人 [1-2]
- 男 [3]
- 廣東省湛江市 [7]
目錄
- 1早年經(jīng)歷
- 2創(chuàng)業(yè)經(jīng)歷
- 3家庭關(guān)系
- 4主要貢獻
- 5社會活動
早年經(jīng)歷
創(chuàng)業(yè)經(jīng)歷
家庭關(guān)系
主要貢獻
社會活動
梁文鋒,男,1985 年出生于廣東省湛江市,畢業(yè)于浙江大學(xué),信息與電子工程學(xué)碩士,研究方向為人工智能方向。他是量化私募幻方量化創(chuàng)始人、國產(chǎn)大模型企業(yè)深度求索(DeepSeek)創(chuàng)始人,是中國人工智能與量化投資領(lǐng)域的領(lǐng)軍人物,其職業(yè)生涯融合了技術(shù)創(chuàng)新與商業(yè)突破。
2008 年,在浙大讀研期間,梁文鋒開始帶領(lǐng)團隊使用機器學(xué)習(xí)等技術(shù)探索全自動量化交易。2015 年,梁文鋒創(chuàng)立幻方量化,開始在量化投資領(lǐng)域嶄露頭角。2019 年,幻方量化管理規(guī)模已超 100 億,成為國內(nèi)量化私募“四巨頭”之一。2023 年 7 月,幻方量化宣布成立大模型公司 DeepSeek,正式進軍通用人工智能領(lǐng)域。2024 年 12 月 26 日,DeepSeek 宣布上線并同步開源的 DeepSeek-V3 模型,采用 MLA(多頭潛在注意力)和 MoE 架構(gòu),訓(xùn)練成本僅為 GPT-4o 的十分之一,引發(fā)行業(yè)價格戰(zhàn)。2025 年 1 月 20 日,DeepSeek 正式發(fā)布 DeepSeek-R1 模型,該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。
職業(yè)經(jīng)歷
2008 年,在浙大讀研期間,梁文鋒帶領(lǐng)團隊探索全自動量化交易,結(jié)合機器學(xué)習(xí)技術(shù)分析金融市場數(shù)據(jù),期間曾拒絕加入大疆創(chuàng)始人汪滔的創(chuàng)業(yè)邀請。 2013 年,與同學(xué)徐進共同創(chuàng)立杭州雅克比投資管理公司,初步涉足量化投資領(lǐng)域。 2015 年,成立幻方量化,依托數(shù)學(xué)建模與 AI 技術(shù)進行量化投資,2016 年上線首個 AI 策略,2017 年全面實現(xiàn)投資策略 AI 化。 2019 年,管理規(guī)模突破百億,2021 年一度超千億,成為國內(nèi)量化私募“四大天王”之一。 2019 年,投資 2 億元自建“螢火一號”超算(1100 塊 GPU),2021 年斥資 10 億升級至“螢火二號”(萬卡級 A100 GPU 集群),算力規(guī)模媲美頭部科技公司。 2023 年,7 月成立深度求索(DeepSeek),專注于通用人工智能(AGI)與大模型研發(fā),初期資金由幻方量化支持。 2024 年,推出高性價比的 DeepSeek-V2(2024 年 5 月)和 V3(2024 年 12 月),采用 MLA(多頭潛在注意力)和 MoE 架構(gòu),訓(xùn)練成本僅為 GPT-4o 的十分之一,引發(fā)行業(yè)價格戰(zhàn)。 2025 年,1月正式發(fā)布 DeepSeek-R1,完全開源模型并公開技術(shù)細節(jié),推動 AI 技術(shù)普惠化。
核心理念
梁文鋒堅信“AI 將改變世界”,主張從基礎(chǔ)研究切入,探索 AGI 本質(zhì),而非短期商業(yè)化。提出“普惠 AI”理念,通過低價 API(如 V3 定價為 GPT-4 的 1%)推動技術(shù)普及,被喻為“AI 界拼多多”。倡導(dǎo)開源技術(shù),認為閉源護城河短暫,開放生態(tài)才能促進全球協(xié)作與技術(shù)進步。
行業(yè)影響
梁文鋒被硅谷稱為“來自東方的神秘力量”,其模型性能在數(shù)學(xué)、代碼等領(lǐng)域比肩 GPT-4o,獲 Meta 首席科學(xué)家 Yann LeCun 等國際認可。
個人風(fēng)格
梁文鋒低調(diào)務(wù)實,極少接受采訪,網(wǎng)上無公開照片,以“技術(shù)極客”形象著稱。崇尚長期主義,強調(diào)“用最長期的眼光回答最大的問題”,拒絕中庸,專注前沿探索。
總結(jié)
梁文鋒以量化投資積累的財力與算力,推動 DeepSeek 在 AI 大模型領(lǐng)域?qū)崿F(xiàn)低成本技術(shù)突破,其開源策略與普惠理念重塑行業(yè)格局。他的職業(yè)生涯體現(xiàn)了技術(shù)創(chuàng)新與商業(yè)理想的結(jié)合,被視為中國 AI 全球化競爭的關(guān)鍵人物。