梁文鋒:從三線小城起步!憑啥讓DeepSeek成AI界“拼多多”? 基金百科 2025-01-23 11:55 廣東 摘要 • 幫你速讀文章內容 梁文鋒是幻方和九章私募創(chuàng)始人,開發(fā)AI大模型DeepSeek,以低成本高性能著稱。他從廣東小城到浙大,后創(chuàng)立兩家量化私募,管理資金超千億。DeepSeek憑借價格優(yōu)勢和技術實力脫穎而出,致力于縮小國內外AI技術差距。 摘要由作者通過智能技術生成 有用 投資者們大家好!在當今私募界創(chuàng)始人中,有一位低調的神秘大咖——梁文鋒。 他不但是幻方和九章兩家百億量化私募的創(chuàng)始人,還開發(fā)了國內首屈一指的AI大模型深度求索(DeepSeek)。 DeepSeek兼具低成本+高性能,在業(yè)內享有AI界“拼多多”的美譽。 1、量化界學霸,從三線小城到浙江大學 1985年,在廣東湛江這座充滿生活氣息的三線小城,梁文鋒誕生了。 他的成長環(huán)境雖未被過多提及,但父親作為小學老師,在他的學習之路上起到了啟蒙與引導的作用。 自幼,梁文鋒便對數學建模展現出濃厚的興趣,這顆興趣的種子在他心中不斷生根發(fā)芽,成為他日后投身科技領域的原始動力。 2002年,年僅17歲的梁文鋒憑借著優(yōu)異的成績考入了浙江大學電子信息工程專業(yè),開啟了他的學術之旅。 2008年,他留在浙大繼續(xù)攻讀信息與通信工程碩士學位,并專注于機器視覺研究。 在上大學時,梁文鋒就篤定:AI一定會改變世界。 2、兩家量化巨頭創(chuàng)始人,規(guī)模突破千億 2008年,全球金融危機的風暴席卷而來,金融市場陷入一片混亂。 然而,梁文鋒卻在這片混沌中看到了機遇的曙光。 他與同學攜手,毅然踏入量化交易的領域,開啟了探索全自動量化交易的征程。 在這個過程中,他們面臨著數據匱乏、技術不成熟等諸多難題,但憑借著對市場的獨特理解和對技術的執(zhí)著追求,他們逐漸積累起了寶貴的經驗和數據資源。 2015年,隨著中證500股指期貨的上市,中國量化私募進入了2.0時代。 梁文鋒順勢而動,與同學徐進共同創(chuàng)立了九章資產。 在創(chuàng)業(yè)初期,公司僅有10張GPU顯卡,但他們憑借著先進的技術和創(chuàng)新的策略,在市場中逐漸嶄露頭角。 此后,他們不斷擴大團隊規(guī)模,提升技術實力,公司管理的資金規(guī)模也迅速增長。 2016年,梁文鋒又成立了幻方量化,進一步鞏固了在量化私募領域的地位。 在他的帶領下,幻方量化短短4年成為管理資金超百億的私募巨頭,又用2年成長為千億量化私募,與九坤投資、明汯投資、靈均投資一同被譽為量化私募領域的“四大天王”。 這一成就的背后,是梁文鋒無數個日夜的辛勤付出和對技術創(chuàng)新的不懈堅持。 據私募排排網,截至2024年底,九章資產、幻方量化展示業(yè)績的14只產品管理規(guī)模合計25.52億元,2024年收益均值為12.21%,近三年收益均值為15.28%,近五年收益均值為121.25%。 值得一提的是,其中一只由徐進管理私募產品2024年收益為26.25%,大幅跑贏同期滬深300指數。 (圖:梁文鋒出席總理座談會,來自公開資料) 3、“AI界的拼多多”!Deepseek何以殺出重圍? 2023年,梁文鋒做出了一個大膽的決定,他跨界進入AI大模型領域,創(chuàng)立了深度求索(DeepSeek)。 這一舉措在當時引起了業(yè)界的廣泛關注和熱議。 圖片來源:DeepSeek官網 2024年5月,DeepSeek發(fā)布了混合專家語言模型DeepSeek-V2,其API定價極具競爭力,僅為GPT-4Turbo的百分之一。 這一價格優(yōu)勢引發(fā)了一眾互聯(lián)網大廠的價格調整潮,因此,DeepSeek也被稱為AI界“拼多多”。 同年12月,DeepSeek-V3重磅推出,在多項性能測試中表現卓越,在數學、代碼能力和中文知識問答等方面超越了眾多國內外知名大模型,而其訓練成本卻僅為557.6萬美元。 圖片來源:DeepSeek官網 相比之下,OpenAI訓練ChatGPT-4o的成本高達7800萬美元甚至更多,成本優(yōu)勢高達十余倍。 DeepSeek的成功,不僅在于其強大的技術實力和創(chuàng)新能力,更在于梁文鋒獨特的人才管理策略。 他組建了一支純粹的本土研發(fā)團隊,成員大多是應屆畢業(yè)生或畢業(yè)不久的年輕人,他認為這些年輕人基礎能力強、富有創(chuàng)造力且充滿熱情,更能適應快速發(fā)展的技術創(chuàng)新需求。 在他的帶領下,DeepSeek正逐漸成為AI領域的一支重要力量,為中國在全球AI競爭中贏得了一席之地。 4、梁文鋒公開發(fā)言一覽 1、我們做大模型,其實跟量化和金融都沒有直接關系。 2、幻方的主要班底里,很多人是做人工智能的。當時我們嘗試了很多場景,最終切入了足夠復雜的金融。 3、通用人工智能可能是下一個最難的事之一,所以對我們來說,這是一個怎么做的問題,而不是為什么做的問題。 4、一個東西能不能讓社會的運行效率變高,以及你能否在它的產業(yè)分工鏈條上找到擅長的位置。只要終局是讓社會效率更高,就是成立的。 5、創(chuàng)新需要盡可能少的干預和管理,讓每個人有自由發(fā)揮的空間和試錯機會。 6、創(chuàng)新往往都是自己產生的,不是刻意安排的,更不是教出來的。 7、中國的AI不可能永遠跟隨,需要有人站到技術的前沿。 8、盡管面臨競爭壓力,Deepseek仍選擇專注在研究和技術上,未做toC應用,也未全面考慮商業(yè)化。 9、對未來AGI的實現時間持樂觀態(tài)度,認為中國在硬核技術創(chuàng)新方面將越來越重要。 10、我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚。 11、搶用戶并不是我們的主要目的。我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另-方面也覺得無論API還是A1,都應該是普惠的、人人可以用得起的東西。 12、如果目標是做應用,那沿用Llama結構,短平快上產品也是合理選擇。但我們目的地是AGI,這意味著我們需要研究新的模型結構。 13、我們要做的,正是不停地去縮小國內外在AI技術上的差距。 14、因為我們覺得現在最重要的是參與到全球創(chuàng)新的浪潮里去。 15、考慮到我國股市發(fā)展、衍生品發(fā)展以及私募海外市場投資布局,萬億規(guī)模的量化私募是可能出現的。 16、傳統(tǒng)上,所有的模型都是多因子模型,通過選股和擇時來獲取超額收益。 17、2017年之后,行業(yè)發(fā)生變化,傳統(tǒng)的多因子框架逐漸被人工智能取代。 18、量化投資目前主要是賺技術面流派原來賺的錢。未來,程序最終也要搶奪基本面流派原來賺的錢。 以上就是對梁文鋒的相關介紹。需注意的是,本文所涉的文章觀點,僅代表筆者個人觀點,不代表本平臺的任何立場,不構成任何基金推薦及投資建議,個股過往數據不預示未來表現,投資需謹慎。想了解更多投資理財知識資訊,請給小編點贊關注。