中国“AI界拼多多”Deep Seek崛起冲击美股 芯片巨头英伟达股价暴跌17% 网友调侃:中国股民做出贡献!

2025-01-28     来源: 狐瞰

资料图:量化巨头幻方创始人梁文锋参加总理座谈会并发言

本文综合红星新闻、新黄河、证券时报、第一财经、观察者网、金融界等

似乎就在一夜之间,来自中国的AI创业公司DeepSeek(深度求索)在大洋彼岸全面“破圈”。

实际上,被称为“AI界拼多多”的DeepSeek背后并是不什么互联网科技大厂,而是来自金融领域的头部量化:幻方量化。记者深入探究DeepSeek创始人梁文锋及其团队的核心成员,揭开它如何从一个默默无闻的小公司,一步步崛起成为震动全球AI圈的“东方神秘力量”的背后故事。

1

DeepSeek崛起

性能优于OpenAI 训练成本仅其1/10 对开发者收费仅其1% 英伟达股价大跌17%

当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。

因受到DeepSeek人工智能模型冲击,纳斯达克综合指数跌幅达3.07%。人工智能主题的美股龙头企业英伟达公司股票暴跌近17%,市值蒸发5927亿美元,创下美股史上最大单日市值损失纪录。

此外,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。

市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位

美国媒体分析认为,DeepSeek开发的模型在多项测试中表现都优于OpenAI,且成本不到600万美元。这引发了市场对美股人工智能股票估值虚高和算力需求的担忧,从而抛售美股相关股票。

据悉,DeepSeek今年1月20日发布的R1模型,其训练只调用了2000余块显卡,为期53天,总的训练成本仅为558万美元,不到其他世界顶级大模型一次训练成本的十分之一

除了性能优异,DeepSeek作为一个开源模型,对终端用户始终免费开放,而它对于开发者调用API的收费定价水平几乎为Open AI的百分之一

目前,DeepSeek的人工智能助手已取代OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。

受到规模定律(Scaling Law,即计算规模越大、训练数据量越多,模型越智能)的影响,全球AI大模型的开发长期以来陷入了一场关于顶尖人才、先进算力和巨额投资的“军备竞赛”。数据显示,微软是英伟达的第一大买家,购买了48.5万块英伟达旗舰产品Hopper芯片,占后者过去一年收入的20%。Meta排第二,去年购买了22.4万块GPU;而亚马逊和谷歌预计分别购买19.6万和16.9万颗Hopper芯片。

2

创始人梁文锋

85后“老股民”从量化投资起家 6年登顶千亿私募大佬

据湛江发布,DeepSeek创始人梁文锋是广东省湛江市吴川市覃巴镇米历岭村人,父母都是小学语文老师。“85后”的梁文锋从小就是“学霸”,在数学方面天赋突出。同学们反映,梁文锋并非“书呆子”类型,而是很有独立思考的精神。

2002年,17岁的梁文锋凭借优异成绩考入浙江大学电子信息工程专业。2007年,22岁的梁文锋又考上了浙江大学信息与通信工程专业硕士,师从项志宇,主要做机器视觉研究。

2008年,在浙大读书期间,23岁的梁文锋与同学一起组团队开始积累市场行情数据、金融市场其他相关数据以及宏观经济等数据。

2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业,其毕业论文题目为《一种鲁棒的PTZ摄像机目标跟踪算法》。

毕业后,他没有像周围人一样去大厂做个程序员,当时推崇“量化投资之父”西蒙斯的他和朋友一起在成都的廉价出租屋里刻苦钻研,不停接受进入诸多场景中尝试的挫败,最终切入了最复杂场景之一的金融,想要找到对股票价格建模的方法。

2010年,沪深股指期货推出,这给了梁文锋充分发挥计算机建模天赋的机会。很快他的自营资金盘就达到了5亿元的水平。2015年,梁文锋与校友一起共同创立幻方量化,在A股市场系统性地进行量化交易。2021年,幻方量化的资产管理规模达到千亿水平,被誉为国内四大顶级量化私募之一。

3

DeepSeek团队

90后、95后为主,喜欢“高潜力年轻人”

幻方量化的成功离不开人工智能的深度融合,梁文锋很早就产生了用AI自动制定量化交易策略的想法,并坚持不懈地付诸实践。

2020年,英伟达发布了A100芯片,这是英伟达下一代旗舰作品,而幻方量化成为亚太地区第一批拿到货的客户。幻方量化多年来不仅储备了大量的尖端芯片,而且在软件算法层面不断推陈出新,这给梁文锋在AI领域的创业奠定了扎实的基础,2023年7月他创立了DeepSeek(全称“杭州深度求索人工智能基础技术研究有限公司”)。

在刚刚成立的一年多时间里,DeepSeek一直不声不响,V2模型的发布成为其破圈的关键。

2024年5月发布的DeepSeek V2提供了一种史无前例的性价比:推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一,DeepSeek因此被业内戏称为“AI届拼多多”。此外,因为其低调的作风,DeepSeek又被称“来自东方的神秘力量”。

据报道,创始人梁文锋是浙江大学信息与通信工程专业的硕士,在他带领下的DeepSeek对人才极其看重,不看经验,只看能力。

据多位与DeepSeek有过接触的行业人士表述,DeepSeek的优势之处就在于人才密度极高,且多来自于中国本土市场。

据报道,DeepSeek的员工规模不到140人,是Open AI的十分之一左右。据领英网站检索样本发现,DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。该公司成员大多毕业于北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。同时DeepSeek的员工中也有相当一部分具有交叉学科背景。

4

各方观点

硅谷AI大佬对Deep Seek刮目相看 网友调侃:中国股民做出贡献!

各方如何看待一夜爆红的Deep Seek?

DeepSeek的横空出世,让硅谷多位AI大佬刮目相看,无论是微软CEO还是OpenAI的投资人都公开表达,DeepSeek-R1作为开源模型在推理计算能力的出色表现,令人印象深刻。

最新消息显示,美国总统特朗普也就此表态称,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利。”

AI芯片巨头英伟达公司周一发表声明称,DeepSeek发布的新模型是一项“出色的AI进步”,并暗示符合美国技术出口管制规定。

近日,美国人工智能数据基础公司Scale AI创始人兼首席执行官Alexandr Wang受访时表示,DeepSeek最新的模型确实试图改变美国在人工智能领域一直处于领先地位的局面。

关于中美人工智能领域的竞争,DeepSeek创始人梁文锋此前接受媒体采访时表示,中国AI不可能永远处在跟随的位置。“我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”

他认为,英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。

资料图:梁文锋

对于Deep Seek的出圈爆红,更令人震惊的是,如此厉害的大模型,竟不是互联网科技巨头研发的,而是来自金融领域的头部量化——幻方量化。幻方量化曾是中国首家突破千亿私募的量化大厂。

这着实惊呆不少网友:国内最牛的AI巨头(之一),竟然是炒股的?看到这里,不少网友可能就会发出感叹:怪不得炒股赚不到钱,原来自己做交易的对手竟然是电脑,论计算,普通人怎么比得过电脑?还有网友直接将其比作是:核动力镰刀

也有网友调侃,中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱,然后幻方量化创始人有钱买最好的GPU,收纳一批中国最牛的精英,做出了不错的Deepseek。