本文来自:凤凰网科技,作家:Danny、董雨晴
OpenAI的最强敌手出现了,这一次来自中国。
2025年一开年就火遍各人的DeepSeek(深度求索),1月20日晚演出了一场“偷袭珍珠港”——发布推理模子 DeepSeek-R1 郑再版,同步开源模子权重,并允许用户利用模子输出、通过模子蒸馏等容颜磨真金不怕火其他模子。这款大模子在数学、代码、当然话语推理等任务上,性能并列OpenAI o1郑再版。
R1版块的推出,在国外被惊呼“这才是实在的灵通的东谈主工智能”。英伟达高等研讨科学家Jim Fan在评价R1模子时就这么说谈:“咱们糊口在这么一个时期:一个不是好意思国公司的AI企业却已毕了 OpenAI成速即的责任——作念实在灵通的前沿研讨、为总共东谈主赋能。”
凤凰网科技在此前的著述《英伟达的最大空头出现了》中曾详备先容过深度求索(DeepSeek)和其系列大模子的中枢竞争力来源,如今看来,DeepSeek的改动含金量还在飞腾。
跟着DeepSeek的改动实力成为各人热议议题,外界也愈发形态,这家中国脉土科技公司偏激背后的掌舵东谈主,究竟有何格外之处?
一个浙大学霸,勇闯无东谈主区
1985年,梁文锋诞生于广东湛江的一个五线城市。其具体的童年景长轨迹已不能考,从公开信息独一可知的是,梁文锋有在采访中提到过我方的父亲是别称小学安分。
2002年,17岁的梁文锋凭借优异收货考入浙江大学电子信息工程专科。2007年,22岁的梁文锋又考上了浙江大学信息与通讯工程专科硕士。师从项志宇,主要作念机器视觉研讨。
2008年,23岁的梁文锋在浙江大学攻读硕士学位期间,与同学组建团队,运行蚁合阛阓行情、金融阛阓有关数据以及宏不雅经济数据。这一年,他指导团队愚弄机器学习工夫探索全自动量化交游,而其时正好各人金融危境的爆发。
有音问称,大疆创举东谈主汪滔曾邀请梁文锋共同创业,彼时大疆正处于起步阶段。要是梁文锋加入,好像也能在大疆的发展中已毕钞票解放。但梁文锋确信东谈主工智能将改变天下,最终决定寂寥创业。
2010年6月,25岁的梁文锋从浙江大学信息与通讯工程专科硕士毕业,其毕业论文题目为《基于低成本PTZ录像机的方针追踪算法研讨》。
硕士毕业后的第三年,28岁的梁文锋将东谈主工智能与量化交游连续,和浙江大学的徐进学友创立了雅克比投资(杭州雅克比投资惩处有限公司)。2015年,他们共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产惩处有限公司,次年又建立了宁波幻方量化投资惩处合资企业(有限合资)。
所谓量化投资,粗浅地说就是用规划机取代东谈主,通过数目化容颜,算作化发出买卖辅导,投资收益较为健硕。
过程几年时期,幻方量化就在国内飞快崛起。2016年10月,幻方量化推出第一个AI模子,第一份由深度学习生成的交游仓位上线推论。到2017年底,简直总共的量化战术王人选用AI模子规划。2019年,幻方量化惩处范畴打破百亿,成为国内量化私募“四巨头”之一。
尔后的幻方量化以致一度成为中国首家打破千亿的私募量化大厂,准确地说亦然迄今为止业内独一范畴曾迈过千亿大关的量化私募。这期间梁文锋在量化投资范围累积了纷乱的工夫实力和算力资源,幻方量化以纷乱的算力扶直闻明。
2023年,各人东谈主工智能飞扬爆发,梁文锋也来到了他创业之路的第十个岁首。
当年5月,38岁的梁文锋通知要作念通用东谈主工智能(AGI)。7月,杭州深度求索东谈主工智能基础工夫研讨有限公司(DeepSeek)建立,专注于AI大模子的研讨与开发。梁文锋也成为量化投资者投身AI创业的“第一东谈主”。
之后等于爽文脚本式的“AI界拼多多”崛起之路,就连大厂也只但是跟从,“在豆包和阿里云之前,DeepSeek最先在全网镌汰了模子成本”,一位AI算法工程师对凤凰网科技暗示,这让他印象终点潜入。
2024年5月,DeepSeek发布的DeepSeek V2的开源模子起初拉起了行业内的价钱战。DeepSeek V2提供了一种史无先例的性价比:推理成本被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。
同庚12月26日,只是时隔7个月,DeepSeek就又发布了DeepSeek V3,再次颠覆了行业关于价钱的走漏。DeepSeek V3的API订价为输入每百万tokens 0.5元(缓存掷中)/2元(缓存未掷中),输出每百万tokens 8元,与字节Doubao-pro-256k订价输入每百万tokens 5元,输出每百万tokens 9元的水平终点,在国产模子中性价比链接进步。
如今,当行业还千里浸在DeepSeek V3的漂泊中时,DeepSeek-R1郑再版又来了。这一次,DeepSeek实在激发了硅谷的心焦。
微软CEO萨蒂亚・纳德拉在瑞士达沃斯天下经济论坛上暗示:“看到DeepSeek的新模子,果真令东谈主印象终点潜入。他们切实灵验地开发出了一款开源模子,在推理规划方面说明出色,且超等规划效果极高。”
“咱们必须终点、终点崇拜地对待中国的这些进展,”纳德拉说。
DeepSeek的贵重之处,仍是改动
“DeepSeek的确有过东谈主之处,业内王人以为他们可能是用了一些o1的数据作念蒸馏,但在算法层面作念了更好的改动”,一位行业从业东谈主士认为。
在刚刚建立的一年多时期里,DeepSeek一直不声不吭,据凤凰网科技了解,这家公司以致莫得开拓公关团队。以至于,当大批大模子公司王人在争声量,抢时期的时候,DeepSeek在闷声尝试改动。
DeepSeek的改动亦然从下到上,简直存在于通盘公司里面。比如,时于当天,梁文锋的日常依旧是看论文、写代码、参与小组筹办。是少有的能堪比一线研讨员材干的公司掌舵者。
由于一运行的方针就是AGI,是以DeepSeek从来不作念跟从战术,即像其他营业类公司一样,遴荐奴才各人最先进的模子,用短平快的容颜作念好应用,而是在模子结构层面作念从0-1的改动。
在吸收《暗涌》采访时,梁文锋曾经明确地抒发,“因为咱们觉适宜今最贫乏的是参与到各人改动的波浪里去。往日许多年,中国公司风气了别东谈主作念工夫改动,咱们拿过来作念应用变现,但这并非是一种理所固然。这一波波浪里,咱们的起点,就不是顺便赚一笔,而是走到工夫的前沿,去鼓吹通盘生态发展”。
往日,碍于东谈主才组成和成本实力,中国企业作念的连续是有限的改动,但现如今,强如字节等企业,如故非凡百亿好意思元范畴的年度利润。据凤凰网科技此前获悉,字节豆包大模子团队已在里面组建AGI永恒研讨团队,代号“Seed Edge”。
这意味着,改动已不再是难题,难的是怎么保执东谈主才密度,以及领有自信。
据多位与DeepSeek有过战争的行业东谈主士表述,DeepSeek的上风之处就在于东谈主才密度极高,且多来自于中国脉土阛阓。
“DeepSeek从一运行团队就是百东谈主傍边范畴,但个个王人很抗打”,一位AI行业猎头对凤凰网科技暗示,“其实早期Kimi曾经思走这个门道,只是莫得格外奏效。”
另一位与DeepSeek有过战争的行业东谈主士称,“DeepSeek给出的薪酬待遇终点具有竞争力,这让其一直对东谈主才有很强的眩惑力”。
此前据多家媒体报谈,雷军曾躬行着手“挖deepseek的东谈主”,支付的薪酬则在千万元级别。这个东谈主恰是DeepSeek-V2的要道开发者之一罗福莉,一个95后。
据量子位整理贵寓发现,DeepSeek团队最大的特色就是年青。应届生、在读生,格外是来自清北的应届生在其中终点活跃。
“只招1%的天才,去作念99%中国公司作念不到的事情。”口试过DeepSeek的应届生这么评价其招聘格调。
这也使得DeepSeek全员潦倒,王人保执着极致的改动能源。
梁文峰在吸收《暗涌》采访时不异抒发过一个不雅点:DeepSeek在招东谈主时主要看材干,而不是看熏陶。“咱们的中枢工夫岗亭,基本以应届和毕业一两年的东谈主为主”。而况梁文锋还抒发,“V2模子莫得国外记忆的东谈主,王人是原土的。前50名顶尖东谈主才可能不在中国,但也许咱们能我方打造这么的东谈主。”
和上一代功成名就的故事不同,DeepSeek代表的是一个硬核改动时期的到来。上一代的奏效东谈主士是属于互联网的,他们在工夫层面的打破并未几,更多是拼速率、拼成本、拼范畴。
一个可喜的信号是,DeepSeek不是孤例,不异来自杭州原土阛阓,宇树科技最新推出的机器东谈主B2-W不异惊艳各人,宇树科技的创举东谈主兼CEO王兴兴,本科就读于浙江理工大学机械与自动欺压学院机电专科,本科毕业后插足上海大学攻读机械工程专科研讨生。
咱们也有原理信赖,中国科技改动的故事如故翻入了新一页。
参考贵寓
1. 揭秘DeepSeek:一个更极致的中国工夫理思看法故事,暗涌Waves,作家:于丽丽
2. 全网王人在扒的DeepSeek团队,是清北应届生撑起一派天,量子位
3. DeepSeek创举东谈主梁文锋,广东东谈主,仅靠百名中国算作员,赶超OpenAI,CEO来信