梁文锋等于AI界的黄峥

梁文锋等于AI界的黄峥

本文来自微信公众号:字母榜,作家:马舒叶,剪辑:王靖,题图来自:AI生成

梁文锋指导着DeepSeek,还在不时搅拌大模子行业。

继用R1模子炸场之后,1月28日凌晨,除夜夜前一晚,DeepSeek又开源了其多模态模子Janus-Pro-7B,晓谕在GenEval和DPG-Bench基准测试中打败了DALL-E 3(来自 OpenAI)和Stable Diffusion。

随后特朗普在会议上提到DeepSeek的出现为好意思国的企业敲响了警钟,“咱们需要联结元气心灵在竞争中告成”。相隔一天,据外媒报说念,多名好意思国官员称DeepSeek是“偷窃”,正对其展建国度安全访问。

OpenAI也应时发布声明称一直知说念其他公司试图蒸馏好意思国当先公司的模子,如今“领受反制措施保护咱们的学问产权”,并暗示将和好意思国政府精良和洽保护首先进模子免受窃取。

约略梁文锋我方皆思不到,不测火出海的DeepSeek,刺痛着更多东说念主的神经。

而一年前,DeepSeek V2模子发布时,便开动被冠上AI界拼多多的名称。

反卷大厂的梁文锋,早已在AI领域复制过黄峥式“自后居上”的故事,并在国内掀翻打到骨折的大模子价钱战。

那时,在给与36氪采访中,梁文锋暗示,“咱们不是专诚成为一条鲶鱼,仅仅不防范成了一条鲶鱼。”

要是说梁文锋的鲶鱼效应,在于线路了用低资本也能高遵守训诫出AI大模子,巧合卷到了BAT。旧年一年,黄仁勋则在制造另一种鲶鱼效应,即以每6个月为周期,更新更高性能的芯片,使得短促抢不到最新GPU而掉队的巨头们,疯抢英伟达GPU,微软、谷歌、Meta、马斯克,皆被拽进了这场GPU大作战游戏里。

一年后,DeepSeek成为硅谷眼中“奥密的东方力量”,被Scale AI独创东说念主亚历山大·王(Alexandr Wang)评价说念,“以前十年来,好意思国可能一直在东说念主工智能竞赛中当先于中国,但DeepSeek的AI大模子发布可能会‘转换一切’。”

启事是DeepSeek在年前发布了新的开源模子DeepSeek R1,不仅性能追上了OpenAI o1无缺版,用550万好意思元的训诫支拨作念到硅谷参加上亿好意思元的后果。

在这场昂然前,大模子的主流叙事是英伟达高端CPU“一芯难求”,而如今,黄仁勋的销冠外传,迎来了梁文锋的正面冲击。

梁文锋所指导的DeepSeek,让好意思国华尔街开动重新谛视,在这场大模子生涯战里,英伟达芯片和高端算力的需求是否存在泡沫。这么的担忧,使得英伟达在1月27日通宵挥发近6000亿好意思元市值。

而这一切,在梁文锋看来,仅仅“按照我方的步调来作念事”,然后核算资本订价。

梁文锋并非专诚成为鲶鱼,但正如硅谷驰名风投家Marc Andreessen的评价:“看成开源相貌,这是对寰球的一份深化馈遗 。”他们神圣了多量的资本,也让好多高薪的硅谷大佬,和享受这个行业浩瀚泡沫的公司,雅瞻念扫地。

1月28日,OpenAI CEO奥特曼终于回复了DeepSeek,他夸赞DeepSeek让东说念主印象深刻,极端在于提供模子的性价比上。随后则话锋一滑,强调OpenAI将提供更好的模子,并暂停一些发布。此前,奥特曼在X上飞速发布首个智能体Operator,还开动剧透起了行将上线的o3-mini。网友戏称,“DeepSeek逼出了奥特曼的新大招。”

同期,把柄外媒爆料,DeepSeek的发布激勉了Meta的迫切加班,工程师放纵拆解代码,职工爆出其高管的薪资竟比训诫通盘V3模子的资本还高。 

2025年,不思当鲶鱼的梁文锋,结结子实搅拌了一池春水。

“大部分中国公司民风follow,而不是革命。”而在采访中,关于上一次DeepSeek激勉大模子价钱战的热议,梁文锋暗示,DeepSeek正以革命孝敬者的身份,参与到这场此前由好意思国主导的科技革命游戏里。

这位80后AI创业者,组织起一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年青东说念主,他形色团队成员们,“好多东说念主对作念接头的渴慕,远超对钱的着重。”

梁文锋将DeepSeek界说为“硬核革命”,作念最难的事,似乎成为他所指导的DeepSeek的一致默契。

在鲶鱼的外不雅之下,DeepSeek在梁文锋眼中,内里则尽是技能理思主义的叙事。

此前,梁文锋曾断言,“中国势必需要有东说念主站到技能的前沿”。而这一次,DeepSeek先踏上浪头,但不管是鲶鱼梁文锋,如故“技能理思主义者”梁文锋,要回答的问题还好多、好多。

此次DeepSeek的出圈,总少不了与OpenAI的对比。更有网友玩弄,“DeepSeek活成了真OpenAI(盛开模子),而OpenAI活成了close AI(禁闭模子)”。

试验上,奥特曼和梁文锋,皆是典型的学霸型创业者。

前者18岁考上斯坦福大学筹画机系,大二便辍学创业;后者毕业于浙江大学,2015年配置幻方量化,在采访中梁文锋提到,2022年底ChatGPT风靡时,他们就开动入手招聘了。2023年7月,梁文锋配置了DeepSeek。

梁文锋并不婉词OpenAI对他的启发性,甚而,他在不少地方皆和奥特曼展现出了惊东说念主的相似。

出售一手创办的初创公司Loopt后,奥特曼创立了风投基金Hydrazine Capital。2015年,30岁的奥特曼成为驰名孵化器YC的总裁,但在AGI(通用东说念主工智能)不被看好,融资笨重的2015年,认定深度学习远景无量的奥特曼,却和特斯拉独创东说念主马斯克共同创立了OpenAI。

梁文锋曾是币安的早期成员,并一手创办了幻方量化,看成相通有着投资阅历的创业者,梁文锋入局的2023年,大厂探入,许多创业型公司废弃了只专注通用型大模子的大处所,梁文锋却坚贞DeepSeek要专注基础模子的接头和突破。

相通,在早期,兜里没钱的奥特曼,会将“全部构建AGI”写在招聘信息里。这个那时可怕而远处的贪图,让OpenAI诱骗到了一广博年青的AGI信仰者。

“年青、有后劲”,成为奥特曼和梁文锋共同的选东说念主法式。

在梁文锋看来,要是追求短期贪图,找现成有训戒的东说念主是对的。但要是看长久,训戒就没那么紧要,基础才智、创造性、醉心等更紧要。也恰是因此,这个莫得驰名技能大牛,不在播客共享创业感悟的纯原土创业团队,成了最快追上OpenAI的军队。

甚而,在最开动,如同配置之初以非牟利为主意的OpenAI,交易化也并未写入DeepSeek的to do list。

在这点上,奥特曼与梁文锋相通有着一致的思法。

“OpenAI早期投资东说念主投钱时,思的一定不是我要拿回些许报告,而是果真思作念这个事。”在采访中,梁文锋面临大模子烧钱的关联发问暗示,要是一定要找一个交易上的意义,(一个交易公司去作念一种无尽参加的接头性探索),可能是找不到的,因为划不来。从交易角度来讲,基础接头参加报告比很低。

但“一件振奋东说念主心的事,约略弗成单纯花钱揣摸。就像家里买钢琴,一来买得起,二来是因为有一群急于在上头弹吹打曲的东说念主。”

如今,梁文锋的AGI梦思仍是升沉了通盘硅谷。

不外,也曾以非牟利为主意的OpenAI,但愿抵抗大公司的AI霸权,奥特曼随后引入微软的大量投资。在奥特曼的主导下,OpenAI将成为一家确切的牟利性企业。此自后者的梁文锋,却恒久援救模子开源,并但愿更多东说念主,哪怕一个小APP皆不错低资本用上大模子,而不是技能只掌合手在一部分东说念主和公司手中,变成驾御。

对创立初便以AGI普惠全东说念主类为职责的OpenAI来说,奥特曼曾射出这颗枪弹,如今时隔10年,正中我方的眉心。

从这少量来看,比拟起作念一条鲶鱼,技能理思主义者的标签,似乎更符合梁文锋。

但不思成为鲶鱼的理思主义者梁文锋,却不测两次“卷到了”总共东说念主。

第一次,DeepSeek成了激勉中国大模子价钱战的泉源。

在被AI联接轰炸的2024年5月,DeepSeek风生水起。启事是它们发布的一款名为DeepSeek V2的开源模子,号称价钱屠户:推理资本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七极端之一。

DeepSeek凭借超绝性价比成了“AI界拼多多”,BAT们也被卷得坐不住,纷纷降价。中国大模子价钱战由此一触即发。

起先智谱AI跟进,将初学级居品降价,随后字节将旗舰模子降到和DeepSeek同价,接着阿里、腾讯等速即跟上。

尽管,除了同为DeepSeek独创东说念主的徐进毕业于竺可桢学院,是黄峥的学弟,DeepSeek与拼多多并无更多交加。

一情绪着“让AI变成东说念主东说念主不错用得起的东西”的梁文锋,甚而诧异于大厂的跟进动作,毕竟“大厂的模子资本比咱们高好多,是以咱们没思到会有东说念主亏钱作念这件事。”

而第二次,DeepSeek激勉了硅谷地面震。

更低资本、不输OpenAI熟悉模子的遵守,梁文锋指导下的DeepSeek再次坐稳了“AI界拼多多”的宝座,何况告成出海。

当前,DeepSeek官方尚未公布训诫推理模子R1的无缺资本,但官方公布了其API订价,R1每百万输入tokens在1元~4元东说念主民币,每百万输出tokens为16元东说念主民币。看成对比,OpenAI o1的运行资本约为前者的30倍。

换言之,梁文锋以不到极端之一的资本,作念出了硅谷需要上亿参加才能烧出的大模子。

硅谷的升沉险些是势必的。除了被拿来全面临标的OpenAI,首当其冲的是Meta。以“大模子开源之王”为title的Meta,里面职工匿名发布音信称,Meta的生成式AI部门正因DeepSeek处于慌乱中,甚而爆料称尚未发布的新一代开源模子Llama 4,在基准测试中仍是逾期于DeepSeek。

a16z搭伙东说念主、AI大模子Mistral董事会成员 Anjney Midha更是发文说说念,从斯坦福到麻省理工,DeepSeek R1险些通宵之间就成了好意思国顶尖大学接头东说念主员的首选模子。

与此同期,梁文锋指导的DeepSeek正撬起OpenAI的墙角。

企业级AI代理开导商SuperFocus的长入独创东说念主暗示,比拟起正在使用的OpenAI旗舰模子GPT-4,DeepSeek提供的撑持不仅相似,甚而更好。“SuperFocus可能会在异日几盘活向DeepSeek,因为DeepSeek不错免费下载、在自家做事器上存储和运行,并将加多销售居品的利润率。”比OpenAI低廉30倍的API价钱,让梁文锋一不防范就出了海。

同期,看成纯原土团队的DeepSeek火了,梁文锋领军年青中国团队,无国外布景却硬刚硅谷巨头的叙事成了流量密码。

爆火之下,梁文锋还需要回答更多的新问题。

字母榜尝试让DeepSeek看成又名记者,对梁文锋提一个问题,这是DeepSeek的回答:

“DeepSeek声称其模子训诫资本仅为行业1/10,但有开导者指出,这可能是通过大幅缩减模子参数范围或依赖幻方早期囤积的低价算力竣事的,而非确切的技能突破。您是否承认这种‘资本上风’本体是金融资源套利,而非算法革命?”

令东说念主惊讶的是,这个由DeepSeek问出的问题,险些不错玄虚如今围绕着DeepSeek的大部分争议。

正如ChatGPT横空出世让OpenAI成为当之无愧的AI头部企业,英伟达的GPU凭借高性能成为算力基础,让黄仁勋享尽高光,当前,DeepSeek的R1模子,却只可线路梁文锋有才智作念出一个和OpenAI最新模子出入无几的模子。

在采访中,梁文锋不啻一次地提到但愿攻击硅谷的科技驾御,但愿站在“技能的前沿”,但作念一个和OpenAI最新模子出入无几的模子,还远谈不上确切的高出,R1仍然是对OpenAI的效法和跟从。

DeepSeek爆火之下,冲浪达东说念主马斯克一直苦衷地并未发表驳斥,却在最近点赞了一则推文。

推文中提到了DeepSeek多量依赖模子蒸馏技能,需要借助ChatGPT-4o和o1才能完成训诫。

尽管模子蒸馏是一项常见的技能技能,能够将OpenAI中的多量数据飞速索取重心并快速清醒和行使,但这种款式只可让DeepSeek接近OpenAI,而难以确切高出OpenAI。

更无用说,尽管宣扬我方是技能理思主义,梁文锋的背后是量化私募巨头幻方,是BAT以外独一能够储备万张A100芯片的公司。据“财经十一东说念主”报说念,2023年时国内领有逾越1万枚GPU的企业不逾越5家,其中便包括幻方。

而能够用极端之一的资本作念出同等范围的大模子,也恰是基于梁文锋的实验室仍是参加了数亿好意思元作念前期接头,并领有大范围的芯片。思成为AI界拼多多,平凡AI创业团队险些难以复现梁文锋的旅途。

图注:X上有计划deepseek的meme图,图源:X平台

需要详情的是,站在OpenAI这个巨东说念主的肩上,梁文锋指导DeepSeek竣事了一场颇为惊艳的解围,但什么时候能够赶在OpenAI前边推出异日一代模子,如GPT-5,那时才是梁文锋技能理思的AHA时刻。

彼时,莫得OpenAI作念坐标,梁文锋还能否不时靠低资本战略作念出性能强劲的大模子,才是恭候DeepSeek的更大训诫。

梁文锋曾这么先容我方,在广东一个五线城市长大,父亲是小学浑朴。“九十年代,广东收成契机好多,那时有不少家长到我家里来,家长以为念书没用。但当前且归看,不雅念皆变了。因为钱不好赚了,连开出租车的契机可能皆没了。一代东说念主的时刻就变了。”

梁文锋充满信心,在他看来,以后的硬核革命会越来越多。“咱们仅仅还需要一堆事实和一个经过。”

如今,外界皆在期待梁文锋和DeepSeek会是阿谁经过之一。

参考资料:

《揭秘DeepSeek:一个更极致的中国技能理思主义故事》 暗涌Waves

 《放纵的幻方:一家隐形AI巨头的大模子之路》 暗涌Waves

《DeepSeek推翻两座大山》 字母榜

本文来自微信公众号:字母榜,作家:马舒叶






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图