DeepSeek利空算力？

发布日期：2025-03-05 06:57 点击次数：63

DeepSeek利空算力？

其实具体逻辑，从12月deepseek v3到这周的r1，咱们前前后后分析过许屡次了，不妨转头梳理下

1. 国外粗拙援用的550万好意思金是v3，而不是r1的考试本钱，且550万仅仅v3骨子考试本钱的零头。v3论文原话：上述本钱仅包括DeepSeek-V3 的正经考试，不包括与架构、算法、数据联系的前期考虑、消融施行的本钱。社群内一位算法工程师就曾说“v3用了幻方我方的r1模子生成数据，这个部分的反复尝试要不要算在本钱里呢？”一个理由。

2. 前沿探索和后发追逐，所需要的算力本就不是一个量级。施展为考试统一代模子所需算力每隔N个月即是指数级裁减。原因包括算法自身的逾越（FP8、夹杂MoE）、算力的合手续通缩、复现纪律如蒸馏等对数据的浓缩。最枢纽的是，探索就意味着会有奢靡，此后发追逐“站在巨东谈主肩膀上”本就不错侧目奢靡。就比如o1的考试本钱信服远超GPT-4，幻方r1的考试本钱信服也非常v3。而从o3到o4/o5，从r1到r2/r3，考试算力只会更多。

3. 单次考试降本了，不代表合座考试本钱会着落。考试戒指提高，施行室就减少进入吗？不会，着实逻辑是：基于更高戒指，榨干算力，去洗劫更大收益。就拿幻方来说，infra优化降自身手这样强、提前囤卡也挺多、没怎样膨胀API行状专注于考虑与考试的情况下，依然还在缺卡。横向对比之下，北好意思某些花了更多钱的施行室，的确显得很无语...但他们之后就降本增效吗？不会。消化领受幻方开源的纪律+比幻方多得多的算力=洗劫智能的更大擢升。考试算力最应该顾忌的是撞墙，算力使用戒指提高，反而可能是提高了模子自身的天花板。

4. 幻方代表的是悉数开源相对闭源的一次凯旋。对社区的孝顺会快速转念为悉数开源社区的振作。要是的确说利空的Loser，那可能是闭源模子。中国这极少照旧提前资格了，被Llama诈骗的懦弱，跑不外Llama3的中国闭源模子公司被动倒闭、转应用、转开源。而今天中国开源打到了北好意思闭源...要是当今还不如r1（以及行将到来的r2 r3），那这家公司的API价值基本归0。但说真话这个经过的确会让模子考试参与方快速缩减。

5. 最枢纽的，以上经营皆是考试，而改日昭彰更大需求来自推理。有极少被大家忽略了，幻方对推理本钱的消减，比考试来的更为震荡。今天大家皆看到了AMD晓示救助幻方v3，用咱们嘉宾Y博的话即是：DeepSeek架构的优雅之处就在于，和圭臬的transformer架构相比起来, 并莫得引入极端的算子。表面上不错相对卤莽救助多样类型卡...（这亦然被GPU禁运逼出来的）大家体会下这句话的重量，以及关于CUDA的启示...幻方这帮东谈主皆是手撸算子的天才...

推理本钱裁减，对算力是利好照旧利空？比考试更好相识。请对比：刚推出来贵到没东谈主用的o1，以及掀翻API价钱战之后的豆包。推理本钱的裁减约略率会带来应用的振作，反而会拉动更大的算力需求。

这里再援用下星球Y博的批驳，当今回头看相称前瞻：DeepSeek-V3将救助罕见部署和自主微调，为下流应用提供弘大于闭源模子期间的发展空间。改日一两年，约略率将见证更丰富的推理芯片居品、更振作的LLM应用生态。

6. 如何均衡北好意思仍在放荡的基建，和往常奢靡的投资？好意思国的确CSP仍在放荡抢电，皆抢到2030年去了。其实各大CSP往常2年千亿好意思金砸下去，莫得一家单纯是为了考试，基本皆是自身业务需求+推理业务增长脱手。只须微软为OpenAI准备的算力credit、AWS算力租借给了下旅客户用于考试、Meta/xAI部分算力用于自身考试，但算力大头皆是因为自身的推选系统业务/自动驾驶业务自身需求。以及微软照旧绝顶于阻隔了Sam Altman赓续All in的诉求，转而聚焦通告更细办法推理（Satya亲口这样说）。

因此幻方这件事对北好意思CSP来说，客不雅来讲，往常某些考试进入的确是吊水漂了。为冒险、探索新市集付出的必要本钱。但看改日，开源的合座振作一定最终是利好这些“中间商”。之前咱们推崇过，他们其实不是切身冒险的矿工，他们仅仅铲子的搬运工，以及基于这些模子（不管开源or闭源）开拓更具交易价值的应用生态。卡并不仅仅用于考试，越来越大比例会挪到推理。假如考试的高效让模子更快逾越，应用生态愈加振作，他们怎样可能不赓续投呢？

临了，赓续援用下《the bitter lesson》：永恒来看，算力才是信得过的决胜身分。历史的警告一次又一次地警告咱们，AI考虑者相似试图将东谈主类的常识扎眼到AI算法中，这种作念法在短期内时常灵验，而况带来个东谈主配置感和虚荣心。但永恒来看，它会酿成瓶颈，以致重荷进一步发展。最终的粉碎性进展时时源于一种迥然相异的想路，即通过搜索和学习来扩展算力规模。而那些最终的得手时时伴跟着苦涩，难以被下咽，因为算力的得手，意味着对咱们以东谈主类为中心的固有想维和虚荣心，是一记响亮的耳光。

本文作家：信息平权，开始：信息平权，原文标题：《DeepSeek利空算力？》

风险辅导及免责条件市集有风险，投资需严慎。本文不组成个东谈主投资提倡，也未辩论到个别用户极端的投资办法、财务景色或需要。用户应试虑本文中的任何认识、不雅点或论断是否稳健其特定景色。据此投资，包袱沸腾。

热点资讯