IT之家 2 月 12 日音讯,据 ZDNET 2 月 10 日报说念,AI 芯片厂商 Cerebras 的 CEO Andrew Feldman 接纳采访时说,该公司也曾被运行 DeepSeek-R1 大讲话模子的订单压垮。
据IT之家此前报说念,Cerebras 曾推出用于 AI 的晶圆级芯片,一块芯片就提供 125 PFLOPS 的峰值算力,搭配片外内存不错完毕至高 1.2PB 的内存容量。
DeepSeek-R1 的预历练资本不错低到 GPTo1 等主流模子的相配之一,且后果邻近以致更好,被一些东说念主觉得是 AI 的分水岭。
Feldman 觉得,DeepSeek 对东说念主工智能的影响不仅在当下,更在于将刺激出更大的 AI 系统。跟着资本的缩短,商场正在变得越来越大。
Cerebras 在官网展示,Cerebras 的晶圆级 AI 芯片,部署 DeepSeek-R1 70B 不错达到 1508 tokens / s 的性能,比 GPU 快许多。
用户在使用包括 DeepSeek-R1 等“推理模子”时,输入指示词后需要时候恭候是一大痛点。因为采纳了名为 Chain-of-thought(CoT)的行径来增强模子的推理才能,将多步问题阐述为中间款式,允许模子在需要时履行畸形的辩论。推理时逐字进行推理,对整段指示词的推理需要进行屡次,需要多数算力。
客户不错通过蒸馏将大模子的“常识”滚动到小模子来缓解痛点,大模子频繁被称为涵养模子,较小的模子被称为学生模子。
为了改善使用 DeepSeek 模子的体验,Cerebras 为客户提供的尺度作念法是哄骗 DeepSeek 开源在 Hugging Face 的模子参数(权重)行为涵养模子,蒸馏出一个较小的学生模子用于骨子部署,Cerebras 在官网示意 DeepSeek R1 蒸馏到 Llama 70B 后精度险些莫得下落。
Feldman 示意,DeepSeek 是第一个顶级的开源推理模子,是开源 AI 的首要告捷。通过蒸馏工夫,开源模子只需要公开模子参数(权重),扣问东说念主员不需要拜访源码也不错复制新 AI 模子的向上。他觉得,DeepSeek 的经济性不仅畏惧扫数这个词东说念主工智能行业,更不错使顶端 AI 芯片领略聚工夫得回更多投资。
有些东说念主觉得辩论资本的下落将导致商场萎缩,但往时 50 年王人推崇出缩短资本反而扩大商场容量。不管是电脑如故智高东说念主机,价钱的缩短王人鼓吹了晋升。
Cerebras 从客岁 8 月运行提供群众推理做事,自称是“寰宇上最快的东说念主工智能推理做事提供商”。该公司现在只提供蒸馏后的 70B 模子,Feldman 示意,405B 的模子太贵了,客户更敬爱价钱实惠的模子,诚然也有一部分客户觉得准确性的提增值得更高的资本而选拔更大的模子。
接洽阅读:
《中小 AI 芯片企业感谢 DeepSeek R1:给了咱们契机和订单》