DeepSeek V4将完全运行于华为AI芯片之上

DeepSeek正在开发其下一代AI模型——V4,而最新技术将完全运行于华为最新的AI芯片之上。一份新报告揭示了这一动态大语言模型的准备情况,并披露了其中最重要的要点。

据TheInformation报道,即将推出的中国先进AI大语言模型——DeepSeek V4将采用华为AI芯片。这听起来或许只是寻常消息,因为许多中国AI初创公司如今都在转向华为。

然而,这绝非一条小新闻!

根据细节,V4模型将仅且完全使用华为最新的AI芯片。阿里巴巴集团、字节跳动和腾讯等公司近期已批量订购了昇腾950PR半导体。

V4 AI模型预计将采用近1万亿参数的架构,可能搭配数十万颗昇腾950PR芯片,以实现1.8倍的推理加速、100万token的上下文窗口,并通过Engram技术提升效率。

更多细节显示,DeepSeek已与华为以及寒武纪(中国芯片制造商)合作数月,对模型的核心代码组件进行了重写和测试。

DeepSeek和华为均未证实这一消息。但该信息极有可能是真实的。长期以来,DeepSeek一直在其AI模型中使用昇腾芯片。因此,在中美关于英伟达H20出口的冲突背景下,这家AI初创公司完全转向华为并不令人意外。

DeepSeek V4预计将在未来几周内发布,并以其高性能编码与推理能力著称。此外,该公司还在开发另外两个V4变体(均使用国产芯片),可能会在今年晚些时候首次亮相。

届时,我们或许能了解更多关于DeepSeek V4 AI模型中将搭载多少颗昇腾950PR芯片的信息。敬请关注。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注