每日生活圈2025年08月25日 14:27消息,DeepSeek采用UE8M0 FP8标准,华为积极适配,彻底与NVIDIA决裂。
8月25日,据报道,深度求索近日正式推出DeepSeek-V3.1。其中一项重要突破和令人惊喜的进展,是新增了对UE8M0FP8的支持。

DeepSeek在其官方发布的关于DeepSeek-V3.1的文章中提到,UE8M0FP8是为即将推出的下一代国产芯片所专门设计的。

东莞证券表示,该格式通过提升灵活性,支持更复杂的模型推理,从而增强芯片的解码效率和运算能力,为国产芯片适配更大规模的模型提供了技术路径,有助于加快国产AI算力生态的建设进程。 我认为,这一技术路径的提出,不仅体现了国内在AI芯片领域持续的技术积累,也反映出产业对自主可控算力生态的迫切需求。随着更多创新技术的落地,国产芯片在性能与适配性上的短板有望逐步补齐,推动整个AI生态向更高效、更开放的方向发展。
那UE8M0 FP8到底是什么?将有何影响?
人工智能领域的企业家与技术专家、清华大学计算机系人工智能所博士梁斌表示,DeepSeek这次为什么非要强调UE8M0 FP8呢?这个和英伟达的FP8是两个东西,两套标准。
他解释称,显存的容量存在一定的限制,而模型的规模却在迅速增长,因此必须通过量化技术对每个参数进行压缩。FP32表示用32位来表示一个参数,而FP8则是用8位来表示一个参数。在可接受的精度范围内,位数越低,意味着在显存中可以存储更多的参数。
FP8格式在不同厂商的实现上存在差异,英伟达采用了E4M3和E5M2方案,而DS公司则推出了UE8M0方案。两者的主要区别在于,前者支持3位或2位的小数表示,而后者则不包含小数部分。从性能上看,英伟达的方案在精度上更具优势,而DS的方案则在功耗、运算速度以及对芯片的要求方面表现更优。这种设计上的取舍反映了不同应用场景下的需求差异。
梁斌表示,现在,DeepSeek已支持UE8M0FP8标准,同时国产芯片厂商也逐渐向这一标准靠拢,这标志着国内在AI算力生态上正逐步形成独立体系,似乎与英伟达的生态系统开始拉开距离。未来,其他推理模型或将面临选择:要么采用DeepSeek的这套技术体系,要么继续依赖英伟达的方案。国内芯片企业也在积极融入这一趋势,推动本土化技术的发展。 从行业发展趋势来看,这种技术路线的分化反映出国内对自主可控算力生态的重视。随着国产芯片性能的不断提升,其在AI领域的应用将更加广泛,未来可能形成与英伟达并行的技术格局。
现在华为为了适配这个标准,真的是全力以赴,拼尽全力去完成,成功的话就能名垂千古,这种诱惑实在太大了。同时,我也注意到DeepSeek确实有胆识,真正将国产大模型的发展推向了一个令人瞩目的高度,值得称赞。