支持非英伟达Hopper架构GPU及国产芯片(如昇腾、寒武纪),FP8精度模型推理速度提升3倍,降低国产AI硬件生态对海外技术的依赖。技术解读:FP8是新型浮点计算格式,能在保持精度的同时减少显存占用,特别适合医疗影像分析等高密度计算场景。
联系编辑
微信二维码
微信公众账号
微信扫一扫加关注