支持非英伟达Hopper架构GPU及国产芯片(如昇腾、寒武纪),FP8精度模型推理速度提升3倍,降低国产AI硬件生态对海外技术的依赖。
技术解读:FP8是新型浮点计算格式,能在保持精度的同时减少显存占用,特别适合医疗影像分析等高密度计算场景。

点赞(0) 打赏

联系编辑

微信二维码

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部