阿里云推出面向自动驾驶领域模型的训练、推理加速框架PAI-TurboX,该框架可提升感知、规划控制乃至世界模型的训推效率,在多个行业模型的训练任务中,PAI-TurboX均可缩短50%的时间。
阿里云推出的PAI-TurboX,在多模态数据预处理、离线大规模模型训练以及实时智驾推理等环节提供了全面解决方案。在系统侧,PAI-TurboX通过优化CPU亲和性、动态编译、流水线并行等策略,显著提升模型的训练推理效率;在数据侧,PAI-TurboX提出了高性能的DataLoader引擎,并且优化了数据预处理流程和实现了智能训练样本分组,有效提升数据处理效率。
此外,PAI-TurboX还提供了算子优化和量化等能力,可进一步减少训练阶段的访存延迟,提升吞吐效率,同时在推理任务中,能在保障精度的同时降低计算开销与内存带宽需求,可实现异构平台下的高性能推理部署。