前言 模型推理的两个主要挑战是延迟和成本。 参考资料 Speeding up model with fusing batch normalization and convolution 深度学习推理时融合BN,轻松获得约5%的提速 CS231n课程笔记翻译:卷积神经网络笔记 模型推理加速技巧:融合BN和Conv层