train中flashattention加速库分析发现softcap功能与flashattention的版本有关,是否需要支持?
train中flashattention加速库分析发现softcap功能与flashattention的版本有关,是否需要支持?