想先确认一个兼容性问题:
MTT S30 是否支持 torch_musa / PyTorch 加速?
我目前在 S30 环境下尝试运行 torch_musa,但初始化阶段发生崩溃,所以想先确认:
- S30 是否在 torch_musa 的支持范围内?
- 如果支持,是否有推荐的驱动版本、MUSA 版本、Docker 镜像版本或配置方式?
- 如果不支持,也希望能帮忙明确说明一下,避免继续在这个方向上排查。
下面是我的尝试过程和现象:
运行环境
- GPU:MTT S30
- Docker 镜像:
registry.mthreads.com/mcconline/musa-pytorch-release-public:rc4.2.0-v2.1.0-S80-py310
启动容器
我使用下面的命令启动容器:
docker run -it --rm \
--network=host \
--env MTHREADS_VISIBLE_DEVICES=all \
registry.mthreads.com/mcconline/musa-pytorch-release-public:rc4.2.0-v2.1.0-S80-py310 /bin/bash
容器内现象
容器启动时出现如下信息:
mthreads-gmi command check successfully!
mtgpu_device_initialize: mtgpu_query_dev_info failed (-22)
corrupted double-linked list
/home/check_status.sh: line 34: 117 Aborted (core dumped) ./test_musa
simple demo check successfully!
mthreads-gmi 输出
容器内执行 mthreads-gmi,可以看到 GPU:
Thu Apr 9 07:10:52 2026
---------------------------------------------------------------
mthreads-gmi:2.0.0 Driver Version:3.1.0
---------------------------------------------------------------
ID Name |PCIe |%GPU Mem
0 MTT S30 |00000000:02:00.0 |0% 509MiB(4096MiB)
Python / torch 环境
容器内 pip list 主要版本如下:
torch 2.5.0
torch_musa 2.1.0
torchvision 0.20.0a0+afc54f7
torchaudio 2.5.0a0+56bc006
triton 3.1.0
我做过的测试
我设置了环境变量:
export MUSA_HOME=/usr/local/musa
export LD_LIBRARY_PATH=$MUSA_HOME/lib:$LD_LIBRARY_PATH
然后执行最小测试:
python -c "
import torch
import torch_musa
print('\n--- MUSA 验证 ---')
print('1. MUSA 是否可用:', torch.musa.is_available())
if torch.musa.is_available():
print('2. 当前设备数量:', torch.musa.device_count())
a = torch.tensor([1.2, 2.3], dtype=torch.float32, device='musa')
b = torch.tensor([3.8, 4.7], dtype=torch.float32).musa()
c = a + b
print(a, b, c)
else:
print('MUSA 不可用')
"
实际报错
执行后报错如下:
mtgpu_device_initialize: mtgpu_query_dev_info failed (-22)
python: ../../../libdrm-mt/mtgpu/mtgpu_internal.h:162: update_references: Assertion `atomic_read(dst) > 0' failed.
Aborted (core dumped)
想先确认一个兼容性问题:
MTT S30 是否支持 torch_musa / PyTorch 加速?
我目前在 S30 环境下尝试运行 torch_musa,但初始化阶段发生崩溃,所以想先确认:
下面是我的尝试过程和现象:
运行环境
registry.mthreads.com/mcconline/musa-pytorch-release-public:rc4.2.0-v2.1.0-S80-py310启动容器
我使用下面的命令启动容器:
容器内现象
容器启动时出现如下信息:
mthreads-gmi输出容器内执行
mthreads-gmi,可以看到 GPU:Python / torch 环境
容器内
pip list主要版本如下:我做过的测试
我设置了环境变量:
然后执行最小测试:
实际报错
执行后报错如下: