transforms.transforms

对用于分割任务的数据进行操作。可以利用Compose类将图像预处理/增强操作进行组合。

Compose类

transforms.transforms.Compose(transforms)

根据数据预处理/数据增强列表对输入数据进行操作。

参数

transforms (list): 数据预处理/数据增强列表。

RandomHorizontalFlip类

transforms.transforms.RandomHorizontalFlip(prob=0.5)

以一定的概率对图像进行水平翻转,模型训练时的数据增强操作。

参数

prob (float): 随机水平翻转的概率。默认值为0.5。

RandomVerticalFlip类

transforms.transforms.RandomVerticalFlip(prob=0.1)

以一定的概率对图像进行垂直翻转,模型训练时的数据增强操作。

参数

prob (float): 随机垂直翻转的概率。默认值为0.1。

Resize类

transforms.transforms.Resize(target_size, interp='LINEAR')

调整图像大小（resize）。

当目标大小（target_size）类型为int时，根据插值方式，将图像resize为[target_size, target_size]。
当目标大小（target_size）类型为list或tuple时，根据插值方式，将图像resize为target_size, target_size的输入应为[w, h]或（w, h）。

参数

target_size (int|list|tuple): 目标大小
interp (str): resize的插值方式，与opencv的插值方式对应，可选的值为['NEAREST', 'LINEAR', 'CUBIC', 'AREA', 'LANCZOS4']，默认为"LINEAR"。

ResizeByLong类

transforms.transforms.ResizeByLong(long_size)

对图像长边resize到固定值，短边按比例进行缩放。

参数

long_size (int): resize后图像的长边大小。

ResizeRangeScaling类

transforms.transforms.ResizeRangeScaling(min_value=400, max_value=600)

对图像长边随机resize到指定范围内，短边按比例进行缩放,模型训练时的数据增强操作。

参数

min_value (int): 图像长边resize后的最小值。默认值400。
max_value (int): 图像长边resize后的最大值。默认值600。

ResizeStepScaling类

transforms.transforms.ResizeStepScaling(min_scale_factor=0.75, max_scale_factor=1.25, scale_step_size=0.25)

对图像按照某一个比例resize，这个比例以scale_step_size为步长，在[min_scale_factor, max_scale_factor]随机变动,模型训练时的数据增强操作。

参数

min_scale_factor（float), resize最小尺度。默认值0.75。
max_scale_factor (float), resize最大尺度。默认值1.25。
scale_step_size (float), resize尺度范围间隔。默认值0.25。

Clip类

transforms.transforms.Clip(min_val=[0, 0, 0], max_val=[255.0, 255.0, 255.0])

对图像上超出一定范围的数据进行裁剪。

参数

min_var (list): 裁剪的下限，小于min_val的数值均设为min_val. 默认值[0, 0, 0].
max_var (list): 裁剪的上限，大于max_val的数值均设为max_val. 默认值[255.0, 255.0, 255.0]

Normalize类

transforms.transforms.Normalize(min_val=[0, 0, 0], max_val=[255.0, 255.0, 255.0], mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])

对图像进行标准化。

1.图像像素归一化到区间 [0.0, 1.0]。 2.对图像进行减均值除以标准差操作。

参数

min_val (list): 图像数据集的最小值。默认值[0, 0, 0].
max_val (list): 图像数据集的最大值。默认值[255.0, 255.0, 255.0]
mean (list): 图像数据集的均值。默认值[0.5, 0.5, 0.5]。
std (list): 图像数据集的标准差。默认值[0.5, 0.5, 0.5]。

Padding类

transforms.transforms.Padding(target_size, im_padding_value=127.5, label_padding_value=255)

对图像或标注图像进行padding，padding方向为右和下。根据提供的值对图像或标注图像进行padding操作。

参数

target_size (int|list|tuple): padding后图像的大小。
im_padding_value (list): 图像padding的值。默认为127.5
label_padding_value (int): 标注图像padding的值。默认值为255（仅在训练时需要设定该参数）。

RandomPaddingCrop类

transforms.transforms.RandomPaddingCrop(crop_size=512, im_padding_value=127.5, label_padding_value=255)

对图像和标注图进行随机裁剪，当所需要的裁剪尺寸大于原图时，则进行padding操作，模型训练时的数据增强操作。

参数

crop_size（int|list|tuple): 裁剪图像大小。默认为512。
im_padding_value (list): 图像padding的值。默认为127.5。
label_padding_value (int): 标注图像padding的值。默认值为255。

RandomBlur类

transforms.transforms.RandomBlur(prob=0.1)

以一定的概率对图像进行高斯模糊，模型训练时的数据增强操作。

参数

prob (float): 图像模糊概率。默认为0.1。

RandomScaleAspect类

transforms.transforms.RandomScaleAspect(min_scale=0.5, aspect_ratio=0.33)

裁剪并resize回原始尺寸的图像和标注图像,模型训练时的数据增强操作。

按照一定的面积比和宽高比对图像进行裁剪，并reszie回原始图像的图像，当存在标注图时，同步进行。

参数

min_scale (float)：裁取图像占原始图像的面积比，取值[0，1]，为0时则返回原图。默认为0.5。
aspect_ratio (float): 裁取图像的宽高比范围，非负值，为0时返回原图。默认为0.33。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

transforms.md

transforms.md

transforms.transforms

Compose类

参数

RandomHorizontalFlip类

参数

RandomVerticalFlip类

参数

Resize类

参数

ResizeByLong类

参数

ResizeRangeScaling类

参数

ResizeStepScaling类

参数

Clip类

参数

Normalize类

参数

Padding类

参数

RandomPaddingCrop类

参数

RandomBlur类

参数

RandomScaleAspect类

参数

Files

transforms.md

Latest commit

History

transforms.md

File metadata and controls

transforms.transforms

Compose类

参数

RandomHorizontalFlip类

参数

RandomVerticalFlip类

参数

Resize类

参数

ResizeByLong类

参数

ResizeRangeScaling类

参数

ResizeStepScaling类

参数

Clip类

参数

Normalize类

参数

Padding类

参数

RandomPaddingCrop类

参数

RandomBlur类

参数

RandomScaleAspect类

参数