2.3 KiB

Raw Blame History

教程 2：自定义数据管道

教程 2：自定义数据管道
- Pipeline 概览
- 在 Pipeline 中创建新的数据增强

`Pipeline` 概览

DataSource 和 Pipeline 是 Dataset 的两个重要组件。我们已经在 add_new_dataset 中介绍了 DataSource 。 Pipeline 负责对图像进行一系列的数据增强，例如随机翻转。

这是用于 SimCLR 训练的 Pipeline 的配置示例：

train_pipeline = [
    dict(type='RandomResizedCrop', size=224),
    dict(type='RandomHorizontalFlip'),
    dict(
        type='RandomAppliedTrans',
        transforms=[
            dict(
                type='ColorJitter',
                brightness=0.8,
                contrast=0.8,
                saturation=0.8,
                hue=0.2)
        ],
        p=0.8),
    dict(type='RandomGrayscale', p=0.2),
    dict(type='GaussianBlur', sigma_min=0.1, sigma_max=2.0, p=0.5)
]

Pipeline 中的每个增强都接收一张图像作为输入，并输出一张增强后的图像。

在 `Pipeline` 中创建新的数据增强

1.在 transforms.py 中编写一个新的数据增强函数，并覆盖 __call__ 函数，该函数接收一张 Pillow 图像作为输入：

@PIPELINES.register_module()
class MyTransform(object):

    def __call__(self, img):
        # apply transforms on img
        return img

2.在配置文件中使用它。我们重新使用上面的配置文件，并在其中添加 MyTransform。

train_pipeline = [
    dict(type='RandomResizedCrop', size=224),
    dict(type='RandomHorizontalFlip'),
    dict(type='MyTransform'),
    dict(
        type='RandomAppliedTrans',
        transforms=[
            dict(
                type='ColorJitter',
                brightness=0.8,
                contrast=0.8,
                saturation=0.8,
                hue=0.2)
        ],
        p=0.8),
    dict(type='RandomGrayscale', p=0.2),
    dict(type='GaussianBlur', sigma_min=0.1, sigma_max=2.0, p=0.5)
]

2.3 KiB Raw Blame History Unescape Escape

教程 2：自定义数据管道

Pipeline 概览

在 Pipeline 中创建新的数据增强

2.3 KiB

Raw Blame History

`Pipeline` 概览

在 `Pipeline` 中创建新的数据增强