[Feature] Add `PackClsInputs` and use `LoadImageFromFile`, `Resize` & `RandomFlip` in MMCV.

2022-05-18 16:48:59 +00:00 · 2022-05-18 16:48:59 +00:00 · 93a27c8324
parent 0537c4d70c
commit 93a27c8324
56 changed files with 575 additions and 1779 deletions
--- a/.dev_scripts/benchmark_regression/1-benchmark_valid.py
+++ b/.dev_scripts/benchmark_regression/1-benchmark_valid.py
@ -92,7 +92,7 @@ def inference(config_file, checkpoint, classes, args):
        cfg.data.test.pipeline.insert(0, dict(type='LoadImageFromFile'))
    if cfg.data.test.type in ['CIFAR10', 'CIFAR100']:
        # The image shape of CIFAR is (32, 32, 3)
-        cfg.data.test.pipeline.insert(1, dict(type='Resize', size=32))
+        cfg.data.test.pipeline.insert(1, dict(type='Resize', scale=32))

    data = dict(img_info=dict(filename=args.img), img_prefix=None)

--- a/configs/_base_/datasets/cub_bs8_384.py
+++ b/configs/_base_/datasets/cub_bs8_384.py
@ -4,7 +4,7 @@ img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
 train_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=510),
+    dict(type='Resize', scale=510),
    dict(type='RandomCrop', size=384),
    dict(type='RandomFlip', flip_prob=0.5, direction='horizontal'),
    dict(type='Normalize', **img_norm_cfg),
@ -14,7 +14,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=510),
+    dict(type='Resize', scale=510),
    dict(type='CenterCrop', crop_size=384),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/cub_bs8_448.py
+++ b/configs/_base_/datasets/cub_bs8_448.py
@ -4,7 +4,7 @@ img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
 train_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=600),
+    dict(type='Resize', scale=600),
    dict(type='RandomCrop', size=448),
    dict(type='RandomFlip', flip_prob=0.5, direction='horizontal'),
    dict(type='Normalize', **img_norm_cfg),
@ -14,7 +14,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=600),
+    dict(type='Resize', scale=600),
    dict(type='CenterCrop', crop_size=448),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet21k_bs128.py
+++ b/configs/_base_/datasets/imagenet21k_bs128.py
@ -13,7 +13,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs128_poolformer_medium_224.py
+++ b/configs/_base_/datasets/imagenet_bs128_poolformer_medium_224.py
@ -41,7 +41,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(236, -1),
+        scale=(236, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/_base_/datasets/imagenet_bs256_rsb_a12.py
+++ b/configs/_base_/datasets/imagenet_bs256_rsb_a12.py
@ -25,7 +25,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(236, -1)),
+    dict(type='Resize', scale=(236, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs256_rsb_a3.py
+++ b/configs/_base_/datasets/imagenet_bs256_rsb_a3.py
@ -25,7 +25,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(236, -1)),
+    dict(type='Resize', scale=(236, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs32.py
+++ b/configs/_base_/datasets/imagenet_bs32.py
@ -13,7 +13,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs32_pil_bicubic.py
+++ b/configs/_base_/datasets/imagenet_bs32_pil_bicubic.py
@ -19,7 +19,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(256, -1),
+        scale=(256, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/_base_/datasets/imagenet_bs32_pil_resize.py
+++ b/configs/_base_/datasets/imagenet_bs32_pil_resize.py
@ -13,7 +13,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1), backend='pillow'),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs64.py
+++ b/configs/_base_/datasets/imagenet_bs64.py
@ -13,7 +13,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs64_autoaug.py
+++ b/configs/_base_/datasets/imagenet_bs64_autoaug.py
@ -16,7 +16,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs64_convmixer_224.py
+++ b/configs/_base_/datasets/imagenet_bs64_convmixer_224.py
@ -41,7 +41,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(233, -1),
+        scale=(233, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/_base_/datasets/imagenet_bs64_mixer_224.py
+++ b/configs/_base_/datasets/imagenet_bs64_mixer_224.py
@ -20,7 +20,11 @@ train_pipeline = [
 test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
-        type='Resize', size=(256, -1), backend='cv2', interpolation='bicubic'),
+        type='Resize',
+        scale=(256, -1),
+        keep_ratio=True,
+        backend='cv2',
+        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs64_pil_resize.py
+++ b/configs/_base_/datasets/imagenet_bs64_pil_resize.py
@ -13,7 +13,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1), backend='pillow'),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/_base_/datasets/imagenet_bs64_pil_resize_autoaug.py
+++ b/configs/_base_/datasets/imagenet_bs64_pil_resize_autoaug.py
@ -24,7 +24,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(256, -1),
+        scale=(256, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/_base_/datasets/imagenet_bs64_swin_224.py
+++ b/configs/_base_/datasets/imagenet_bs64_swin_224.py
@ -41,7 +41,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(256, -1),
+        scale=(256, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/_base_/datasets/imagenet_bs64_swin_384.py
+++ b/configs/_base_/datasets/imagenet_bs64_swin_384.py
@ -17,7 +17,12 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=384, backend='pillow', interpolation='bicubic'),
+    dict(
+        type='Resize',
+        scale=(256, -1),
+        keep_ratio=True,
+        backend='pillow',
+        interpolation='bicubic'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img'])
--- a/configs/_base_/datasets/imagenet_bs64_t2t_224.py
+++ b/configs/_base_/datasets/imagenet_bs64_t2t_224.py
@ -41,7 +41,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(248, -1),
+        scale=(248, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/_base_/datasets/voc_bs16.py
+++ b/configs/_base_/datasets/voc_bs16.py
@ -13,7 +13,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/cspnet/cspdarknet50_8xb32_in1k.py
+++ b/configs/cspnet/cspdarknet50_8xb32_in1k.py
@ -36,7 +36,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(288, -1),
+        scale=(288, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=256),
--- a/configs/cspnet/cspresnet50_8xb32_in1k.py
+++ b/configs/cspnet/cspresnet50_8xb32_in1k.py
@ -37,7 +37,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(288, -1),
+        scale=(288, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=256),
--- a/configs/cspnet/cspresnext50_8xb32_in1k.py
+++ b/configs/cspnet/cspresnext50_8xb32_in1k.py
@ -36,7 +36,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(256, -1),
+        scale=(256, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/lenet/lenet5_mnist.py
+++ b/configs/lenet/lenet5_mnist.py
@ -11,14 +11,14 @@ model = dict(
 dataset_type = 'MNIST'
 img_norm_cfg = dict(mean=[33.46], std=[78.87], to_rgb=True)
 train_pipeline = [
-    dict(type='Resize', size=32),
+    dict(type='Resize', scale=32),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='ToTensor', keys=['gt_label']),
    dict(type='Collect', keys=['img', 'gt_label']),
 ]
 test_pipeline = [
-    dict(type='Resize', size=32),
+    dict(type='Resize', scale=32),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img']),
--- a/configs/regnet/regnetx-400mf_8xb128_in1k.py
+++ b/configs/regnet/regnetx-400mf_8xb128_in1k.py
@ -51,7 +51,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', mean=NORM_MEAN, std=NORM_STD, to_rgb=False),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/repmlp/repmlp-base_8xb64_in1k-256px.py
+++ b/configs/repmlp/repmlp-base_8xb64_in1k-256px.py
@ -11,7 +11,11 @@ img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256 * 256 // 224, -1), backend='pillow'),
+    dict(
+        type='Resize',
+        scale_factor=(256 * 256 // 224, -1),
+        keep_ratio=True,
+        backend='pillow'),
    dict(type='CenterCrop', crop_size=256),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/repmlp/repmlp-base_8xb64_in1k.py
+++ b/configs/repmlp/repmlp-base_8xb64_in1k.py
@ -10,7 +10,7 @@ img_norm_cfg = dict(
 test_pipeline = [
    dict(type='LoadImageFromFile'),
    # resizing to (256, 256) here, different with resizing shorter edge to 256
-    dict(type='Resize', size=(256, 256), backend='pillow'),
+    dict(type='Resize', scale=(256, 256), backend='pillow'),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/tnt/tnt-s-p16_16xb64_in1k.py
+++ b/configs/tnt/tnt-s-p16_16xb64_in1k.py
@ -12,7 +12,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(248, -1),
+        scale=(248, -1),
+        keep_ratio=True,
        interpolation='bicubic',
        backend='pillow'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/van/van-base_8xb128_in1k.py
+++ b/configs/van/van-base_8xb128_in1k.py
@ -45,7 +45,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(248, -1),
+        scale=(248, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/van/van-large_8xb128_in1k.py
+++ b/configs/van/van-large_8xb128_in1k.py
@ -45,7 +45,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(248, -1),
+        scale=(248, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/van/van-small_8xb128_in1k.py
+++ b/configs/van/van-small_8xb128_in1k.py
@ -45,7 +45,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(248, -1),
+        scale=(248, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/van/van-tiny_8xb128_in1k.py
+++ b/configs/van/van-tiny_8xb128_in1k.py
@ -45,7 +45,8 @@ test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='Resize',
-        size=(248, -1),
+        scale=(248, -1),
+        keep_ratio=True,
        backend='pillow',
        interpolation='bicubic'),
    dict(type='CenterCrop', crop_size=224),
--- a/configs/vision_transformer/vit-base-p16_ft-4xb544-ipu_in1k.py
+++ b/configs/vision_transformer/vit-base-p16_ft-4xb544-ipu_in1k.py
@ -39,7 +39,7 @@ train_pipeline = [

 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(224, -1), backend='pillow'),
+    dict(type='Resize', scale=(224, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/vision_transformer/vit-base-p16_ft-64xb64_in1k-384.py
+++ b/configs/vision_transformer/vit-base-p16_ft-64xb64_in1k-384.py
@ -22,7 +22,7 @@ train_pipeline = [

 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(384, -1), backend='pillow'),
+    dict(type='Resize', scale=(384, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=384),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/vision_transformer/vit-base-p32_ft-64xb64_in1k-384.py
+++ b/configs/vision_transformer/vit-base-p32_ft-64xb64_in1k-384.py
@ -22,7 +22,7 @@ train_pipeline = [

 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(384, -1), backend='pillow'),
+    dict(type='Resize', scale=(384, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=384),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/vision_transformer/vit-large-p16_ft-64xb64_in1k-384.py
+++ b/configs/vision_transformer/vit-large-p16_ft-64xb64_in1k-384.py
@ -22,7 +22,7 @@ train_pipeline = [

 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(384, -1), backend='pillow'),
+    dict(type='Resize', scale=(384, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=384),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/configs/vision_transformer/vit-large-p32_ft-64xb64_in1k-384.py
+++ b/configs/vision_transformer/vit-large-p32_ft-64xb64_in1k-384.py
@ -23,7 +23,7 @@ train_pipeline = [

 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(384, -1), backend='pillow'),
+    dict(type='Resize', scale=(384, -1), keep_ratio=True, backend='pillow'),
    dict(type='CenterCrop', crop_size=384),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/docs/en/api/transforms.rst
+++ b/docs/en/api/transforms.rst
@ -30,7 +30,7 @@ for example:
    ]
    test_pipeline = [
        dict(type='LoadImageFromFile'),
-        dict(type='Resize', size=256),
+        dict(type='Resize', scale=256),
        dict(type='CenterCrop', crop_size=224),
        dict(type='Normalize', **img_norm_cfg),
        dict(type='ImageToTensor', keys=['img']),
--- a/docs/en/tutorials/MMClassification_tools.ipynb
+++ b/docs/en/tutorials/MMClassification_tools.ipynb
--- a/docs/en/tutorials/config.md
+++ b/docs/en/tutorials/config.md
@ -193,7 +193,7 @@ train_pipeline = [
 # test data pipeline
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
@ -309,7 +309,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=384, backend='pillow'),
+    dict(type='Resize', scale=(384, -1), keep_ratio=True, backend='pillow'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img'])
--- a/docs/en/tutorials/data_pipeline.md
+++ b/docs/en/tutorials/data_pipeline.md
@ -28,7 +28,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=256),
+    dict(type='Resize', scale=256),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/docs/en/tutorials/finetune.md
+++ b/docs/en/tutorials/finetune.md
@ -112,14 +112,14 @@ img_norm_cfg = dict(
 train_pipeline = [
    dict(type='RandomCrop', size=32, padding=4),
    dict(type='RandomFlip', flip_prob=0.5, direction='horizontal'),
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='ToTensor', keys=['gt_label']),
    dict(type='Collect', keys=['img', 'gt_label']),
 ]
 test_pipeline = [
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img']),
@ -177,14 +177,14 @@ img_norm_cfg = dict(
 train_pipeline = [
    dict(type='RandomCrop', size=32, padding=4),
    dict(type='RandomFlip', flip_prob=0.5, direction='horizontal'),
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='ToTensor', keys=['gt_label']),
    dict(type='Collect', keys=['img', 'gt_label']),
 ]
 test_pipeline = [
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img']),
--- a/docs/zh_CN/tutorials/MMClassification_tools_cn.ipynb
+++ b/docs/zh_CN/tutorials/MMClassification_tools_cn.ipynb
--- a/docs/zh_CN/tutorials/config.md
+++ b/docs/zh_CN/tutorials/config.md
@ -194,7 +194,7 @@ train_pipeline = [
 # 测试数据流水线
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=(256, -1)),
+    dict(type='Resize', scale=(256, -1), keep_ratio=True),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
@ -310,7 +310,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=384, backend='pillow'),
+    dict(type='Resize', scale=384, backend='pillow'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img'])
--- a/docs/zh_CN/tutorials/data_pipeline.md
+++ b/docs/zh_CN/tutorials/data_pipeline.md
@ -27,7 +27,7 @@ train_pipeline = [
 ]
 test_pipeline = [
    dict(type='LoadImageFromFile'),
-    dict(type='Resize', size=256),
+    dict(type='Resize', scale=256),
    dict(type='CenterCrop', crop_size=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
--- a/docs/zh_CN/tutorials/finetune.md
+++ b/docs/zh_CN/tutorials/finetune.md
@ -102,14 +102,14 @@ img_norm_cfg = dict(
 train_pipeline = [
    dict(type='RandomCrop', size=32, padding=4),
    dict(type='RandomFlip', flip_prob=0.5, direction='horizontal'),
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='ToTensor', keys=['gt_label']),
    dict(type='Collect', keys=['img', 'gt_label']),
 ]
 test_pipeline = [
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img']),
@ -166,14 +166,14 @@ img_norm_cfg = dict(
 train_pipeline = [
    dict(type='RandomCrop', size=32, padding=4),
    dict(type='RandomFlip', flip_prob=0.5, direction='horizontal'),
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='ToTensor', keys=['gt_label']),
    dict(type='Collect', keys=['img', 'gt_label']),
 ]
 test_pipeline = [
-    dict(type='Resize', size=224),
+    dict(type='Resize', scale=224),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='ImageToTensor', keys=['img']),
    dict(type='Collect', keys=['img']),
--- a/mmcls/datasets/pipelines/init.py
+++ b/mmcls/datasets/pipelines/init.py
@ -4,19 +4,18 @@ from .auto_augment import (AutoAugment, AutoContrast, Brightness,
                           Posterize, RandAugment, Rotate, Sharpness, Shear,
                           Solarize, SolarizeAdd, Translate)
 from .compose import Compose
-from .formatting import (Collect, ImageToTensor, ToNumpy, ToPIL, ToTensor,
-                         Transpose, to_tensor)
-from .loading import LoadImageFromFile
+from .formatting import (Collect, ImageToTensor, PackClsInputs, ToNumpy, ToPIL,
+                         ToTensor, Transpose, to_tensor)
 from .transforms import (CenterCrop, ColorJitter, Lighting, Normalize, Pad,
-                         RandomCrop, RandomErasing, RandomFlip,
-                         RandomGrayscale, RandomResizedCrop, Resize)
+                         RandomCrop, RandomErasing, RandomGrayscale,
+                         RandomResizedCrop)

 __all__ = [
    'Compose', 'to_tensor', 'ToTensor', 'ImageToTensor', 'ToPIL', 'ToNumpy',
-    'Transpose', 'Collect', 'LoadImageFromFile', 'Resize', 'CenterCrop',
-    'RandomFlip', 'Normalize', 'RandomCrop', 'RandomResizedCrop',
-    'RandomGrayscale', 'Shear', 'Translate', 'Rotate', 'Invert',
-    'ColorTransform', 'Solarize', 'Posterize', 'AutoContrast', 'Equalize',
-    'Contrast', 'Brightness', 'Sharpness', 'AutoAugment', 'SolarizeAdd',
-    'Cutout', 'RandAugment', 'Lighting', 'ColorJitter', 'RandomErasing', 'Pad'
+    'Transpose', 'Collect', 'CenterCrop', 'Normalize', 'RandomCrop',
+    'RandomResizedCrop', 'RandomGrayscale', 'Shear', 'Translate', 'Rotate',
+    'Invert', 'ColorTransform', 'Solarize', 'Posterize', 'AutoContrast',
+    'Equalize', 'Contrast', 'Brightness', 'Sharpness', 'AutoAugment',
+    'SolarizeAdd', 'Cutout', 'RandAugment', 'Lighting', 'ColorJitter',
+    'RandomErasing', 'Pad', 'PackClsInputs'
 ]
--- a/mmcls/datasets/pipelines/formatting.py
+++ b/mmcls/datasets/pipelines/formatting.py
@ -1,12 +1,15 @@
 # Copyright (c) OpenMMLab. All rights reserved.
+import warnings
 from collections.abc import Sequence

 import mmcv
 import numpy as np
 import torch
 from mmcv.parallel import DataContainer as DC
+from mmcv.transforms.base import BaseTransform
 from PIL import Image

+from mmcls.core import ClsDataSample
 from mmcls.registry import TRANSFORMS


@ -33,8 +36,87 @@ def to_tensor(data):
            '`Sequence`, `int` and `float`')


+@TRANSFORMS.register_module()
+class PackClsInputs(BaseTransform):
+    """Pack the inputs data for the classification.
+
+    The ``img_meta`` item is always populated.  The contents of the
+    ``img_meta`` dictionary depends on ``meta_keys``. By default this includes:
+
+        - ``sample_idx``: id of the image sample
+
+        - ``img_path``: path to the image file
+
+        - ``ori_shape``: original shape of the image as a tuple (H, W).
+
+        - ``img_shape``: shape of the image input to the network as a tuple
+          (H, W).  Note that images may be zero padded on the bottom/right
+          if the batch tensor is larger than this shape.
+
+        - ``scale_factor``: a float indicating the preprocessing scale
+
+        - ``flip``: a boolean indicating if image flip transform was used
+
+        - ``flip_direction``: the flipping direction
+
+    Args:
+        meta_keys (Sequence[str], optional): The meta keys to saved in the
+            ``metainfo`` of the packed ``data_sample``.
+            Default: ``('sample_idx', 'img_path', 'ori_shape', 'img_shape',
+            'scale_factor', 'flip', 'flip_direction')``
+    """
+
+    def __init__(self,
+                 meta_keys=('sample_idx', 'img_path', 'ori_shape', 'img_shape',
+                            'scale_factor', 'flip', 'flip_direction')):
+        self.meta_keys = meta_keys
+
+    def transform(self, results: dict) -> dict:
+        """Method to pack the input data.
+
+        Args:
+            results (dict): Result dict from the data pipeline.
+
+        Returns:
+            dict:
+            - 'inputs' (obj:`torch.Tensor`): The forward data of models.
+            - 'data_sample' (obj:`ClsDataSample`): The annotation info of the
+              sample.
+        """
+        packed_results = dict()
+        if 'img' in results:
+            img = results['img']
+            if len(img.shape) < 3:
+                img = np.expand_dims(img, -1)
+            img = np.ascontiguousarray(img.transpose(2, 0, 1))
+            packed_results['inputs'] = to_tensor(img)
+        else:
+            warnings.warn(
+                'Cannot get "img" in the input dict of `PackClsInputs`,'
+                'please make sure `LoadImageFromFile` has been added '
+                'in the data pipeline or images have been loaded in '
+                'the dataset.')
+
+        data_sample = ClsDataSample()
+        if 'gt_label' in results:
+            gt_label = results['gt_label']
+            data_sample.set_gt_label(gt_label)
+
+        img_meta = {k: results[k] for k in self.meta_keys if k in results}
+        data_sample.set_metainfo(img_meta)
+        packed_results['data_sample'] = data_sample
+
+        return packed_results
+
+    def __repr__(self) -> str:
+        repr_str = self.__class__.__name__
+        repr_str += f'(meta_keys={self.meta_keys})'
+        return repr_str
+
+
@TRANSFORMS.register_module()
 class ToTensor(object):
+    """Convert objects of various python types to :obj:`torch.Tensor`."""

    def __init__(self, keys):
        self.keys = keys
@ -50,6 +132,7 @@ class ToTensor(object):

@TRANSFORMS.register_module()
 class ImageToTensor(object):
+    """Convert objects :obj:`PIL.Image` to :obj:`torch.Tensor`."""

    def __init__(self, keys):
        self.keys = keys
@ -68,6 +151,7 @@ class ImageToTensor(object):

@TRANSFORMS.register_module()
 class Transpose(object):
+    """matrix transpose."""

    def __init__(self, keys, order):
        self.keys = keys
@ -85,6 +169,7 @@ class Transpose(object):

@TRANSFORMS.register_module()
 class ToPIL(object):
+    """Convert tensor to :obj:`PIL.Image`."""

    def __init__(self):
        pass
@ -96,6 +181,7 @@ class ToPIL(object):

@TRANSFORMS.register_module()
 class ToNumpy(object):
+    """Convert tensor to :obj:`np.ndarray`."""

    def __init__(self):
        pass
--- a/mmcls/datasets/pipelines/loading.py
+++ b/mmcls/datasets/pipelines/loading.py
@ -1,70 +0,0 @@
-# Copyright (c) OpenMMLab. All rights reserved.
-import os.path as osp
-
-import mmcv
-import numpy as np
-
-from mmcls.registry import TRANSFORMS
-
-
-@TRANSFORMS.register_module()
-class LoadImageFromFile(object):
-    """Load an image from file.
-
-    Required keys are "img_prefix" and "img_info" (a dict that must contain the
-    key "filename"). Added or updated keys are "filename", "img", "img_shape",
-    "ori_shape" (same as `img_shape`) and "img_norm_cfg" (means=0 and stds=1).
-
-    Args:
-        to_float32 (bool): Whether to convert the loaded image to a float32
-            numpy array. If set to False, the loaded image is an uint8 array.
-            Defaults to False.
-        color_type (str): The flag argument for :func:`mmcv.imfrombytes()`.
-            Defaults to 'color'.
-        file_client_args (dict): Arguments to instantiate a FileClient.
-            See :class:`mmcv.fileio.FileClient` for details.
-            Defaults to ``dict(backend='disk')``.
-    """
-
-    def __init__(self,
-                 to_float32=False,
-                 color_type='color',
-                 file_client_args=dict(backend='disk')):
-        self.to_float32 = to_float32
-        self.color_type = color_type
-        self.file_client_args = file_client_args.copy()
-        self.file_client = None
-
-    def __call__(self, results):
-        if self.file_client is None:
-            self.file_client = mmcv.FileClient(**self.file_client_args)
-
-        if results['img_prefix'] is not None:
-            filename = osp.join(results['img_prefix'],
-                                results['img_info']['filename'])
-        else:
-            filename = results['img_info']['filename']
-
-        img_bytes = self.file_client.get(filename)
-        img = mmcv.imfrombytes(img_bytes, flag=self.color_type)
-        if self.to_float32:
-            img = img.astype(np.float32)
-
-        results['filename'] = filename
-        results['ori_filename'] = results['img_info']['filename']
-        results['img'] = img
-        results['img_shape'] = img.shape
-        results['ori_shape'] = img.shape
-        num_channels = 1 if len(img.shape) < 3 else img.shape[2]
-        results['img_norm_cfg'] = dict(
-            mean=np.zeros(num_channels, dtype=np.float32),
-            std=np.ones(num_channels, dtype=np.float32),
-            to_rgb=False)
-        return results
-
-    def __repr__(self):
-        repr_str = (f'{self.__class__.__name__}('
-                    f'to_float32={self.to_float32}, '
-                    f"color_type='{self.color_type}', "
-                    f'file_client_args={self.file_client_args})')
-        return repr_str
--- a/mmcls/datasets/pipelines/transforms.py
+++ b/mmcls/datasets/pipelines/transforms.py
@ -430,48 +430,6 @@ class RandomGrayscale(object):
        return self.__class__.__name__ + f'(gray_prob={self.gray_prob})'


-@TRANSFORMS.register_module()
-class RandomFlip(object):
-    """Flip the image randomly.
-
-    Flip the image randomly based on flip probaility and flip direction.
-
-    Args:
-        flip_prob (float): probability of the image being flipped. Default: 0.5
-        direction (str): The flipping direction. Options are
-            'horizontal' and 'vertical'. Default: 'horizontal'.
-    """
-
-    def __init__(self, flip_prob=0.5, direction='horizontal'):
-        assert 0 <= flip_prob <= 1
-        assert direction in ['horizontal', 'vertical']
-        self.flip_prob = flip_prob
-        self.direction = direction
-
-    def __call__(self, results):
-        """Call function to flip image.
-
-        Args:
-            results (dict): Result dict from loading pipeline.
-
-        Returns:
-            dict: Flipped results, 'flip', 'flip_direction' keys are added into
-                result dict.
-        """
-        flip = True if np.random.rand() < self.flip_prob else False
-        results['flip'] = flip
-        results['flip_direction'] = self.direction
-        if results['flip']:
-            # flip image
-            for key in results.get('img_fields', ['img']):
-                results[key] = mmcv.imflip(
-                    results[key], direction=results['flip_direction'])
-        return results
-
-    def __repr__(self):
-        return self.__class__.__name__ + f'(flip_prob={self.flip_prob})'
-
-
@TRANSFORMS.register_module()
 class RandomErasing(object):
    """Randomly selects a rectangle region in an image and erase pixels.
@ -664,111 +622,6 @@ class Pad(object):
        return repr_str


-@TRANSFORMS.register_module()
-class Resize(object):
-    """Resize images.
-
-    Args:
-        size (int | tuple): Images scales for resizing (h, w).
-            When size is int, the default behavior is to resize an image
-            to (size, size). When size is tuple and the second value is -1,
-            the image will be resized according to adaptive_side. For example,
-            when size is 224, the image is resized to 224x224. When size is
-            (224, -1) and adaptive_size is "short", the short side is resized
-            to 224 and the other side is computed based on the short side,
-            maintaining the aspect ratio.
-        interpolation (str): Interpolation method. For "cv2" backend, accepted
-            values are "nearest", "bilinear", "bicubic", "area", "lanczos". For
-            "pillow" backend, accepted values are "nearest", "bilinear",
-            "bicubic", "box", "lanczos", "hamming".
-            More details can be found in `mmcv.image.geometric`.
-        adaptive_side(str): Adaptive resize policy, accepted values are
-            "short", "long", "height", "width". Default to "short".
-        backend (str): The image resize backend type, accepted values are
-            `cv2` and `pillow`. Default: `cv2`.
-    """
-
-    def __init__(self,
-                 size,
-                 interpolation='bilinear',
-                 adaptive_side='short',
-                 backend='cv2'):
-        assert isinstance(size, int) or (isinstance(size, tuple)
-                                         and len(size) == 2)
-        assert adaptive_side in {'short', 'long', 'height', 'width'}
-
-        self.adaptive_side = adaptive_side
-        self.adaptive_resize = False
-        if isinstance(size, int):
-            assert size > 0
-            size = (size, size)
-        else:
-            assert size[0] > 0 and (size[1] > 0 or size[1] == -1)
-            if size[1] == -1:
-                self.adaptive_resize = True
-        if backend not in ['cv2', 'pillow']:
-            raise ValueError(f'backend: {backend} is not supported for resize.'
-                             'Supported backends are "cv2", "pillow"')
-        if backend == 'cv2':
-            assert interpolation in ('nearest', 'bilinear', 'bicubic', 'area',
-                                     'lanczos')
-        else:
-            assert interpolation in ('nearest', 'bilinear', 'bicubic', 'box',
-                                     'lanczos', 'hamming')
-        self.size = size
-        self.interpolation = interpolation
-        self.backend = backend
-
-    def _resize_img(self, results):
-        for key in results.get('img_fields', ['img']):
-            img = results[key]
-            ignore_resize = False
-            if self.adaptive_resize:
-                h, w = img.shape[:2]
-                target_size = self.size[0]
-
-                condition_ignore_resize = {
-                    'short': min(h, w) == target_size,
-                    'long': max(h, w) == target_size,
-                    'height': h == target_size,
-                    'width': w == target_size
-                }
-
-                if condition_ignore_resize[self.adaptive_side]:
-                    ignore_resize = True
-                elif any([
-                        self.adaptive_side == 'short' and w < h,
-                        self.adaptive_side == 'long' and w > h,
-                        self.adaptive_side == 'width',
-                ]):
-                    width = target_size
-                    height = int(target_size * h / w)
-                else:
-                    height = target_size
-                    width = int(target_size * w / h)
-            else:
-                height, width = self.size
-            if not ignore_resize:
-                img = mmcv.imresize(
-                    img,
-                    size=(width, height),
-                    interpolation=self.interpolation,
-                    return_scale=False,
-                    backend=self.backend)
-                results[key] = img
-                results['img_shape'] = img.shape
-
-    def __call__(self, results):
-        self._resize_img(results)
-        return results
-
-    def __repr__(self):
-        repr_str = self.__class__.__name__
-        repr_str += f'(size={self.size}, '
-        repr_str += f'interpolation={self.interpolation})'
-        return repr_str
-
-
@TRANSFORMS.register_module()
 class CenterCrop(object):
    r"""Center crop the image.
--- a/tests/test_data/test_builder.py
+++ b/tests/test_data/test_builder.py
@ -1,272 +0,0 @@
-# Copyright (c) OpenMMLab. All rights reserved.
-import os.path as osp
-from copy import deepcopy
-from unittest.mock import patch
-
-import torch
-from mmcv.utils import digit_version
-
-from mmcls.datasets import ImageNet, build_dataloader, build_dataset
-from mmcls.datasets.dataset_wrappers import (ClassBalancedDataset,
-                                             ConcatDataset, KFoldDataset,
-                                             RepeatDataset)
-
-
-class TestDataloaderBuilder():
-
-    @classmethod
-    def setup_class(cls):
-        cls.data = list(range(20))
-        cls.samples_per_gpu = 5
-        cls.workers_per_gpu = 1
-
-    @patch('mmcls.datasets.builder.get_dist_info', return_value=(0, 1))
-    def test_single_gpu(self, _):
-        common_cfg = dict(
-            dataset=self.data,
-            samples_per_gpu=self.samples_per_gpu,
-            workers_per_gpu=self.workers_per_gpu,
-            dist=False)
-
-        # Test default config
-        dataloader = build_dataloader(**common_cfg)
-
-        if digit_version(torch.__version__) >= digit_version('1.8.0'):
-            assert dataloader.persistent_workers
-        elif hasattr(dataloader, 'persistent_workers'):
-            assert not dataloader.persistent_workers
-
-        assert dataloader.batch_size == self.samples_per_gpu
-        assert dataloader.num_workers == self.workers_per_gpu
-        assert not all(
-            torch.cat(list(iter(dataloader))) == torch.tensor(self.data))
-
-        # Test without shuffle
-        dataloader = build_dataloader(**common_cfg, shuffle=False)
-        assert all(
-            torch.cat(list(iter(dataloader))) == torch.tensor(self.data))
-
-        # Test with custom sampler_cfg
-        dataloader = build_dataloader(
-            **common_cfg,
-            sampler_cfg=dict(type='RepeatAugSampler', selected_round=0),
-            shuffle=False)
-        expect = [0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6]
-        assert all(torch.cat(list(iter(dataloader))) == torch.tensor(expect))
-
-    @patch('mmcls.datasets.builder.get_dist_info', return_value=(0, 1))
-    def test_multi_gpu(self, _):
-        common_cfg = dict(
-            dataset=self.data,
-            samples_per_gpu=self.samples_per_gpu,
-            workers_per_gpu=self.workers_per_gpu,
-            num_gpus=2,
-            dist=False)
-
-        # Test default config
-        dataloader = build_dataloader(**common_cfg)
-
-        if digit_version(torch.__version__) >= digit_version('1.8.0'):
-            assert dataloader.persistent_workers
-        elif hasattr(dataloader, 'persistent_workers'):
-            assert not dataloader.persistent_workers
-
-        assert dataloader.batch_size == self.samples_per_gpu * 2
-        assert dataloader.num_workers == self.workers_per_gpu * 2
-        assert not all(
-            torch.cat(list(iter(dataloader))) == torch.tensor(self.data))
-
-        # Test without shuffle
-        dataloader = build_dataloader(**common_cfg, shuffle=False)
-        assert all(
-            torch.cat(list(iter(dataloader))) == torch.tensor(self.data))
-
-        # Test with custom sampler_cfg
-        dataloader = build_dataloader(
-            **common_cfg,
-            sampler_cfg=dict(type='RepeatAugSampler', selected_round=0),
-            shuffle=False)
-        expect = torch.tensor(
-            [0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6])
-        assert all(torch.cat(list(iter(dataloader))) == expect)
-
-    @patch('mmcls.datasets.builder.get_dist_info', return_value=(1, 2))
-    def test_distributed(self, _):
-        common_cfg = dict(
-            dataset=self.data,
-            samples_per_gpu=self.samples_per_gpu,
-            workers_per_gpu=self.workers_per_gpu,
-            num_gpus=2,  # num_gpus will be ignored in distributed environment.
-            dist=True)
-
-        # Test default config
-        dataloader = build_dataloader(**common_cfg)
-
-        if digit_version(torch.__version__) >= digit_version('1.8.0'):
-            assert dataloader.persistent_workers
-        elif hasattr(dataloader, 'persistent_workers'):
-            assert not dataloader.persistent_workers
-
-        assert dataloader.batch_size == self.samples_per_gpu
-        assert dataloader.num_workers == self.workers_per_gpu
-        non_expect = torch.tensor(self.data[1::2])
-        assert not all(torch.cat(list(iter(dataloader))) == non_expect)
-
-        # Test without shuffle
-        dataloader = build_dataloader(**common_cfg, shuffle=False)
-        expect = torch.tensor(self.data[1::2])
-        assert all(torch.cat(list(iter(dataloader))) == expect)
-
-        # Test with custom sampler_cfg
-        dataloader = build_dataloader(
-            **common_cfg,
-            sampler_cfg=dict(type='RepeatAugSampler', selected_round=0),
-            shuffle=False)
-        expect = torch.tensor(
-            [0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6][1::2])
-        assert all(torch.cat(list(iter(dataloader))) == expect)
-
-
-class TestDatasetBuilder():
-
-    @classmethod
-    def setup_class(cls):
-        data_prefix = osp.join(osp.dirname(__file__), '../data/dataset')
-        cls.dataset_cfg = dict(
-            type='ImageNet',
-            data_prefix=data_prefix,
-            ann_file=osp.join(data_prefix, 'ann.txt'),
-            pipeline=[],
-            test_mode=False,
-        )
-
-    def test_normal_dataset(self):
-        # Test build
-        dataset = build_dataset(self.dataset_cfg)
-        assert isinstance(dataset, ImageNet)
-        assert dataset.test_mode == self.dataset_cfg['test_mode']
-
-        # Test default_args
-        dataset = build_dataset(self.dataset_cfg, {'test_mode': True})
-        assert dataset.test_mode == self.dataset_cfg['test_mode']
-
-        cp_cfg = deepcopy(self.dataset_cfg)
-        cp_cfg.pop('test_mode')
-        dataset = build_dataset(cp_cfg, {'test_mode': True})
-        assert dataset.test_mode
-
-    def test_concat_dataset(self):
-        # Test build
-        dataset = build_dataset([self.dataset_cfg, self.dataset_cfg])
-        assert isinstance(dataset, ConcatDataset)
-        assert dataset.datasets[0].test_mode == self.dataset_cfg['test_mode']
-
-        # Test default_args
-        dataset = build_dataset([self.dataset_cfg, self.dataset_cfg],
-                                {'test_mode': True})
-        assert dataset.datasets[0].test_mode == self.dataset_cfg['test_mode']
-
-        cp_cfg = deepcopy(self.dataset_cfg)
-        cp_cfg.pop('test_mode')
-        dataset = build_dataset([cp_cfg, cp_cfg], {'test_mode': True})
-        assert dataset.datasets[0].test_mode
-
-    def test_repeat_dataset(self):
-        # Test build
-        dataset = build_dataset(
-            dict(type='RepeatDataset', dataset=self.dataset_cfg, times=3))
-        assert isinstance(dataset, RepeatDataset)
-        assert dataset.dataset.test_mode == self.dataset_cfg['test_mode']
-
-        # Test default_args
-        dataset = build_dataset(
-            dict(type='RepeatDataset', dataset=self.dataset_cfg, times=3),
-            {'test_mode': True})
-        assert dataset.dataset.test_mode == self.dataset_cfg['test_mode']
-
-        cp_cfg = deepcopy(self.dataset_cfg)
-        cp_cfg.pop('test_mode')
-        dataset = build_dataset(
-            dict(type='RepeatDataset', dataset=cp_cfg, times=3),
-            {'test_mode': True})
-        assert dataset.dataset.test_mode
-
-    def test_class_balance_dataset(self):
-        # Test build
-        dataset = build_dataset(
-            dict(
-                type='ClassBalancedDataset',
-                dataset=self.dataset_cfg,
-                oversample_thr=1.,
-            ))
-        assert isinstance(dataset, ClassBalancedDataset)
-        assert dataset.dataset.test_mode == self.dataset_cfg['test_mode']
-
-        # Test default_args
-        dataset = build_dataset(
-            dict(
-                type='ClassBalancedDataset',
-                dataset=self.dataset_cfg,
-                oversample_thr=1.,
-            ), {'test_mode': True})
-        assert dataset.dataset.test_mode == self.dataset_cfg['test_mode']
-
-        cp_cfg = deepcopy(self.dataset_cfg)
-        cp_cfg.pop('test_mode')
-        dataset = build_dataset(
-            dict(
-                type='ClassBalancedDataset',
-                dataset=cp_cfg,
-                oversample_thr=1.,
-            ), {'test_mode': True})
-        assert dataset.dataset.test_mode
-
-    def test_kfold_dataset(self):
-        # Test build
-        dataset = build_dataset(
-            dict(
-                type='KFoldDataset',
-                dataset=self.dataset_cfg,
-                fold=0,
-                num_splits=5,
-                test_mode=False,
-            ))
-        assert isinstance(dataset, KFoldDataset)
-        assert not dataset.test_mode
-        assert dataset.dataset.test_mode == self.dataset_cfg['test_mode']
-
-        # Test default_args
-        dataset = build_dataset(
-            dict(
-                type='KFoldDataset',
-                dataset=self.dataset_cfg,
-                fold=0,
-                num_splits=5,
-                test_mode=False,
-            ),
-            default_args={
-                'test_mode': True,
-                'classes': [1, 2, 3]
-            })
-        assert not dataset.test_mode
-        assert dataset.dataset.test_mode == self.dataset_cfg['test_mode']
-        assert dataset.dataset.CLASSES == [1, 2, 3]
-
-        cp_cfg = deepcopy(self.dataset_cfg)
-        cp_cfg.pop('test_mode')
-        dataset = build_dataset(
-            dict(
-                type='KFoldDataset',
-                dataset=self.dataset_cfg,
-                fold=0,
-                num_splits=5,
-            ),
-            default_args={
-                'test_mode': True,
-                'classes': [1, 2, 3]
-            })
-        # The test_mode in default_args will be passed to KFoldDataset
-        assert dataset.test_mode
-        assert not dataset.dataset.test_mode
-        # Other default_args will be passed to child dataset.
-        assert dataset.dataset.CLASSES == [1, 2, 3]
--- a/tests/test_data/test_datasets/test_dataset_wrapper.py
+++ b/tests/test_data/test_datasets/test_dataset_wrapper.py
@ -1,192 +0,0 @@
-# Copyright (c) OpenMMLab. All rights reserved.
-import bisect
-import math
-from collections import defaultdict
-from unittest.mock import MagicMock, patch
-
-import numpy as np
-import pytest
-
-from mmcls.datasets import (BaseDataset, ClassBalancedDataset, ConcatDataset,
-                            KFoldDataset, RepeatDataset)
-
-
-def mock_evaluate(results,
-                  metric='accuracy',
-                  metric_options=None,
-                  indices=None,
-                  logger=None):
-    return dict(
-        results=results,
-        metric=metric,
-        metric_options=metric_options,
-        indices=indices,
-        logger=logger)
-
-
-@patch.multiple(BaseDataset, __abstractmethods__=set())
-def construct_toy_multi_label_dataset(length):
-    BaseDataset.CLASSES = ('foo', 'bar')
-    BaseDataset.__getitem__ = MagicMock(side_effect=lambda idx: idx)
-    dataset = BaseDataset(data_prefix='', pipeline=[], test_mode=True)
-    cat_ids_list = [
-        np.random.randint(0, 80, num).tolist()
-        for num in np.random.randint(1, 20, length)
-    ]
-    dataset.data_infos = MagicMock()
-    dataset.data_infos.__len__.return_value = length
-    dataset.get_cat_ids = MagicMock(side_effect=lambda idx: cat_ids_list[idx])
-    dataset.get_gt_labels = \
-        MagicMock(side_effect=lambda: np.array(cat_ids_list))
-    dataset.evaluate = MagicMock(side_effect=mock_evaluate)
-    return dataset, cat_ids_list
-
-
-@patch.multiple(BaseDataset, __abstractmethods__=set())
-def construct_toy_single_label_dataset(length):
-    BaseDataset.CLASSES = ('foo', 'bar')
-    BaseDataset.__getitem__ = MagicMock(side_effect=lambda idx: idx)
-    dataset = BaseDataset(data_prefix='', pipeline=[], test_mode=True)
-    cat_ids_list = [[np.random.randint(0, 80)] for _ in range(length)]
-    dataset.data_infos = MagicMock()
-    dataset.data_infos.__len__.return_value = length
-    dataset.get_cat_ids = MagicMock(side_effect=lambda idx: cat_ids_list[idx])
-    dataset.get_gt_labels = \
-        MagicMock(side_effect=lambda: np.array(cat_ids_list))
-    dataset.evaluate = MagicMock(side_effect=mock_evaluate)
-    return dataset, cat_ids_list
-
-
-@pytest.mark.parametrize('construct_dataset', [
-    'construct_toy_multi_label_dataset', 'construct_toy_single_label_dataset'
-])
-def test_concat_dataset(construct_dataset):
-    construct_toy_dataset = eval(construct_dataset)
-    dataset_a, cat_ids_list_a = construct_toy_dataset(10)
-    dataset_b, cat_ids_list_b = construct_toy_dataset(20)
-
-    concat_dataset = ConcatDataset([dataset_a, dataset_b])
-    assert concat_dataset[5] == 5
-    assert concat_dataset[25] == 15
-    assert concat_dataset.get_cat_ids(5) == cat_ids_list_a[5]
-    assert concat_dataset.get_cat_ids(25) == cat_ids_list_b[15]
-    assert len(concat_dataset) == len(dataset_a) + len(dataset_b)
-    assert concat_dataset.CLASSES == BaseDataset.CLASSES
-
-
-@pytest.mark.parametrize('construct_dataset', [
-    'construct_toy_multi_label_dataset', 'construct_toy_single_label_dataset'
-])
-def test_repeat_dataset(construct_dataset):
-    construct_toy_dataset = eval(construct_dataset)
-    dataset, cat_ids_list = construct_toy_dataset(10)
-    repeat_dataset = RepeatDataset(dataset, 10)
-    assert repeat_dataset[5] == 5
-    assert repeat_dataset[15] == 5
-    assert repeat_dataset[27] == 7
-    assert repeat_dataset.get_cat_ids(5) == cat_ids_list[5]
-    assert repeat_dataset.get_cat_ids(15) == cat_ids_list[5]
-    assert repeat_dataset.get_cat_ids(27) == cat_ids_list[7]
-    assert len(repeat_dataset) == 10 * len(dataset)
-    assert repeat_dataset.CLASSES == BaseDataset.CLASSES
-
-
-@pytest.mark.parametrize('construct_dataset', [
-    'construct_toy_multi_label_dataset', 'construct_toy_single_label_dataset'
-])
-def test_class_balanced_dataset(construct_dataset):
-    construct_toy_dataset = eval(construct_dataset)
-    dataset, cat_ids_list = construct_toy_dataset(10)
-
-    category_freq = defaultdict(int)
-    for cat_ids in cat_ids_list:
-        cat_ids = set(cat_ids)
-        for cat_id in cat_ids:
-            category_freq[cat_id] += 1
-    for k, v in category_freq.items():
-        category_freq[k] = v / len(cat_ids_list)
-
-    mean_freq = np.mean(list(category_freq.values()))
-    repeat_thr = mean_freq
-
-    category_repeat = {
-        cat_id: max(1.0, math.sqrt(repeat_thr / cat_freq))
-        for cat_id, cat_freq in category_freq.items()
-    }
-
-    repeat_factors = []
-    for cat_ids in cat_ids_list:
-        cat_ids = set(cat_ids)
-        repeat_factor = max({category_repeat[cat_id] for cat_id in cat_ids})
-        repeat_factors.append(math.ceil(repeat_factor))
-    repeat_factors_cumsum = np.cumsum(repeat_factors)
-    repeat_factor_dataset = ClassBalancedDataset(dataset, repeat_thr)
-    assert repeat_factor_dataset.CLASSES == BaseDataset.CLASSES
-    assert len(repeat_factor_dataset) == repeat_factors_cumsum[-1]
-    for idx in np.random.randint(0, len(repeat_factor_dataset), 3):
-        assert repeat_factor_dataset[idx] == bisect.bisect_right(
-            repeat_factors_cumsum, idx)
-
-
-@pytest.mark.parametrize('construct_dataset', [
-    'construct_toy_multi_label_dataset', 'construct_toy_single_label_dataset'
-])
-def test_kfold_dataset(construct_dataset):
-    construct_toy_dataset = eval(construct_dataset)
-    dataset, cat_ids_list = construct_toy_dataset(10)
-
-    # test without random seed
-    train_datasets = [
-        KFoldDataset(dataset, fold=i, num_splits=3, test_mode=False)
-        for i in range(5)
-    ]
-    test_datasets = [
-        KFoldDataset(dataset, fold=i, num_splits=3, test_mode=True)
-        for i in range(5)
-    ]
-
-    assert sum([i.indices for i in test_datasets], []) == list(range(10))
-    for train_set, test_set in zip(train_datasets, test_datasets):
-        train_samples = [train_set[i] for i in range(len(train_set))]
-        test_samples = [test_set[i] for i in range(len(test_set))]
-        assert set(train_samples + test_samples) == set(range(10))
-
-    # test with random seed
-    train_datasets = [
-        KFoldDataset(dataset, fold=i, num_splits=3, test_mode=False, seed=1)
-        for i in range(5)
-    ]
-    test_datasets = [
-        KFoldDataset(dataset, fold=i, num_splits=3, test_mode=True, seed=1)
-        for i in range(5)
-    ]
-
-    assert sum([i.indices for i in test_datasets], []) != list(range(10))
-    assert set(sum([i.indices for i in test_datasets], [])) == set(range(10))
-    for train_set, test_set in zip(train_datasets, test_datasets):
-        train_samples = [train_set[i] for i in range(len(train_set))]
-        test_samples = [test_set[i] for i in range(len(test_set))]
-        assert set(train_samples + test_samples) == set(range(10))
-
-    # test behavior of get_cat_ids method
-    for train_set, test_set in zip(train_datasets, test_datasets):
-        for i in range(len(train_set)):
-            cat_ids = train_set.get_cat_ids(i)
-            assert cat_ids == cat_ids_list[train_set.indices[i]]
-        for i in range(len(test_set)):
-            cat_ids = test_set.get_cat_ids(i)
-            assert cat_ids == cat_ids_list[test_set.indices[i]]
-
-    # test behavior of get_gt_labels method
-    for train_set, test_set in zip(train_datasets, test_datasets):
-        for i in range(len(train_set)):
-            gt_label = train_set.get_gt_labels()[i]
-            assert gt_label == cat_ids_list[train_set.indices[i]]
-        for i in range(len(test_set)):
-            gt_label = test_set.get_gt_labels()[i]
-            assert gt_label == cat_ids_list[test_set.indices[i]]
-
-    # test evaluate
-    for test_set in test_datasets:
-        eval_inputs = test_set.evaluate(None)
-        assert eval_inputs['indices'] == test_set.indices
--- a/tests/test_data/test_datasets/test_sampler.py
+++ b/tests/test_data/test_datasets/test_sampler.py
@ -1,53 +0,0 @@
-# Copyright (c) OpenMMLab. All rights reserved.
-
-from unittest.mock import MagicMock, patch
-
-import numpy as np
-
-from mmcls.datasets import BaseDataset, RepeatAugSampler, build_sampler
-
-
-@patch.multiple(BaseDataset, __abstractmethods__=set())
-def construct_toy_single_label_dataset(length):
-    BaseDataset.CLASSES = ('foo', 'bar')
-    BaseDataset.__getitem__ = MagicMock(side_effect=lambda idx: idx)
-    dataset = BaseDataset(data_prefix='', pipeline=[], test_mode=True)
-    cat_ids_list = [[np.random.randint(0, 80)] for _ in range(length)]
-    dataset.data_infos = MagicMock()
-    dataset.data_infos.__len__.return_value = length
-    dataset.get_cat_ids = MagicMock(side_effect=lambda idx: cat_ids_list[idx])
-    return dataset, cat_ids_list
-
-
-@patch('mmcls.datasets.samplers.repeat_aug.get_dist_info', return_value=(0, 1))
-def test_sampler_builder(_):
-    assert build_sampler(None) is None
-    dataset = construct_toy_single_label_dataset(1000)[0]
-    build_sampler(dict(type='RepeatAugSampler', dataset=dataset))
-
-
-@patch('mmcls.datasets.samplers.repeat_aug.get_dist_info', return_value=(0, 1))
-def test_rep_aug(_):
-    dataset = construct_toy_single_label_dataset(1000)[0]
-    ra = RepeatAugSampler(dataset, selected_round=0, shuffle=False)
-    ra.set_epoch(0)
-    assert len(ra) == 1000
-    ra = RepeatAugSampler(dataset)
-    assert len(ra) == 768
-    val = None
-    for idx, content in enumerate(ra):
-        if idx % 3 == 0:
-            val = content
-        else:
-            assert val is not None
-            assert content == val
-
-
-@patch('mmcls.datasets.samplers.repeat_aug.get_dist_info', return_value=(0, 2))
-def test_rep_aug_dist(_):
-    dataset = construct_toy_single_label_dataset(1000)[0]
-    ra = RepeatAugSampler(dataset, selected_round=0, shuffle=False)
-    ra.set_epoch(0)
-    assert len(ra) == 1000 // 2
-    ra = RepeatAugSampler(dataset)
-    assert len(ra) == 768 // 2
--- a/tests/test_data/test_pipelines/test_formatting.py
+++ b/tests/test_data/test_pipelines/test_formatting.py
@ -0,0 +1,54 @@
+# Copyright (c) OpenMMLab. All rights reserved.
+import copy
+import os.path as osp
+import unittest
+
+import numpy as np
+import torch
+from mmengine.data import LabelData
+
+from mmcls.core import ClsDataSample
+from mmcls.datasets.pipelines import PackClsInputs
+
+
+class TestPackClsInputs(unittest.TestCase):
+
+    def setUp(self):
+        """Setup the model and optimizer which are used in every test method.
+
+        TestCase calls functions in this order: setUp() -> testMethod() ->
+        tearDown() -> cleanUp()
+        """
+        data_prefix = osp.join(osp.dirname(__file__), '../../data')
+        img_path = osp.join(data_prefix, 'color.jpg')
+        rng = np.random.RandomState(0)
+        self.results1 = {
+            'sample_idx': 1,
+            'img_path': img_path,
+            'ori_height': 300,
+            'ori_width': 400,
+            'height': 600,
+            'width': 800,
+            'scale_factor': 2.0,
+            'flip': False,
+            'img': rng.rand(300, 400),
+            'gt_label': rng.randint(3, )
+        }
+        self.meta_keys = ('sample_idx', 'img_path', 'ori_shape', 'img_shape',
+                          'scale_factor', 'flip')
+
+    def test_transform(self):
+        transform = PackClsInputs(meta_keys=self.meta_keys)
+        results = transform(copy.deepcopy(self.results1))
+        self.assertIn('inputs', results)
+        self.assertIsInstance(results['inputs'], torch.Tensor)
+        self.assertIn('data_sample', results)
+        self.assertIsInstance(results['data_sample'], ClsDataSample)
+
+        data_sample = results['data_sample']
+        self.assertIsInstance(data_sample.gt_label, LabelData)
+
+    def test_repr(self):
+        transform = PackClsInputs(meta_keys=self.meta_keys)
+        self.assertEqual(
+            repr(transform), f'PackClsInputs(meta_keys={self.meta_keys})')
--- a/tests/test_data/test_pipelines/test_loading.py
+++ b/tests/test_data/test_pipelines/test_loading.py
@ -1,59 +0,0 @@
-# Copyright (c) OpenMMLab. All rights reserved.
-import copy
-import os.path as osp
-
-import numpy as np
-
-from mmcls.datasets.pipelines import LoadImageFromFile
-
-
-class TestLoading(object):
-
-    @classmethod
-    def setup_class(cls):
-        cls.data_prefix = osp.join(osp.dirname(__file__), '../../data')
-
-    def test_load_img(self):
-        results = dict(
-            img_prefix=self.data_prefix, img_info=dict(filename='color.jpg'))
-        transform = LoadImageFromFile()
-        results = transform(copy.deepcopy(results))
-        assert results['filename'] == osp.join(self.data_prefix, 'color.jpg')
-        assert results['ori_filename'] == 'color.jpg'
-        assert results['img'].shape == (300, 400, 3)
-        assert results['img'].dtype == np.uint8
-        assert results['img_shape'] == (300, 400, 3)
-        assert results['ori_shape'] == (300, 400, 3)
-        np.testing.assert_equal(results['img_norm_cfg']['mean'],
-                                np.zeros(3, dtype=np.float32))
-        assert repr(transform) == transform.__class__.__name__ + \
-            "(to_float32=False, color_type='color', " + \
-            "file_client_args={'backend': 'disk'})"
-
-        # no img_prefix
-        results = dict(
-            img_prefix=None, img_info=dict(filename='tests/data/color.jpg'))
-        transform = LoadImageFromFile()
-        results = transform(copy.deepcopy(results))
-        assert results['filename'] == 'tests/data/color.jpg'
-        assert results['img'].shape == (300, 400, 3)
-
-        # to_float32
-        transform = LoadImageFromFile(to_float32=True)
-        results = transform(copy.deepcopy(results))
-        assert results['img'].dtype == np.float32
-
-        # gray image
-        results = dict(
-            img_prefix=self.data_prefix, img_info=dict(filename='gray.jpg'))
-        transform = LoadImageFromFile()
-        results = transform(copy.deepcopy(results))
-        assert results['img'].shape == (288, 512, 3)
-        assert results['img'].dtype == np.uint8
-
-        transform = LoadImageFromFile(color_type='unchanged')
-        results = transform(copy.deepcopy(results))
-        assert results['img'].shape == (288, 512)
-        assert results['img'].dtype == np.uint8
-        np.testing.assert_equal(results['img_norm_cfg']['mean'],
-                                np.zeros(1, dtype=np.float32))
--- a/tests/test_data/test_pipelines/test_transform.py
+++ b/tests/test_data/test_pipelines/test_transform.py
@ -31,204 +31,6 @@ def construct_toy_data():
    return results


-def test_resize():
-    # test assertion if size is smaller than 0
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=-1)
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if size is tuple but the second value is smaller than 0
-    # and the second value is not equal to -1
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=(224, -2))
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if size is tuple but the first value is smaller than 0
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=(-1, 224))
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if size is tuple and len(size) < 2
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=(224, ))
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if size is tuple len(size) > 2
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=(224, 224, 3))
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion when interpolation is invalid
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=224, interpolation='2333')
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion when resize_short is invalid
-    with pytest.raises(AssertionError):
-        transform = dict(type='Resize', size=224, adaptive_side='False')
-        build_from_cfg(transform, PIPELINES)
-
-    # test repr
-    transform = dict(type='Resize', size=224)
-    resize_module = build_from_cfg(transform, PIPELINES)
-    assert isinstance(repr(resize_module), str)
-
-    # read test image
-    results = dict()
-    img = mmcv.imread(
-        osp.join(osp.dirname(__file__), '../../data/color.jpg'), 'color')
-    original_img = copy.deepcopy(img)
-    results['img'] = img
-    results['img2'] = copy.deepcopy(img)
-    results['img_shape'] = img.shape
-    results['ori_shape'] = img.shape
-    results['img_fields'] = ['img', 'img2']
-
-    def reset_results(results, original_img):
-        results['img'] = copy.deepcopy(original_img)
-        results['img2'] = copy.deepcopy(original_img)
-        results['img_shape'] = original_img.shape
-        results['ori_shape'] = original_img.shape
-        results['img_fields'] = ['img', 'img2']
-        return results
-
-    # test resize when size is int
-    transform = dict(type='Resize', size=224, interpolation='bilinear')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = resize_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (224, 224, 3)
-
-    # test resize when size is tuple and the second value is -1
-    transform = dict(type='Resize', size=(224, -1), interpolation='bilinear')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (224, 298, 3)
-
-    # test resize when size is tuple
-    transform = dict(type='Resize', size=(224, 224), interpolation='bilinear')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (224, 224, 3)
-
-    # test resize when resize_height != resize_width
-    transform = dict(type='Resize', size=(224, 256), interpolation='bilinear')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (224, 256, 3)
-
-    # test resize when size is larger than img.shape
-    img_height, img_width, _ = original_img.shape
-    transform = dict(
-        type='Resize',
-        size=(img_height * 2, img_width * 2),
-        interpolation='bilinear')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (img_height * 2, img_width * 2, 3)
-
-    # test resize with different backends
-    transform_cv2 = dict(
-        type='Resize',
-        size=(224, 256),
-        interpolation='bilinear',
-        backend='cv2')
-    transform_pil = dict(
-        type='Resize',
-        size=(224, 256),
-        interpolation='bilinear',
-        backend='pillow')
-    resize_module_cv2 = build_from_cfg(transform_cv2, PIPELINES)
-    resize_module_pil = build_from_cfg(transform_pil, PIPELINES)
-    results = reset_results(results, original_img)
-    results['img_fields'] = ['img']
-    results_cv2 = resize_module_cv2(results)
-    results['img_fields'] = ['img2']
-    results_pil = resize_module_pil(results)
-    assert np.allclose(results_cv2['img'], results_pil['img2'], atol=45)
-
-    # compare results with torchvision
-    transform = dict(type='Resize', size=(224, 224), interpolation='area')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module(results)
-    resize_module = transforms.Resize(
-        size=(224, 224), interpolation=Image.BILINEAR)
-    pil_img = Image.fromarray(original_img)
-    resized_img = resize_module(pil_img)
-    resized_img = np.array(resized_img)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (224, 224, 3)
-    assert np.allclose(results['img'], resized_img, atol=30)
-
-    # test resize when size is tuple, the second value is -1
-    # and adaptive_side='long'
-    transform = dict(
-        type='Resize',
-        size=(224, -1),
-        adaptive_side='long',
-        interpolation='bilinear')
-    resize_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (168, 224, 3)
-
-    # test resize when size is tuple, the second value is -1
-    # and adaptive_side='long', h > w
-    transform1 = dict(type='Resize', size=(300, 200), interpolation='bilinear')
-    resize_module1 = build_from_cfg(transform1, PIPELINES)
-    transform2 = dict(
-        type='Resize',
-        size=(224, -1),
-        adaptive_side='long',
-        interpolation='bilinear')
-    resize_module2 = build_from_cfg(transform2, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module1(results)
-    results = resize_module2(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (224, 149, 3)
-
-    # test resize when size is tuple, the second value is -1
-    # and adaptive_side='short', h > w
-    transform1 = dict(type='Resize', size=(300, 200), interpolation='bilinear')
-    resize_module1 = build_from_cfg(transform1, PIPELINES)
-    transform2 = dict(
-        type='Resize',
-        size=(224, -1),
-        adaptive_side='short',
-        interpolation='bilinear')
-    resize_module2 = build_from_cfg(transform2, PIPELINES)
-    results = reset_results(results, original_img)
-    results = resize_module1(results)
-    results = resize_module2(results)
-    assert np.equal(results['img'], results['img2']).all()
-    assert results['img_shape'] == (336, 224, 3)
-
-    # test interpolation method checking
-    with pytest.raises(AssertionError):
-        transform = dict(
-            type='Resize', size=(300, 200), backend='cv2', interpolation='box')
-        resize_module = build_from_cfg(transform, PIPELINES)
-
-    with pytest.raises(AssertionError):
-        transform = dict(
-            type='Resize',
-            size=(300, 200),
-            backend='pillow',
-            interpolation='area')
-        resize_module = build_from_cfg(transform, PIPELINES)
-
-
 def test_pad():
    results = dict()
    img = mmcv.imread(
@ -361,7 +163,7 @@ def test_center_crop():
    short_edge = min(*results['ori_shape'][:2])
    transform = dict(type='CenterCrop', crop_size=short_edge)
    baseline_center_crop_module = build_from_cfg(transform, PIPELINES)
-    transform = dict(type='Resize', size=224)
+    transform = dict(type='Resize', scale=224)
    baseline_resize_module = build_from_cfg(transform, PIPELINES)
    results = reset_results(results, original_img)
    results = baseline_center_crop_module(results)
@ -617,310 +419,6 @@ def test_randomcrop():
        assert nonzero == nonzero_transform


-def test_randomresizedcrop():
-    ori_img = mmcv.imread(
-        osp.join(osp.dirname(__file__), '../../data/color.jpg'), 'color')
-    ori_img_pil = Image.open(
-        osp.join(osp.dirname(__file__), '../../data/color.jpg'))
-
-    seed = random.randint(0, 100)
-
-    # test when scale is not of kind (min, max)
-    with pytest.raises(ValueError):
-        kwargs = dict(
-            size=(200, 300), scale=(1.0, 0.08), ratio=(3. / 4., 4. / 3.))
-        aug = []
-        aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-        composed_transform = Compose(aug)
-        results = dict()
-        results['img'] = ori_img
-        composed_transform(results)['img']
-
-    # test when ratio is not of kind (min, max)
-    with pytest.raises(ValueError):
-        kwargs = dict(
-            size=(200, 300), scale=(0.08, 1.0), ratio=(4. / 3., 3. / 4.))
-        aug = []
-        aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-        composed_transform = Compose(aug)
-        results = dict()
-        results['img'] = ori_img
-        composed_transform(results)['img']
-
-    # test when efficientnet_style is True and crop_padding < 0
-    with pytest.raises(AssertionError):
-        kwargs = dict(size=200, efficientnet_style=True, crop_padding=-1)
-        aug = []
-        aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-        composed_transform = Compose(aug)
-        results = dict()
-        results['img'] = ori_img
-        composed_transform(results)['img']
-
-    # test crop size is int
-    kwargs = dict(size=200, scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.))
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([torchvision.transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    baseline = composed_transform(ori_img_pil)
-
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-
-    # test __repr__()
-    print(composed_transform)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert np.array(img).shape == (200, 200, 3)
-    assert np.array(baseline).shape == (200, 200, 3)
-    nonzero = len((ori_img - np.array(ori_img_pil)[:, :, ::-1]).nonzero())
-    nonzero_transform = len((img - np.array(baseline)[:, :, ::-1]).nonzero())
-    assert nonzero == nonzero_transform
-
-    # test crop size < image size
-    kwargs = dict(size=(200, 300), scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.))
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([torchvision.transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    baseline = composed_transform(ori_img_pil)
-
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert np.array(img).shape == (200, 300, 3)
-    assert np.array(baseline).shape == (200, 300, 3)
-    nonzero = len((ori_img - np.array(ori_img_pil)[:, :, ::-1]).nonzero())
-    nonzero_transform = len((img - np.array(baseline)[:, :, ::-1]).nonzero())
-    assert nonzero == nonzero_transform
-
-    # test crop size < image size when efficientnet_style = True
-    kwargs = dict(
-        size=200,
-        scale=(0.08, 1.0),
-        ratio=(3. / 4., 4. / 3.),
-        efficientnet_style=True)
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert img.shape == (200, 200, 3)
-
-    # test crop size > image size
-    kwargs = dict(size=(600, 700), scale=(0.08, 1.0), ratio=(3. / 4., 4. / 3.))
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([torchvision.transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    baseline = composed_transform(ori_img_pil)
-
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert np.array(img).shape == (600, 700, 3)
-    assert np.array(baseline).shape == (600, 700, 3)
-    nonzero = len((ori_img - np.array(ori_img_pil)[:, :, ::-1]).nonzero())
-    nonzero_transform = len((img - np.array(baseline)[:, :, ::-1]).nonzero())
-    assert nonzero == nonzero_transform
-
-    # test crop size < image size when efficientnet_style = True
-    kwargs = dict(
-        size=600,
-        scale=(0.08, 1.0),
-        ratio=(3. / 4., 4. / 3.),
-        efficientnet_style=True)
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert img.shape == (600, 600, 3)
-
-    # test cropping the whole image
-    kwargs = dict(
-        size=(ori_img.shape[0], ori_img.shape[1]),
-        scale=(1.0, 2.0),
-        ratio=(1.0, 2.0))
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([torchvision.transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    baseline = composed_transform(ori_img_pil)
-
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert np.array(img).shape == (ori_img.shape[0], ori_img.shape[1], 3)
-    assert np.array(baseline).shape == (ori_img.shape[0], ori_img.shape[1], 3)
-    nonzero = len((ori_img - np.array(ori_img_pil)[:, :, ::-1]).nonzero())
-    nonzero_transform = len((img - np.array(baseline)[:, :, ::-1]).nonzero())
-    assert nonzero == nonzero_transform
-    # assert_array_equal(ori_img, img)
-    # assert_array_equal(np.array(ori_img_pil), np.array(baseline))
-
-    # test central crop when in_ratio < min(ratio)
-    kwargs = dict(
-        size=(ori_img.shape[0], ori_img.shape[1]),
-        scale=(1.0, 2.0),
-        ratio=(2., 3.))
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([torchvision.transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    baseline = composed_transform(ori_img_pil)
-
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert np.array(img).shape == (ori_img.shape[0], ori_img.shape[1], 3)
-    assert np.array(baseline).shape == (ori_img.shape[0], ori_img.shape[1], 3)
-    nonzero = len((ori_img - np.array(ori_img_pil)[:, :, ::-1]).nonzero())
-    nonzero_transform = len((img - np.array(baseline)[:, :, ::-1]).nonzero())
-    assert nonzero == nonzero_transform
-
-    # test central crop when in_ratio > max(ratio)
-    kwargs = dict(
-        size=(ori_img.shape[0], ori_img.shape[1]),
-        scale=(1.0, 2.0),
-        ratio=(3. / 4., 1))
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([torchvision.transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    baseline = composed_transform(ori_img_pil)
-
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-    assert np.array(img).shape == (ori_img.shape[0], ori_img.shape[1], 3)
-    assert np.array(baseline).shape == (ori_img.shape[0], ori_img.shape[1], 3)
-    nonzero = len((ori_img - np.array(ori_img_pil)[:, :, ::-1]).nonzero())
-    nonzero_transform = len((img - np.array(baseline)[:, :, ::-1]).nonzero())
-    assert nonzero == nonzero_transform
-
-    # test central crop when max_attempts = 0 and efficientnet_style = True
-    kwargs = dict(
-        size=200,
-        scale=(0.08, 1.0),
-        ratio=(3. / 4., 4. / 3.),
-        efficientnet_style=True,
-        max_attempts=0,
-        crop_padding=32)
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-
-    kwargs = dict(crop_size=200, efficientnet_style=True, crop_padding=32)
-    resize_kwargs = dict(size=200)
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.CenterCrop(**kwargs)])
-    aug.extend([mmcls_transforms.Resize(**resize_kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    baseline = composed_transform(results)['img']
-
-    assert img.shape == baseline.shape
-    assert np.equal(img, baseline).all()
-
-    # test central crop when max_attempts = 0 and efficientnet_style = True
-    kwargs = dict(
-        size=200,
-        scale=(0.08, 1.0),
-        ratio=(3. / 4., 4. / 3.),
-        efficientnet_style=True,
-        max_attempts=100,
-        min_covered=1)
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    img = composed_transform(results)['img']
-
-    kwargs = dict(crop_size=200, efficientnet_style=True, crop_padding=32)
-    resize_kwargs = dict(size=200)
-    random.seed(seed)
-    np.random.seed(seed)
-    aug = []
-    aug.extend([mmcls_transforms.CenterCrop(**kwargs)])
-    aug.extend([mmcls_transforms.Resize(**resize_kwargs)])
-    composed_transform = Compose(aug)
-    results = dict()
-    results['img'] = ori_img
-    baseline = composed_transform(results)['img']
-
-    assert img.shape == baseline.shape
-    assert np.equal(img, baseline).all()
-
-    # test different interpolation types
-    for mode in ['nearest', 'bilinear', 'bicubic', 'area', 'lanczos']:
-        kwargs = dict(
-            size=(600, 700),
-            scale=(0.08, 1.0),
-            ratio=(3. / 4., 4. / 3.),
-            interpolation=mode)
-        aug = []
-        aug.extend([mmcls_transforms.RandomResizedCrop(**kwargs)])
-        composed_transform = Compose(aug)
-        results = dict()
-        results['img'] = ori_img
-        img = composed_transform(results)['img']
-        assert img.shape == (600, 700, 3)
-
-
 def test_randomgrayscale():

    # test rgb2gray, return the grayscale image with p>1
@ -978,83 +476,6 @@ def test_randomgrayscale():
    assert np.array(img_pil).shape == (10, 10)


-def test_randomflip():
-    # test assertion if flip probability is smaller than 0
-    with pytest.raises(AssertionError):
-        transform = dict(type='RandomFlip', flip_prob=-1)
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if flip probability is larger than 1
-    with pytest.raises(AssertionError):
-        transform = dict(type='RandomFlip', flip_prob=2)
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if direction is not horizontal and vertical
-    with pytest.raises(AssertionError):
-        transform = dict(type='RandomFlip', direction='random')
-        build_from_cfg(transform, PIPELINES)
-
-    # test assertion if direction is not lowercase
-    with pytest.raises(AssertionError):
-        transform = dict(type='RandomFlip', direction='Horizontal')
-        build_from_cfg(transform, PIPELINES)
-
-    # read test image
-    results = dict()
-    img = mmcv.imread(
-        osp.join(osp.dirname(__file__), '../../data/color.jpg'), 'color')
-    original_img = copy.deepcopy(img)
-    results['img'] = img
-    results['img2'] = copy.deepcopy(img)
-    results['img_shape'] = img.shape
-    results['ori_shape'] = img.shape
-    results['img_fields'] = ['img', 'img2']
-
-    def reset_results(results, original_img):
-        results['img'] = copy.deepcopy(original_img)
-        results['img2'] = copy.deepcopy(original_img)
-        results['img_shape'] = original_img.shape
-        results['ori_shape'] = original_img.shape
-        return results
-
-    # test RandomFlip when flip_prob is 0
-    transform = dict(type='RandomFlip', flip_prob=0)
-    flip_module = build_from_cfg(transform, PIPELINES)
-    results = flip_module(results)
-    assert np.equal(results['img'], original_img).all()
-    assert np.equal(results['img'], results['img2']).all()
-
-    # test RandomFlip when flip_prob is 1
-    transform = dict(type='RandomFlip', flip_prob=1)
-    flip_module = build_from_cfg(transform, PIPELINES)
-    results = flip_module(results)
-    assert np.equal(results['img'], results['img2']).all()
-
-    # compare horizontal flip with torchvision
-    transform = dict(type='RandomFlip', flip_prob=1, direction='horizontal')
-    flip_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = flip_module(results)
-    flip_module = transforms.RandomHorizontalFlip(p=1)
-    pil_img = Image.fromarray(original_img)
-    flipped_img = flip_module(pil_img)
-    flipped_img = np.array(flipped_img)
-    assert np.equal(results['img'], results['img2']).all()
-    assert np.equal(results['img'], flipped_img).all()
-
-    # compare vertical flip with torchvision
-    transform = dict(type='RandomFlip', flip_prob=1, direction='vertical')
-    flip_module = build_from_cfg(transform, PIPELINES)
-    results = reset_results(results, original_img)
-    results = flip_module(results)
-    flip_module = transforms.RandomVerticalFlip(p=1)
-    pil_img = Image.fromarray(original_img)
-    flipped_img = flip_module(pil_img)
-    flipped_img = np.array(flipped_img)
-    assert np.equal(results['img'], results['img2']).all()
-    assert np.equal(results['img'], flipped_img).all()
-
-
 def test_random_erasing():
    # test erase_prob assertion
    with pytest.raises(AssertionError):
@ -1269,6 +690,8 @@ def test_albu_transform():
    results = dict(
        img_prefix=osp.join(osp.dirname(__file__), '../../data'),
        img_info=dict(filename='color.jpg'))
+    results['img_path'] = osp.join(results['img_prefix'],
+                                   results['img_info']['filename'])

    # Define simple pipeline
    load = dict(type='LoadImageFromFile')