mmpretrain/tools/visualization/browse_dataset.py

# Copyright (c) OpenMMLab. All rights reserved.
import argparse
import os.path as osp
import sys

import mmcv
from mmengine.config import Config, DictAction
from mmengine.dataset import Compose
from mmengine.registry import init_default_scope
from mmengine.utils import ProgressBar
from mmengine.visualization.utils import img_from_canvas

from mmpretrain.datasets.builder import build_dataset
from mmpretrain.visualization import UniversalVisualizer, create_figure


def parse_args():
    parser = argparse.ArgumentParser(description='Browse a dataset')
    parser.add_argument('config', help='train config file path')
    parser.add_argument(
        '--output-dir',
        '-o',
        default=None,
        type=str,
        help='If there is no display interface, you can save it.')
    parser.add_argument('--not-show', default=False, action='store_true')
    parser.add_argument(
        '--phase',
        '-p',
        default='train',
        type=str,
        choices=['train', 'test', 'val'],
        help='phase of dataset to visualize, accept "train" "test" and "val".'
        ' Defaults to "train".')
    parser.add_argument(
        '--show-number',
        '-n',
        type=int,
        default=sys.maxsize,
        help='number of images selected to visualize, must bigger than 0. if '
        'the number is bigger than length of dataset, show all the images in '
        'dataset; default "sys.maxsize", show all images in dataset')
    parser.add_argument(
        '--show-interval',
        '-i',
        type=float,
        default=2,
        help='the interval of show (s)')
    parser.add_argument(
        '--mode',
        '-m',
        default='transformed',
        type=str,
        choices=['original', 'transformed', 'concat', 'pipeline'],
        help='display mode; display original pictures or transformed pictures'
        ' or comparison pictures. "original" means show images load from disk'
        '; "transformed" means to show images after transformed; "concat" '
        'means show images stitched by "original" and "output" images. '
        '"pipeline" means show all the intermediate images. '
        'Defaults to "transformed".')
    parser.add_argument(
        '--rescale-factor',
        '-r',
        type=float,
        help='image rescale factor, which is useful if the output is too '
        'large or too small.')
    parser.add_argument(
        '--channel-order',
        '-c',
        default='BGR',
        choices=['BGR', 'RGB'],
        help='The channel order of the showing images, could be "BGR" '
        'or "RGB", Defaults to "BGR".')
    parser.add_argument(
        '--cfg-options',
        nargs='+',
        action=DictAction,
        help='override some settings in the used config, the key-value pair '
        'in xxx=yyy format will be merged into config file. If the value to '
        'be overwritten is a list, it should be like key="[a,b]" or key=a,b '
        'It also allows nested list/tuple values, e.g. key="[(a,b),(c,d)]" '
        'Note that the quotation marks are necessary and that no white space '
        'is allowed.')
    args = parser.parse_args()
    return args


def make_grid(imgs, names, rescale_factor=None):
    """Concat list of pictures into a single big picture, align height here."""
    figure = create_figure()
    gs = figure.add_gridspec(1, len(imgs))

    ori_shapes = [img.shape[:2] for img in imgs]
    if rescale_factor is not None:
        imgs = [mmcv.imrescale(img, rescale_factor) for img in imgs]

    for i, img in enumerate(imgs):
        subplot = figure.add_subplot(gs[0, i])
        subplot.axis(False)
        subplot.imshow(img)
        subplot.set_title(f'{names[i]}\n{ori_shapes[i]}')

    return img_from_canvas(figure.canvas)


class InspectCompose(Compose):
    """Compose multiple transforms sequentially.

    And record "img" field of all results in one list.
    """

    def __init__(self, transforms, intermediate_imgs):
        super().__init__(transforms=transforms)
        self.intermediate_imgs = intermediate_imgs

    def __call__(self, data):
        if 'img' in data:
            self.intermediate_imgs.append({
                'name': 'Original',
                'img': data['img'].copy()
            })

        for t in self.transforms:
            data = t(data)
            if data is None:
                return None
            if 'img' in data:
                self.intermediate_imgs.append({
                    'name': t.__class__.__name__,
                    'img': data['img'].copy()
                })
        return data


def main():
    args = parse_args()
    cfg = Config.fromfile(args.config)
    if args.cfg_options is not None:
        cfg.merge_from_dict(args.cfg_options)

    init_default_scope('mmpretrain')  # Use mmpretrain as default scope.

    dataset_cfg = cfg.get(args.phase + '_dataloader').get('dataset')
    dataset = build_dataset(dataset_cfg)

    intermediate_imgs = []
    dataset.pipeline = InspectCompose(dataset.pipeline.transforms,
                                      intermediate_imgs)

    # init visualizer
    cfg.visualizer.pop('type')
    visualizer = UniversalVisualizer(**cfg.visualizer)
    visualizer.dataset_meta = dataset.metainfo

    # init visualization image number
    display_number = min(args.show_number, len(dataset))
    progress_bar = ProgressBar(display_number)

    for i, item in zip(range(display_number), dataset):
        rescale_factor = args.rescale_factor
        if args.mode == 'original':
            image = intermediate_imgs[0]['img']
        elif args.mode == 'transformed':
            image = intermediate_imgs[-1]['img']
        elif args.mode == 'concat':
            ori_image = intermediate_imgs[0]['img']
            trans_image = intermediate_imgs[-1]['img']
            image = make_grid([ori_image, trans_image],
                              ['original', 'transformed'], rescale_factor)
            rescale_factor = None
        else:
            image = make_grid([result['img'] for result in intermediate_imgs],
                              [result['name'] for result in intermediate_imgs],
                              rescale_factor)
            rescale_factor = None

        intermediate_imgs.clear()

        data_sample = item['data_samples'].numpy()

        # get filename from dataset or just use index as filename
        if hasattr(item['data_samples'], 'img_path'):
            filename = osp.basename(item['data_samples'].img_path)
        else:
            # some dataset have not image path
            filename = f'{i}.jpg'

        out_file = osp.join(args.output_dir,
                            filename) if args.output_dir is not None else None

        visualizer.visualize_cls(
            image if args.channel_order == 'RGB' else image[..., ::-1],
            data_sample,
            rescale_factor=rescale_factor,
            show=not args.not_show,
            wait_time=args.show_interval,
            name=filename,
            out_file=out_file)
        progress_bar.update()


if __name__ == '__main__':
    main()
Add browse dataset 2022-05-30 03:11:44 +00:00			`# Copyright (c) OpenMMLab. All rights reserved.`
			`import argparse`
			`import os.path as osp`
			`import sys`

			`import mmcv`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`from mmengine.config import Config, DictAction`
			`from mmengine.dataset import Compose`
[Improve] Update registries of mmcls. (#1306) * [Improve] Update registries of mmcls. * Update according to comments 2023-01-11 15:20:51 +08:00			`from mmengine.registry import init_default_scope`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`from mmengine.utils import ProgressBar`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`from mmengine.visualization.utils import img_from_canvas`
Add browse dataset 2022-05-30 03:11:44 +00:00
Rename the package name to `mmpretrain`. 2023-02-17 11:31:08 +08:00			`from mmpretrain.datasets.builder import build_dataset`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`from mmpretrain.visualization import UniversalVisualizer, create_figure`
Add browse dataset 2022-05-30 03:11:44 +00:00

			`def parse_args():`
			`parser = argparse.ArgumentParser(description='Browse a dataset')`
			`parser.add_argument('config', help='train config file path')`
			`parser.add_argument(`
			`'--output-dir',`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`'-o',`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`default=None,`
Add browse dataset 2022-05-30 03:11:44 +00:00			`type=str,`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`help='If there is no display interface, you can save it.')`
Add browse dataset 2022-05-30 03:11:44 +00:00			`parser.add_argument('--not-show', default=False, action='store_true')`
			`parser.add_argument(`
			`'--phase',`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`'-p',`
Add browse dataset 2022-05-30 03:11:44 +00:00			`default='train',`
			`type=str,`
			`choices=['train', 'test', 'val'],`
			`help='phase of dataset to visualize, accept "train" "test" and "val".'`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`' Defaults to "train".')`
Add browse dataset 2022-05-30 03:11:44 +00:00			`parser.add_argument(`
			`'--show-number',`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`'-n',`
Add browse dataset 2022-05-30 03:11:44 +00:00			`type=int,`
			`default=sys.maxsize,`
			`help='number of images selected to visualize, must bigger than 0. if '`
			`'the number is bigger than length of dataset, show all the images in '`
			`'dataset; default "sys.maxsize", show all images in dataset')`
			`parser.add_argument(`
			`'--show-interval',`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`'-i',`
Add browse dataset 2022-05-30 03:11:44 +00:00			`type=float,`
			`default=2,`
			`help='the interval of show (s)')`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`parser.add_argument(`
			`'--mode',`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`'-m',`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`default='transformed',`
			`type=str,`
			`choices=['original', 'transformed', 'concat', 'pipeline'],`
			`help='display mode; display original pictures or transformed pictures'`
			`' or comparison pictures. "original" means show images load from disk'`
			`'; "transformed" means to show images after transformed; "concat" '`
			`'means show images stitched by "original" and "output" images. '`
			`'"pipeline" means show all the intermediate images. '`
			`'Defaults to "transformed".')`
Add browse dataset 2022-05-30 03:11:44 +00:00			`parser.add_argument(`
			`'--rescale-factor',`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`'-r',`
Add browse dataset 2022-05-30 03:11:44 +00:00			`type=float,`
			`help='image rescale factor, which is useful if the output is too '`
			`'large or too small.')`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`parser.add_argument(`
			`'--channel-order',`
			`'-c',`
			`default='BGR',`
			`choices=['BGR', 'RGB'],`
			`help='The channel order of the showing images, could be "BGR" '`
			`'or "RGB", Defaults to "BGR".')`
Add browse dataset 2022-05-30 03:11:44 +00:00			`parser.add_argument(`
			`'--cfg-options',`
			`nargs='+',`
			`action=DictAction,`
			`help='override some settings in the used config, the key-value pair '`
			`'in xxx=yyy format will be merged into config file. If the value to '`
			`'be overwritten is a list, it should be like key="[a,b]" or key=a,b '`
			`'It also allows nested list/tuple values, e.g. key="[(a,b),(c,d)]" '`
			`'Note that the quotation marks are necessary and that no white space '`
			`'is allowed.')`
			`args = parser.parse_args()`
			`return args`


Enhance browse datset 2022-06-16 13:33:19 +00:00			`def make_grid(imgs, names, rescale_factor=None):`
			`"""Concat list of pictures into a single big picture, align height here."""`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`figure = create_figure()`
			`gs = figure.add_gridspec(1, len(imgs))`
Enhance browse datset 2022-06-16 13:33:19 +00:00
			`ori_shapes = [img.shape[:2] for img in imgs]`
			`if rescale_factor is not None:`
			`imgs = [mmcv.imrescale(img, rescale_factor) for img in imgs]`

			`for i, img in enumerate(imgs):`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`subplot = figure.add_subplot(gs[0, i])`
			`subplot.axis(False)`
			`subplot.imshow(img)`
			`subplot.set_title(f'{names[i]}\n{ori_shapes[i]}')`

			`return img_from_canvas(figure.canvas)`
Enhance browse datset 2022-06-16 13:33:19 +00:00

			`class InspectCompose(Compose):`
			`"""Compose multiple transforms sequentially.`

			`And record "img" field of all results in one list.`
			`"""`

			`def __init__(self, transforms, intermediate_imgs):`
			`super().__init__(transforms=transforms)`
			`self.intermediate_imgs = intermediate_imgs`

			`def __call__(self, data):`
			`if 'img' in data:`
			`self.intermediate_imgs.append({`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`'name': 'Original',`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`'img': data['img'].copy()`
			`})`

			`for t in self.transforms:`
			`data = t(data)`
			`if data is None:`
			`return None`
			`if 'img' in data:`
			`self.intermediate_imgs.append({`
			`'name': t.__class__.__name__,`
			`'img': data['img'].copy()`
			`})`
			`return data`


Add browse dataset 2022-05-30 03:11:44 +00:00			`def main():`
			`args = parse_args()`
			`cfg = Config.fromfile(args.config)`
			`if args.cfg_options is not None:`
			`cfg.merge_from_dict(args.cfg_options)`

Rename the package name to `mmpretrain`. 2023-02-17 11:31:08 +08:00			`init_default_scope('mmpretrain') # Use mmpretrain as default scope.`
Add browse dataset 2022-05-30 03:11:44 +00:00
Enhance browse datset 2022-06-16 13:33:19 +00:00			`dataset_cfg = cfg.get(args.phase + '_dataloader').get('dataset')`
			`dataset = build_dataset(dataset_cfg)`

			`intermediate_imgs = []`
			`dataset.pipeline = InspectCompose(dataset.pipeline.transforms,`
			`intermediate_imgs)`

			`# init visualizer`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`cfg.visualizer.pop('type')`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`visualizer = UniversalVisualizer(**cfg.visualizer)`
Add browse dataset 2022-05-30 03:11:44 +00:00			`visualizer.dataset_meta = dataset.metainfo`

Enhance browse datset 2022-06-16 13:33:19 +00:00			`# init visualization image number`
Add browse dataset 2022-05-30 03:11:44 +00:00			`display_number = min(args.show_number, len(dataset))`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`progress_bar = ProgressBar(display_number)`
Add browse dataset 2022-05-30 03:11:44 +00:00
Enhance browse datset 2022-06-16 13:33:19 +00:00			`for i, item in zip(range(display_number), dataset):`
			`rescale_factor = args.rescale_factor`
			`if args.mode == 'original':`
			`image = intermediate_imgs[0]['img']`
			`elif args.mode == 'transformed':`
			`image = intermediate_imgs[-1]['img']`
			`elif args.mode == 'concat':`
			`ori_image = intermediate_imgs[0]['img']`
			`trans_image = intermediate_imgs[-1]['img']`
			`image = make_grid([ori_image, trans_image],`
			`['original', 'transformed'], rescale_factor)`
			`rescale_factor = None`
			`else:`
			`image = make_grid([result['img'] for result in intermediate_imgs],`
			`[result['name'] for result in intermediate_imgs],`
			`rescale_factor)`
			`rescale_factor = None`

			`intermediate_imgs.clear()`

[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`data_sample = item['data_samples'].numpy()`
Add browse dataset 2022-05-30 03:11:44 +00:00
Enhance browse datset 2022-06-16 13:33:19 +00:00			`# get filename from dataset or just use index as filename`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`if hasattr(item['data_samples'], 'img_path'):`
			`filename = osp.basename(item['data_samples'].img_path)`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`else:`
			`# some dataset have not image path`
			`filename = f'{i}.jpg'`

			`out_file = osp.join(args.output_dir,`
			`filename) if args.output_dir is not None else None`
Add browse dataset 2022-05-30 03:11:44 +00:00
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`visualizer.visualize_cls(`
[Refactor] Fix visualization tools. (#1045) * update browse dataset * update images * update tools * update grad_cam * update docs * update tools * update docs 2022-09-20 18:09:05 +08:00			`image if args.channel_order == 'RGB' else image[..., ::-1],`
Add browse dataset 2022-05-30 03:11:44 +00:00			`data_sample,`
Enhance browse datset 2022-06-16 13:33:19 +00:00			`rescale_factor=rescale_factor,`
Add browse dataset 2022-05-30 03:11:44 +00:00			`show=not args.not_show,`
			`wait_time=args.show_interval,`
[Feature] Implememnt the universal visualizer for multiple task. (#1404) * [Feature] Implememnt the universal visualizer for multiple task. * Update tools * Improve according to comments. * Fix tools docs * Add --test-cfg option and set default collate function. 2023-03-09 11:36:54 +08:00			`name=filename,`
Add browse dataset 2022-05-30 03:11:44 +00:00			`out_file=out_file)`
			`progress_bar.update()`


			`if __name__ == '__main__':`
			`main()`