add get_class in base_dataset (#85)

* modify base_dataset * revise according to the comments
2020-11-12 14:22:02 +08:00 · 2020-11-12 14:22:02 +08:00 · 7636409b3b
parent 909a6b9c3f
commit 7636409b3b
2 changed files with 66 additions and 1 deletions
--- a/mmcls/datasets/base_dataset.py
+++ b/mmcls/datasets/base_dataset.py
@ -1,6 +1,7 @@
 import copy
 from abc import ABCMeta, abstractmethod
 import mmcv
 import numpy as np
 from torch.utils.data import Dataset
@ -23,7 +24,12 @@ class BaseDataset(Dataset, metaclass=ABCMeta):
    CLASSES = None
-    def __init__(self, data_prefix, pipeline, ann_file=None, test_mode=False):
+    def __init__(self,
                 data_prefix,
                 pipeline,
                 classes=None,
                 ann_file=None,
                 test_mode=False):
        super(BaseDataset, self).__init__()
        self.ann_file = ann_file
@ -31,6 +37,7 @@ class BaseDataset(Dataset, metaclass=ABCMeta):
        self.test_mode = test_mode
        self.pipeline = Compose(pipeline)
        self.data_infos = self.load_annotations()
        self.CLASSES = self.get_classes(classes)
    @abstractmethod
    def load_annotations(self):
@ -78,6 +85,32 @@ class BaseDataset(Dataset, metaclass=ABCMeta):
    def __getitem__(self, idx):
        return self.prepare_data(idx)
    @classmethod
    def get_classes(cls, classes=None):
        """Get class names of current dataset.
        Args:
            classes (Sequence[str] | str | None): If classes is None, use
                default CLASSES defined by builtin dataset. If classes is a
                string, take it as a file name. The file contains the name of
                classes where each line contains one class name. If classes is
                a tuple or list, override the CLASSES defined by the dataset.
        Returns:
            tuple[str] or list[str]: Names of categories of the dataset.
        """
        if classes is None:
            return cls.CLASSES
        if isinstance(classes, str):
            # take it as a file path
            class_names = mmcv.list_from_file(classes)
        elif isinstance(classes, (tuple, list)):
            class_names = classes
        else:
            raise ValueError(f'Unsupported type {type(classes)} of classes.')
        return class_names
    def evaluate(self,
                 results,
                 metric='accuracy',
--- a/tests/test_dataset.py
+++ b/tests/test_dataset.py
@ -21,12 +21,44 @@ def test_datasets_override_default(dataset_name):
    dataset_class = DATASETS.get(dataset_name)
    dataset_class.load_annotations = MagicMock()
    original_classes = dataset_class.CLASSES
    # Test setting classes as a tuple
    dataset = dataset_class(
        data_prefix='', pipeline=[], classes=('bus', 'car'), test_mode=True)
    assert dataset.CLASSES != original_classes
    assert dataset.CLASSES == ('bus', 'car')
    # Test setting classes as a list
    dataset = dataset_class(
        data_prefix='', pipeline=[], classes=['bus', 'car'], test_mode=True)
    assert dataset.CLASSES != original_classes
    assert dataset.CLASSES == ['bus', 'car']
    # Test setting classes through a file
    tmp_file = tempfile.NamedTemporaryFile()
    with open(tmp_file.name, 'w') as f:
        f.write('bus\ncar\n')
    dataset = dataset_class(
        data_prefix='', pipeline=[], classes=tmp_file.name, test_mode=True)
    tmp_file.close()
    assert dataset.CLASSES != original_classes
    assert dataset.CLASSES == ['bus', 'car']
    # Test overriding not a subset
    dataset = dataset_class(
        data_prefix='', pipeline=[], classes=['foo'], test_mode=True)
    assert dataset.CLASSES != original_classes
    assert dataset.CLASSES == ['foo']
    # Test default behavior
    dataset = dataset_class(data_prefix='', pipeline=[])
    assert dataset.data_prefix == ''
    assert not dataset.test_mode
    assert dataset.ann_file is None
    assert dataset.CLASSES == original_classes
@patch.multiple(BaseDataset, __abstractmethods__=set())