make engine more model-agnostic

2025-06-03 14:53:23 +08:00 · 2020-04-16 12:46:15 +01:00 · 2020-04-16 12:46:15 +01:00 · 36e22e8ce1
commit 36e22e8ce1
parent 322ec2b2de
6 changed files with 296 additions and 333 deletions
--- a/projects/OSNet_AIN/softmax_nas.py
+++ b/projects/OSNet_AIN/softmax_nas.py
@ -27,8 +27,7 @@ class ImageSoftmaxNASEngine(Engine):
        lmda_decay_rate=0.5,
        fixed_lmda=False
    ):
-        super(ImageSoftmaxNASEngine, self
-              ).__init__(datamanager, model, optimizer, scheduler, use_gpu)
+        super(ImageSoftmaxNASEngine, self).__init__(datamanager, use_gpu)
        self.mc_iter = mc_iter
        self.init_lmda = init_lmda
        self.min_lmda = min_lmda
@ -36,108 +35,44 @@ class ImageSoftmaxNASEngine(Engine):
        self.lmda_decay_rate = lmda_decay_rate
        self.fixed_lmda = fixed_lmda

+        self.model = model
+        self.optimizer = optimizer
+        self.scheduler = scheduler
+        self.register_model('model', model, optimizer, scheduler)
+
        self.criterion = CrossEntropyLoss(
            num_classes=self.datamanager.num_train_pids,
            use_gpu=self.use_gpu,
            label_smooth=label_smooth
        )

-    def train(
-        self,
-        epoch,
-        max_epoch,
-        writer,
-        fixbase_epoch=0,
-        open_layers=None,
-        print_freq=10
-    ):
-        losses = AverageMeter()
-        accs = AverageMeter()
-        batch_time = AverageMeter()
-        data_time = AverageMeter()
+    def forward_backward(self, data):
+        imgs, pids = self._parse_data_for_train(data)

-        self.model.train()
-        if (epoch + 1) <= fixbase_epoch and open_layers is not None:
-            print(
-                '* Only train {} (epoch: {}/{})'.format(
-                    open_layers, epoch + 1, fixbase_epoch
-                )
-            )
-            open_specified_layers(self.model, open_layers)
+        if self.use_gpu:
+            imgs = imgs.cuda()
+            pids = pids.cuda()
+
+        # softmax temporature
+        if self.fixed_lmda or self.lmda_decay_step == -1:
+            lmda = self.init_lmda
        else:
-            open_all_layers(self.model)
+            lmda = self.init_lmda * self.lmda_decay_rate**(
+                epoch // self.lmda_decay_step
+            )
+            if lmda < self.min_lmda:
+                lmda = self.min_lmda

-        num_batches = len(self.train_loader)
-        end = time.time()
-        for batch_idx, data in enumerate(self.train_loader):
-            data_time.update(time.time() - end)
+        for k in range(self.mc_iter):
+            outputs = self.model(imgs, lmda=lmda)
+            loss = self._compute_loss(self.criterion, outputs, pids)
+            self.optimizer.zero_grad()
+            loss.backward()
+            self.optimizer.step()

-            imgs, pids = self._parse_data_for_train(data)
-            if self.use_gpu:
-                imgs = imgs.cuda()
-                pids = pids.cuda()
+        loss_dict = {
+            'loss': loss.item(),
+            'acc': metrics.accuracy(outputs, pids)[0].item()
+        }

-            # softmax temporature
-            if self.fixed_lmda or self.lmda_decay_step == -1:
-                lmda = self.init_lmda
-            else:
-                lmda = self.init_lmda * self.lmda_decay_rate**(
-                    epoch // self.lmda_decay_step
-                )
-                if lmda < self.min_lmda:
-                    lmda = self.min_lmda
-
-            for k in range(self.mc_iter):
-                outputs = self.model(imgs, lmda=lmda)
-                loss = self._compute_loss(self.criterion, outputs, pids)
-                self.optimizer.zero_grad()
-                loss.backward()
-                self.optimizer.step()
-
-            batch_time.update(time.time() - end)
-
-            losses.update(loss.item(), pids.size(0))
-            accs.update(metrics.accuracy(outputs, pids)[0].item())
-
-            if (batch_idx+1) % print_freq == 0:
-                # estimate remaining time
-                eta_seconds = batch_time.avg * (
-                    num_batches - (batch_idx+1) + (max_epoch -
-                                                   (epoch+1)) * num_batches
-                )
-                eta_str = str(datetime.timedelta(seconds=int(eta_seconds)))
-                print(
-                    'Epoch: [{0}/{1}][{2}/{3}]\t'
-                    'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
-                    'Data {data_time.val:.3f} ({data_time.avg:.3f})\t'
-                    'Loss {loss.val:.4f} ({loss.avg:.4f})\t'
-                    'Acc {acc.val:.2f} ({acc.avg:.2f})\t'
-                    'Lr {lr:.6f}\t'
-                    'eta {eta}'.format(
-                        epoch + 1,
-                        max_epoch,
-                        batch_idx + 1,
-                        num_batches,
-                        batch_time=batch_time,
-                        data_time=data_time,
-                        loss=losses,
-                        acc=accs,
-                        lr=self.optimizer.param_groups[0]['lr'],
-                        eta=eta_str
-                    )
-                )
-
-            if writer is not None:
-                n_iter = epoch*num_batches + batch_idx
-                writer.add_scalar('Train/Time', batch_time.avg, n_iter)
-                writer.add_scalar('Train/Data', data_time.avg, n_iter)
-                writer.add_scalar('Train/Loss', losses.avg, n_iter)
-                writer.add_scalar('Train/Acc', accs.avg, n_iter)
-                writer.add_scalar(
-                    'Train/Lr', self.optimizer.param_groups[0]['lr'], n_iter
-                )
-
-            end = time.time()
-
-        if self.scheduler is not None:
-            self.scheduler.step()
+        return loss_dict
--- a/torchreid/engine/engine.py
+++ b/torchreid/engine/engine.py
@ -3,13 +3,15 @@ import time
 import numpy as np
 import os.path as osp
 import datetime
+from collections import OrderedDict
 import torch
 from torch.nn import functional as F
 from torch.utils.tensorboard import SummaryWriter

 from torchreid import metrics
 from torchreid.utils import (
-    AverageMeter, re_ranking, save_checkpoint, visualize_ranked_results
+    MetricMeter, AverageMeter, re_ranking, open_all_layers, save_checkpoint,
+    open_specified_layers, visualize_ranked_results
 )
 from torchreid.losses import DeepSupervision

@ -26,22 +28,89 @@ class Engine(object):
        use_gpu (bool, optional): use gpu. Default is True.
    """

-    def __init__(
-        self,
-        datamanager,
-        model,
-        optimizer=None,
-        scheduler=None,
-        use_gpu=True
-    ):
+    def __init__(self, datamanager, use_gpu=True):
        self.datamanager = datamanager
-        self.model = model
-        self.optimizer = optimizer
-        self.scheduler = scheduler
-        self.use_gpu = (torch.cuda.is_available() and use_gpu)
-        self.writer = None
        self.train_loader = self.datamanager.train_loader
        self.test_loader = self.datamanager.test_loader
+        self.use_gpu = (torch.cuda.is_available() and use_gpu)
+        self.writer = None
+
+        self.model = None
+        self.optimizer = None
+        self.scheduler = None
+
+        self._models = OrderedDict()
+        self._optims = OrderedDict()
+        self._scheds = OrderedDict()
+
+    def register_model(self, name='model', model=None, optim=None, sched=None):
+        if self.__dict__.get('_models') is None:
+            raise AttributeError(
+                'Cannot assign model before super().__init__() call'
+            )
+
+        if self.__dict__.get('_optims') is None:
+            raise AttributeError(
+                'Cannot assign optim before super().__init__() call'
+            )
+
+        if self.__dict__.get('_scheds') is None:
+            raise AttributeError(
+                'Cannot assign sched before super().__init__() call'
+            )
+
+        self._models[name] = model
+        self._optims[name] = optim
+        self._scheds[name] = sched
+
+    def get_model_names(self, names=None):
+        names_real = list(self._models.keys())
+        if names is not None:
+            if not isinstance(names, list):
+                names = [names]
+            for name in names:
+                assert name in names_real
+            return names
+        else:
+            return names_real
+
+    def save_model(self, epoch, rank1, save_dir, is_best=False):
+        names = self.get_model_names()
+
+        for name in names:
+            save_checkpoint(
+                {
+                    'state_dict': self._models[name].state_dict(),
+                    'epoch': epoch + 1,
+                    'rank1': rank1,
+                    'optimizer': self._optims[name].state_dict(),
+                    'scheduler': self._scheds[name].state_dict()
+                },
+                osp.join(save_dir, name),
+                is_best=is_best
+            )
+
+    def set_model_mode(self, mode='train', names=None):
+        assert mode in ['train', 'eval', 'test']
+        names = self.get_model_names(names)
+
+        for name in names:
+            if mode == 'train':
+                self._models[name].train()
+            else:
+                self._models[name].eval()
+
+    def get_current_lr(self, names=None):
+        names = self.get_model_names(names)
+        name = names[0]
+        return self._optims[name].param_groups[0]['lr']
+
+    def update_lr(self, names=None):
+        names = self.get_model_names(names)
+
+        for name in names:
+            if self._scheds[name] is not None:
+                self._scheds[name].step()

    def run(
        self,
@ -142,7 +211,7 @@ class Engine(object):
                    use_metric_cuhk03=use_metric_cuhk03,
                    ranks=ranks
                )
-                self._save_checkpoint(epoch, rank1, save_dir)
+                self.save_model(epoch, rank1, save_dir)

        if max_epoch > 0:
            print('=> Final test')
@ -156,7 +225,7 @@ class Engine(object):
                use_metric_cuhk03=use_metric_cuhk03,
                ranks=ranks
            )
-            self._save_checkpoint(epoch, rank1, save_dir)
+            self.save_model(epoch, rank1, save_dir)

        elapsed = round(time.time() - time_start)
        elapsed = str(datetime.timedelta(seconds=elapsed))
@ -164,20 +233,68 @@ class Engine(object):
        if self.writer is not None:
            self.writer.close()

-    def train(self):
-        r"""Performs training on source datasets for one epoch.
+    def train(
+        self,
+        epoch,
+        max_epoch,
+        writer,
+        print_freq=10,
+        fixbase_epoch=0,
+        open_layers=None
+    ):
+        losses = MetricMeter()
+        batch_time = AverageMeter()
+        data_time = AverageMeter()

-        This will be called every epoch in ``run()``, e.g.
+        self.set_model_mode('train')

-        .. code-block:: python
-            
-            for epoch in range(start_epoch, max_epoch):
-                self.train(some_arguments)
+        self._two_stepped_transfer_learning(epoch, fixbase_epoch, open_layers)

-        .. note::
-            
-            This must be implemented in subclasses.
-        """
+        num_batches = len(self.train_loader)
+        end = time.time()
+        for batch_idx, data in enumerate(self.train_loader):
+            data_time.update(time.time() - end)
+            loss_dict = self.forward_backward(data)
+            batch_time.update(time.time() - end)
+            losses.update(loss_dict)
+
+            if (batch_idx+1) % print_freq == 0:
+                nb_this_epoch = num_batches - (batch_idx+1)
+                nb_future_epochs = (max_epoch - (epoch+1)) * num_batches
+                eta_seconds = batch_time.avg * (nb_this_epoch+nb_future_epochs)
+                eta_str = str(datetime.timedelta(seconds=int(eta_seconds)))
+                print(
+                    'epoch: [{0}/{1}][{2}/{3}]\t'
+                    'time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
+                    'data {data_time.val:.3f} ({data_time.avg:.3f})\t'
+                    'eta {eta}\t'
+                    '{losses}\t'
+                    'lr {lr:.6f}'.format(
+                        epoch + 1,
+                        max_epoch,
+                        batch_idx + 1,
+                        num_batches,
+                        batch_time=batch_time,
+                        data_time=data_time,
+                        eta=eta_str,
+                        losses=losses,
+                        lr=self.get_current_lr()
+                    )
+                )
+
+            if writer is not None:
+                n_iter = epoch*num_batches + batch_idx
+                writer.add_scalar('Train/time', batch_time.avg, n_iter)
+                writer.add_scalar('Train/data', data_time.avg, n_iter)
+                for name, meter in losses.meters.items():
+                    writer.add_scalar('Train/' + name, meter.avg, n_iter)
+                writer.add_scalar('Train/lr', self.get_current_lr(), n_iter)
+
+            end = time.time()
+
+        self.update_lr()
+
+    def forward_backward(self, data):
        raise NotImplementedError

    def test(
@ -205,6 +322,7 @@ class Engine(object):
            ``_extract_features()`` and ``_parse_data_for_eval()`` (most of the time),
            but not a must. Please refer to the source code for more details.
        """
+        self.set_model_mode('eval')
        targets = list(self.test_loader.keys())

        for name in targets:
@ -330,7 +448,6 @@ class Engine(object):
        return loss

    def _extract_features(self, input):
-        self.model.eval()
        return self.model(input)

    def _parse_data_for_train(self, data):
@ -344,15 +461,26 @@ class Engine(object):
        camids = data[2]
        return imgs, pids, camids

-    def _save_checkpoint(self, epoch, rank1, save_dir, is_best=False):
-        save_checkpoint(
-            {
-                'state_dict': self.model.state_dict(),
-                'epoch': epoch + 1,
-                'rank1': rank1,
-                'optimizer': self.optimizer.state_dict(),
-                'scheduler': self.scheduler.state_dict(),
-            },
-            save_dir,
-            is_best=is_best
-        )
+    def _two_stepped_transfer_learning(
+        self, epoch, fixbase_epoch, open_layers, model=None
+    ):
+        """Two stepped transfer learning.
+
+        The idea is to freeze base layers for a certain number of epochs
+        and then open all layers for training.
+
+        Reference: https://arxiv.org/abs/1611.05244
+        """
+        model = self.model if model is None else model
+        if model is None:
+            return
+
+        if (epoch + 1) <= fixbase_epoch and open_layers is not None:
+            print(
+                '* Only train {} (epoch: {}/{})'.format(
+                    open_layers, epoch + 1, fixbase_epoch
+                )
+            )
+            open_specified_layers(model, open_layers)
+        else:
+            open_all_layers(model)
--- a/torchreid/engine/image/softmax.py
+++ b/torchreid/engine/image/softmax.py
@ -3,9 +3,6 @@ import time
 import datetime

 from torchreid import metrics
-from torchreid.utils import (
-    AverageMeter, open_all_layers, open_specified_layers
-)
 from torchreid.losses import CrossEntropyLoss

 from ..engine import Engine
@ -67,8 +64,12 @@ class ImageSoftmaxEngine(Engine):
        use_gpu=True,
        label_smooth=True
    ):
-        super(ImageSoftmaxEngine, self
-              ).__init__(datamanager, model, optimizer, scheduler, use_gpu)
+        super(ImageSoftmaxEngine, self).__init__(datamanager, use_gpu)
+
+        self.model = model
+        self.optimizer = optimizer
+        self.scheduler = scheduler
+        self.register_model('model', model, optimizer, scheduler)

        self.criterion = CrossEntropyLoss(
            num_classes=self.datamanager.num_train_pids,
@ -76,91 +77,22 @@ class ImageSoftmaxEngine(Engine):
            label_smooth=label_smooth
        )

-    def train(
-        self,
-        epoch,
-        max_epoch,
-        writer,
-        print_freq=10,
-        fixbase_epoch=0,
-        open_layers=None
-    ):
-        losses = AverageMeter()
-        accs = AverageMeter()
-        batch_time = AverageMeter()
-        data_time = AverageMeter()
+    def forward_backward(self, data):
+        imgs, pids = self._parse_data_for_train(data)

-        self.model.train()
-        if (epoch + 1) <= fixbase_epoch and open_layers is not None:
-            print(
-                '* Only train {} (epoch: {}/{})'.format(
-                    open_layers, epoch + 1, fixbase_epoch
-                )
-            )
-            open_specified_layers(self.model, open_layers)
-        else:
-            open_all_layers(self.model)
+        if self.use_gpu:
+            imgs = imgs.cuda()
+            pids = pids.cuda()

-        num_batches = len(self.train_loader)
-        end = time.time()
-        for batch_idx, data in enumerate(self.train_loader):
-            data_time.update(time.time() - end)
+        self.optimizer.zero_grad()
+        outputs = self.model(imgs)
+        loss = self._compute_loss(self.criterion, outputs, pids)
+        loss.backward()
+        self.optimizer.step()

-            imgs, pids = self._parse_data_for_train(data)
-            if self.use_gpu:
-                imgs = imgs.cuda()
-                pids = pids.cuda()
+        loss_dict = {
+            'loss': loss.item(),
+            'acc': metrics.accuracy(outputs, pids)[0].item()
+        }

-            self.optimizer.zero_grad()
-            outputs = self.model(imgs)
-            loss = self._compute_loss(self.criterion, outputs, pids)
-            loss.backward()
-            self.optimizer.step()
-
-            batch_time.update(time.time() - end)
-
-            losses.update(loss.item(), pids.size(0))
-            accs.update(metrics.accuracy(outputs, pids)[0].item())
-
-            if (batch_idx+1) % print_freq == 0:
-                # estimate remaining time
-                eta_seconds = batch_time.avg * (
-                    num_batches - (batch_idx+1) + (max_epoch -
-                                                   (epoch+1)) * num_batches
-                )
-                eta_str = str(datetime.timedelta(seconds=int(eta_seconds)))
-                print(
-                    'Epoch: [{0}/{1}][{2}/{3}]\t'
-                    'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
-                    'Data {data_time.val:.3f} ({data_time.avg:.3f})\t'
-                    'Loss {loss.val:.4f} ({loss.avg:.4f})\t'
-                    'Acc {acc.val:.2f} ({acc.avg:.2f})\t'
-                    'Lr {lr:.6f}\t'
-                    'eta {eta}'.format(
-                        epoch + 1,
-                        max_epoch,
-                        batch_idx + 1,
-                        num_batches,
-                        batch_time=batch_time,
-                        data_time=data_time,
-                        loss=losses,
-                        acc=accs,
-                        lr=self.optimizer.param_groups[0]['lr'],
-                        eta=eta_str
-                    )
-                )
-
-            if writer is not None:
-                n_iter = epoch*num_batches + batch_idx
-                writer.add_scalar('Train/Time', batch_time.avg, n_iter)
-                writer.add_scalar('Train/Data', data_time.avg, n_iter)
-                writer.add_scalar('Train/Loss', losses.avg, n_iter)
-                writer.add_scalar('Train/Acc', accs.avg, n_iter)
-                writer.add_scalar(
-                    'Train/Lr', self.optimizer.param_groups[0]['lr'], n_iter
-                )
-
-            end = time.time()
-
-        if self.scheduler is not None:
-            self.scheduler.step()
+        return loss_dict
--- a/torchreid/engine/image/triplet.py
+++ b/torchreid/engine/image/triplet.py
@ -3,9 +3,6 @@ import time
 import datetime

 from torchreid import metrics
-from torchreid.utils import (
-    AverageMeter, open_all_layers, open_specified_layers
-)
 from torchreid.losses import TripletLoss, CrossEntropyLoss

 from ..engine import Engine
@ -76,8 +73,12 @@ class ImageTripletEngine(Engine):
        use_gpu=True,
        label_smooth=True
    ):
-        super(ImageTripletEngine, self
-              ).__init__(datamanager, model, optimizer, scheduler, use_gpu)
+        super(ImageTripletEngine, self).__init__(datamanager, use_gpu)
+
+        self.model = model
+        self.optimizer = optimizer
+        self.scheduler = scheduler
+        self.register_model('model', model, optimizer, scheduler)

        self.weight_t = weight_t
        self.weight_x = weight_x
@ -89,98 +90,25 @@ class ImageTripletEngine(Engine):
            label_smooth=label_smooth
        )

-    def train(
-        self,
-        epoch,
-        max_epoch,
-        writer,
-        print_freq=10,
-        fixbase_epoch=0,
-        open_layers=None
-    ):
-        losses_t = AverageMeter()
-        losses_x = AverageMeter()
-        accs = AverageMeter()
-        batch_time = AverageMeter()
-        data_time = AverageMeter()
+    def forward_backward(self, data):
+        imgs, pids = self._parse_data_for_train(data)

-        self.model.train()
-        if (epoch + 1) <= fixbase_epoch and open_layers is not None:
-            print(
-                '* Only train {} (epoch: {}/{})'.format(
-                    open_layers, epoch + 1, fixbase_epoch
-                )
-            )
-            open_specified_layers(self.model, open_layers)
-        else:
-            open_all_layers(self.model)
+        if self.use_gpu:
+            imgs = imgs.cuda()
+            pids = pids.cuda()

-        num_batches = len(self.train_loader)
-        end = time.time()
-        for batch_idx, data in enumerate(self.train_loader):
-            data_time.update(time.time() - end)
+        self.optimizer.zero_grad()
+        outputs, features = self.model(imgs)
+        loss_t = self._compute_loss(self.criterion_t, features, pids)
+        loss_x = self._compute_loss(self.criterion_x, outputs, pids)
+        loss = self.weight_t * loss_t + self.weight_x * loss_x
+        loss.backward()
+        self.optimizer.step()

-            imgs, pids = self._parse_data_for_train(data)
-            if self.use_gpu:
-                imgs = imgs.cuda()
-                pids = pids.cuda()
+        loss_dict = {
+            'loss_t': loss_t.item(),
+            'loss_x': loss_x.item(),
+            'acc': metrics.accuracy(outputs, pids)[0].item()
+        }

-            self.optimizer.zero_grad()
-            outputs, features = self.model(imgs)
-            loss_t = self._compute_loss(self.criterion_t, features, pids)
-            loss_x = self._compute_loss(self.criterion_x, outputs, pids)
-            loss = self.weight_t * loss_t + self.weight_x * loss_x
-            loss.backward()
-            self.optimizer.step()
-
-            batch_time.update(time.time() - end)
-
-            losses_t.update(loss_t.item(), pids.size(0))
-            losses_x.update(loss_x.item(), pids.size(0))
-            accs.update(metrics.accuracy(outputs, pids)[0].item())
-
-            if (batch_idx+1) % print_freq == 0:
-                # estimate remaining time
-                eta_seconds = batch_time.avg * (
-                    num_batches - (batch_idx+1) + (max_epoch -
-                                                   (epoch+1)) * num_batches
-                )
-                eta_str = str(datetime.timedelta(seconds=int(eta_seconds)))
-                print(
-                    'Epoch: [{0}/{1}][{2}/{3}]\t'
-                    'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
-                    'Data {data_time.val:.3f} ({data_time.avg:.3f})\t'
-                    'Loss_t {loss_t.val:.4f} ({loss_t.avg:.4f})\t'
-                    'Loss_x {loss_x.val:.4f} ({loss_x.avg:.4f})\t'
-                    'Acc {acc.val:.2f} ({acc.avg:.2f})\t'
-                    'Lr {lr:.6f}\t'
-                    'eta {eta}'.format(
-                        epoch + 1,
-                        max_epoch,
-                        batch_idx + 1,
-                        num_batches,
-                        batch_time=batch_time,
-                        data_time=data_time,
-                        loss_t=losses_t,
-                        loss_x=losses_x,
-                        acc=accs,
-                        lr=self.optimizer.param_groups[0]['lr'],
-                        eta=eta_str
-                    )
-                )
-
-            if writer is not None:
-                n_iter = epoch*num_batches + batch_idx
-                writer.add_scalar('Train/Time', batch_time.avg, n_iter)
-                writer.add_scalar('Train/Data', data_time.avg, n_iter)
-                writer.add_scalar('Train/Loss_t', losses_t.avg, n_iter)
-                writer.add_scalar('Train/Loss_x', losses_x.avg, n_iter)
-                writer.add_scalar('Train/Acc', accs.avg, n_iter)
-                writer.add_scalar(
-                    'Train/Lr', self.optimizer.param_groups[0]['lr'], n_iter
-                )
-
-            end = time.time()
-
-        if self.scheduler is not None:
-            self.scheduler.step()
+        return loss_dict
--- a/torchreid/losses/cross_entropy_loss.py
+++ b/torchreid/losses/cross_entropy_loss.py
@ -13,25 +13,23 @@ class CrossEntropyLoss(nn.Module):
    
    .. math::
        \begin{equation}
-        (1 - \epsilon) \times y + \frac{\epsilon}{K},
+        (1 - \eps) \times y + \frac{\eps}{K},
        \end{equation}

-    where :math:`K` denotes the number of classes and :math:`\epsilon` is a weight. When
-    :math:`\epsilon = 0`, the loss function reduces to the normal cross entropy.
+    where :math:`K` denotes the number of classes and :math:`\eps` is a weight. When
+    :math:`\eps = 0`, the loss function reduces to the normal cross entropy.
    
    Args:
        num_classes (int): number of classes.
-        epsilon (float, optional): weight. Default is 0.1.
+        eps (float, optional): weight. Default is 0.1.
        use_gpu (bool, optional): whether to use gpu devices. Default is True.
        label_smooth (bool, optional): whether to apply label smoothing. Default is True.
    """

-    def __init__(
-        self, num_classes, epsilon=0.1, use_gpu=True, label_smooth=True
-    ):
+    def __init__(self, num_classes, eps=0.1, use_gpu=True, label_smooth=True):
        super(CrossEntropyLoss, self).__init__()
        self.num_classes = num_classes
-        self.epsilon = epsilon if label_smooth else 0
+        self.eps = eps if label_smooth else 0
        self.use_gpu = use_gpu
        self.logsoftmax = nn.LogSoftmax(dim=1)

@ -48,7 +46,5 @@ class CrossEntropyLoss(nn.Module):
        targets = zeros.scatter_(1, targets.unsqueeze(1).data.cpu(), 1)
        if self.use_gpu:
            targets = targets.cuda()
-        targets = (
-            1 - self.epsilon
-        ) * targets + self.epsilon / self.num_classes
+        targets = (1 - self.eps) * targets + self.eps / self.num_classes
        return (-targets * log_probs).mean(0).sum()
--- a/torchreid/utils/avgmeter.py
+++ b/torchreid/utils/avgmeter.py
@ -1,6 +1,8 @@
 from __future__ import division, absolute_import
+from collections import defaultdict
+import torch

-__all__ = ['AverageMeter']
+__all__ = ['AverageMeter', 'MetricMeter']


 class AverageMeter(object):
@ -27,3 +29,45 @@ class AverageMeter(object):
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count
+
+
+class MetricMeter(object):
+    """A collection of metrics.
+
+    Source: https://github.com/KaiyangZhou/Dassl.pytorch
+
+    Examples::
+        >>> # 1. Create an instance of MetricMeter
+        >>> metric = MetricMeter()
+        >>> # 2. Update using a dictionary as input
+        >>> input_dict = {'loss_1': value_1, 'loss_2': value_2}
+        >>> metric.update(input_dict)
+        >>> # 3. Convert to string and print
+        >>> print(str(metric))
+    """
+
+    def __init__(self, delimiter='\t'):
+        self.meters = defaultdict(AverageMeter)
+        self.delimiter = delimiter
+
+    def update(self, input_dict):
+        if input_dict is None:
+            return
+
+        if not isinstance(input_dict, dict):
+            raise TypeError(
+                'Input to MetricMeter.update() must be a dictionary'
+            )
+
+        for k, v in input_dict.items():
+            if isinstance(v, torch.Tensor):
+                v = v.item()
+            self.meters[k].update(v)
+
+    def __str__(self):
+        output_str = []
+        for name, meter in self.meters.items():
+            output_str.append(
+                '{} {:.4f} ({:.4f})'.format(name, meter.val, meter.avg)
+            )
+        return self.delimiter.join(output_str)