fast-reid/tools/train.py

# encoding: utf-8
"""
@author:  sherlock
@contact: sherlockliao01@gmail.com
"""

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
from __future__ import unicode_literals

import argparse
import logging
import os
import sys
from pprint import pprint

import torch
from torch import nn

import network
from core.config import opt, update_config
from core.loader import get_data_provider
from core.solver import Solver
from utils.loss import TripletLoss
from utils.lr_scheduler import LRScheduler

FORMAT = '[%(levelname)s]: %(message)s'
logging.basicConfig(
    level=logging.INFO,
    format=FORMAT,
    stream=sys.stdout
)


def train(args):
    logging.info('======= user config ======')
    logging.info(pprint(opt))
    logging.info(pprint(args))
    logging.info('======= end ======')

    train_data, test_data, num_query = get_data_provider(opt)

    net = getattr(network, opt.network.name)(opt.dataset.num_classes, opt.network.last_stride)
    net = nn.DataParallel(net).cuda()

    optimizer = getattr(torch.optim, opt.train.optimizer)(net.parameters(), lr=opt.train.lr, weight_decay=opt.train.wd)
    ce_loss = nn.CrossEntropyLoss()
    triplet_loss = TripletLoss(margin=opt.train.margin)

    def ce_loss_func(scores, feat, labels):
        ce = ce_loss(scores, labels)
        return ce

    def tri_loss_func(scores, feat, labels):
        tri = triplet_loss(feat, labels)[0]
        return tri

    def ce_tri_loss_func(scores, feat, labels):
        ce = ce_loss(scores, labels)
        triplet = triplet_loss(feat, labels)[0]
        return ce + triplet

    if opt.train.loss_fn == 'softmax':
        loss_fn = ce_loss_func
    elif opt.train.loss_fn == 'triplet':
        loss_fn = tri_loss_func
    elif opt.train.loss_fn == 'softmax_triplet':
        loss_fn = ce_tri_loss_func
    else:
        raise ValueError('Unknown loss func {}'.format(opt.train.loss_fn))

    lr_scheduler = LRScheduler(base_lr=opt.train.lr, step=opt.train.step,
                               factor=opt.train.factor, warmup_epoch=opt.train.warmup_epoch,
                               warmup_begin_lr=opt.train.warmup_begin_lr)

    mod = Solver(opt, net)
    mod.fit(train_data=train_data, test_data=test_data, num_query=num_query, optimizer=optimizer,
            criterion=loss_fn, lr_scheduler=lr_scheduler)


def main():
    parser = argparse.ArgumentParser(description='reid model training')
    parser.add_argument('--config_file', type=str, default=None, required=True,
                        help='Optional config file for params')
    parser.add_argument('--save_dir', type=str, default=None, required=True,
                        help='model save checkpoint directory')

    args = parser.parse_args()
    if args.config_file is not None:
        update_config(args.config_file)
    opt.misc.save_dir = args.save_dir
    os.environ["CUDA_VISIBLE_DEVICES"] = opt.network.gpus
    train(args)


if __name__ == '__main__':
    main()
update baseline finish a new baseline, can get a better result 2018-09-18 15:47:38 +08:00			`# encoding: utf-8`
			`"""`
			`@author: sherlock`
			`@contact: sherlockliao01@gmail.com`
			`"""`

			`from __future__ import absolute_import`
			`from __future__ import division`
			`from __future__ import print_function`
			`from __future__ import unicode_literals`

			`import argparse`
			`import logging`
			`import os`
			`import sys`
			`from pprint import pprint`

			`import torch`
			`from torch import nn`

			`import network`
			`from core.config import opt, update_config`
			`from core.loader import get_data_provider`
			`from core.solver import Solver`
update triplet 2018-09-19 18:17:06 +08:00			`from utils.loss import TripletLoss`
update baseline finish a new baseline, can get a better result 2018-09-18 15:47:38 +08:00			`from utils.lr_scheduler import LRScheduler`

			`FORMAT = '[%(levelname)s]: %(message)s'`
			`logging.basicConfig(`
			`level=logging.INFO,`
			`format=FORMAT,`
			`stream=sys.stdout`
			`)`


			`def train(args):`
			`logging.info('======= user config ======')`
			`logging.info(pprint(opt))`
			`logging.info(pprint(args))`
			`logging.info('======= end ======')`

			`train_data, test_data, num_query = get_data_provider(opt)`

			`net = getattr(network, opt.network.name)(opt.dataset.num_classes, opt.network.last_stride)`
			`net = nn.DataParallel(net).cuda()`

			`optimizer = getattr(torch.optim, opt.train.optimizer)(net.parameters(), lr=opt.train.lr, weight_decay=opt.train.wd)`
			`ce_loss = nn.CrossEntropyLoss()`
update triplet 2018-09-19 18:17:06 +08:00			`triplet_loss = TripletLoss(margin=opt.train.margin)`
update baseline finish a new baseline, can get a better result 2018-09-18 15:47:38 +08:00
update triplet 2018-09-19 18:17:06 +08:00			`def ce_loss_func(scores, feat, labels):`
update baseline finish a new baseline, can get a better result 2018-09-18 15:47:38 +08:00			`ce = ce_loss(scores, labels)`
			`return ce`

update triplet 2018-09-19 18:17:06 +08:00			`def tri_loss_func(scores, feat, labels):`
			`tri = triplet_loss(feat, labels)[0]`
			`return tri`

			`def ce_tri_loss_func(scores, feat, labels):`
			`ce = ce_loss(scores, labels)`
			`triplet = triplet_loss(feat, labels)[0]`
			`return ce + triplet`

			`if opt.train.loss_fn == 'softmax':`
			`loss_fn = ce_loss_func`
			`elif opt.train.loss_fn == 'triplet':`
			`loss_fn = tri_loss_func`
			`elif opt.train.loss_fn == 'softmax_triplet':`
			`loss_fn = ce_tri_loss_func`
			`else:`
			`raise ValueError('Unknown loss func {}'.format(opt.train.loss_fn))`

update baseline finish a new baseline, can get a better result 2018-09-18 15:47:38 +08:00			`lr_scheduler = LRScheduler(base_lr=opt.train.lr, step=opt.train.step,`
			`factor=opt.train.factor, warmup_epoch=opt.train.warmup_epoch,`
			`warmup_begin_lr=opt.train.warmup_begin_lr)`

			`mod = Solver(opt, net)`
			`mod.fit(train_data=train_data, test_data=test_data, num_query=num_query, optimizer=optimizer,`
			`criterion=loss_fn, lr_scheduler=lr_scheduler)`


			`def main():`
			`parser = argparse.ArgumentParser(description='reid model training')`
			`parser.add_argument('--config_file', type=str, default=None, required=True,`
			`help='Optional config file for params')`
			`parser.add_argument('--save_dir', type=str, default=None, required=True,`
			`help='model save checkpoint directory')`

			`args = parser.parse_args()`
			`if args.config_file is not None:`
			`update_config(args.config_file)`
update triplet 2018-09-19 18:17:06 +08:00			`opt.misc.save_dir = args.save_dir`
update baseline finish a new baseline, can get a better result 2018-09-18 15:47:38 +08:00			`os.environ["CUDA_VISIBLE_DEVICES"] = opt.network.gpus`
			`train(args)`


			`if __name__ == '__main__':`
			`main()`