deep-person-reid/torchreid/models/resnet.py

from __future__ import absolute_import
from __future__ import division

import torch
from torch import nn
from torch.nn import functional as F
import torchvision


__all__ = ['ResNet50', 'ResNet101', 'ResNet50M']


class ResNet50(nn.Module):
    def __init__(self, num_classes, loss={'xent'}, **kwargs):
        super(ResNet50, self).__init__()
        self.loss = loss
        resnet50 = torchvision.models.resnet50(pretrained=True)
        self.base = nn.Sequential(*list(resnet50.children())[:-2])
        self.classifier = nn.Linear(2048, num_classes)
        self.feat_dim = 2048

    def forward(self, x):
        x = self.base(x)
        x = F.avg_pool2d(x, x.size()[2:])
        f = x.view(x.size(0), -1)
        if not self.training:
            return f
        y = self.classifier(f)

        if self.loss == {'xent'}:
            return y
        elif self.loss == {'xent', 'htri'}:
            return y, f
        else:
            raise KeyError("Unsupported loss: {}".format(self.loss))


class ResNet101(nn.Module):
    def __init__(self, num_classes, loss={'xent'}, **kwargs):
        super(ResNet101, self).__init__()
        self.loss = loss
        resnet101 = torchvision.models.resnet101(pretrained=True)
        self.base = nn.Sequential(*list(resnet101.children())[:-2])
        self.classifier = nn.Linear(2048, num_classes)
        self.feat_dim = 2048 # feature dimension

    def forward(self, x):
        x = self.base(x)
        x = F.avg_pool2d(x, x.size()[2:])
        f = x.view(x.size(0), -1)
        if not self.training:
            return f
        y = self.classifier(f)

        if self.loss == {'xent'}:
            return y
        elif self.loss == {'xent', 'htri'}:
            return y, f
        else:
            raise KeyError("Unsupported loss: {}".format(self.loss))


class ResNet50M(nn.Module):
    """ResNet50 + mid-level features.

    Reference:
    Yu et al. The Devil is in the Middle: Exploiting Mid-level Representations for
    Cross-Domain Instance Matching. arXiv:1711.08106.
    """
    def __init__(self, num_classes=0, loss={'xent'}, **kwargs):
        super(ResNet50M, self).__init__()
        self.loss = loss
        resnet50 = torchvision.models.resnet50(pretrained=True)
        base = nn.Sequential(*list(resnet50.children())[:-2])
        self.layers1 = nn.Sequential(base[0], base[1], base[2])
        self.layers2 = nn.Sequential(base[3], base[4])
        self.layers3 = base[5]
        self.layers4 = base[6]
        self.layers5a = base[7][0]
        self.layers5b = base[7][1]
        self.layers5c = base[7][2]
        self.fc_fuse = nn.Sequential(nn.Linear(4096, 1024), nn.BatchNorm1d(1024), nn.ReLU())
        self.classifier = nn.Linear(3072, num_classes)
        self.feat_dim = 3072 # feature dimension

    def forward(self, x):
        x1 = self.layers1(x)
        x2 = self.layers2(x1)
        x3 = self.layers3(x2)
        x4 = self.layers4(x3)
        x5a = self.layers5a(x4)
        x5b = self.layers5b(x5a)
        x5c = self.layers5c(x5b)

        x5a_feat = F.avg_pool2d(x5a, x5a.size()[2:]).view(x5a.size(0), x5a.size(1))
        x5b_feat = F.avg_pool2d(x5b, x5b.size()[2:]).view(x5b.size(0), x5b.size(1))
        x5c_feat = F.avg_pool2d(x5c, x5c.size()[2:]).view(x5c.size(0), x5c.size(1))

        midfeat = torch.cat((x5a_feat, x5b_feat), dim=1)
        midfeat = self.fc_fuse(midfeat)

        combofeat = torch.cat((x5c_feat, midfeat), dim=1)
        
        if not self.training:
            return combofeat
        
        prelogits = self.classifier(combofeat)
        
        if self.loss == {'xent'}:
            return prelogits
        elif self.loss == {'xent', 'htri'}:
            return prelogits, combofeat
        else:
            raise KeyError("Unsupported loss: {}".format(self.loss))
standardize code 2018-07-04 17:32:43 +08:00			`from __future__ import absolute_import`
			`from __future__ import division`
restore models 2018-07-02 17:33:10 +08:00
			`import torch`
			`from torch import nn`
			`from torch.nn import functional as F`
			`import torchvision`


			`__all__ = ['ResNet50', 'ResNet101', 'ResNet50M']`


			`class ResNet50(nn.Module):`
			`def __init__(self, num_classes, loss={'xent'}, **kwargs):`
			`super(ResNet50, self).__init__()`
			`self.loss = loss`
			`resnet50 = torchvision.models.resnet50(pretrained=True)`
			`self.base = nn.Sequential(*list(resnet50.children())[:-2])`
			`self.classifier = nn.Linear(2048, num_classes)`
			`self.feat_dim = 2048`

			`def forward(self, x):`
			`x = self.base(x)`
			`x = F.avg_pool2d(x, x.size()[2:])`
			`f = x.view(x.size(0), -1)`
			`if not self.training:`
			`return f`
			`y = self.classifier(f)`

			`if self.loss == {'xent'}:`
			`return y`
			`elif self.loss == {'xent', 'htri'}:`
			`return y, f`
			`else:`
			`raise KeyError("Unsupported loss: {}".format(self.loss))`


			`class ResNet101(nn.Module):`
			`def __init__(self, num_classes, loss={'xent'}, **kwargs):`
			`super(ResNet101, self).__init__()`
			`self.loss = loss`
			`resnet101 = torchvision.models.resnet101(pretrained=True)`
			`self.base = nn.Sequential(*list(resnet101.children())[:-2])`
			`self.classifier = nn.Linear(2048, num_classes)`
			`self.feat_dim = 2048 # feature dimension`

			`def forward(self, x):`
			`x = self.base(x)`
			`x = F.avg_pool2d(x, x.size()[2:])`
			`f = x.view(x.size(0), -1)`
			`if not self.training:`
			`return f`
			`y = self.classifier(f)`

			`if self.loss == {'xent'}:`
			`return y`
			`elif self.loss == {'xent', 'htri'}:`
			`return y, f`
			`else:`
			`raise KeyError("Unsupported loss: {}".format(self.loss))`


			`class ResNet50M(nn.Module):`
			`"""ResNet50 + mid-level features.`

			`Reference:`
			`Yu et al. The Devil is in the Middle: Exploiting Mid-level Representations for`
			`Cross-Domain Instance Matching. arXiv:1711.08106.`
			`"""`
			`def __init__(self, num_classes=0, loss={'xent'}, **kwargs):`
			`super(ResNet50M, self).__init__()`
			`self.loss = loss`
			`resnet50 = torchvision.models.resnet50(pretrained=True)`
			`base = nn.Sequential(*list(resnet50.children())[:-2])`
			`self.layers1 = nn.Sequential(base[0], base[1], base[2])`
			`self.layers2 = nn.Sequential(base[3], base[4])`
			`self.layers3 = base[5]`
			`self.layers4 = base[6]`
			`self.layers5a = base[7][0]`
			`self.layers5b = base[7][1]`
			`self.layers5c = base[7][2]`
			`self.fc_fuse = nn.Sequential(nn.Linear(4096, 1024), nn.BatchNorm1d(1024), nn.ReLU())`
			`self.classifier = nn.Linear(3072, num_classes)`
			`self.feat_dim = 3072 # feature dimension`

			`def forward(self, x):`
			`x1 = self.layers1(x)`
			`x2 = self.layers2(x1)`
			`x3 = self.layers3(x2)`
			`x4 = self.layers4(x3)`
			`x5a = self.layers5a(x4)`
			`x5b = self.layers5b(x5a)`
			`x5c = self.layers5c(x5b)`

			`x5a_feat = F.avg_pool2d(x5a, x5a.size()[2:]).view(x5a.size(0), x5a.size(1))`
			`x5b_feat = F.avg_pool2d(x5b, x5b.size()[2:]).view(x5b.size(0), x5b.size(1))`
			`x5c_feat = F.avg_pool2d(x5c, x5c.size()[2:]).view(x5c.size(0), x5c.size(1))`

			`midfeat = torch.cat((x5a_feat, x5b_feat), dim=1)`
			`midfeat = self.fc_fuse(midfeat)`

			`combofeat = torch.cat((x5c_feat, midfeat), dim=1)`

			`if not self.training:`
			`return combofeat`

			`prelogits = self.classifier(combofeat)`

			`if self.loss == {'xent'}:`
			`return prelogits`
			`elif self.loss == {'xent', 'htri'}:`
			`return prelogits, combofeat`
			`else:`
			`raise KeyError("Unsupported loss: {}".format(self.loss))`