mmclassification/mmpretrain/models/heads/cae_head.py

# Copyright (c) OpenMMLab. All rights reserved.
from typing import List, Optional, Tuple, Union

import torch
from mmengine.model import BaseModule

from mmpretrain.registry import MODELS


@MODELS.register_module()
class CAEHead(BaseModule):
    """Head for CAE Pre-training.

    Compute the align loss and the main loss. In addition, this head also
    generates the prediction target generated by dalle.

    Args:
        loss (dict): The config of loss.
        tokenizer_path (str): The path of the tokenizer.
        init_cfg (dict or List[dict], optional): Initialization config dict.
            Defaults to None.
    """

    def __init__(self,
                 loss: dict,
                 init_cfg: Optional[Union[dict, List[dict]]] = None) -> None:
        super().__init__(init_cfg=init_cfg)
        self.loss_module = MODELS.build(loss)

    @torch.no_grad()
    def _generate_target(self, logits_target: torch.Tensor) -> torch.Tensor:
        """Generate the reconstruction target.

        Args:
            logits_target (torch.Tensor): The logits generated by DALL-E.s

        Returns:
            torch.Tensor: The logits target.
        """
        target = torch.argmax(logits_target, dim=1)
        return target.flatten(1)

    def loss(self, logits: torch.Tensor, logits_target: torch.Tensor,
             latent_pred: torch.Tensor, latent_target: torch.Tensor,
             mask: torch.Tensor) -> Tuple[torch.Tensor, torch.Tensor]:
        """Generate loss.

        Args:
            logits (torch.Tensor): Logits generated by decoder.
            logits_target (img_target): Target generated by dalle for decoder
                prediction.
            latent_pred (torch.Tensor): Latent prediction by regressor.
            latent_target (torch.Tensor): Target for latent prediction,
                generated by teacher.

        Returns:
            Tuple[torch.Tensor, torch.Tensor]: The tuple of loss.
                - ``loss_main`` (torch.Tensor): Cross entropy loss.
                - ``loss_align`` (torch.Tensor): MSE loss.
        """

        target = self._generate_target(logits_target)  # target features
        target = target[mask].detach()

        # loss main for decoder, loss align for regressor
        loss_main, loss_align = self.loss_module(logits, target, latent_pred,
                                                 latent_target)

        return (loss_main, loss_align)
[Refactor] Add necks, heads and losses for the self-supervised task. (#1376) * add necks * refactor linear neck * rename simmim neck * add heads * add losses * fix * add unittest * update * update cae * remove mim head * update config 2023-02-28 10:05:00 +08:00			`# Copyright (c) OpenMMLab. All rights reserved.`
			`from typing import List, Optional, Tuple, Union`

			`import torch`
[Refactor] Add selfsup algorithms. (#1389) * remove basehead * add moco series * add byol simclr simsiam * add ut * update configs * add simsiam hook * add and refactor beit * update ut * add cae * update extract_feat * refactor cae * add mae * refactor data preprocessor * update heads * add maskfeat * add milan * add simmim * add mixmim * fix lint * fix ut * fix lint * add eva * add densecl * add barlowtwins * add swav * fix lint * update readtherdocs rst * update docs * update * Decrease UT memory usage * Fix docstring * update DALLEEncoder * Update model docs * refactor dalle encoder * update docstring * fix ut * fix config error * add val_cfg and test_cfg * refactor clip generator * fix lint * pass check * fix ut * add lars * update type of BEiT in configs * Use MMEngine style momentum in EMA. * apply mmpretrain solarize --------- Co-authored-by: mzr1996 <mzr1996@163.com> 2023-03-06 16:53:15 +08:00			`from mmengine.model import BaseModule`
[Refactor] Add necks, heads and losses for the self-supervised task. (#1376) * add necks * refactor linear neck * rename simmim neck * add heads * add losses * fix * add unittest * update * update cae * remove mim head * update config 2023-02-28 10:05:00 +08:00
			`from mmpretrain.registry import MODELS`


			`@MODELS.register_module()`
[Refactor] Add selfsup algorithms. (#1389) * remove basehead * add moco series * add byol simclr simsiam * add ut * update configs * add simsiam hook * add and refactor beit * update ut * add cae * update extract_feat * refactor cae * add mae * refactor data preprocessor * update heads * add maskfeat * add milan * add simmim * add mixmim * fix lint * fix ut * fix lint * add eva * add densecl * add barlowtwins * add swav * fix lint * update readtherdocs rst * update docs * update * Decrease UT memory usage * Fix docstring * update DALLEEncoder * Update model docs * refactor dalle encoder * update docstring * fix ut * fix config error * add val_cfg and test_cfg * refactor clip generator * fix lint * pass check * fix ut * add lars * update type of BEiT in configs * Use MMEngine style momentum in EMA. * apply mmpretrain solarize --------- Co-authored-by: mzr1996 <mzr1996@163.com> 2023-03-06 16:53:15 +08:00			`class CAEHead(BaseModule):`
			`"""Head for CAE Pre-training.`
[Refactor] Add necks, heads and losses for the self-supervised task. (#1376) * add necks * refactor linear neck * rename simmim neck * add heads * add losses * fix * add unittest * update * update cae * remove mim head * update config 2023-02-28 10:05:00 +08:00
			`Compute the align loss and the main loss. In addition, this head also`
			`generates the prediction target generated by dalle.`

			`Args:`
			`loss (dict): The config of loss.`
			`tokenizer_path (str): The path of the tokenizer.`
			`init_cfg (dict or List[dict], optional): Initialization config dict.`
			`Defaults to None.`
			`"""`

			`def __init__(self,`
			`loss: dict,`
			`init_cfg: Optional[Union[dict, List[dict]]] = None) -> None:`
			`super().__init__(init_cfg=init_cfg)`
			`self.loss_module = MODELS.build(loss)`

			`@torch.no_grad()`
			`def _generate_target(self, logits_target: torch.Tensor) -> torch.Tensor:`
			`"""Generate the reconstruction target.`

			`Args:`
			`logits_target (torch.Tensor): The logits generated by DALL-E.s`

			`Returns:`
			`torch.Tensor: The logits target.`
			`"""`
			`target = torch.argmax(logits_target, dim=1)`
			`return target.flatten(1)`

			`def loss(self, logits: torch.Tensor, logits_target: torch.Tensor,`
			`latent_pred: torch.Tensor, latent_target: torch.Tensor,`
			`mask: torch.Tensor) -> Tuple[torch.Tensor, torch.Tensor]:`
			`"""Generate loss.`

			`Args:`
			`logits (torch.Tensor): Logits generated by decoder.`
			`logits_target (img_target): Target generated by dalle for decoder`
			`prediction.`
			`latent_pred (torch.Tensor): Latent prediction by regressor.`
			`latent_target (torch.Tensor): Target for latent prediction,`
			`generated by teacher.`

			`Returns:`
			`Tuple[torch.Tensor, torch.Tensor]: The tuple of loss.`
[Refactor] Add selfsup algorithms. (#1389) * remove basehead * add moco series * add byol simclr simsiam * add ut * update configs * add simsiam hook * add and refactor beit * update ut * add cae * update extract_feat * refactor cae * add mae * refactor data preprocessor * update heads * add maskfeat * add milan * add simmim * add mixmim * fix lint * fix ut * fix lint * add eva * add densecl * add barlowtwins * add swav * fix lint * update readtherdocs rst * update docs * update * Decrease UT memory usage * Fix docstring * update DALLEEncoder * Update model docs * refactor dalle encoder * update docstring * fix ut * fix config error * add val_cfg and test_cfg * refactor clip generator * fix lint * pass check * fix ut * add lars * update type of BEiT in configs * Use MMEngine style momentum in EMA. * apply mmpretrain solarize --------- Co-authored-by: mzr1996 <mzr1996@163.com> 2023-03-06 16:53:15 +08:00			- ``loss_main`` (torch.Tensor): Cross entropy loss.
			- ``loss_align`` (torch.Tensor): MSE loss.
[Refactor] Add necks, heads and losses for the self-supervised task. (#1376) * add necks * refactor linear neck * rename simmim neck * add heads * add losses * fix * add unittest * update * update cae * remove mim head * update config 2023-02-28 10:05:00 +08:00			`"""`

			`target = self._generate_target(logits_target) # target features`
			`target = target[mask].detach()`

			`# loss main for decoder, loss align for regressor`
			`loss_main, loss_align = self.loss_module(logits, target, latent_pred,`
			`latent_target)`

			`return (loss_main, loss_align)`