mmpretrain/configs/xcit/xcit-large-24-p16_8xb128_in...

_base_ = [
    '../_base_/datasets/imagenet_bs64_swin_224.py',
    '../_base_/schedules/imagenet_bs1024_adamw_swin.py',
    '../_base_/default_runtime.py',
]

model = dict(
    type='ImageClassifier',
    backbone=dict(
        type='XCiT',
        patch_size=16,
        embed_dims=768,
        depth=24,
        num_heads=16,
        mlp_ratio=4,
        qkv_bias=True,
        layer_scale_init_value=1e-5,
        tokens_norm=True,
        out_type='cls_token',
    ),
    head=dict(
        type='LinearClsHead',
        num_classes=1000,
        in_channels=768,
        loss=dict(type='CrossEntropyLoss', loss_weight=1.0),
    ),
    train_cfg=dict(arguments=[
        dict(type='Mixup', alpha=0.8),
        dict(type='CutMix', alpha=1.0),
    ]),
)

# dataset settings
train_dataloader = dict(batch_size=128)
[Feature] Support XCiT Backbone. (#1305) * update model file * Update XCiT implementation and configs. * Update metafiles * Update metafile * Fix floor divide * Imporve memory usage --------- Co-authored-by: qingtian <459291290@qq.com> Co-authored-by: mzr1996 <mzr1996@163.com> 2023-02-15 10:32:35 +08:00			`_base_ = [`
			`'../_base_/datasets/imagenet_bs64_swin_224.py',`
			`'../_base_/schedules/imagenet_bs1024_adamw_swin.py',`
			`'../_base_/default_runtime.py',`
			`]`

			`model = dict(`
			`type='ImageClassifier',`
			`backbone=dict(`
			`type='XCiT',`
			`patch_size=16,`
			`embed_dims=768,`
			`depth=24,`
			`num_heads=16,`
			`mlp_ratio=4,`
			`qkv_bias=True,`
			`layer_scale_init_value=1e-5,`
			`tokens_norm=True,`
			`out_type='cls_token',`
			`),`
			`head=dict(`
			`type='LinearClsHead',`
			`num_classes=1000,`
			`in_channels=768,`
			`loss=dict(type='CrossEntropyLoss', loss_weight=1.0),`
			`),`
			`train_cfg=dict(arguments=[`
			`dict(type='Mixup', alpha=0.8),`
			`dict(type='CutMix', alpha=1.0),`
			`]),`
			`)`

			`# dataset settings`
			`train_dataloader = dict(batch_size=128)`