mmyolo/configs/yolov7/yolov7_w-p6_syncbn_fast_8x1...

_base_ = './yolov7_l_syncbn_fast_8x16b-300e_coco.py'

img_scale = (1280, 1280)  # height, width
num_classes = 80
# only on Val
batch_shapes_cfg = dict(img_size=img_scale[0], size_divisor=64)

anchors = [
    [(19, 27), (44, 40), (38, 94)],  # P3/8
    [(96, 68), (86, 152), (180, 137)],  # P4/16
    [(140, 301), (303, 264), (238, 542)],  # P5/32
    [(436, 615), (739, 380), (925, 792)]  # P6/64
]
strides = [8, 16, 32, 64]
num_det_layers = 4

model = dict(
    backbone=dict(arch='W', out_indices=(2, 3, 4, 5)),
    neck=dict(
        in_channels=[256, 512, 768, 1024],
        out_channels=[128, 256, 384, 512],
        use_maxpool_in_downsample=False,
        use_repconv_outs=False),
    bbox_head=dict(
        head_module=dict(
            type='YOLOv7p6HeadModule',
            in_channels=[128, 256, 384, 512],
            featmap_strides=strides,
            norm_cfg=dict(type='BN', momentum=0.03, eps=0.001),
            act_cfg=dict(type='SiLU', inplace=True)),
        prior_generator=dict(base_sizes=anchors, strides=strides),
        simota_candidate_topk=20,  # note
        # scaled based on number of detection layers
        loss_cls=dict(loss_weight=0.3 *
                      (num_classes / 80 * 3 / num_det_layers)),
        loss_bbox=dict(loss_weight=0.05 * (3 / num_det_layers)),
        loss_obj=dict(loss_weight=0.7 *
                      ((img_scale[0] / 640)**2 * 3 / num_det_layers)),
        obj_level_weights=[4.0, 1.0, 0.25, 0.06]))

pre_transform = _base_.pre_transform

mosiac4_pipeline = [
    dict(
        type='Mosaic',
        img_scale=img_scale,
        pad_val=114.0,
        pre_transform=pre_transform),
    dict(
        type='YOLOv5RandomAffine',
        max_rotate_degree=0.0,
        max_shear_degree=0.0,
        max_translate_ratio=0.2,  # note
        scaling_ratio_range=(0.1, 2.0),  # note
        # img_scale is (width, height)
        border=(-img_scale[0] // 2, -img_scale[1] // 2),
        border_val=(114, 114, 114)),
]

mosiac9_pipeline = [
    dict(
        type='Mosaic9',
        img_scale=img_scale,
        pad_val=114.0,
        pre_transform=pre_transform),
    dict(
        type='YOLOv5RandomAffine',
        max_rotate_degree=0.0,
        max_shear_degree=0.0,
        max_translate_ratio=0.2,  # note
        scaling_ratio_range=(0.1, 2.0),  # note
        # img_scale is (width, height)
        border=(-img_scale[0] // 2, -img_scale[1] // 2),
        border_val=(114, 114, 114)),
]

randchoice_mosaic_pipeline = dict(
    type='RandomChoice',
    transforms=[mosiac4_pipeline, mosiac9_pipeline],
    prob=[0.8, 0.2])

train_pipeline = [
    *pre_transform,
    randchoice_mosaic_pipeline,
    dict(
        type='YOLOv5MixUp',
        alpha=8.0,  # note
        beta=8.0,  # note
        prob=0.15,
        pre_transform=[*pre_transform, randchoice_mosaic_pipeline]),
    dict(type='YOLOv5HSVRandomAug'),
    dict(type='mmdet.RandomFlip', prob=0.5),
    dict(
        type='mmdet.PackDetInputs',
        meta_keys=('img_id', 'img_path', 'ori_shape', 'img_shape', 'flip',
                   'flip_direction'))
]
train_dataloader = dict(dataset=dict(pipeline=train_pipeline))

test_pipeline = [
    dict(type='LoadImageFromFile', file_client_args=_base_.file_client_args),
    dict(type='YOLOv5KeepRatioResize', scale=img_scale),
    dict(
        type='LetterResize',
        scale=img_scale,
        allow_scale_up=False,
        pad_val=dict(img=114)),
    dict(type='LoadAnnotations', with_bbox=True, _scope_='mmdet'),
    dict(
        type='mmdet.PackDetInputs',
        meta_keys=('img_id', 'img_path', 'ori_shape', 'img_shape',
                   'scale_factor', 'pad_param'))
]
val_dataloader = dict(
    dataset=dict(pipeline=test_pipeline, batch_shapes_cfg=batch_shapes_cfg))
test_dataloader = val_dataloader

# The only difference between P6 and P5 in terms of
# hyperparameters is lr_factor
default_hooks = dict(param_scheduler=dict(lr_factor=0.2))
[Feature] Support YOLOv7 P5 training (#243) * support yolov7 * update dev * update headmodule and convert * update * fix pipeline * fix loss * fix optimizer parameter groups * refactor mosaic9 * refactor optim * refactor loss * refactor * refactor * refactor new * support yolov7x * refine * support tiny * refactor model * refactor model * support yolov7x inference * support yolov7-tiny inference * support yolov7-e inference * refactor * support yolov7-tiny train * add docstr * fix merge error * fix merge error * fix merge error * fix lint * fix lint * fix lint * fix UT * update * update 2022-11-21 17:30:19 +08:00			`_base_ = './yolov7_l_syncbn_fast_8x16b-300e_coco.py'`

			`img_scale = (1280, 1280) # height, width`
			`num_classes = 80`
			`# only on Val`
			`batch_shapes_cfg = dict(img_size=img_scale[0], size_divisor=64)`

			`anchors = [`
			`[(19, 27), (44, 40), (38, 94)], # P3/8`
			`[(96, 68), (86, 152), (180, 137)], # P4/16`
			`[(140, 301), (303, 264), (238, 542)], # P5/32`
			`[(436, 615), (739, 380), (925, 792)] # P6/64`
			`]`
			`strides = [8, 16, 32, 64]`
			`num_det_layers = 4`

			`model = dict(`
			`backbone=dict(arch='W', out_indices=(2, 3, 4, 5)),`
			`neck=dict(`
			`in_channels=[256, 512, 768, 1024],`
			`out_channels=[128, 256, 384, 512],`
			`use_maxpool_in_downsample=False,`
			`use_repconv_outs=False),`
			`bbox_head=dict(`
			`head_module=dict(`
			`type='YOLOv7p6HeadModule',`
			`in_channels=[128, 256, 384, 512],`
			`featmap_strides=strides,`
			`norm_cfg=dict(type='BN', momentum=0.03, eps=0.001),`
			`act_cfg=dict(type='SiLU', inplace=True)),`
			`prior_generator=dict(base_sizes=anchors, strides=strides),`
[Feature] Support YOLOv7 P6 training (#310) * support p6 train * fix bug * add readme * add link 2022-11-30 18:45:08 +08:00			`simota_candidate_topk=20, # note`
			`# scaled based on number of detection layers`
			`loss_cls=dict(loss_weight=0.3 *`
			`(num_classes / 80 * 3 / num_det_layers)),`
			`loss_bbox=dict(loss_weight=0.05 * (3 / num_det_layers)),`
			`loss_obj=dict(loss_weight=0.7 *`
			`((img_scale[0] / 640)*2 3 / num_det_layers)),`
[Feature] Support YOLOv7 P5 training (#243) * support yolov7 * update dev * update headmodule and convert * update * fix pipeline * fix loss * fix optimizer parameter groups * refactor mosaic9 * refactor optim * refactor loss * refactor * refactor * refactor new * support yolov7x * refine * support tiny * refactor model * refactor model * support yolov7x inference * support yolov7-tiny inference * support yolov7-e inference * refactor * support yolov7-tiny train * add docstr * fix merge error * fix merge error * fix merge error * fix lint * fix lint * fix lint * fix UT * update * update 2022-11-21 17:30:19 +08:00			`obj_level_weights=[4.0, 1.0, 0.25, 0.06]))`

[Feature] Support YOLOv7 P6 training (#310) * support p6 train * fix bug * add readme * add link 2022-11-30 18:45:08 +08:00			`pre_transform = _base_.pre_transform`

			`mosiac4_pipeline = [`
			`dict(`
			`type='Mosaic',`
			`img_scale=img_scale,`
			`pad_val=114.0,`
			`pre_transform=pre_transform),`
			`dict(`
			`type='YOLOv5RandomAffine',`
			`max_rotate_degree=0.0,`
			`max_shear_degree=0.0,`
			`max_translate_ratio=0.2, # note`
			`scaling_ratio_range=(0.1, 2.0), # note`
[BC Breaking] Keep the same input shape order as mmdet 3.0.0rc5 (#436) * Keep the same input shape order as mmdet * add desc * update * update 2023-01-06 19:00:30 +08:00			`# img_scale is (width, height)`
[Feature] Support YOLOv7 P6 training (#310) * support p6 train * fix bug * add readme * add link 2022-11-30 18:45:08 +08:00			`border=(-img_scale[0] // 2, -img_scale[1] // 2),`
			`border_val=(114, 114, 114)),`
			`]`

			`mosiac9_pipeline = [`
			`dict(`
			`type='Mosaic9',`
			`img_scale=img_scale,`
			`pad_val=114.0,`
			`pre_transform=pre_transform),`
			`dict(`
			`type='YOLOv5RandomAffine',`
			`max_rotate_degree=0.0,`
			`max_shear_degree=0.0,`
			`max_translate_ratio=0.2, # note`
			`scaling_ratio_range=(0.1, 2.0), # note`
[BC Breaking] Keep the same input shape order as mmdet 3.0.0rc5 (#436) * Keep the same input shape order as mmdet * add desc * update * update 2023-01-06 19:00:30 +08:00			`# img_scale is (width, height)`
[Feature] Support YOLOv7 P6 training (#310) * support p6 train * fix bug * add readme * add link 2022-11-30 18:45:08 +08:00			`border=(-img_scale[0] // 2, -img_scale[1] // 2),`
			`border_val=(114, 114, 114)),`
			`]`

			`randchoice_mosaic_pipeline = dict(`
			`type='RandomChoice',`
			`transforms=[mosiac4_pipeline, mosiac9_pipeline],`
			`prob=[0.8, 0.2])`

			`train_pipeline = [`
			`*pre_transform,`
			`randchoice_mosaic_pipeline,`
			`dict(`
			`type='YOLOv5MixUp',`
			`alpha=8.0, # note`
			`beta=8.0, # note`
			`prob=0.15,`
			`pre_transform=[*pre_transform, randchoice_mosaic_pipeline]),`
			`dict(type='YOLOv5HSVRandomAug'),`
			`dict(type='mmdet.RandomFlip', prob=0.5),`
			`dict(`
			`type='mmdet.PackDetInputs',`
			`meta_keys=('img_id', 'img_path', 'ori_shape', 'img_shape', 'flip',`
			`'flip_direction'))`
			`]`
			`train_dataloader = dict(dataset=dict(pipeline=train_pipeline))`

[Feature] Support YOLOv7 P5 training (#243) * support yolov7 * update dev * update headmodule and convert * update * fix pipeline * fix loss * fix optimizer parameter groups * refactor mosaic9 * refactor optim * refactor loss * refactor * refactor * refactor new * support yolov7x * refine * support tiny * refactor model * refactor model * support yolov7x inference * support yolov7-tiny inference * support yolov7-e inference * refactor * support yolov7-tiny train * add docstr * fix merge error * fix merge error * fix merge error * fix lint * fix lint * fix lint * fix UT * update * update 2022-11-21 17:30:19 +08:00			`test_pipeline = [`
			`dict(type='LoadImageFromFile', file_client_args=_base_.file_client_args),`
			`dict(type='YOLOv5KeepRatioResize', scale=img_scale),`
			`dict(`
			`type='LetterResize',`
			`scale=img_scale,`
			`allow_scale_up=False,`
			`pad_val=dict(img=114)),`
			`dict(type='LoadAnnotations', with_bbox=True, _scope_='mmdet'),`
			`dict(`
			`type='mmdet.PackDetInputs',`
			`meta_keys=('img_id', 'img_path', 'ori_shape', 'img_shape',`
			`'scale_factor', 'pad_param'))`
			`]`
			`val_dataloader = dict(`
			`dataset=dict(pipeline=test_pipeline, batch_shapes_cfg=batch_shapes_cfg))`
			`test_dataloader = val_dataloader`
[Feature] Support YOLOv7 P6 training (#310) * support p6 train * fix bug * add readme * add link 2022-11-30 18:45:08 +08:00
			`# The only difference between P6 and P5 in terms of`
			`# hyperparameters is lr_factor`
			`default_hooks = dict(param_scheduler=dict(lr_factor=0.2))`