Should have included Conv2d layers in original weight init. Lets see what the impact is...

2025-06-03 15:01:08 +08:00 · 2021-03-18 23:15:48 -07:00 · 2021-03-18 23:15:48 -07:00 · cbcb76d72c
commit cbcb76d72c
parent 4de57ccf01
1 changed files with 1 additions and 1 deletions
--- a/timm/models/vision_transformer.py
+++ b/timm/models/vision_transformer.py
@ -476,7 +476,7 @@ class VisionTransformer(nn.Module):


 def _init_weights_original(m: nn.Module, n: str = ''):
-    if isinstance(m, nn.Linear):
+    if isinstance(m, (nn.Conv2d, nn.Linear)):
        trunc_normal_(m.weight, std=.02)
        if isinstance(m, nn.Linear) and m.bias is not None:
            nn.init.constant_(m.bias, 0)