From 90f17f2e62ef3079dfcdb21c364892a43a2ff210 Mon Sep 17 00:00:00 2001
From: huangjiyi <43315610+huangjiyi@users.noreply.github.com>
Date: Thu, 15 Jun 2023 13:53:25 +0800
Subject: [PATCH 1/3] Add coco-wholebody-hand skeleton (#2186)

* update

* update
---
 demo/csrc/cpp/pose_tracker.cxx |  2 +-
 demo/csrc/cpp/utils/skeleton.h | 21 +++++++++++++++++++++
 2 files changed, 22 insertions(+), 1 deletion(-)

diff --git a/demo/csrc/cpp/pose_tracker.cxx b/demo/csrc/cpp/pose_tracker.cxx
index 484fe0ebd..c4cf26b89 100644
--- a/demo/csrc/cpp/pose_tracker.cxx
+++ b/demo/csrc/cpp/pose_tracker.cxx
@@ -18,7 +18,7 @@ DEFINE_int32(flip, 0, "Set to 1 for flipping the input horizontally");
 DEFINE_int32(show, 1, "Delay passed to `cv::waitKey` when using `cv::imshow`; -1: disable");
 
 DEFINE_string(skeleton, "coco",
-              R"(Path to skeleton data or name of predefined skeletons: "coco", "coco-wholebody")");
+              R"(Path to skeleton data or name of predefined skeletons: "coco", "coco-wholebody", "coco-wholebody-hand")");
 DEFINE_string(background, "default",
               R"(Output background, "default": original image, "black": black background)");
 
diff --git a/demo/csrc/cpp/utils/skeleton.h b/demo/csrc/cpp/utils/skeleton.h
index 1a7312167..8319c2886 100644
--- a/demo/csrc/cpp/utils/skeleton.h
+++ b/demo/csrc/cpp/utils/skeleton.h
@@ -73,6 +73,25 @@ const Skeleton& gSkeletonCocoWholeBody() {
   return inst;
 }
 
+const Skeleton& gSkeletonCocoWholeBodyHand() {
+  static const Skeleton inst{
+      {
+          {0, 1},  {1, 2},   {2, 3},   {3, 4},
+          {0, 5},  {5, 6},   {6, 7},   {7, 8},
+          {0, 9},  {9, 10},  {10, 11}, {11, 12},
+          {0, 13}, {13, 14}, {14, 15}, {15, 16},
+          {0, 17}, {17, 18}, {18, 19}, {19, 20},
+      },
+      {
+          {255, 255, 255}, {255, 128, 0}, {255, 153, 255},
+          {102, 178, 255}, {255, 51, 51}, {0, 255, 0},
+      },
+      {1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5,},
+      {0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5,},
+  };
+  return inst;
+}
+
 // n_links
 // u0, v0, u1, v1, ..., un-1, vn-1
 // n_palette
@@ -86,6 +105,8 @@ inline Skeleton Skeleton::get(const std::string& path) {
     return gSkeletonCoco();
   } else if (path == "coco-wholebody") {
     return gSkeletonCocoWholeBody();
+  } else if (path == "coco-wholebody-hand") {
+    return gSkeletonCocoWholeBodyHand();
   }
   std::ifstream ifs(path);
   if (!ifs.is_open()) {

From 2f2ada9d9695a92138865da9eb74a649cbb24c9a Mon Sep 17 00:00:00 2001
From: huayuan4396 <110151316+huayuan4396@users.noreply.github.com>
Date: Sun, 25 Jun 2023 15:02:21 +0800
Subject: [PATCH 2/3] Fix NMS Return Index (#2196)

* fix nms index return

* fix
---
 mmdeploy/mmcv/ops/nms.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/mmdeploy/mmcv/ops/nms.py b/mmdeploy/mmcv/ops/nms.py
index 918f6e48f..671fde41d 100644
--- a/mmdeploy/mmcv/ops/nms.py
+++ b/mmdeploy/mmcv/ops/nms.py
@@ -345,7 +345,11 @@ def _multiclass_nms_single(boxes: Tensor,
     labels = labels[:, topk_inds, ...]
 
     if output_index:
-        bbox_index = pre_topk_inds[None, topk_inds]
+        bbox_index = box_inds.unsqueeze(0)
+        if pre_top_k > 0:
+            bbox_index = pre_topk_inds[None, box_inds]
+        if keep_top_k > 0:
+            bbox_index = bbox_index[:, topk_inds[:-1]]
         return dets, labels, bbox_index
     else:
         return dets, labels

From faf2d9c2b55e1db45e0db8cf5b417904ab390228 Mon Sep 17 00:00:00 2001
From: RunningLeon <mnsheng@yeah.net>
Date: Sun, 25 Jun 2023 15:02:45 +0800
Subject: [PATCH 3/3] fix mmseg out_channels=1 (#2179)

* fix

* fix

* fix

* fix

* fix
---
 .../text-detection_ncnn-int8_static.py        |  0
 docs/en/05-supported-backends/onnxruntime.md  |  2 +-
 .../codebase/mmseg/models/segmentors/base.py  | 23 ++++++++++++--
 .../segmentors/cascade_encoder_decoder.py     |  5 ++--
 .../models/segmentors/encoder_decoder.py      | 20 ++-----------
 .../test_mmseg/test_mmseg_models.py           | 30 ++++++++++++++++---
 tests/test_codebase/test_mmseg/utils.py       |  3 +-
 7 files changed, 55 insertions(+), 28 deletions(-)
 rename configs/{ => mmocr/text-detection}/text-detection_ncnn-int8_static.py (100%)

diff --git a/configs/text-detection_ncnn-int8_static.py b/configs/mmocr/text-detection/text-detection_ncnn-int8_static.py
similarity index 100%
rename from configs/text-detection_ncnn-int8_static.py
rename to configs/mmocr/text-detection/text-detection_ncnn-int8_static.py
diff --git a/docs/en/05-supported-backends/onnxruntime.md b/docs/en/05-supported-backends/onnxruntime.md
index 2d6532203..1036e40a2 100644
--- a/docs/en/05-supported-backends/onnxruntime.md
+++ b/docs/en/05-supported-backends/onnxruntime.md
@@ -1,4 +1,4 @@
-# onnxruntime 支持情况
+# onnxruntime Support
 
 ## Introduction of ONNX Runtime
 
diff --git a/mmdeploy/codebase/mmseg/models/segmentors/base.py b/mmdeploy/codebase/mmseg/models/segmentors/base.py
index 6462d5b2e..960d34062 100644
--- a/mmdeploy/codebase/mmseg/models/segmentors/base.py
+++ b/mmdeploy/codebase/mmseg/models/segmentors/base.py
@@ -1,8 +1,9 @@
 # Copyright (c) OpenMMLab. All rights reserved.
+import torch
 from mmseg.structures import SegDataSample
 
 from mmdeploy.core import FUNCTION_REWRITER, mark
-from mmdeploy.utils import is_dynamic_shape
+from mmdeploy.utils import get_codebase_config, is_dynamic_shape
 
 
 @FUNCTION_REWRITER.register_rewriter(
@@ -47,4 +48,22 @@ def base_segmentor__forward(self,
     for data_sample in data_samples:
         data_sample.set_field(
             name='img_shape', value=img_shape, field_type='metainfo')
-    return self.predict(inputs, data_samples)
+    seg_logit = self.predict(inputs, data_samples)
+
+    # mark seg_head
+    @mark('decode_head', outputs=['output'])
+    def __mark_seg_logit(seg_logit):
+        return seg_logit
+
+    ctx = FUNCTION_REWRITER.get_context()
+    with_argmax = get_codebase_config(ctx.cfg).get('with_argmax', True)
+    # deal with out_channels=1 with two classes
+    if seg_logit.shape[1] == 1:
+        seg_logit = seg_logit.sigmoid()
+        seg_pred = seg_logit > self.decode_head.threshold
+        seg_pred = seg_pred.to(torch.int64)
+    else:
+        seg_pred = __mark_seg_logit(seg_logit)
+        if with_argmax:
+            seg_pred = seg_pred.argmax(dim=1, keepdim=True)
+    return seg_pred
diff --git a/mmdeploy/codebase/mmseg/models/segmentors/cascade_encoder_decoder.py b/mmdeploy/codebase/mmseg/models/segmentors/cascade_encoder_decoder.py
index ad8d35b81..05b3bf932 100644
--- a/mmdeploy/codebase/mmseg/models/segmentors/cascade_encoder_decoder.py
+++ b/mmdeploy/codebase/mmseg/models/segmentors/cascade_encoder_decoder.py
@@ -17,7 +17,7 @@ def cascade_encoder_decoder__predict(self, inputs, data_samples, **kwargs):
         data_samples (SampleList): The seg data samples.
 
     Returns:
-        torch.Tensor: Output segmentation map pf shape [N, 1, H, W].
+        torch.Tensor: Output segmentation logits of shape [N, C, H, W].
     """
     batch_img_metas = []
     for data_sample in data_samples:
@@ -28,5 +28,4 @@ def cascade_encoder_decoder__predict(self, inputs, data_samples, **kwargs):
         out = self.decode_head[i].forward(x, out)
     seg_logit = self.decode_head[-1].predict(x, out, batch_img_metas,
                                              self.test_cfg)
-    seg_pred = seg_logit.argmax(dim=1, keepdim=True)
-    return seg_pred
+    return seg_logit
diff --git a/mmdeploy/codebase/mmseg/models/segmentors/encoder_decoder.py b/mmdeploy/codebase/mmseg/models/segmentors/encoder_decoder.py
index 312c0fbfe..e7a8d1f59 100644
--- a/mmdeploy/codebase/mmseg/models/segmentors/encoder_decoder.py
+++ b/mmdeploy/codebase/mmseg/models/segmentors/encoder_decoder.py
@@ -1,6 +1,5 @@
 # Copyright (c) OpenMMLab. All rights reserved.
-from mmdeploy.core import FUNCTION_REWRITER, mark
-from mmdeploy.utils import get_codebase_config
+from mmdeploy.core import FUNCTION_REWRITER
 
 
 @FUNCTION_REWRITER.register_rewriter(
@@ -18,24 +17,11 @@ def encoder_decoder__predict(self, inputs, data_samples, **kwargs):
         data_samples (SampleList): The seg data samples.
 
     Returns:
-        torch.Tensor: Output segmentation map pf shape [N, 1, H, W].
+        torch.Tensor: Output segmentation logits of shape [N, C, H, W].
     """
     batch_img_metas = []
     for data_sample in data_samples:
         batch_img_metas.append(data_sample.metainfo)
     x = self.extract_feat(inputs)
     seg_logit = self.decode_head.predict(x, batch_img_metas, self.test_cfg)
-
-    ctx = FUNCTION_REWRITER.get_context()
-    if get_codebase_config(ctx.cfg).get('with_argmax', True) is False:
-        return seg_logit
-
-    # mark seg_head
-    @mark('decode_head', outputs=['output'])
-    def __mark_seg_logit(seg_logit):
-        return seg_logit
-
-    seg_logit = __mark_seg_logit(seg_logit)
-
-    seg_pred = seg_logit.argmax(dim=1, keepdim=True)
-    return seg_pred
+    return seg_logit
diff --git a/tests/test_codebase/test_mmseg/test_mmseg_models.py b/tests/test_codebase/test_mmseg/test_mmseg_models.py
index b5704b822..1c03139b4 100644
--- a/tests/test_codebase/test_mmseg/test_mmseg_models.py
+++ b/tests/test_codebase/test_mmseg/test_mmseg_models.py
@@ -2,6 +2,7 @@
 import mmengine
 import pytest
 import torch
+from packaging import version
 
 from mmdeploy.codebase import import_codebase
 from mmdeploy.utils import Backend, Codebase, Task
@@ -36,14 +37,31 @@ def test_encoderdecoder_predict(backend):
         wrapped_model=wrapped_model,
         model_inputs=rewrite_inputs,
         deploy_cfg=deploy_cfg)
-    assert torch.allclose(model_outputs, rewrite_outputs[0].squeeze(0))
+    rewrite_outputs = segmentor.postprocess_result(rewrite_outputs[0],
+                                                   data_samples)
+    rewrite_outputs = rewrite_outputs[0].pred_sem_seg.data
+    assert torch.allclose(model_outputs, rewrite_outputs)
 
 
 @pytest.mark.parametrize('backend', [Backend.ONNXRUNTIME])
-def test_basesegmentor_forward(backend):
+@pytest.mark.parametrize('with_argmax,use_sigmoid', [(True, False),
+                                                     (False, True)])
+def test_basesegmentor_forward(backend: Backend, with_argmax: bool,
+                               use_sigmoid: bool):
     check_backend(backend)
+    config_path = 'tests/test_codebase/test_mmseg/data/model.py'
+    model_cfg = mmengine.Config.fromfile(config_path)
+    if use_sigmoid:
+        import mmseg
+        if version.parse(mmseg.__version__) <= version.parse('1.0.0'):
+            pytest.skip('ignore mmseg<=1.0.0')
+        model_cfg.model.decode_head.num_classes = 2
+        model_cfg.model.decode_head.out_channels = 1
+        model_cfg.model.decode_head.threshold = 0.3
     deploy_cfg = generate_mmseg_deploy_config(backend.value)
-    task_processor = generate_mmseg_task_processor(deploy_cfg=deploy_cfg)
+    deploy_cfg.codebase_config.with_argmax = with_argmax
+    task_processor = generate_mmseg_task_processor(
+        deploy_cfg=deploy_cfg, model_cfg=model_cfg)
     segmentor = task_processor.build_pytorch_model()
     size = 256
     inputs = torch.randn(1, 3, size, size)
@@ -58,7 +76,11 @@ def test_basesegmentor_forward(backend):
         wrapped_model=wrapped_model,
         model_inputs=rewrite_inputs,
         deploy_cfg=deploy_cfg)
-    assert torch.allclose(model_outputs, rewrite_outputs[0].squeeze(0))
+    rewrite_outputs = rewrite_outputs[0]
+    if rewrite_outputs.shape[1] != 1:
+        rewrite_outputs = rewrite_outputs.argmax(dim=1, keepdim=True)
+    rewrite_outputs = rewrite_outputs.squeeze(0).to(model_outputs)
+    assert torch.allclose(model_outputs, rewrite_outputs)
 
 
 @pytest.mark.parametrize('backend', [Backend.ONNXRUNTIME])
diff --git a/tests/test_codebase/test_mmseg/utils.py b/tests/test_codebase/test_mmseg/utils.py
index 7da63d7a4..095dda56b 100644
--- a/tests/test_codebase/test_mmseg/utils.py
+++ b/tests/test_codebase/test_mmseg/utils.py
@@ -24,7 +24,8 @@ def generate_mmseg_deploy_config(backend='onnxruntime'):
     deploy_cfg = mmengine.Config(
         dict(
             backend_config=dict(type=backend),
-            codebase_config=dict(type='mmseg', task='Segmentation'),
+            codebase_config=dict(
+                type='mmseg', task='Segmentation', with_argmax=False),
             onnx_config=dict(
                 type='onnx',
                 export_params=True,