refactor(onnx2ncnn): add test case and simplify code (#436)

* refactor(onnx2ncnn.cpp): split it to shape_inference, pass and utils * refactor(onnx2ncnn.cpp): split it to shape_inference, pass and utils * refactor(onnx2ncnn.cpp): split code * refactor(net_module.cpp): fix build error * ci(test_onnx2ncnn.py): add generate model adn run * ci(onnx2ncnn): add ncnn backend * ci(test_onnx2ncnn): add converted onnx model` * ci(onnx2ncnn): fix ncnn tar * ci(backed-ncnn): simplify dependency install * ci(onnx2ncnn): fix apt install * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * Update backend-ncnn.yml * fix(ci): add include algorithm * Update build.yml * parent aa857605319f63bc624a11956e1cd66b5389e4bf author q.yao <streetyao@live.com> 1651287879 +0800 committer tpoisonooo <khj.application@aliyun.com> 1652169959 +0800 [Fix] Fix ci (#426) * fix ci * add nvidia key * remote torch * recover pytorch refactor(onnx2ncnn.cpp): split it to shape_inference, pass and utils * fix(onnx2ncnn): review * fix(onnx2ncnn): build error Co-authored-by: q.yao <streetyao@live.com>
2025-01-14 08:09:43 +08:00 · 2022-05-16 10:36:25 +08:00 · 2022-05-16 10:36:25 +08:00 · d04c8dc9c0
commit d04c8dc9c0
parent 6eb83a9daa
11 changed files with 3251 additions and 2925 deletions
--- a/.github/scripts/test_onnx2ncnn.py
+++ b/.github/scripts/test_onnx2ncnn.py
@ -0,0 +1,97 @@
+# Copyright (c) OpenMMLab. All rights reserved.
+
+import argparse
+import os
+import subprocess
+
+# list of tuple: config, pretrained model, onnx filename
+CONFIGS = [
+    (
+        'mmclassification/configs/vision_transformer/vit-base-p32_ft-64xb64_in1k-384.py',  # noqa: E501
+        'https://download.openmmlab.com/mmclassification/v0/vit/finetune/vit-base-p32_in21k-pre-3rdparty_ft-64xb64_in1k-384_20210928-9cea8599.pth',  # noqa: E501
+        'vit.onnx'),
+    (
+        'mmclassification/configs/resnet/resnet50_8xb32_in1k.py',
+        'https://download.openmmlab.com/mmclassification/v0/resnet/resnet50_8xb32_in1k_20210831-ea4938fc.pth',  # noqa: E501
+        'resnet50.onnx',
+    ),
+    (
+        'mmclassification/configs/resnet/resnet18_8xb32_in1k.py',
+        'https://download.openmmlab.com/mmclassification/v0/resnet/resnet18_8xb32_in1k_20210831-fbbb1da6.pth',  # noqa: E501
+        'resnet18.onnx',
+        'https://media.githubusercontent.com/media/tpoisonooo/mmdeploy-onnx2ncnn-testdata/main/resnet18.onnx',  # noqa: E501
+    ),
+    (
+        'mmclassification/configs/mobilenet_v2/mobilenet-v2_8xb32_in1k.py',
+        'https://download.openmmlab.com/mmclassification/v0/mobilenet_v2/mobilenet_v2_batch256_imagenet_20200708-3b2dc3af.pth',  # noqa: E501
+        'mobilenet-v2.onnx',
+        'https://media.githubusercontent.com/media/tpoisonooo/mmdeploy-onnx2ncnn-testdata/main/mobilenet-v2.onnx',  # noqa: E501
+    )
+]
+
+
+def parse_args():
+    parser = argparse.ArgumentParser(
+        description='MMDeploy onnx2ncnn test tool.')
+    parser.add_argument('--run', type=bool, help='Execute onnx2ncnn bin.')
+    parser.add_argument(
+        '--repo-dir', type=str, default='~/', help='mmcls directory.')
+    parser.add_argument(
+        '--out',
+        type=str,
+        default='onnx_output',
+        help='onnx model output directory.')
+    parser.add_argument(
+        '--generate-onnx', type=bool, help='Generate onnx model.')
+    args = parser.parse_args()
+    return args
+
+
+def generate_onnx(args):
+    import mmcv
+    mmcv.mkdir_or_exist(args.out)
+    for conf in CONFIGS:
+        config = os.path.join(args.repo_dir, conf[0])
+        model = conf[1]
+        convert_cmd = [
+            'python3', 'tools/deploy.py',
+            'configs/mmcls/classification_ncnn_static.py', config, model,
+            'cat-dog.png', '--work-dir', 'work_dir', '--device', 'cpu'
+        ]
+        print(subprocess.call(convert_cmd))
+
+        move_cmd = [
+            'mv', 'work_dir/end2end.onnx',
+            os.path.join(args.out, conf[2])
+        ]
+        print(subprocess.call(move_cmd))
+
+
+def run(args):
+    for conf in CONFIGS:
+        if len(conf) < 4:
+            continue
+        download_url = conf[3]
+        filename = conf[2]
+        download_cmd = ['wget', download_url]
+        # show processbar
+        os.system(' '.join(download_cmd))
+
+        convert_cmd = ['./onnx2ncnn', filename, 'onnx.param', 'onnx.bin']
+        subprocess.run(convert_cmd, capture_output=True, check=True)
+
+
+def main():
+    """test `onnx2ncnn.cpp`
+
+    First generate onnx model then convert it with `onnx2ncnn`.
+    """
+    args = parse_args()
+    if args.generate_onnx:
+        generate_onnx(args)
+    if args.run:
+        run(args)
+
+
+if __name__ == '__main__':
+    main()
--- a/.github/workflows/backend-ncnn.yml
+++ b/.github/workflows/backend-ncnn.yml
@ -0,0 +1,68 @@
+name: backend
+
+on:
+  push:
+    paths-ignore:
+      - "demo/**"
+      - "tools/**"
+
+  pull_request:
+    paths-ignore:
+      - "demo/**"
+      - "tools/**"
+      - "docs/**"
+
+concurrency:
+  group: ${{ github.workflow }}-${{ github.ref }}
+  cancel-in-progress: true
+
+jobs:
+  test_onnx2ncnn:
+    runs-on: ubuntu-18.04
+    strategy:
+      matrix:
+        python-version: [3.7]
+        torch: [1.9.0]
+        mmcv: [1.4.2]
+        include:
+          - torch: 1.9.0
+            torch_version: torch1.9
+            torchvision: 0.10.0
+    steps:
+      - name: Checkout repository
+        uses: actions/checkout@v3
+        with:
+          submodules: 'recursive'
+      - name: Set up Python ${{ matrix.python-version }}
+        uses: actions/setup-python@v2
+        with:
+          python-version: ${{ matrix.python-version }}
+      - name: Install unittest dependencies
+        run: |
+          pip install cmake onnx
+      - name: update
+        run: sudo apt update
+      - name: gcc-multilib
+        run: sudo apt install gcc-multilib g++-multilib wget libprotobuf-dev protobuf-compiler
+      - name: Install ncnn
+        run: |
+          wget https://github.com/Tencent/ncnn/archive/refs/tags/20220420.tar.gz
+          tar xf 20220420.tar.gz
+          pushd ncnn-20220420
+          mkdir build && pushd build
+          cmake -DCMAKE_INSTALL_PREFIX=$(pwd)/../install -DNCNN_BUILD_TESTS=OFF -DNCNN_BUILD_TOOLS=OFF -DNCNN_BUILD_EXAMPLES=OFF ..
+          cmake --build . -j2
+          make install
+          popd && popd
+      - name: Install mmdeploy with ncnn backend
+        run: |
+          mkdir -p build && pushd build
+          export LD_LIBRARY_PATH=/home/runner/work/mmdeploy/mmdeploy/ncnn-20220420/install/lib/:$LD_LIBRARY_PATH
+          cmake -DMMDEPLOY_TARGET_BACKENDS=ncnn -Dncnn_DIR=/home/runner/work/mmdeploy/mmdeploy/ncnn-20220420/install/lib/cmake/ncnn/ ..
+          make onnx2ncnn -j2
+          popd
+      - name: Test onnx2ncnn
+        run: |
+          echo $(pwd)
+          ln -s build/bin/onnx2ncnn ./
+          python3 .github/scripts/test_onnx2ncnn.py --run 1
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@ -152,4 +152,4 @@ jobs:
          env_vars: OS,PYTHON
          name: codecov-umbrella
          fail_ci_if_error: false
-          gcov_ignore : [".github/scripts/doc_link_checker.py"]
+          gcov_ignore : [".github/scripts/*"]
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@ -5,7 +5,7 @@ endif ()
 message(STATUS "CMAKE_INSTALL_PREFIX: ${CMAKE_INSTALL_PREFIX}")

 cmake_minimum_required(VERSION 3.14)
-project(MMDeploy VERSION 0.1.0)
+project(MMDeploy VERSION 0.5.0)

 set(CMAKE_CXX_STANDARD 17)

--- a/csrc/backend_ops/ncnn/onnx2ncnn/CMakeLists.txt
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/CMakeLists.txt
@ -7,7 +7,7 @@ find_package(Protobuf)
 if (PROTOBUF_FOUND)
    protobuf_generate_cpp(ONNX_PROTO_SRCS ONNX_PROTO_HDRS
            ${CMAKE_CURRENT_SOURCE_DIR}/onnx.proto)
-    add_executable(onnx2ncnn onnx2ncnn.cpp ${ONNX_PROTO_SRCS} ${ONNX_PROTO_HDRS})
+    add_executable(onnx2ncnn onnx2ncnn.cpp fuse_pass.cpp shape_inference.cpp ${ONNX_PROTO_SRCS} ${ONNX_PROTO_HDRS})
    target_include_directories(onnx2ncnn PRIVATE ${PROTOBUF_INCLUDE_DIR}
            ${CMAKE_CURRENT_BINARY_DIR})
    target_link_libraries(onnx2ncnn PRIVATE ${PROTOBUF_LIBRARIES})
--- a/csrc/backend_ops/ncnn/onnx2ncnn/fuse_pass.cpp
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/fuse_pass.cpp
--- a/csrc/backend_ops/ncnn/onnx2ncnn/fuse_pass.h
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/fuse_pass.h
@ -0,0 +1,120 @@
+// Copyright (c) OpenMMLab. All rights reserved.
+#pragma once
+
+#include "shape_inference.h"
+#include "utils.h"
+
+void fuse_weight_reshape(onnx::GraphProto* mutable_graph,
+                         std::map<std::string, onnx::TensorProto>& weights,
+                         std::map<std::string, int>& node_reference,
+                         std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_shufflechannel(onnx::GraphProto* mutable_graph,
+                         std::map<std::string, onnx::TensorProto>& weights,
+                         std::map<std::string, int>& node_reference,
+                         std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_shufflechannel_split(onnx::GraphProto* mutable_graph,
+                               std::map<std::string, onnx::TensorProto>& weights,
+                               std::map<std::string, int>& node_reference,
+                               std::set<std::string>& blob_names, int& reduced_node_count);
+
+/**
+ * @brief fuse subgraph
+ *
+ * conv - - - - - - - - - - - -> reshape
+ *     \                        /
+ *       shape - slice - concat
+ *
+ * to
+ *
+ * conv --> reshape
+ *
+ * @param mutable_graph
+ * @param weights
+ * @param node_reference
+ * @param blob_names
+ * @param reduced_node_count
+ */
+void fuse_conv_reshape(onnx::GraphProto* mutable_graph,
+                       std::map<std::string, onnx::TensorProto>& weights,
+                       std::map<std::string, int>& node_reference,
+                       std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_binaryop_with_scalar(onnx::GraphProto* mutable_graph,
+                               std::map<std::string, onnx::TensorProto>& weights,
+                               std::map<std::string, int>& node_reference,
+                               std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_hardswish(onnx::GraphProto* mutable_graph,
+                    std::map<std::string, onnx::TensorProto>& weights,
+                    std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                    int& reduced_node_count);
+
+void fuse_hardsigmoid(onnx::GraphProto* mutable_graph,
+                      std::map<std::string, onnx::TensorProto>& weights,
+                      std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                      int& reduced_node_count);
+
+void fuse_batchnorm1d_squeeze_unsqueeze(onnx::GraphProto* mutable_graph,
+                                        std::map<std::string, onnx::TensorProto>& weights,
+                                        std::map<std::string, int>& node_reference,
+                                        std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_unsqueeze_prelu(onnx::GraphProto* mutable_graph,
+                          std::map<std::string, onnx::TensorProto>& weights,
+                          std::map<std::string, int>& node_reference,
+                          std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_normalize(onnx::GraphProto* mutable_graph,
+                    std::map<std::string, onnx::TensorProto>& weights,
+                    std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                    int& reduced_node_count);
+
+void fuse_groupnorm(onnx::GraphProto* mutable_graph,
+                    std::map<std::string, onnx::TensorProto>& weights,
+                    std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                    int& reduced_node_count);
+
+void fuse_layernorm(onnx::GraphProto* mutable_graph,
+                    std::map<std::string, onnx::TensorProto>& weights,
+                    std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                    int& reduced_node_count);
+
+void fuse_flatten(onnx::GraphProto* mutable_graph,
+                  std::map<std::string, onnx::TensorProto>& weights,
+                  std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                  int& reduced_node_count);
+
+void fuse_pixelshuffle(onnx::GraphProto* mutable_graph,
+                       std::map<std::string, onnx::TensorProto>& weights,
+                       std::map<std::string, int>& node_reference,
+                       std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_reorg(onnx::GraphProto* mutable_graph, std::map<std::string, onnx::TensorProto>& weights,
+                std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                int& reduced_node_count);
+
+void fuse_expand_broadcast(onnx::GraphProto* mutable_graph,
+                           std::map<std::string, onnx::TensorProto>& weights,
+                           std::map<std::string, int>& node_reference,
+                           std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_lstm_gru_rnn(onnx::GraphProto* mutable_graph,
+                       std::map<std::string, onnx::TensorProto>& weights,
+                       std::map<std::string, int>& node_reference,
+                       std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_multiheadattention(onnx::GraphProto* mutable_graph,
+                             std::map<std::string, onnx::TensorProto>& weights,
+                             std::map<std::string, int>& node_reference,
+                             std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_weight_transpose(onnx::GraphProto* mutable_graph,
+                           std::map<std::string, onnx::TensorProto>& weights,
+                           std::map<std::string, int>& node_reference,
+                           std::set<std::string>& blob_names, int& reduced_node_count);
+
+void fuse_swish(onnx::GraphProto* mutable_graph, std::map<std::string, onnx::TensorProto>& weights,
+                std::map<std::string, int>& node_reference, std::set<std::string>& blob_names,
+                int& reduced_node_count);
--- a/csrc/backend_ops/ncnn/onnx2ncnn/onnx2ncnn.cpp
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/onnx2ncnn.cpp
--- a/csrc/backend_ops/ncnn/onnx2ncnn/shape_inference.cpp
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/shape_inference.cpp
@ -0,0 +1,168 @@
+// Copyright (c) OpenMMLab. All rights reserved.
+
+#include "shape_inference.h"
+
+/**
+ * @brief query output shape of target node
+ *
+ * @param mutable_graph
+ * @param target
+ * @param weights
+ * @param context <tensor name, shape>
+ * @return std::tuple<bool, std::vector<int>>
+ */
+std::tuple<bool, std::vector<int>> query_shape(
+    onnx::GraphProto* mutable_graph, onnx::NodeProto* target,
+    const std::map<std::string, onnx::TensorProto>& weights,
+    std::map<std::string, std::vector<int>>& context) {
+  // emplace all input nodes
+  const int input_count = mutable_graph->input_size();
+  for (int i = 0; i < input_count; i++) {
+    auto inp = mutable_graph->input(i);
+    onnx::TypeProto inp_type = inp.type();
+    onnx::TensorShapeProto shape_proto = inp_type.tensor_type().shape();
+
+    auto dim_size = shape_proto.dim_size();
+    std::vector<int> shape(dim_size);
+    for (int index = 0; index < dim_size; ++index) {
+      shape[index] = shape_proto.dim(index).dim_value();
+    }
+
+    context.emplace(inp.name(), shape);
+  }
+
+  // BFS the tree, `target` as root, onnx::graph inputs and weights as leaf nodes
+  std::vector<onnx::NodeProto*> serial = {target};
+  {
+    std::set<std::string> mark_as_appended = {};
+    while (true) {
+      int start = 0, end = serial.size();
+      for (int i = start; i < end; ++i) {
+        auto node_ptr = serial[i];
+        auto len = node_ptr->input_size();
+
+        for (int j = 0; j < len; ++j) {
+          std::string name = node_ptr->input(j);
+          if (context.find(name) != context.end()) {
+            // if input founded, skip
+            continue;
+          }
+
+          if (weights.find(name) != weights.end()) {
+            // if founded in weights, extract shape to context
+            auto weight = weights.at(name);
+            std::vector<int> shape;
+            for (auto index = 0; index < weight.dims_size(); ++index) {
+              shape.emplace_back(weight.dims(index));
+            }
+            context.emplace(name, shape);
+            continue;
+          }
+
+          if (mark_as_appended.find(name) != mark_as_appended.end()) {
+            // if mark as appended, skip
+            continue;
+          }
+          // else append it to serialization list
+          auto depend_ptr = find_node_by_output_name(mutable_graph, name);
+          if (depend_ptr == nullptr) {
+            fprintf(stderr, "cannot find %s from graph !\n", name.c_str());
+            return std::make_tuple(false, std::vector<int>{});
+          }
+          mark_as_appended.insert(name);
+          serial.emplace_back(depend_ptr);
+        }
+      }
+
+      if (serial.size() <= end) {
+        // if not new node added, quit
+        break;
+      }
+
+      // update start and end position, continue BFS the tree
+      start = end;
+      end = serial.size();
+    }
+  }
+
+  // for each node in serialization list, calculate the output shape
+  {
+    std::reverse(serial.begin(), serial.end());
+    for (auto node : serial) {
+      if (node->op_type() == "Conv") {
+        auto inp = context[node->input(0)];
+        auto weight = context[node->input(1)];
+        assert(inp.size() == 4 and weight.size() == 4);
+
+        int group = get_node_attr_i(*node, "group", 1);
+        assert(group == 1);
+
+        // treat multiple spatial attr as single one
+#define EXTRACT_REPEATED_PARAM(NAME, ATTR, DEFAULT)        \
+  int ATTR = DEFAULT;                                      \
+  {                                                        \
+    std::vector<int> _vec = get_node_attr_ai(*node, NAME); \
+    if (not _vec.empty()) {                                \
+      ATTR = _vec[0];                                      \
+    }                                                      \
+  }
+
+        EXTRACT_REPEATED_PARAM("dilations", dilation, 1);
+        EXTRACT_REPEATED_PARAM("pads", pad, 0);
+        EXTRACT_REPEATED_PARAM("strides", stride, 1);
+
+#undef EXTRACT_REPEATED_PARAM
+
+        int on = inp[0];
+        int oc = weight[0];
+        int oh = (inp[2] + 2 * pad - weight[2]) / stride + 1;
+        int ow = (inp[3] + 2 * pad - weight[3]) / stride + 1;
+        context.emplace(node->output(0), std::vector<int>{on, oc, oh, ow});
+
+      } else if (node->op_type() == "Shape") {
+        auto inp = context[node->input(0)];
+        context.emplace(node->output(0), std::vector<int>{1, inp[1], inp[2], inp[3]});
+
+      } else if (node->op_type() == "Slice") {
+        assert(node->input_size() >= 4);
+
+        auto inp = context[node->input(0)];
+        int start = get_node_attr_from_input<int>(weights.at(node->input(1)));
+        int end = get_node_attr_from_input<int>(weights.at(node->input(2)));
+        int axes = get_node_attr_from_input<int>(weights.at(node->input(3)));
+
+        if (axes != 0) {
+          fprintf(stderr, "Not support axes=%d !\n", axes);
+          return std::make_tuple(false, std::vector<int>{});
+        }
+
+        assert(inp.size() >= end - start);
+        context.emplace(node->output(0), std::vector<int>{inp.begin() + start, inp.begin() + end});
+
+      } else if (node->op_type() == "Concat") {
+        assert(node->input_size() >= 2);
+
+        auto axis = get_node_attr_i(*node, "axis", 0);
+        if (axis != 0) {
+          fprintf(stderr, "Not support axes=%d !\n", axis);
+          return std::make_tuple(false, std::vector<int>{});
+        }
+
+        std::vector<int> inp = context[node->input(0)];
+        std::vector<int> w_data = get_node_attr_from_input_ai(weights.at(node->input(1)));
+
+        // concat data on axis 0
+        inp.insert(inp.end(), w_data.begin(), w_data.end());
+        context.emplace(node->output(0), inp);
+
+      } else {
+        fprintf(stderr, "Unsupported type %s in query_shape !\n", node->op_type().c_str());
+        return std::make_tuple(false, std::vector<int>{});
+      }
+    }
+  }
+
+  assert(context.find(target->output(0)) != context.end());
+  auto target_shape = context[target->output(0)];
+  return std::make_tuple(true, target_shape);
+}
--- a/csrc/backend_ops/ncnn/onnx2ncnn/shape_inference.h
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/shape_inference.h
@ -0,0 +1,20 @@
+// Copyright (c) OpenMMLab. All rights reserved.
+
+#pragma once
+#include <algorithm>
+
+#include "utils.h"
+
+/**
+ * @brief query output shape of target node
+ *
+ * @param mutable_graph
+ * @param target
+ * @param weights
+ * @param context <tensor name, shape>
+ * @return std::tuple<bool, std::vector<int>>
+ */
+std::tuple<bool, std::vector<int>> query_shape(
+    onnx::GraphProto* mutable_graph, onnx::NodeProto* target,
+    const std::map<std::string, onnx::TensorProto>& weights,
+    std::map<std::string, std::vector<int>>& context);
--- a/csrc/backend_ops/ncnn/onnx2ncnn/utils.h
+++ b/csrc/backend_ops/ncnn/onnx2ncnn/utils.h
@ -0,0 +1,401 @@
+// Copyright (c) OpenMMLab. All rights reserved.
+#pragma once
+
+#include <float.h>
+#include <google/protobuf/io/coded_stream.h>
+#include <google/protobuf/io/zero_copy_stream_impl.h>
+#include <google/protobuf/message.h>
+#include <google/protobuf/text_format.h>
+#include <limits.h>
+
+#include <cstdlib>
+#include <fstream>
+#include <iostream>
+
+#include "onnx.pb.h"
+
+/**
+ * @brief find graph node by output name
+ *
+ * @param graph
+ * @param name
+ * @return onnx::NodeProto*
+ */
+static onnx::NodeProto* find_node_by_output_name(onnx::GraphProto* mutable_graph,
+                                                 const std::string& name) {
+  const int input_count = mutable_graph->node_size();
+  for (int i = 0; i < input_count; ++i) {
+    onnx::NodeProto* node = mutable_graph->mutable_node(i);
+
+    for (int j = 0; j < node->output_size(); ++j) {
+      auto output = node->output(j);
+      if (output == name) {
+        return node;
+      }
+    }
+  }
+
+  return nullptr;
+}
+
+static bool read_proto_from_binary(const char* filepath, onnx::ModelProto* message) {
+  std::ifstream fs(filepath, std::ifstream::in | std::ifstream::binary);
+  if (!fs.is_open()) {
+    fprintf(stderr, "open failed %s\n", filepath);
+    return false;
+  }
+
+  google::protobuf::io::IstreamInputStream input(&fs);
+  google::protobuf::io::CodedInputStream codedstr(&input);
+
+#if GOOGLE_PROTOBUF_VERSION >= 3011000
+  codedstr.SetTotalBytesLimit(INT_MAX);
+#else
+  codedstr.SetTotalBytesLimit(INT_MAX, INT_MAX / 2);
+#endif
+
+  bool success = message->ParseFromCodedStream(&codedstr);
+
+  fs.close();
+
+  return success;
+}
+
+static std::vector<int> get_node_attr_ai(const onnx::NodeProto& node, const char* key) {
+  std::vector<int> v;
+
+  for (int i = 0; i < node.attribute_size(); i++) {
+    const onnx::AttributeProto& attr = node.attribute(i);
+    if (attr.name() == key) {
+      v.resize(attr.ints_size());
+      for (int j = 0; j < attr.ints_size(); j++) {
+        v[j] = std::max(std::min(attr.ints(j), (::google::protobuf::int64)INT_MAX),
+                        (::google::protobuf::int64)INT_MIN);
+      }
+
+      break;
+    }
+  }
+
+  return v;
+}
+
+static void set_node_attr_ai(onnx::NodeProto& node, const char* key,
+                             const std::vector<int>& value) {
+  onnx::AttributeProto* attr_group = node.add_attribute();
+  attr_group->set_name(key);
+  for (auto v : value) {
+    attr_group->add_ints(v);
+  }
+
+  return;
+}
+
+static std::vector<float> get_node_attr_af(const onnx::NodeProto& node, const char* key) {
+  std::vector<float> v;
+
+  for (int i = 0; i < node.attribute_size(); i++) {
+    const onnx::AttributeProto& attr = node.attribute(i);
+    if (attr.name() == key) {
+      v.resize(attr.floats_size());
+      for (int j = 0; j < attr.floats_size(); j++) {
+        v[j] = attr.floats(j);
+      }
+
+      break;
+    }
+  }
+
+  return v;
+}
+
+static int get_node_attr_i(const onnx::NodeProto& node, const char* key, int def = 0) {
+  for (int i = 0; i < node.attribute_size(); i++) {
+    const onnx::AttributeProto& attr = node.attribute(i);
+    if (attr.name() == key) {
+      return std::max(std::min(attr.i(), (::google::protobuf::int64)INT_MAX),
+                      (::google::protobuf::int64)INT_MIN);
+    }
+  }
+
+  return def;
+}
+
+static float get_node_attr_f(const onnx::NodeProto& node, const char* key, float def = 0.f) {
+  for (int i = 0; i < node.attribute_size(); i++) {
+    const onnx::AttributeProto& attr = node.attribute(i);
+    if (attr.name() == key) {
+      return attr.f();
+    }
+  }
+
+  return def;
+}
+
+static std::string get_node_attr_s(const onnx::NodeProto& node, const char* key,
+                                   const std::string& def = std::string()) {
+  for (int i = 0; i < node.attribute_size(); i++) {
+    const onnx::AttributeProto& attr = node.attribute(i);
+    if (attr.name() == key) {
+      return attr.s();
+    }
+  }
+
+  return def;
+}
+
+static onnx::TensorProto get_node_attr_tensor(const onnx::NodeProto& node, const char* key) {
+  for (int i = 0; i < node.attribute_size(); i++) {
+    const onnx::AttributeProto& attr = node.attribute(i);
+    if (attr.name() == key) {
+      return attr.t();
+    }
+  }
+
+  return onnx::TensorProto();
+}
+
+template <typename T>
+static T get_node_attr_from_input(const onnx::TensorProto& tp) {
+  T v = 0.f;
+
+  // float
+  if (tp.data_type() == 1) {
+    const float* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const float*)tp.raw_data().data();
+    } else {
+      shape_data = tp.float_data().data();
+    }
+    v = shape_data[0];
+  }
+  // double
+  else if (tp.data_type() == 11) {
+    const double* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const double*)tp.raw_data().data();
+    } else {
+      shape_data = tp.double_data().data();
+    }
+    v = shape_data[0];
+  }
+  // int64
+  else if (tp.data_type() == 7) {
+    const int64_t* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const int64_t*)tp.raw_data().data();
+    } else {
+      shape_data = tp.int64_data().data();
+    }
+    v = std::max(std::min(shape_data[0], (::google::protobuf::int64)INT_MAX),
+                 (::google::protobuf::int64)INT_MIN);
+  }
+  // int32
+  else if (tp.data_type() == 6) {
+    const int32_t* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const int32_t*)tp.raw_data().data();
+    } else {
+      shape_data = tp.int32_data().data();
+    }
+    v = shape_data[0];
+  } else {
+    // fprintf(stderr, "tp.name: %s\n", tp.name().c_str());
+    fprintf(stderr, "Unknown data type %d\n", tp.data_type());
+    fprintf(stderr, "get_node_attr_from_input\n");
+    abort();
+  }
+
+  return v;
+}
+
+static std::vector<int> get_node_attr_from_input_ai(const onnx::TensorProto& tp) {
+  int size = 0;
+
+  std::vector<int> v;
+
+  // int64
+  if (tp.data_type() == 7) {
+    const int64_t* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const int64_t*)tp.raw_data().data();
+      size = (int)(tp.raw_data().size() / 8);
+    } else {
+      shape_data = tp.int64_data().data();
+      size = tp.int64_data_size();
+    }
+    for (int j = 0; j < size; j++) {
+      int vi = std::max(std::min(shape_data[j], (::google::protobuf::int64)INT_MAX),
+                        (::google::protobuf::int64)INT_MIN);
+      v.push_back(vi);
+    }
+  }
+  // int32
+  else if (tp.data_type() == 6) {
+    const int32_t* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const int32_t*)tp.raw_data().data();
+      size = (int)(tp.raw_data().size() / 4);
+    } else {
+      shape_data = tp.int32_data().data();
+      size = tp.int32_data_size();
+    }
+    for (int j = 0; j < size; j++) {
+      v.push_back(shape_data[j]);
+    }
+  } else {
+    fprintf(stderr, "Unknown data type %d\n", tp.data_type());
+  }
+
+  return v;
+}
+
+static std::vector<float> get_node_attr_from_input_af(const onnx::TensorProto& tp) {
+  int size = 0;
+
+  std::vector<float> v;
+
+  // float
+  if (tp.data_type() == 1) {
+    const float* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const float*)tp.raw_data().data();
+      size = (int)(tp.raw_data().size() / 4);
+    } else {
+      shape_data = tp.float_data().data();
+      size = tp.float_data_size();
+    }
+    for (int j = 0; j < size; j++) {
+      v.push_back(shape_data[j]);
+    }
+  }
+  // double
+  else if (tp.data_type() == 11) {
+    const double* shape_data = 0;
+    if (tp.has_raw_data()) {
+      shape_data = (const double*)tp.raw_data().data();
+      size = (int)(tp.raw_data().size() / 8);
+    } else {
+      shape_data = tp.double_data().data();
+      size = tp.double_data_size();
+    }
+    for (int j = 0; j < size; j++) {
+      v.push_back((float)shape_data[j]);
+    }
+  } else {
+    fprintf(stderr, "Unknown data type %d\n", tp.data_type());
+  }
+
+  return v;
+}
+
+static int get_tensor_proto_data_size(const onnx::TensorProto& tp) {
+  if (tp.has_raw_data()) {
+    if (tp.data_type() == 1 || tp.data_type() == 6) {
+      const std::string& raw_data = tp.raw_data();
+      int size = (int)raw_data.size() / 4;
+      return size;
+    } else if (tp.data_type() == 7 || tp.data_type() == 11) {
+      const std::string& raw_data = tp.raw_data();
+      int size = (int)raw_data.size() / 8;
+      return size;
+    } else if (tp.data_type() == 9) {
+      const std::string& raw_data = tp.raw_data();
+      return 0;
+    }
+  } else if (tp.data_type() == 1) {
+    return tp.float_data_size();
+  } else if (tp.data_type() == 7) {
+    return tp.int64_data_size();
+  } else if (tp.data_type() == 6) {
+    return tp.int32_data_size();
+  } else if (tp.data_type() == 11) {
+    return tp.double_data_size();
+  }
+
+  return 0;
+}
+
+static void fwrite_tensor_proto_data(const onnx::TensorProto& tp, FILE* bp) {
+  int size = get_tensor_proto_data_size(tp);
+
+  if (tp.has_raw_data()) {
+    const std::string& raw_data = tp.raw_data();
+    fwrite(raw_data.data(), sizeof(float), size, bp);
+  } else if (tp.data_type() == 1) {
+    fwrite(tp.float_data().data(), sizeof(float), size, bp);
+  }
+}
+
+static void fwrite_tensor_proto_data_to_float(const onnx::TensorProto& tp, FILE* bp) {
+  int size = get_tensor_proto_data_size(tp);
+  size_t written_size;
+  if (tp.has_raw_data()) {
+    const std::string& raw_data = tp.raw_data();
+    if (tp.data_type() == 6) {
+      int* intdataptr = (int*)raw_data.data();
+      float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+      for (int i = 0; i < size; i++) {
+        floatdataptr[i] = (float)intdataptr[i];
+      }
+      written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+      std::free(floatdataptr);
+    } else if (tp.data_type() == 7) {
+      int64_t* intdataptr = (int64_t*)raw_data.data();
+      float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+      for (int i = 0; i < size; i++) {
+        floatdataptr[i] = (float)intdataptr[i];
+      }
+      written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+      std::free(floatdataptr);
+    } else if (tp.data_type() == 9) {
+      bool* intdataptr = (bool*)raw_data.data();
+      float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+      for (int i = 0; i < size; i++) {
+        floatdataptr[i] = (float)intdataptr[i];
+      }
+      written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+      std::free(floatdataptr);
+    } else if (tp.data_type() == 11) {
+      double* doubledataptr = (double*)raw_data.data();
+      float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+      for (int i = 0; i < size; i++) {
+        floatdataptr[i] = (float)doubledataptr[i];
+      }
+      written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+      std::free(floatdataptr);
+    }
+  } else if (tp.data_type() == 6) {
+    int* intdataptr = (int*)tp.int32_data().data();
+    float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+    for (int i = 0; i < size; i++) {
+      floatdataptr[i] = (float)intdataptr[i];
+    }
+    written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+    std::free(floatdataptr);
+  } else if (tp.data_type() == 7) {
+    int64_t* intdataptr = (int64_t*)tp.int64_data().data();
+    float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+    for (int i = 0; i < size; i++) {
+      floatdataptr[i] = (float)intdataptr[i];
+    }
+    written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+    std::free(floatdataptr);
+  } else if (tp.data_type() == 9) {
+    int* intdataptr = (int*)tp.int64_data().data();
+    float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+    for (int i = 0; i < size; i++) {
+      floatdataptr[i] = (float)intdataptr[i];
+    }
+    written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+    std::free(floatdataptr);
+  } else if (tp.data_type() == 11) {
+    double* doubledataptr = (double*)tp.double_data().data();
+    float* floatdataptr = (float*)std::malloc(sizeof(float) * size);
+    for (int i = 0; i < size; i++) {
+      floatdataptr[i] = (float)doubledataptr[i];
+    }
+    written_size = fwrite(floatdataptr, sizeof(float), size, bp);
+    std::free(floatdataptr);
+  }
+}