mmdeploy/demo/python/pose_tracker.py

# Copyright (c) OpenMMLab. All rights reserved.
import argparse
import os

import cv2
from mmdeploy_runtime import PoseTracker


def parse_args():
    parser = argparse.ArgumentParser(
        description='show how to use SDK Python API')
    parser.add_argument('device_name', help='name of device, cuda or cpu')
    parser.add_argument(
        'det_model',
        help='path of mmdeploy SDK model dumped by model converter')
    parser.add_argument(
        'pose_model',
        help='path of mmdeploy SDK model dumped by model converter')
    parser.add_argument('video', help='video path or camera index')
    parser.add_argument('--output_dir', help='output directory', default=None)
    args = parser.parse_args()
    if args.video.isnumeric():
        args.video = int(args.video)
    return args


def visualize(frame, results, output_dir, frame_id, thr=0.5, resize=1280):
    skeleton = [(15, 13), (13, 11), (16, 14), (14, 12), (11, 12), (5, 11),
                (6, 12), (5, 6), (5, 7), (6, 8), (7, 9), (8, 10), (1, 2),
                (0, 1), (0, 2), (1, 3), (2, 4), (3, 5), (4, 6)]
    palette = [(255, 128, 0), (255, 153, 51), (255, 178, 102), (230, 230, 0),
               (255, 153, 255), (153, 204, 255), (255, 102, 255),
               (255, 51, 255), (102, 178, 255),
               (51, 153, 255), (255, 153, 153), (255, 102, 102), (255, 51, 51),
               (153, 255, 153), (102, 255, 102), (51, 255, 51), (0, 255, 0),
               (0, 0, 255), (255, 0, 0), (255, 255, 255)]
    link_color = [
        0, 0, 0, 0, 7, 7, 7, 9, 9, 9, 9, 9, 16, 16, 16, 16, 16, 16, 16
    ]
    point_color = [16, 16, 16, 16, 16, 9, 9, 9, 9, 9, 9, 0, 0, 0, 0, 0, 0]
    scale = resize / max(frame.shape[0], frame.shape[1])
    keypoints, bboxes, _ = results
    scores = keypoints[..., 2]
    keypoints = (keypoints[..., :2] * scale).astype(int)
    bboxes *= scale
    img = cv2.resize(frame, (0, 0), fx=scale, fy=scale)
    for kpts, score, bbox in zip(keypoints, scores, bboxes):
        show = [0] * len(kpts)
        for (u, v), color in zip(skeleton, link_color):
            if score[u] > thr and score[v] > thr:
                cv2.line(img, kpts[u], tuple(kpts[v]), palette[color], 1,
                         cv2.LINE_AA)
                show[u] = show[v] = 1
        for kpt, show, color in zip(kpts, show, point_color):
            if show:
                cv2.circle(img, kpt, 1, palette[color], 2, cv2.LINE_AA)
    if output_dir:
        cv2.imwrite(f'{output_dir}/{str(frame_id).zfill(6)}.jpg', img)
    else:
        cv2.imshow('pose_tracker', img)
        return cv2.waitKey(1) != 'q'
    return True


def main():
    args = parse_args()

    video = cv2.VideoCapture(args.video)

    tracker = PoseTracker(
        det_model=args.det_model,
        pose_model=args.pose_model,
        device_name=args.device_name)

    # optionally use OKS for keypoints similarity comparison
    coco_sigmas = [
        0.026, 0.025, 0.025, 0.035, 0.035, 0.079, 0.079, 0.072, 0.072, 0.062,
        0.062, 0.107, 0.107, 0.087, 0.087, 0.089, 0.089
    ]
    state = tracker.create_state(
        det_interval=1, det_min_bbox_size=100, keypoint_sigmas=coco_sigmas)

    if args.output_dir:
        os.makedirs(args.output_dir, exist_ok=True)

    frame_id = 0
    while True:
        success, frame = video.read()
        if not success:
            break
        results = tracker(state, frame, detect=-1)
        if not visualize(frame, results, args.output_dir, frame_id):
            break
        frame_id += 1


if __name__ == '__main__':
    main()
[Feature] Pose tracker C/C++/Python API&demos (#1663) * add PoseTracker API * add mahalanobis distance, add det_pose demo * simplify api * simplify api * fix cmake & fix `CropResizePad` * ignore out of frame bboxes * clean-up * fix lint * add c api docs * add c++ api docs/comments * fix gcc7 build * fix gcc7+opencv3 * fix stupid lint * fix ci * add help info & webcam support for C++ pose tracker demo * add webcam support for Python pose tracker demo * fix lint * minor * minor * fix MSVC build * fix python binding * simplify module adapter * fix module adapter * minor fix 2023-01-31 11:24:24 +08:00			`# Copyright (c) OpenMMLab. All rights reserved.`
			`import argparse`
			`import os`

			`import cv2`
[Refactor] Rename mmdeploy_python to mmdeploy_runtime (#1911) * [Feature]: Add github prebuild workflow after new release. (#1852) * add prebuild dockerfile * add prebuild test workflw * update * update * rm other workflow for test * Update docker image * add win1o prebuild * add test prebuild * add windows scripts in prebuilt package * add linux scripts in prebuilt package * generate_build_config.py * fix cudnn search * fix env * fix script * fix rpath * fix cwd * fix windows * fix lint * windows prebuild ci * linux prebuild ci * fix * update trigger * Revert "rm other workflow for test" This reverts commit 0a0387275014efab71046d33a0e52904672b4012. * update sdk build readme * update prebuild * fix dll deps for python >= 3.8 on windows * fix ci * test prebuild * update test script to avoid modify upload folder * add onnxruntime.dll to mmdeploy_python * update prebuild workflow * update prebuild * Update loader.cpp.in * remove exists prebuild files * fix opencv env * update cmake options for mmdeploy python build * remove test code * fix lint --------- Co-authored-by: RunningLeon <mnsheng@yeah.net> Co-authored-by: RunningLeon <maningsheng@sensetime.com> * rename mmdeploy_python -> mmdeploy_runtime * test master prebuild * fix trt net build * Revert "test master prebuild" This reverts commit aad5258648f5f2c410c965b295c309fd1166da22. * add master branch * fix linux set_env script * update package_tools docs * fix gcc 7.3 aligned_alloc * comment temporarily as text_det_recog can't be built with prebuild package built under manylinux --------- Co-authored-by: RunningLeon <mnsheng@yeah.net> Co-authored-by: RunningLeon <maningsheng@sensetime.com> 2023-03-29 19:02:37 +08:00			`from mmdeploy_runtime import PoseTracker`
[Feature] Pose tracker C/C++/Python API&demos (#1663) * add PoseTracker API * add mahalanobis distance, add det_pose demo * simplify api * simplify api * fix cmake & fix `CropResizePad` * ignore out of frame bboxes * clean-up * fix lint * add c api docs * add c++ api docs/comments * fix gcc7 build * fix gcc7+opencv3 * fix stupid lint * fix ci * add help info & webcam support for C++ pose tracker demo * add webcam support for Python pose tracker demo * fix lint * minor * minor * fix MSVC build * fix python binding * simplify module adapter * fix module adapter * minor fix 2023-01-31 11:24:24 +08:00

			`def parse_args():`
			`parser = argparse.ArgumentParser(`
			`description='show how to use SDK Python API')`
			`parser.add_argument('device_name', help='name of device, cuda or cpu')`
			`parser.add_argument(`
			`'det_model',`
			`help='path of mmdeploy SDK model dumped by model converter')`
			`parser.add_argument(`
			`'pose_model',`
			`help='path of mmdeploy SDK model dumped by model converter')`
			`parser.add_argument('video', help='video path or camera index')`
			`parser.add_argument('--output_dir', help='output directory', default=None)`
			`args = parser.parse_args()`
			`if args.video.isnumeric():`
			`args.video = int(args.video)`
			`return args`


			`def visualize(frame, results, output_dir, frame_id, thr=0.5, resize=1280):`
			`skeleton = [(15, 13), (13, 11), (16, 14), (14, 12), (11, 12), (5, 11),`
			`(6, 12), (5, 6), (5, 7), (6, 8), (7, 9), (8, 10), (1, 2),`
			`(0, 1), (0, 2), (1, 3), (2, 4), (3, 5), (4, 6)]`
			`palette = [(255, 128, 0), (255, 153, 51), (255, 178, 102), (230, 230, 0),`
			`(255, 153, 255), (153, 204, 255), (255, 102, 255),`
			`(255, 51, 255), (102, 178, 255),`
			`(51, 153, 255), (255, 153, 153), (255, 102, 102), (255, 51, 51),`
			`(153, 255, 153), (102, 255, 102), (51, 255, 51), (0, 255, 0),`
			`(0, 0, 255), (255, 0, 0), (255, 255, 255)]`
			`link_color = [`
			`0, 0, 0, 0, 7, 7, 7, 9, 9, 9, 9, 9, 16, 16, 16, 16, 16, 16, 16`
			`]`
			`point_color = [16, 16, 16, 16, 16, 9, 9, 9, 9, 9, 9, 0, 0, 0, 0, 0, 0]`
			`scale = resize / max(frame.shape[0], frame.shape[1])`
			`keypoints, bboxes, _ = results`
			`scores = keypoints[..., 2]`
			`keypoints = (keypoints[..., :2] * scale).astype(int)`
			`bboxes *= scale`
			`img = cv2.resize(frame, (0, 0), fx=scale, fy=scale)`
			`for kpts, score, bbox in zip(keypoints, scores, bboxes):`
			`show = [0] * len(kpts)`
			`for (u, v), color in zip(skeleton, link_color):`
			`if score[u] > thr and score[v] > thr:`
			`cv2.line(img, kpts[u], tuple(kpts[v]), palette[color], 1,`
			`cv2.LINE_AA)`
			`show[u] = show[v] = 1`
			`for kpt, show, color in zip(kpts, show, point_color):`
			`if show:`
			`cv2.circle(img, kpt, 1, palette[color], 2, cv2.LINE_AA)`
			`if output_dir:`
			`cv2.imwrite(f'{output_dir}/{str(frame_id).zfill(6)}.jpg', img)`
			`else:`
			`cv2.imshow('pose_tracker', img)`
			`return cv2.waitKey(1) != 'q'`
			`return True`


			`def main():`
			`args = parse_args()`

			`video = cv2.VideoCapture(args.video)`

			`tracker = PoseTracker(`
			`det_model=args.det_model,`
			`pose_model=args.pose_model,`
			`device_name=args.device_name)`

			`# optionally use OKS for keypoints similarity comparison`
			`coco_sigmas = [`
			`0.026, 0.025, 0.025, 0.035, 0.035, 0.079, 0.079, 0.072, 0.072, 0.062,`
			`0.062, 0.107, 0.107, 0.087, 0.087, 0.089, 0.089`
			`]`
			`state = tracker.create_state(`
			`det_interval=1, det_min_bbox_size=100, keypoint_sigmas=coco_sigmas)`

			`if args.output_dir:`
			`os.makedirs(args.output_dir, exist_ok=True)`

			`frame_id = 0`
			`while True:`
			`success, frame = video.read()`
			`if not success:`
			`break`
			`results = tracker(state, frame, detect=-1)`
			`if not visualize(frame, results, args.output_dir, frame_id):`
			`break`
			`frame_id += 1`


			`if __name__ == '__main__':`
			`main()`