靜態手勢識別

原創

2020-05-01 00:00

現有產品和技術

騰訊雲手勢識別

騰訊雲手勢識別pdf文檔

功能

靜態手勢識別、關鍵點識別、指尖識別、手勢動作識別等多種功能

靜態手勢識別（手型識別）

返回手的位置及類別
17種單手，8種雙手

手勢關鍵點識別

定位手的22個關鍵點的位置

指尖識別

只識別中指指尖

手勢識別

基於視頻識別近距離動作包括左滑、右滑，遠距離動作包括揮手、舉手、敬禮等

性能

靜態手勢識別算法的正確率爲95+%
手勢關鍵點算法的識別正確率爲94+%
手勢動作識別的正確率爲90+%
在 iPhone8 上
靜態手勢識別速度爲22ms/fps，
手部關鍵點識別速度爲28ms/fps
手勢動作識別速度爲30ms/fps

曠視手勢識別

二維手型識別

19種常見手勢

reference

二維手型、二維手勢、三維手勢的差異
 只需揮一揮手：3D手勢識別系統含相關引用文獻
Google Open Sources Real-Time Hand Gesture Recognition Algorithm For Developers

谷歌開源的手勢識別

功能

MediaPipe

交叉平臺框架
可處理不同模態的感知數據
移動端實現了實時性，且可實現多個手的追蹤
單幀推理21個3D關鍵點
可識別手勢追蹤和識別

模型組成

BlazePalm 實時手掌/手勢檢測模型

內容

返回帶方向的邊界框
採用手掌檢測模型可以很大程度地減少數據增強，使得關鍵點識別模型可以專注於關鍵點的識別上（而不是區分前景和背景上）
對SSD單階段檢測器進行優化，用於手掌檢測

難點

手掌檢測的難點體現在：不同尺度、遮擋和遮擋、缺乏高對比度的模式(VS 人臉有眼睛、鼻子)

解決方案

訓練手掌檢測器，而不是手檢測器

–估計手掌的邊界框和拳頭比估計高自由度的手要容易一些，

手掌是小目標，NMS(非極大值抑制)在兩隻手遮擋時也可得到較好的結果
手掌檢測可以採用方形邊界框，而不需要考慮不同縱橫比的邊界框，這樣可以減少3-5倍的邊界框

編解碼結構

編碼器-解碼器結構可以感知更大的感受野，小目標也可以獲得很大的感受野

focal loss

準確率

手掌識別準確率：95.7%
採用普通交叉熵損失函數、無解碼結構準確率：86.22%

手勢關鍵點識別模型

基於手掌及其附近的裁剪區域，通過迴歸的方式返回高保證的21個3Ｄ關鍵點
原始數據集（約30K）和合成數據集，都採用3D標註，z座標在深度圖獲得

手勢識別器

將之前的關鍵點外形分類爲一組離散的手勢
備註：該方法類似於人臉網格的方法，有研究者將其應用於位姿識別

手勢識別技術

難點

手勢遮擋

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Object.values()對象遍歷

Object.keys() 對象的遍歷返回給定對象所有可枚舉屬性的數組；是屬性名組成的數組 let obj = { a: 1, b: 2, c: 3 }; Object.keys(obj).map((key) => {

2024-05-13 14:33:01

c++踩方格-動態規劃基礎題

有一個方格矩陣，矩陣邊界在無窮遠處。我們做如下假設： a、每走一步時，只能從當前方格移動一格，走到某個相鄰的方格上； b、走過的格子立即塌陷無法再走第二次； c、只能向北、東、西三個方向走；請問：如果允許在方格矩陣上走n步，共有多少種不同

2024-05-13 14:30:51

[Mellanox] 安裝MLNX_OFED

[Mellanox] 安裝MLNX_OFED 雖然已經安裝過很多遍了，但是這裏還是再次寫一遍安裝過程，方便以後查閱。 Mellanox的這堆東西其實每個安裝起來都不難，難點在於版本要匹配。所以最重要的是我們要知道1.我們需要哪個版本的驅動；

2024-05-13 14:28:30

JPA使用pg數據庫時，bool字段不能跨庫遷移的解決方案

首先，大多數人的印象裏，hibernate作爲一個笨重學習成本高的近乎全自動的框架它的優點就是可以支持很多數據庫，但是最近研究發現，java中的boolean類型的字段，在mariadb/mysql 中爲bit 0/1,在sqlserver

漫漫人生路總會錯幾步

2024-05-13 14:27:30

【ubuntu】程序運行時的任務欄圖標

1. 快捷方式需要正確的配置StartupWMClass屬性，那麼如何獲取這個屬性呢？參考如下命令 xprop | grep WM_CLASS 將終端程序小窗運行上述命令，鼠標點擊哪個應用窗體就會獲取哪個窗體的名稱，有可能會有多個，多個

漫漫人生路總會錯幾步

2024-05-13 14:27:30

CodePen 的國內替代「筆.COOL」，一個功能完備、使用便捷的在線HTML/CSS/JS編輯器和作品分享平臺

筆.COOL，是一個最近在國內嶄露頭角的在線HTML/CSS/JS編輯器和作品分享平臺。筆.COOL 提供了一個在線的 HTML、CSS 和 JavaScript 代碼編輯器。無需任何安裝，你只需打開網站，就可以開始編寫前端代碼。編輯

2024-05-13 14:26:50

Visual Studio中的四款代碼格式化工具

前言今天大姚給大家分享四款Visual Studio中的代碼格式化工具、擴展插件。大家可以在Visual Studio中的管理擴展或者插件市場下載安裝。代碼格式化工具的作用自動調整代碼的佈局和風格，以確保代碼具有統一的格式，提高可讀性

2024-05-13 14:21:59

幹了 2 年多 Java 外包，終於脫離了！

大家好，我是R哥。金三銀四結束了，上個月分享了一個 35K 入職的面試輔導案例： 35K*14 薪入職了，這公司只要不裁員，我能一直呆下去。。今天再分享一個上個月讓人很有成就感的面試輔導 case：外包、空窗四個月、薪資 10k、

2024-05-13 14:21:19

mysql 存json數據會自動亂序的解決方案

https://blog.csdn.net/whatzhang007/article/details/110089447 總結就是一個字: 啓用json類的保存方式.改成logntext即可. 例如我的方穹項目的表設計: 不吐槽不行, 真

張博的博客

2024-05-13 14:19:49

【Python】保存gym截圖

如果想做基於圖像cnn的深度強化學習，需要拿到gym的截圖，下面是兩種截圖方法。 1. 利用render結果生成圖像： import gym import warnings import os from PIL import Image

2024-05-13 14:11:08

win10 22H2

Windows 10 update history https://support.microsoft.com/en-gb/topic/windows-10-update-history-8127c2c6-6edf-4fdf-8b9f-0f

2024-05-13 14:06:58

【譯】使用 GitHub Copilot 作爲你的編碼 GPS

　　GitHub Copilot 是一個改變遊戲規則的人工智能助手，可以徹底改變您在 Visual Studio 中的編碼流程。在我們的視頻系列中，Bruno Capuano 探討了這個智能編碼夥伴如何幫助您更有效地編寫代碼，同時保持質量

2024-05-13 14:06:38

兩個有趣的AI項目

　　最近看到一個比較有意思的 AI 項目，叫 AI 時間線，顧名思義，就是藉助 AI 來創建某個關鍵字的時間線。主頁界面很簡單，就是一個輸入框。　　　　我在輸入辛亥革命後，就會生成下圖的時間線，將辛亥革命的各個關鍵點都列了出來。我看到這

咖啡機（K.F.J）

2024-05-13 14:05:57

從油猴腳本管理器的角度審視Chrome擴展

從油猴腳本管理器的角度審視Chrome擴展在之前一段時間，我需要藉助Chrome擴展來完成一個需求，當時還在使用油猴腳本與瀏覽器擴展之間調研了一波，而此時恰好我又有一些做的還可以的油猴腳本 TKScript (點個star吧 😁)，相對會

2024-05-13 14:05:17

一文學會 Kubernetes Pod 的生命週期管理（轉載）

收穫瞭解 Pod 的狀態（Status）瞭解 pod 階段（Phase）瞭解 Pod conditions 　　瞭解容器狀態（Status）保持容器健康　　瞭解容器自動重啓　　使用探活（liveness）探針（Probe）檢查容

2024-05-13 14:03:07

24小時熱門文章

最新文章

最新評論文章