国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

2D人臉關(guān)鍵點(diǎn)轉(zhuǎn)3D人臉關(guān)鍵點(diǎn)的映射~頭部姿態(tài)筆記

2年前作者：NoNoUnknow分類：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了2D人臉關(guān)鍵點(diǎn)轉(zhuǎn)3D人臉關(guān)鍵點(diǎn)的映射~頭部姿態(tài)筆記。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

本文主要內(nèi)容

對通過相機(jī)參數(shù)計(jì)算圖像上的二維坐標(biāo)到三維坐標(biāo)的映射進(jìn)行簡單探討。

參考資料：

????????學(xué)習(xí)的話直接看他們的就好，我僅是拾人牙慧，拿GPT寫給自己看的，圖也是直接搬運(yùn)的別人畫的，以下鏈接有很完善的理論研究和代碼提供。

https://medium.com/@susanne.thierfelder/head-pose-estimation-with-mediapipe-and-opencv-in-javascript-c87980df3acbhttps://medium.com/@susanne.thierfelder/head-pose-estimation-with-mediapipe-and-opencv-in-javascript-c87980df3acbGitHub - itsvaibhav01/3D-Viewing-Angle-from-Face-Mesh: Monitor viewing angle using Mediapipe Face meshMonitor viewing angle using Mediapipe Face mesh. Contribute to itsvaibhav01/3D-Viewing-Angle-from-Face-Mesh development by creating an account on GitHub.https://github.com/itsvaibhav01/3D-Viewing-Angle-from-Face-Meshhttps://github.com/niconielsen32/ComputerVision/blob/master/headPoseEstimation.pyhttps://github.com/niconielsen32/ComputerVision/blob/master/headPoseEstimation.pyhttps://github.com/niconielsen32/ComputerVision/blob/master/headPoseEstimation.pyhttps://github.com/niconielsen32/ComputerVision/blob/master/headPoseEstimation.py????? ????? ?? ?? ??????? ?? Mediapipe - ???????? ??? ???? ?? ????? ????? ????? ????? ?? ?????????? ? ??? ?? ?? ?? ?? ???? ???????????? ?????? ?????????? ?????? ???.https://virgool.io/@shenasa/%D8%AA%D8%AE%D9%85%DB%8C%D9%86-%D9%88%D8%B6%D8%B9%DB%8C%D8%AA-%D8%B3%D8%B1-%D8%A8%D8%A7-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87-%D8%A7%D8%B2-mediapipe-jiwmpml2mxag

正文

概念介紹

The camera matrix

????????在計(jì)算機(jī)視覺中，相機(jī)矩陣（Camera Matrix）是一個(gè)重要的參數(shù)，它描述了相機(jī)的內(nèi)部參數(shù)。相機(jī)矩陣通常用于將三維空間中的點(diǎn)投影到二維圖像平面上。它定義了圖像坐標(biāo)系和相機(jī)坐標(biāo)系之間的轉(zhuǎn)換關(guān)系。

[ fx   0  cx ]
[  0  fy  cy ]
[  0   0   1 ]

fx 和 fy 是焦距（focal length）在圖像坐標(biāo)系中的縮放因子。它們表示相機(jī)在X和Y軸上的焦距，通常以像素為單位。
cx 和 cy 是主點(diǎn)（principal point）在圖像坐標(biāo)系中的坐標(biāo)。主點(diǎn)是圖像平面上的光學(xué)中心，它通常是圖像的中心點(diǎn)，也以像素為單位。

????????相機(jī)矩陣的具體值與相機(jī)硬件相關(guān)，并且可以通過相機(jī)校準(zhǔn)（Camera Calibration）來獲得。相機(jī)校準(zhǔn)是一個(gè)重要的過程，它通過拍攝特定的校準(zhǔn)板圖案，并結(jié)合一些幾何和優(yōu)化算法，來確定相機(jī)矩陣和畸變參數(shù)，從而提供準(zhǔn)確的相機(jī)參數(shù)，以便進(jìn)行準(zhǔn)確的圖像測量和姿態(tài)估計(jì)等任務(wù)。

????????在給定了相機(jī)矩陣后，可以使用它進(jìn)行圖像點(diǎn)到相機(jī)坐標(biāo)系點(diǎn)的轉(zhuǎn)換，或者相機(jī)坐標(biāo)系點(diǎn)到圖像點(diǎn)的投影。這在計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)中都是常見的操作。

相機(jī)矩陣與三維坐標(biāo)

????????通過使用線性代數(shù)并將該矩陣乘以物體的三維坐標(biāo)，就可以在圖像中找到它們的坐標(biāo)。

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

圖像來自最后一個(gè)鏈接：????? ????? ?? ?? ??????? ?? Mediapipe - ??????。

三維坐標(biāo)的空間變換：旋轉(zhuǎn)矩陣和平移矩陣

????????三維空間中的任何點(diǎn)都可以通過三分量向量移動(dòng)，或者繞三個(gè)坐標(biāo)軸旋轉(zhuǎn)三個(gè)角度。為此，使用變換矩陣。將變換矩陣乘以點(diǎn)的初始坐標(biāo)，即可得到變換后的坐標(biāo)。

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

?????????例如繞X軸平移或旋轉(zhuǎn)的變換矩陣如下：

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

? ? ? ? ?這兩個(gè)矩陣分別是平移矩陣（Translation Matrix）和旋轉(zhuǎn)矩陣（Rotation Matrix），它們一起描述了相機(jī)相對于某個(gè)參考坐標(biāo)系的位置和方向。

平移矩陣（Translation Matrix）：平移矩陣是一個(gè)3x1的矩陣，用來描述相機(jī)坐標(biāo)系的原點(diǎn)在參考坐標(biāo)系（如現(xiàn)實(shí)世界坐標(biāo)系）中的位置。平移矩陣通常用 t 或 T 表示，其中 t = [tx, ty, tz]，表示相機(jī)坐標(biāo)系原點(diǎn)相對于參考坐標(biāo)系原點(diǎn)在X、Y、Z軸方向上的平移量。
旋轉(zhuǎn)矩陣（Rotation Matrix）：旋轉(zhuǎn)矩陣是一個(gè)3x3的正交矩陣，用來描述相機(jī)坐標(biāo)系相對于參考坐標(biāo)系的旋轉(zhuǎn)變換。旋轉(zhuǎn)矩陣通常用 R 表示，它將相機(jī)坐標(biāo)系中的向量映射到參考坐標(biāo)系中的向量。旋轉(zhuǎn)矩陣有以下幾個(gè)重要性質(zhì)：
- 它的行和列是單位向量，表示相機(jī)坐標(biāo)系的三個(gè)軸在參考坐標(biāo)系中的方向。
- 它的行和列是正交的，即彼此之間互相垂直。
- 它的行和列的模長都為1，因?yàn)樗硎玖诵D(zhuǎn)變換而不改變向量的長度。

????????可以通過矩陣乘法同時(shí)執(zhí)行繞所有三個(gè)軸的平移和旋轉(zhuǎn)操作，如下所示：

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

?計(jì)算的實(shí)現(xiàn)：opencv庫

success, rotation_vec, translation_vec = cv2.solvePnP( 
face_coordination_in_real_world, 
face_coordination_in_image, 
cam_matrix, dist_matrix)

????????顯而易見，完成這一套計(jì)算最重要的就是得到這些參數(shù)，參數(shù)的獲取方式將在下面講述。

頭部姿態(tài)估計(jì)問題

????????頭部姿態(tài)問題涉及的是對多個(gè)坐標(biāo)系之間映射的處理問題，這些坐標(biāo)系分別是：

現(xiàn)實(shí)世界坐標(biāo)系：由 U、V 和 W 軸構(gòu)成，代表現(xiàn)實(shí)世界中的物體坐標(biāo)。這是物體在現(xiàn)實(shí)世界的真實(shí)坐標(biāo)，可以是任意單位，例如米（m）。
相機(jī)坐標(biāo)系：由 X、Y 和 Z 軸構(gòu)成，代表相機(jī)的坐標(biāo)系。相機(jī)坐標(biāo)系是相對于相機(jī)本身的坐標(biāo)系，其中 X 軸指向右側(cè)，Y 軸指向下方，Z 軸指向相機(jī)的觀察方向。這個(gè)坐標(biāo)系通常用于描述相機(jī)內(nèi)部的幾何屬性，如焦距、畸變等。點(diǎn) P 在相機(jī)坐標(biāo)系中的坐標(biāo)可以用來描述物體相對于相機(jī)的位置。
二維圖像坐標(biāo)系：由 x 軸和 y 軸構(gòu)成，代表相機(jī)拍攝到的二維圖像坐標(biāo)。二維圖像坐標(biāo)是將三維空間中的點(diǎn)投影到相機(jī)成像平面上得到的，通常以像素為單位。

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

將圖像中的 3D 坐標(biāo)轉(zhuǎn)換為 2D 坐標(biāo)的公式：

2d關(guān)鍵點(diǎn)到3d關(guān)鍵點(diǎn),深度學(xué)習(xí),筆記

????????我們的目標(biāo)是找到現(xiàn)實(shí)世界中頭部的角度或方向。我們知道，當(dāng)我們將頭轉(zhuǎn)向兩側(cè)時(shí)，實(shí)際上相機(jī)處于固定位置和方向，頭部會改變位置；但我們可以假設(shè)頭部是固定的，變化的是相機(jī)相對于頭部的位置和方向。在這種情況下，我們的目標(biāo)變?yōu)閷ふ倚D(zhuǎn)矩陣 R。

參數(shù)獲取

????????如果我們想要估計(jì)現(xiàn)實(shí)世界中頭部的位置，可以使用一個(gè)假設(shè)的人臉模型，并將一些關(guān)鍵點(diǎn)的坐標(biāo)作為現(xiàn)實(shí)世界中的參考點(diǎn)。這些關(guān)鍵點(diǎn)的坐標(biāo)需要在所有三個(gè)坐標(biāo)軸上都有變化，以確保估計(jì)的準(zhǔn)確性。

????????實(shí)現(xiàn)方法所需要使用的點(diǎn)以及他們分別對應(yīng)的mediapipe mesh坐標(biāo)，這也是2D世界坐標(biāo)。

鼻尖
右眼外角
左眼外角
眉間
右唇角
左唇角

            head = [landmark[1], landmark[9], landmark[57],
                    landmark[130], landmark[287], landmark[359]]

相機(jī)參數(shù)矩陣和失真系數(shù)

相機(jī)參數(shù)矩陣與焦距

????????相機(jī)參數(shù)通常是與相機(jī)類型和相機(jī)規(guī)格相關(guān)的，并且可以通過相機(jī)校準(zhǔn)來獲得。但是，如果沒有提供準(zhǔn)確的相機(jī)參數(shù)，我們可以利用圖像的長度和寬度作為焦距值，并將圖像中心的坐標(biāo)作為光學(xué)焦點(diǎn)的值，來進(jìn)行一個(gè)簡單的估計(jì)，當(dāng)然，這是不夠嚴(yán)謹(jǐn)?shù)?，僅僅是為了表達(dá)思想。

# Approximate focal length as half of the image width or height
focal_length = (w + h) / 2

# Approximate optical center as the center of the image
optical_center = (w / 2, h / 2)

# Construct an approximate camera matrix
cam_matrix = np.array([[focal_length, 0, optical_center[0]],
                       [0, focal_length, optical_center[1]],
                       [0, 0, 1]])

            focal_length = 1 * w
            cam_matrix = np.array([[focal_length, 0, w / 2],
                                   [0, focal_length, h / 2],
                                   [0, 0, 1]])

????????以上提供了兩種估計(jì)方法，在第一種估計(jì)中，假設(shè)相機(jī)的焦距在水平和垂直方向上相等，可以使用圖像的寬度（w）和高度（h）的一半來估計(jì)焦距（focal_length）。這個(gè)假設(shè)的焦距值可以用于構(gòu)造一個(gè)近似的相機(jī)矩陣（Camera Matrix），第二種則使用圖像寬度的一倍作為焦距。

焦距估計(jì)的方法評價(jià)：

使用圖像寬度的一倍作為焦距（focal_length = 1 * w）：
- 優(yōu)點(diǎn)：這種方法簡單快速，不需要額外的相機(jī)校準(zhǔn)步驟，適用于快速原型或簡單的應(yīng)用場景。
- 缺點(diǎn)：這種方法忽略了相機(jī)的真實(shí)參數(shù)和畸變，是一個(gè)近似值，可能導(dǎo)致估計(jì)的精度較低，尤其在復(fù)雜場景中。
使用相機(jī)校準(zhǔn)得到的準(zhǔn)確焦距值：
- 優(yōu)點(diǎn)：通過相機(jī)校準(zhǔn)可以得到相機(jī)的準(zhǔn)確內(nèi)部參數(shù)和外部參數(shù)，提供了更精確的相機(jī)矩陣，估計(jì)結(jié)果更可靠和精確。
- 缺點(diǎn)：相機(jī)校準(zhǔn)過程可能相對復(fù)雜，需要拍攝特定的校準(zhǔn)板圖案，對于某些應(yīng)用可能增加了額外的工作和成本。

????????如果需要高精度的位姿估計(jì)，尤其在復(fù)雜場景或精密測量中，建議使用第二種方法，即使用相機(jī)校準(zhǔn)得到的準(zhǔn)確焦距值和相機(jī)參數(shù)。相機(jī)校準(zhǔn)可以提供更準(zhǔn)確的相機(jī)內(nèi)部參數(shù)和外部參數(shù)，對于頭部姿態(tài)估計(jì)等任務(wù)會有更可靠的結(jié)果。

????????但如果只是進(jìn)行簡單的頭部姿態(tài)估計(jì)、目標(biāo)跟蹤等應(yīng)用，并且對于精度要求不是非常高，第一種方法即使用圖像寬度的一倍作為焦距值可能足夠滿足需求，而且更加簡便快捷。

失真系數(shù)（畸變系數(shù)）矩陣的估計(jì)

dist_matrix = np.zeros((4, 1), dtype=np.float64)

????????畸變系數(shù)矩陣是一個(gè)4x1的矩陣，它包含相機(jī)的徑向和切向畸變系數(shù)。在這里，畸變系數(shù)矩陣被初始化為零，表示沒有考慮畸變。如果相機(jī)存在畸變，可以通過相機(jī)校準(zhǔn)等方法來估計(jì)得到畸變系數(shù)。?

????????這里矩陣的規(guī)格是根據(jù)之前的計(jì)算公式來確立的，也是追求了理想情況做了簡化。

圖像中的二維坐標(biāo)矩陣

????????為了給這個(gè)矩陣賦值，需要找到圖像中的坐標(biāo)，比如現(xiàn)實(shí)世界中的指定點(diǎn)。為此，我們可以使用mediapipe進(jìn)行實(shí)現(xiàn)。

????????通過指定上述所有矩陣的值，可以使用Lunberg-Marquardt優(yōu)化找到R和t的最佳值。

真實(shí)世界坐標(biāo)的設(shè)置

    face_coordination_in_real_world = np.array([
        [285, 528, 200],
        [285, 371, 152],
        [197, 574, 128],
        [173, 425, 108],
        [360, 574, 128],
        [391, 425, 108]
    ], dtype=np.float64)

????????在 Mediapipe 庫中，它返回的關(guān)鍵點(diǎn)坐標(biāo)是相對于圖像尺寸的歸一化坐標(biāo)（介于 0 和 1 之間），為了將這些歸一化坐標(biāo)轉(zhuǎn)換為像素坐標(biāo)，需要將它們乘以圖像的長度和寬度。

def detect_face_landmarks(image):
    fps_time = time.time()
    results = face_mesh.process(image)
    now = time.time()
    process_time =  (now - fps_time)
    print('mesh_time:', process_time)
    face_landmarks = []
    if results.multi_face_landmarks:
        for face in results.multi_face_landmarks:
            landmarks = []
            for landmark in face.landmark:
                x = int(landmark.x * image.shape[1])
                y = int(landmark.y * image.shape[0])
                landmarks.append((x, y))
            face_landmarks.append(landmarks)

    return face_landmarks

而我們只做頭部姿態(tài)則只需要這些點(diǎn)：這些也是面部圖像中所需點(diǎn)的二維坐標(biāo)。

            head = [landmark[1], landmark[9], landmark[57],
                    landmark[130], landmark[287], landmark[359]]

通過cv2計(jì)算旋轉(zhuǎn)矩陣和平移矩陣

通過以上數(shù)據(jù)可以計(jì)算旋轉(zhuǎn)矩陣和平移矩陣。

            for (landmark_x, landmark_y) in head:
                x, y = (x1 + landmark_x, y1 + landmark_y)
                face_coordination_in_image.append([x, y])

            face_coordination_in_image = np.array(face_coordination_in_image,
                                                  dtype=np.float64)

            success, rotation_vec, transition_vec = cv2.solvePnP(
                face_coordination_in_real_world, face_coordination_in_image,
                cam_matrix, dist_matrix)

cv2.solvePnP 是 OpenCV 庫中的一個(gè)函數(shù)，用于解決透視投影問題。該函數(shù)可以用于估計(jì)相機(jī)的旋轉(zhuǎn)向量和平移向量，從而得到相機(jī)在現(xiàn)實(shí)世界中的位姿信息。

retval, rotation_vec, translation_vec = cv2.solvePnP(object_points, image_points, camera_matrix, dist_coeffs[, rvec[, tvec[, useExtrinsicGuess[, flags]]]])文章來源地址http://www.zghlxwxcb.cn/news/detail-766061.html

object_points: 真實(shí)世界中待估計(jì)物體的三維坐標(biāo)矩陣，是一個(gè) Nx3 的 NumPy 數(shù)組，其中 N 是點(diǎn)的數(shù)量，每一行包含一個(gè)點(diǎn)的 X、Y、Z 坐標(biāo)。
image_points: 相機(jī)圖像中檢測到的物體特征點(diǎn)的二維像素坐標(biāo)矩陣，是一個(gè) Nx2 的 NumPy 數(shù)組，其中 N 是點(diǎn)的數(shù)量，每一行包含一個(gè)點(diǎn)的像素坐標(biāo) (x, y)。
camera_matrix: 相機(jī)矩陣，它是一個(gè)3x3的矩陣，包含了相機(jī)的內(nèi)部參數(shù)，如焦距和光學(xué)中心。
dist_coeffs: 畸變系數(shù)矩陣，它是一個(gè)4x1的矩陣，包含了相機(jī)的徑向和切向畸變系數(shù)。
rvec: 輸出的旋轉(zhuǎn)向量，是一個(gè)3x1的矩陣，表示相機(jī)坐標(biāo)系相對于現(xiàn)實(shí)世界坐標(biāo)系的旋轉(zhuǎn)。
tvec: 輸出的平移向量，是一個(gè)3x1的矩陣，表示相機(jī)坐標(biāo)系原點(diǎn)相對于現(xiàn)實(shí)世界坐標(biāo)系原點(diǎn)的平移。
useExtrinsicGuess: 布爾值，表示是否使用輸入的 rvec 和 tvec 作為初始估計(jì)值，默認(rèn)為 False。
flags: 用于指定求解 PnP 問題的標(biāo)志，可以是 cv2.SOLVEPNP_ITERATIVE、cv2.SOLVEPNP_EPNP、cv2.SOLVEPNP_P3P、cv2.SOLVEPNP_DLS 或 cv2.SOLVEPNP_UPNP，具體選擇哪個(gè)取決于問題的類型和需求。

到了這里，關(guān)于2D人臉關(guān)鍵點(diǎn)轉(zhuǎn)3D人臉關(guān)鍵點(diǎn)的映射~頭部姿態(tài)筆記的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

YOLOv5姿態(tài)估計(jì)：HRnet實(shí)時(shí)檢測人體關(guān)鍵點(diǎn)
前言： Hello大家好，我是Dream。今天來學(xué)習(xí)一下利用YOLOv5進(jìn)行姿態(tài)估計(jì)，HRnet與SimDR檢測圖片、視頻以及攝像頭中的人體關(guān)鍵點(diǎn) ，歡迎大家一起前來探討學(xué)習(xí)~ 首先需要我們利用Pycharm直接克隆github中的姿態(tài)估計(jì)原工程文件，如果不知道怎樣在本地克隆Pycharm，可以接著往下看，
2024年01月17日
瀏覽(27)
Python+OpenCV+OpenPose實(shí)現(xiàn)人體姿態(tài)估計(jì)（人體關(guān)鍵點(diǎn)檢測）
1、人體姿態(tài)估計(jì)簡介 2、人體姿態(tài)估計(jì)數(shù)據(jù)集 3、OpenPose庫 4、實(shí)現(xiàn)原理 5、實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò) 6、實(shí)現(xiàn)代碼人體姿態(tài)估計(jì)(Human Posture Estimation)，是通過將圖片中已檢測到的人體關(guān)鍵點(diǎn)正確的聯(lián)系起來，從而估計(jì)人體姿態(tài)。人體關(guān)鍵點(diǎn)通常對應(yīng)人體上有一定自由度的關(guān)節(jié)，比如頸、
2024年02月04日
瀏覽(23)
Mediapipe人臉關(guān)鍵點(diǎn)檢測
MediaPipe是由google制作的開源的、跨平臺的機(jī)器學(xué)習(xí)框架，可以將一些模型部署到不同的平臺和設(shè)備上使用的同時(shí)，也能保住檢測速度。從圖中可以發(fā)現(xiàn)，能在Python上實(shí)現(xiàn)的功能包括人臉檢測（Face Detection）、人臉關(guān)鍵點(diǎn)（Face Mesh）,手部關(guān)鍵點(diǎn)（Hands）等。利用C++能實(shí)現(xiàn)更豐富
2024年02月02日
瀏覽(21)
opencv-人臉關(guān)鍵點(diǎn)定位
2024年02月12日
瀏覽(20)
OpenCV實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)檢測
目錄實(shí)現(xiàn)過程 1，代碼解讀 1.1?導(dǎo)入工具包 1.2導(dǎo)入所需圖像，以及訓(xùn)練好的人臉預(yù)測模型 1.3?將 dlib 的關(guān)鍵點(diǎn)對象轉(zhuǎn)換為 NumPy 數(shù)組，以便后續(xù)處理 1.4圖像上可視化面部關(guān)鍵點(diǎn) 1.5# 讀取輸入數(shù)據(jù)，預(yù)處理 1.6進(jìn)行人臉檢測 1.7遍歷檢測到的框 1.8遍歷每個(gè)面部 2，所有代碼 3，結(jié)果
2024年04月23日
瀏覽(35)
OpenCV中的人臉關(guān)鍵點(diǎn)檢測和人臉特征提取如何實(shí)現(xiàn)？
在OpenCV中，人臉關(guān)鍵點(diǎn)檢測和人臉特征提取是常見的計(jì)算機(jī)視覺任務(wù)。OpenCV提供了一些用于實(shí)現(xiàn)這些任務(wù)的函數(shù)和算法。下面將介紹如何在OpenCV中實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)檢測和人臉特征提取。 1. 人臉關(guān)鍵點(diǎn)檢測人臉關(guān)鍵點(diǎn)檢測是指識別和定位人臉上的關(guān)鍵點(diǎn)，如眼睛、鼻子、嘴巴
2024年02月03日
瀏覽(27)
YOLOv8 人體姿態(tài)估計(jì)(關(guān)鍵點(diǎn)檢測) python推理 && ONNX RUNTIME C++部署
目錄 ? 1、下載權(quán)重 ?編輯2、python 推理 3、轉(zhuǎn)ONNX格式 4、ONNX RUNTIME C++ 部署 utils.h utils.cpp detect.h detect.cpp main.cpp CmakeList.txt 我這里之前在做實(shí)例分割的時(shí)候，項(xiàng)目已經(jīng)下載到本地，環(huán)境也安裝好了，只需要下載pose的權(quán)重就可以輸出： ? 用netron查看一下： ?如上圖所是，YOLO
2024年02月07日
瀏覽(29)
OpenCV 入門教程：人臉檢測和關(guān)鍵點(diǎn)定位
人臉檢測和關(guān)鍵點(diǎn)定位是計(jì)算機(jī)視覺中的重要任務(wù)，用于在圖像或視頻中自動(dòng)檢測人臉并定位人臉關(guān)鍵點(diǎn)，如眼睛、鼻子、嘴巴等。這項(xiàng)技術(shù)在人臉識別、表情分析、姿態(tài)估計(jì)等領(lǐng)
2024年02月15日
瀏覽(20)
人臉68、29、21、14、5關(guān)鍵點(diǎn)標(biāo)注序號及對應(yīng)關(guān)系
最近需要用到solvePnP算法[1]通過人臉關(guān)鍵點(diǎn)求解人臉姿態(tài)，涉及到的數(shù)據(jù)集中關(guān)鍵點(diǎn)標(biāo)注數(shù)量不統(tǒng)一，但網(wǎng)上使用solvePnP算法時(shí)人臉模型比較好找到的是68個(gè)關(guān)鍵點(diǎn)，因此需要找到模型的68個(gè)關(guān)鍵點(diǎn)中與其他幾種數(shù)量關(guān)鍵點(diǎn)的對應(yīng)關(guān)系。目錄 98關(guān)鍵點(diǎn)標(biāo)注序號 68關(guān)鍵點(diǎn)標(biāo)注序號
2024年02月08日
瀏覽(213)
人臉與關(guān)鍵點(diǎn)檢測：YOLO5Face實(shí)戰(zhàn)
Github:https://github.com/deepcam-cn/yolov5-face 導(dǎo)讀：居然花了一天時(shí)間把該項(xiàng)目復(fù)現(xiàn)，主要是折騰在數(shù)據(jù)集格式上，作者居然在train2yolo中居然把Widerface訓(xùn)練集（12000+張圖）重新一張一張保存，不這么還出bug，原因是無法讀到數(shù)據(jù)緩存；在評估階段，val2yolo也沒用上。搬運(yùn)工，一個(gè)字，
2024年02月06日
瀏覽(27)

<tfoot id="c7dd7"><tt id="c7dd7"><tbody id="c7dd7"></tbody></tt></tfoot>