HRNet: Una rete Neurale per Human Pose Estimation

HRNet: Rete Neurale per Human Pose Estimation

🤖 HRNet: High-Resolution Network per Human Pose Estimation

HRNet (High-Resolution Network) è una rete neurale per la keypoint detection progettata per compiti di Human Pose Estimation, in cui è fondamentale mantenere le caratteristiche ad alta risoluzione lungo tutta la rete.

📌 Caratteristiche Principali

  • Mantenimento dell'alta risoluzione durante tutta la rete.
  • ✅ Scambio di informazioni tra scale diverse per migliorare la precisione.
  • Heat Map per rappresentare la probabilità di posizione delle articolazioni.

🕵️‍♂️ Human Pose Estimation

HRNet viene utilizzata per il riconoscimento delle pose umane analizzando le immagini e localizzando i keypoint delle articolazioni. 

Le label sono i keypoint del corpo umano e possiamo rappresentarle attraverso le coordinate dirette oppure come nella prima versione v1 di questa rete attraverso le heat map.

🔥 Heat Map

La rete genera mappe di calore (Heat Map) per ogni punto chiave del corpo, indicando la probabilità della sua posizione all'interno dell'immagine.

📉 Metrica MSE (Mean Squared Error)

La MSE è la funzione di perdita utilizzata per confrontare le predizioni della rete con le posizioni reali dei keypoint.

MSE = 1/N * SUM ( Yi - Pi )^2

📊 Metrica OKS (Object Keypoint Similarity)

OKS misura la somiglianza tra keypoint predetti e ground truth, considerando la scala dell'oggetto e il livello di errore accettabile.



🎯 Conclusione

HRNet è una rete potente per la Human Pose Estimation, grazie all'uso di Heat Map, MSE e OKS.



KEYPOINT DETECTION di Jo & Luke

Commenti

Post popolari in questo blog

SSD (Single Shot MultiBox Detector)

Instance Segmentation: Cos'è e Come Funziona

U-Net: Architettura per la Segmentazione di Immagini