Pose Estimation และ AR Filters

บทที่ 6: Pose Estimation และ AR Filters

จบบทนี้ คุณจะเข้าใจ MediaPipe Pose และ Face Mesh ตรวจจับจุดสำคัญบนใบหน้า (landmarks) ได้ รู้วิธีติดวัตถุเสมือนบนใบหน้า และลองสร้าง AR filter แบบง่าย

Pose Estimation คืออะไร?

Pose Estimation คือการตรวจจับตำแหน่งของส่วนต่างๆ ของร่างกาย เช่น มือ แขน ขา ใช้ในฟิลเตอร์ AR บน Instagram และ Snapchat การติดตามท่าออกกำลังกาย motion capture และการรู้จำภาษามือ

MediaPipe

MediaPipe เป็น framework จาก Google สำหรับประมวลผลภาพและวิดีโอ มี Pose ที่ตรวจจับจุดบนร่างกายได้หลายสิบจุด Face Mesh ที่ให้จุดบนใบหน้านับร้อยจุด และ Hands สำหรับมือ ทำงานได้เร็วและแม่นยำพอสำหรับ real-time

Landmarks คือจุดสำคัญบนใบหน้า เช่น ตา จมูก ปาก คาง ใช้ landmarks เหล่านี้เพื่อวางวัตถุเสมือน (แว่น หนวด หมวก) วิเคราะห์อารมณ์ หรือทำ beauty filter

AR Filters

AR (Augmented Reality) filters คือการวางวัตถุเสมือนบนภาพจริง เช่น ใส่แว่น หนวด หมวก หรือเปลี่ยนสีผม หลักการคือตรวจจับใบหน้าด้วย MediaPipe หา landmarks แล้ววาดหรือวางภาพ overlay ให้ตรงตำแหน่ง

โปรเจกต์ปฏิบัติ: AR Filter แบบ Snapchat/Instagram

ใน colab_notebook.ipynb มีตัวอย่างการตรวจจับใบหน้าด้วย MediaPipe หา landmarks ติดวัตถุเสมือน เช่น แว่นหรือหนวด แล้วแสดงผล (รวมถึงแบบ real-time ถ้าใช้กับวิดีโอ) ลองปรับเป็นฟิลเตอร์ของตัวเอง

สรุป

เราได้รู้จัก Pose Estimation และ MediaPipe ตรวจจับ landmarks บนใบหน้า และสร้าง AR filter แบบง่าย บทถัดไปจะไปต่อที่ Image Segmentation