📊 手の立体認識システムフロー

1. WEBカメラ映像取得
getUserMedia APIで映像ストリームを取得(1920x1080)
2. 深度マップ推論
MiDaSモデル(ONNX)で深度推定、WebGPU使用(512x512)
3. 手のランドマーク検出
MediaPipe Handsで21個のランドマークを検出(信頼度0.7)
4. 座標系変換
MediaPipe座標 → Three.js座標(Y軸・Z軸反転、スケール150)
5. 3D空間に表示
球体マーカー + チューブ接続線で手の形状を可視化
6. リアルタイム更新
30fpsでランドマークを更新、手の動きを追跡
ボタンを押してフローを開始