Selasa, 21 November 2017

A Novel Vision-Based Human Motion Capture System Using Dual-Kinect



1.      Introduction
Dalam tulisan ini, kami menyajikan sebuah sistem pengejaran gerak manusia berbasis visi baru, yang menggunakan dua Kinect yang berjalan bersamaan untuk memindai subjek yang sama guna memperbaiki stabilitas. Pertama, penyebab kebisingan dan ketidakstabilan sistem Kinect tunggal dianalisis. Kemudian kami mengenalkan metode yang sangat sederhana namun efektif untuk mengkalibrasi dua Kinect. Karena penginderaan kedalaman Kinect didasarkan pada pancaran pola inframerah, dua Kinektor harus ditempatkan dengan sudut 1800 satu sama lain untuk mengurangi kesalahan interferensi yang disebabkan oleh bidang pandang yang tumpang tindih. Dua Kinects menangkap gerakan dari subjek yang sama menghasilkan dua set data, masing-masing mewakili gerakan dari sudut tertentu. Kami mengusulkan sebuah algoritma fusi dengan data redundan untuk menebus bagian yang terhambat tanpa melakukan estimasi atau aproksimasi pos dan menstabilkan sistem juga. Percobaan memvalidasi keefektifan pendekatan yang diusulkan untuk mengatasi kebisingan dan masalah oklusi.
2.      Kinect And Its Stability Analysis
Sensor Kinect menggabungkan beberapa perangkat penginderaan jauh. Ini berisi sensor kedalaman, sensor kedalaman, dan rangkaian empat mikrofon yang memberikan kemampuan menangkap gerak tubuh 3D penuh dan kemampuan pengenalan suara. Kami terutama tertarik pada aspek penglihatan dari sensor Kinect. Gambar 2 menunjukkan susunan proyektor inframerah (inframerah), kamera warna, dan kamera infra merah. Sensor kedalaman terdiri dari proyektor IR yang dipadukan dengan kamera IR, yang merupakan sensor semikonduktor oksida logam monokrom komplementer (CMOS). Proyektor inframerah menghasilkan pola konstan dan kamera IR mengukur perbedaan antara pola yang diamati dan gambar yang telah direkam sebelumnya pada kedalaman konstan yang diketahui. Keluaran terdiri dari citra nilai disparitas skala. Lebih khusus lagi, sensor Kinect mampu memberikan pelacakan skeletal. Alih-alih menentukan secara langsung pancaran tubuh di ruang berdimensi tinggi, Kinect menggunakan perpixel, pengenalan bagian tubuh sebagai langkah perantara untuk menghindari pencarian kombinatorial pada sendi tubuh yang berbeda. Dalam pelacakan skeletal, tubuh manusia ditunjukkan oleh sejumlah sendi yang mewakili bagian tubuh seperti kepala, leher, bahu dan lengan. Setiap sendi diwakili oleh koordinat 3D-nya. Dengan semua parameter 3D sendi ini ditentukan, pelacakan gerak manusia menjadi tugas yang kurang menantang.

3.      Calibration And Relative Position
Untuk merekonstruksi sebuah adegan dari dua kamera kedalaman Kinect, sistem harus dikalibrasi. Ini termasuk kalibrasi internal setiap Kinect serta kalibrasi pose relatif antara Kinect. Sedangkan kalibrasi sensor kedalaman masih harus menjadi tugas yang cukup menantang. Dari Gambar 2 kita dapat menemukan bahwa kamera IR dan RGB hanya dipisahkan oleh garis dasar kecil. Menunjukkan bahwa komponen rotasi transform antara kamera IR dan kamera RGB sangat kecil sehingga hampir bisa terbengkalai. Oleh karena itu, kita kira-kira bisa berasumsi bahwa kamera IR dan RGB berada dalam koordinat dunia yang sama. Dengan memanfaatkannya, kita bisa mendapatkan transformasi kaku antara dua kamera IR dengan mengkalibrasi dua kamera RGB yang jelas jauh lebih mudah.

4.      Data Process
Seperti yang dijelaskan di Sec. II, posisi relatif sendi rangka antara frame yang berdekatan kadang jitter atau loncat karena noise. Jadi sebelum operasi lebih lanjut kerangka kerangka harus dihaluskan dengan menggunakan saringan. Kerangka kerangka disediakan oleh 30 frame per detik, yang jelas merupakan data deret waktu dengan tren. Dalam situasi ini, pemulusan eksponensial ganda atau eksponensial orde kedua biasanya diadopsi. Ide dasar dibalik pemulusan eksponensial ganda adalah mengenalkan sebuah istilah untuk memperhitungkan kemungkinan sebuah seri yang menunjukkan beberapa bentuk tren. Komponen kemiringan ini sendiri diperbarui melalui smoothing eksponensial. Kami menggunakan salah satu metode pemulusan eksponensial ganda, yang kadang-kadang disebut sebagai pemulusan eksponensial Holt-Winter [16], untuk memberikan perataan dengan latensi lebih sedikit daripada algoritma penyaring smoothing lainnya. Ini bekerja seperti perataan sederhana kecuali dua komponen harus diperbarui setiap periode: tingkat dan tren. Tingkat adalah perkiraan nilai data yang merapikan pada akhir setiap periode. Tren ini merupakan perkiraan rata-rata pertumbuhan rata-rata pada akhir setiap periode.



5.  Experiments
Untuk memverifikasi keakuratan sistem kami, kami membandingkan sistem kami dengan tingkat sudut digital yang mengukur sudut dengan cepat dan mudah dengan akurasi yang luar biasa dengan mengukur sudut sendi pinggul kiri saat berjalan. Pada Gambar 5, kurva melintang hijau menunjukkan variasi sudut yang diukur dengan tingkat sudut digital, dan kurva solid biru menunjukkan variasi sudut yang diukur oleh sistem Dual-Kinect. Perubahan Tren dua kurva hampir identik yang periodik dan mulus. Tapi masih ada beberapa kesalahan, diperkirakan rata-rata 10%. Biasanya kesalahan pengukuran Kinect tunggal adalah sekitar 5% yang kurang dari nilai kita. Kesalahan mungkin datang dari prosedur kalibrasi dan kesimpulan inframerah dengan perkiraan terbaik kami.

6.  Conclusions And Future Work
Makalah ini memperkenalkan metode berbasis visi baru untuk menangkap gerakan manusia menggunakan dua Kinect yang berjalan bersamaan. Dibandingkan metode tradisional yang hanya menggunakan satu Kinect, pendekatan kami dapat membantu menghindari masalah kebisingan dan oklusi untuk menstabilkan sistem dan mengeluarkan kemungkinan kondisi aplikasinya. Pekerjaan kami juga mengusulkan algoritma fusi yang sesuai untuk menangani data yang diperoleh. Hasil percobaan mengkonfirmasi kelayakan pendekatan baru kami. Pekerjaan masa depan mencakup isu-isu berikut untuk memperbaiki kinerja sistem: Pertama, mengkalibrasi langsung kedua kamera kedalaman dapat mengurangi kesalahan kalibrasi dan bukan mengkalibrasi dua kamera RGB; Kedua, dengan menggunakan setup multiplexing waktu yang terdiri dari dua Kinect aktif, kesalahan interferensi dapat dieliminasi; Dan ketiga, algoritma fusi yang kami ajukan efektif tapi sederhana, algoritma lain yang lebih baik dapat diadopsi untuk lebih meningkatkan kinerjanya.

Tidak ada komentar:

Posting Komentar