III-bob. ASOSIY MODEL ASOSIDA ALGORITMLARNI ISHLAB CHIQISH
III-BOB. ODAMLARNING YURISH XUSUSIYATLARIGA KO‘RA SINFLARI VA STANDARTLARIGA DOIR ASOSIY MODELLAR VA ALGORITMLAR
3.1-§. Oldindan segmentlash modelini tanlash va asoslash
Har bir inson o‘ziga xos yurish uslubiga ega bo‘lishiga qaramay, yurishning o‘zgarishi juda kichik. Odamning ko‘zi odatda ikkita harakatni osongina ajratib turadigan bo‘lsa-da, ikki kishining yurishi ancha yaqinroq va farqlash qiyin. Aksariyat haraka tlar "tashqi ko‘rinish" xususiyatlari bilan aniqlanishi mumkin. Misol uchun, agar biror kishi uyali telefonni qulog’iga yaqin tutsa, ehtimol u telefonda kimdir bilan gaplashadi. Yoki havoda odamning qiyofasi osilgan bo‘lsa, u sakrab tushgan bo‘lishi kerak. Ammo yurish hali ham bir xil "yurish" harakati bo‘lib, agar odamlarning to‘liqligi va kiyimi o‘xshash bo‘lsa yoki o‘lchamlari past bo‘lsa, harakat odamlarning tashqi ko‘rinishidan ko‘ra muhimroq bo‘ladi.
Yurishni tanib olish muammosini qayta identifikatsiya qilish va yuzni aniqlashdan ajratish uchun tashqi ko‘rinishni o‘z ichiga olgan xom ramkalar emas, balki nuqtalarning harakatlarini tahlil qilish kerak. Bundan tashqari, tasvir ko‘rinishining ko‘pgina xususiyatlari, masalan, rang yoki kontrast, yurish xususiyatlariga ta’sir qilmaydi (3.1-rasm), bu harakatni videodan ajratib olish kerakligini tasdiqlaydi.
3.1-rasm — Yorqinlik, kontrast va toʻyinganlik sozlamalari turlicha boʻlgan bir xil ramka
Shu sabablarga ko‘ra, fikrlarning tarjimalari katta qiziqish uyg’otadigan ma’lumotlardir. Ushbu tarjimalar haqidagi ma’lumotlarni o‘z ichiga olgan matematik ob’ekt optik oqimdir (OF), shuning uchun yurishni aniqlash uchun asosiy ma’lumot manbai sifatida optik oqim tanlangan.
Rasmiy ravishda OF - kuzatuvchi va sahna o‘rtasidagi nisbiy harakat natijasida yuzaga keladigan vizual sahnadagi ob’ektlarning ko‘rinadigan harakatining naqshidir [85; 86]. Bu ketma-ket video kadrlar orasidagi sahna nuqtalarining ko‘rinadigan harakatini aks ettiradi (3.2-rasm). Matematik nuqtai nazardan, optik oqim nuqtalarning tarjimasiga javob beradigan vektor maydonidir. 𝐼1 va 𝐼2 kengligi 𝑊 va balandligi 𝐻 boʻlgan videoning ketma-ket ikkita kadri deb faraz qilsak, 𝑂𝐹 3 oʻlchamli 𝑊 × 𝐻 × 2 oʻlchamli tensordir, shu kabi
𝐼2 [x + 𝑂𝐹 [x,y, 0], y+ 𝑂𝐹 [x, y, 1]] = 𝐼1[, ], (2.1)
ya’ni 𝐼1 ramkaning koordinatalari (x,y) nuqtada ( x+ 𝑂𝐹 [x,y, 0], y+ 𝑂𝐹 [x,y, 1]) 𝐼2 ga siljiydi. Agar kamera statik bo‘lsa, orqa fon harakat qilmaydi va o‘zgarmaydi, keyin faqat harakatlanuvchi ob’ektlar oqim hosil qiladi va fonga nol vektor maydoni mos keladi.
first frame second frame optical flow
3.2-rasm — Optik oqim ketma-ket kadrlar orasidagi vektor harakat maydoni sifatida
Optik oqimdan foydalanish [50] da harakatni aniqlash uchun taklif qilingan edi, bu o‘z davridagi eng muvaffaqiyatli video tasniflash yondashuvlaridan biri bo‘lgan va ko‘plab tadqiqotchilarni xom kadrlarga qo‘shimcha ravishda optik oqimni tahlil qilishga undagan. Yurishni aniqlash umumiy harakatlarga qaraganda ko‘proq harakatga bog’liq bo‘lganligi sababli, optik oqim harakatni tahlil qilish va odamlarni yurish usulidan tanib olish uchun zarur bo‘lgan barcha ma’lumotlarni o‘z ichiga olishi kerak. Bundan tashqari, OF xaritalarini manba ma’lumotlari sifatida ishlatganda, tan olish odamning tashqi ko‘rinishi, kiyimi, tanasi turi yoki shakli bilan emas, balki harakat shakllari bilan tan olinishiga ishonch hosil qilish mumkin.
Dostları ilə paylaş: |