Tadqiqot natijalarining ilmiy va amaliy ahamiyati. Tadqiqot natijalarining ilmiy ahamiyati
Tadqiqot natijalarining amaliy ahamiyati
Tadqiqot natijalarining joriy qilinishi. …
Tadqiqot natijalarining aprobatsiyasi. Ushbu tadqiqot natijalari 5 ta xalqaro va 2 ta respublika ilmiy-amaliy anjumanlarida muhokama qilingan.
Tadqiqot natijalarining e’lon qilinganligi. Dissertatsiya mavzusi bo‘yicha jami 18 ta ilmiy ish, shulardan 7 tasi O‘zbekiston Respublikasi Oliy attestatsiya komissiyasining doktorlik dissertatsiyalari asosiy ilmiy natijalarini chop etish tavsiya etgan ilmiy nashrlaridagi maqolalar (5 tasi xorijiy va 2 tasi respublika jurnallarida), shuningdek, EHM lar uchun dasturiy mahsulotlarga O‘zbekiston Respublikasi Intellektual mulk agentligidan ro‘yxatdan o‘tgan 4 ta guvohnoma olingan.
Dissertatsiyaning tuzilishi va hajmi. Dissertatsiya kirish, to‘rtta bob, xulosa, foydalanilgan adabiyotlar ro‘yxati va ilovalardan iborat. Dissertatsiya hajmi …. betni tashkil etadi.
I-BOB. SHAXSNI IDENTIFIKATSIYALASHDA MA’LUMOTLARNI OLISHNING YONDASHUVLARI
1.1-§. Shaxsni identifikatsiyalashda videoma’lumotni tahlil qilish va qayta ishlash tamoyillari
Bugungi kunda, tasvirlarni tanib olish va inson xatti-harakatini baholashning nazariy asosini rivojlantirishga katta ahamiyat berilmoqda. Shuning uchun ham murakkab holatdagi ob’yektlarni xarakterlashda, asosiy dinamik ob’yektlarning tanib olish, intellektual tahlil qilish va qayta ishlashda rivojlangan matematik apparatlar usullari mavjudligi bilan ifodalanadi.
Shaxsni identifikatsiyalashda videoma’lumotni aqlli tahlil qilish va qayta ishlash istiqbolli, eng tez rivojlanayotgan tadqiqot yo‘nalishlaridan biri va inson faoliyatining turli sohalarida keng qo‘llanilib kelmoqda. Dastlab, videokameralardan olingan ma’lumotlar, asosan xavfsizlik televizion tizimlarida ishlatilgan. Bu esa yangi video ma’lumotlardan foydalanish, tahlil qilish va qayta ishlash usullaridan foydalanish imkonini beradi. Shuning uchun, zamonaviy avtomatlashtirilgan video axborotni qayta ishlash va tahlil qilish tizimlari keng qo‘llaniladi. Jumladan xavfsizlikni ta’minlash uchun videokuzatuv kabi muammolarni hal qilish va turli maqsadlardagi ob’yektlarga (xavfsizlik tizimlari, boshqaruv tizimlari) kirish, yong‘indan himoya qilish tizimlari, navigatsiyada, sifatni nazorat qilish uchun va ishlab chiqarilgan mahsulotlar miqdori va ko‘pchilikning video monitoringi maqsadli jarayonlarni nazorat qilish va identifikatsiyalashda foydalanish imkoni yaratilmoqda.
Statik ramkalardan farqli o‘laroq, jonli video tasvirlarni o‘z ichiga oladi va kuzatilgan vaqt davomida sodir bo‘ladigan o‘zgarishlar haqida ma’lumot sahna holatida saqlanadi. Video ketma-ketliklar – bu keng qamrovli axborot resursi bo’lib, ular statik tasvirlarning fazoviy xususiyatlarini o‘zida birlashtiradigan va ko‘p o‘lchovli xususiyatlari vaqt o‘tishi bilan o‘zgaruvchan signallar ko’rinishida tasvirlanadi [1, 36]. Ularning asosiy xususiyatlari sifatida ko‘rinish, ortiqchalik, ixchamlik, maksimal axborot mazmunini (insonga yetkaziladigan barcha ma’lumotlarning 80% gacha) qamrab oladi [41]. Video ketma-ketliklarini tahlil qilish statik va dinamik ob’yektlarining xususiyatlarini kuzatish imkonini beradi. Video ketma-ketligini tahlil qilish natijasida ikki turdagi savollarga javob olish mumkin: mantiqiy (ramkada ma’lum bir ob’yektning mavjudligi, boshqa ob’yektlar bilan mutanosiblikdan ajratib olish) va miqdoriy (ob’yektlar soni, ularning o‘lchamlari, ulargacha bo‘lgan masofa va boshqalar). Natijada video tasvirlarni tahlil qilishning asosiy maqsadi monitoring qilish orqali foydali va tegishli ma’lumotlarni ketma-ketlikda mavjud bo‘lgan ramkalarni chiqarish mumkin. Ushbu ma’lumotlarning mezonlari muhimligi muayyan tizimning maqsadli vazifalari va asosiy vazifasi bilan belgilanadi.
Shunday qilib avtomatlashtirilgan videokuzatuv tizimlari odam harakatlari haqida axborot shakllantirib berishi, kameraning ko‘rish sohasida shakllangan vaziyat va dasturiy ta’minot uchun taqdim etilgan qarorlar qabul qilishga doir ma’lumotlar berishdan iboratligini ta’kidlab o’tish joiz [16]. Bunday tizimlarni qurish jarayoni quyidagi sxema bilan ifodalanadi (1.1-rasm).
1.1-rasm – Avtomatlashtirilgan videokuzatuv tizimini tashkil qilish sxemasi.
Yuqoridagi jarayon quyidagi bosqichlarni o‘z ichiga oladi:
1) video signalni qabul qilish va uni raqamli shaklga o‘tkazish (agar asosiy signal analog shaklda qabul qilinsa);
2) videoma’lumotlarning joriy kadrlarini to‘plash;
3) raqamli qabul qilingan video tasvirlarni amalga oshirish maqsadida qayta ishlash, tegishli va kerakli ma’lumotlarni ajratib ko‘rsatish;
4) olingan ma’lumotlarni tahlil qilish va uni hal qilish uchun aniq vazifa tanlash.
Agar tanib olinadigan ob’yekt harakatlanuvchi transport vositalariga nisbatan qaraladigan bo’lsa, videokuzatuv tizimlarida shaxsni identifikatsiyalash masalasi yanada murakkablashadi [7]. Chunki tanib olishda video ketma-ketligi vaqt o‘tishlari tasvirlanmagan bo’ladi va video tasvir transformatsiyalarini ma’lum analitik bog‘liqliklar asosida yaratishi mumkin [36].
Harakatni tasniflash, tanib olish va aniqlash vazifalari bitta jarayon sifatida video ketma-ketlikdagi ob’yektlarda yagona tizimli pozitsiyada yondashish maqsadga muvofiq bo’ladi.
Video tasvir tahlilining tipik vazifalari (1.2-rasm) quyidagilarni o‘z ichiga
oladi [11]:
- ob’yektlarni aniqlash, ularni tanlash (kerakli ma’lumotlarni tanlash);
- ma’lumotlarni saqlash;
- ob’yektlarni aniqlash va ularni kuzatish;
- harakatlanuvchi ob’yektlarni tanlash va joriy boshqarish holatiga o’tish;
- ob’yektlar parametrlarini o‘lchash;
- ob’yektlarni tasniflash va tanib olish;
- boshqa vazifalar (monitoringning o‘ziga xos xususiyatlariga ko‘ra).
Tasvirni aniqlash bilan bog‘liq muammolar bir-biri bilan o‘zaro bog‘liq bo‘lgan tanlash va tanib olishning quyidagi masalalarini keltirb chiqaradi [1, 55, 70]:
1) harakatlanuvchi ob’yektlarni aniqlash, tanlash va kuzatish (odamlar, hayvonlar, transport va boshqalar);
2) ob’yektlarning ommaviy to‘planishini aniqlash va tanlash (olomon odamlarning tirbandligi, yo‘llarda tirbandlik);
3) nazorat qilinadigan hududda joylashgan ob’yektlarni aniqlash, himoyalangan ob’yektlarni nazorat qilish (tirbandlik joylarida odamlar tomonidan tashlab ketilgan narsalarning mavjudligini aniqlash, noto‘g‘ri to‘xtatilgan transport vositalarini aniqlash);
4) ob’yektlar harakatining traektoriyasini aniqlash va kuzatish (noto‘g‘ri yo‘nalishda harakat qilayotgan odamlarni aniqlash, taqiqlangan yo’nalishga burilish, qarama-qarshi yo’nalishda haydash, yo‘lni tark etish).
1.2-rasm. Tasvirlarni tahlil qilish va qayta ishlash tizimlarining maqsadli vazifalari.
Ob’yektlar parametrlarini o‘lchash video tasvirlarning quyidagi belgilangan parametrlarini baholashni nazarda tutadi [14, 24]:
1) Videotasvirda ob’yektlarning harakat tezligini aniqlash va baholash (masalan, avtomobillar tezligini o‘lchash, nostandart tezlikda harakatlanayotgan, ya’ni yugurayotgan insonni aniqlash va boshqalar);
2) foydalanuvchini qiziqtiradigan ob’yektlar sonini hisoblash: harakat intensivligini baholash va o‘tayotgan transport vositalarining sonini hisoblash, band va bo‘sh joylar sonini avtomatik aniqlash, konveyerdagi mahsulotlar sonini hisoblash, savdo va ko‘ngilochar markazlarda statistik tadqiqotlar o‘tkazish, shuningdek, muzeylarda, ma’lum bir nazorat qilinadigan hudud orqali o‘tadigan odamlar sonini hisoblash;
3) ob’yektlarning o‘lchamlarini aniqlash;
4) ob’yektdan videokameragacha bo‘lgan masofani aniqlash.
Ob’yektni tanib olish quyidagilarni o‘z ichiga oladi:
1) ma’lum bir shakl va o‘lchamdagi narsalarni tanib olish;
2) harakatlanuvchi ob’yektlarda raqamlarni va yozuvlarni tanib olish;
3) odamlarni, shu jumladan biometrik belgilar bo‘yicha identifikatsiya qilish (yuz, yurish, termal portret va boshqalar);
4) vaziyatlarni tanib olish (nazorat qilinadigan hududda yong‘inlarni, baxtsiz hodisalarni, falokatlarni erta aniqlash, o‘g‘irlik va nostandart xatti-harakatlarni aniqlash).
Yuqoridagi ta’kidlangan vazifalar doirasida shaxs harkatini identifikatsiyalash masalasi eng dolzarb va murakkab muammo sifatida qaraladi.
Ixtiyoriy kompyuterli ko‘rish muammosiga o’xshash, harakatni aniqlashda ham har qanday muammoli holatlarda video mazmunini o‘zgartirmaydigan, ammo tashqi ko‘rinishni o‘zgartiradigan va shuning uchun yurishning ichki holatiga ta’sir qiladigan ko‘plab omillar mavjud. Ushbu omillarning barchasini ikki guruhga bo‘linadi: tasvirning o‘ziga ta’sir qiluvchi va faqat holatga ta’sir qiluvchi. Birinchi guruhning omillari haqiqatan ham yurish usulini o‘zgartiradi va ham inson, ham kompyuter uchun tanib olinishi ancha murakkab. Ikkinchi guruhda faqatgina ichki tasvirlashni o’zgartiradigan shartlar mavjud bo’lib insonning yurish usuli o’zgarmaydi. Inson nigohida ikkita videoda bir xil odam aks etiladi, ammo kompyuter uchun turli xil xususiyatlarga ega ikkita turli tasvir ketma-ketliklari mavjud bo’ladi.
1.3-rasmda yurishga ta’sir qiluvchi birinchi guruh omillari tasvirlangan. Birinchi video (1.3-rasm-a) ketma-ketlikni tahlilida ushbu omillar turli xil tashqi sharoitlarni tufayli o‘zgarishi mumkin, masalan, qo‘llarni egib olish, yurish og‘irligini oshiradigan poyabzal, har qanday og‘ir yukni, sumka va boshqalarni ko‘tarish (1.3-rasm-b-c-d-e). Bundan tashqari, holatni o‘zgartiradigan ichki sharoitlar mavjud, masalan, kasallik (shikastlanish, charchoq va boshqalar) yoki mast bo‘lish. Boshqa bir ichki sharoit sifatida tasvirlar orasida uzoq vaqt oralig‘i qaralishi mumkin, ya’ni birinchi va keyingi tasvirlarda harakatamalga hech narsa bo‘lmagan bo‘lsa ham, agar uzoq vaqt davomida harakat tasvirlanishi nazarda tutilmagan bo’lsa ham, vaqt oralig‘i uzoq bo’lganligi sababli yurishda o’zgarishlar kuzatiladi.
(a) (b) (c) (d) (e)
1.3-rasm. Yurishga ta’sir qiluvchi omillarga misollar: (a) quvvatni qo‘llab-quvvatlovchi yordamida, (b) baland poshnalar. Yuk ko‘tarish shartlari: (c) sumka, (d) orqaga taqiluvchi sumka, (e) boshqa yuklar.
Ta’sir etuvchi omillarning ikkinchi guruhi yurish usulida o‘zgarishni sezdirmaydi, lekin ob’yektning holati tasvirlanishida tafovutni vujudga keltiradi (1.4-rasm). Bu omillar ko‘proq yahirin bo‘lib, ular inson ko‘zi uchun sezilarli, ammo hisoblash mashinasi uchun ortiqcha vaqt ya’ni, solishtirish uchun qo’shimcha amallarni bajarishni talab qiladi.
(a) (b) (c) (d) (e)
1.4-rasm. Yurish tasviriga ta’sir qiluvchi omillarga misollar: (a) kombinezon, (b) uzun ko‘ylak, (c) palto, (d) okluzyonlar, (e) yomon yoritilishi va ramkaning past sifatliligi.
Misol sifatida harakatni tanib olishda eng murakkab muammo bo’lgan nigoh o’zgarishini keltirish mumkin. Shu qatorda tananing ba’zi qismlarini yashiradigan va inson qiyofasining shaklini o‘zgartirishi mumkin bo‘lgan turli xil kiyimlar (masalan, uzun ko‘ylaklar, paltolar yoki yaktaklar), yorug‘lik va kamera sozlamalarini o‘zgartirish ham ikkinchi guruh omillariga yaqqol misollar sifatida qaraladi. Inson farqni sezmasligi mumkin, ammo barcha tafovutlarga barqaror tanib olish modelini ishlab chiqish ancha muammoli masala hisoblanadi.
Barcha ta’kidlangan omillar kombinatsiyalanganda tanib olish muammosini yanada murakkablashadi (1.3-rasm b-d-e holatlarda ustki kiyimlar, yuk tashish sharoitlari, poyabzal poshnasi balandligi).
Sababi, ta’sir etuvchi sharoitlarning keskin o‘zgaruvchanligi tufayli katta hajmdagi umumiy ma’lumotlar to‘plamini shakllantirish qiyin. Odatda tadqiqotchilar ma’lum bir shartlarga e’tibor bergan holda, boshqa sharoitlarni hisobga olmaydi, bu esa o’z navbatida modellarni ma’lumotlar bazasida taqdim etilgan aniq shartlarga haddan tashqari moslashtirishga olib keladi. Ta’kidlash joizki, ma’lumotlar bazasi qanchalik katta bo’lmasin barcha shart-sharoitlarni qamrab olish imkonsiz qolaveradi va ushbu holat mazkur dissertatsiyaning tadqiqot mavzusi dolzarbligi va ehtiyojini asoslaydi.
1.2-§. Inson harakati tasvirlarini tanib olishning asosiy yondashuvlarining tahlili
Zamonaviy harakat tasvirlarini tanib olishga bag‘ishlangan tadqiqotlarda odatda shakllangan ma’lumotlar bazalaridan foydalaniladi. Asosan Germaniya, Yaponiya va Hindistonlik izlanuvchilar tomonidan bunday ma’lumotlar to’plamlari taqdim etib kelinmoqda. Inson harakatlarini aniqlash uchun eng koʻp qoʻllaniladigan nisbatan mukammal maʼlumotlar toʻplami sifatida “TUM Gait from Audio, Image and Depth” (TUM-GAID) [7], OU ISIR Large Population Dataset (OULP) [8] va CASIA Gait ma’lumotlar to‘plamlari qaraladi [9]. Ushbu to‘plamlar doimiy tarzda yangilanib va takomillashib borishi alohida diqqatga sazovor va to’plamlardagi ma’lumotlar dolzarbligi yo’qolmasligini ta’minlab boradi.
Eng oddiy ma’lumotlar bazasi TUM-GAID insonning yon ko‘rinishini aniqlash uchun ishlatiladi (1.5-rasm). Unda chapdan o‘ngga va o‘ngdan chapga yon ko‘rinishdan olingan 305 ta holatlar uchun tasvirlar mavjud. Videolarning kadr tezligi taxminan 30 kadr / sek va har bir kadrning o‘lchamlari 320×240 o’lchamda qabul qilinadi. TUM-GAID to’plamlari turli xil yurish sharoitlarini ya’ni 6 xil normal yurish, 2 xil keng kiyimda yurish, va har bir kishi uchun poshnali poyabzal kiygan 2 xil yurishlarni tasvirlagan videolarni o‘z ichiga oladi. Tasvirlar faqat bitta ko’rinishdan yozib olingan bo‘lsa-da, tadqiqot ob’yektlari (odamlar) soni ularning yarmini tanlanma o’qitiladigan to’plam sifatida va qolgan yarmini baholash uchun to’plam sifatida olish imkonini beradi. Ma’lumotlar bazasi 150 ta holat uchun ma’lumotlardan foydalangan holda modellarni o‘qitish va boshqa 155 tasi bilan sinovdan o‘tkazish uchun o‘qitiladagan, tekshirish va test to‘plamlariga bo‘linishni ta’minlanadi. Shunday qilib, hech qanday tasodifiylik natijaga ta’sir qilmaydi. To‘liq rangli bo‘lgani uchun, ushbu to‘plam turli yondashuvlar bilan ko‘plab tajribalarda qo‘llanilish imkonini beradi. Bundan tashqari, ushbu ma’lumotlar bazasida olti oylik interval vaqt bilan olingan tasvirlar mavjud bo‘lib, bu vaqtinchalik yurish o‘zgarishlarida algoritmlarning barqarorligini tekshirish imkonini beradi.
normal yurish normal yurish qoplamali poyabzal ryukzak
1.5-rasm — TUM-GAID ma’lumotlar bazasidagi kadrlarga misollar
Keyingi ma’lumotlar to‘plami CASIA B bo’lib, u sub’ektlar soni bo‘yicha nisbatan kichik, lekin u ko‘rishlarning katta o‘zgarishiga ega va u 124 ta ob’yektni 11 xil ko‘rinish burchagidan (0° dan 18° qadam bilan 180° gacha) olingan. Videolar 3 soniyadan 5 soniyagacha davom etadi, kvadrat tezligi taxminan 25 kadr/s va o‘lchamlari 320×240 pikselga teng. Barcha traektoriyalar hamma ishtirokchilar uchun bir xonada to‘g‘ridan-to‘g‘ri va yopiq tarzda qayd etilgan. Yechimlarning xilma-xilligi bilan bir qatorda, xuddi birinchi kolleksiyadagi kabi, turli xil kiyimda palto kiyish va sumka ko‘tarib olish kabi sharoitlari taqdim etilgan. Hammasi bo‘lib, har bir ko‘rinishdan olingan har bir kishi uchun qo‘shimcha shartlarsiz 6 ta oddiy yurish, ochiq kiyimda ikkita yurish va sumka bilan ikkita yurish kabi 10 ta video ketma-ketligi mavjud. CASIA ma’lumotlar to‘plami ko‘rish o‘zgaruvchanligi tufayli juda mashhurligi bilan birgalikda chuqur neyron tarmog‘ini har qanday ko‘rinishdagi yurishni haddan tashqari moslashtirmasdan taniy oladigan o‘rgatish uchun juda kam holatlar mavjud. CASIA B to‘plamidagi (1.6-rasm) turli xil ko’rish burchaklarida olingan video ramkalar ko‘rsatilgan.
normal yurish normal yurish ustki kiyimli sumkali
1.6-rasm. CASIA B yurish maʼlumotlar toʻplamidagi kadrlarga misollar
OULP to‘plamida esa ikkita kamera yordamida olingan 4000 dan ortiq odam uchun video ketma-ketliklardan iborat, tortishish burchagi 55° dan 85° gacha silliq o‘zgaradi. Ushbu to‘plamdagi ma’lumotlar siluet maskalari shaklida taqsimlanadi, shuning uchun barcha tavsiflangan usullar ushbu ma’lumotlar bazasiga taalluqli emas. Siluetlar binarlashtirilgan va 1.7-rasmda ko‘rsatilganidek, 88 × 128 o‘lchamiga normallashtiriladi. Shunga qaramay, yurishni aniqlashning ishlab chiqilgan ko‘plab usullari ushbu ma’lumotlar bazasida baholanganligi sababli yondashuvlarni taqqoslash uchun ham qo‘llaniladi.
1.7-rasm. Ko’pchilik aholi maʼlumotlar toʻplamidan olingan kadrlar namunalari.
Biroq, turli sharoitlarda tajribalar uchun to‘plangan boshqa ko‘plab yurish ma’lumotlar bazalarini Myunxen texnika universitetida TUM-GAID ma’lumotlar to‘plami shakllantirilgan. Hindistonning Kharagpur texnologiya institutida TUM IIT-KGP to‘plamini tashkil etuvchi 35 ta sub’ektni o‘z ichiga olgan juda kichik, ammo yurishlar 6 xil sharoitda, jumladan dinamik va statik okklyuzionlarda mos ravishda harakatlanadigan yoki harakat qilmaydigan ob’yektlar bilan olingan ma’lumotlar bazasi shakllantirilgan [10]. Shunday qilib, TUM IIT-KGP anchagina murakkablashgan va undan real hayotda tez-tez uchraydigan okklyuzion muammoni hal qilishda foydalanish mumkin.
Ba’zi ma’lumotlar bazalarida o‘zgarib turadigan yana bir omil - bu yurish tezligi. Masalan, CASIA C Gait ma’lumotlar bazasi va CMU MoBo ma’lumotlar to‘plami (CMU Motion of body)da normal, sekin va tez yurishlarni o‘z ichiga oluvchi va OUST (OU-ISIR Gait Speed Transition Dataset) videolardan iborat va har-xil joylarda tezligi asta-sekin o‘zgarib turadigan yurish holatlari mavjud [11, 12, 13]. Masalan, 1 km/s dan 5 km/s gacha tezlashishi va 5 km/s dan 1 km/s gacha sekinlashishi mumkin. Osaka universitetida toʻplangan yana bir maʼlumotlar bazasi OUTM (OU-ISIR Treadmill) maʼlumotlar toʻplami mavjud bo’lib, u tezligi
1 km/soatdan 10 km/soatgacha oʻzgaruvchan yugurish yoʻlakchasida qayd etilgan yurishlarni oʻz ichiga oladi va OULPga oʻxshab, barcha OU-ISIR toʻplamlaridagi eksperimentlar uchun foydalanishni cheklovchi ikkilik niqoblar koʻrinishida taqsimlangan bo’ladi [14, 8].
Osaka universitetida turli yoshdagi odamlarning ma’lumotlar to‘plamini, OU ISIR Gait ma’lumotlar bazasi, hamda yoshga oid ko’p aholi ma’lumotlar to‘plamini (OULP + Age) to‘plangan va bunda sub’ektlarning yoshi 2 yoshdan 90 yoshgacha taqsimlangan [15]. Tadqiqotlar shuni ko‘rsatadiki, yurish usuli insonning yoshiga qarab o‘zgarishi mumkin, shuning uchun haqiqatan ham korrelyatsiya mavjudligini tekshirishni talab etadi. Yurish uzoq vaqt davomida o‘zgarishi mumkinligini tekshirish uchun vaqtli o‘zgaruvchan ma’lumotlar to‘plamini yig‘ish talab etiladi. TUM-GAID, MIT AI toʻplami va USF HumanID maʼlumotlar toʻplamida turli xil oʻzgarishlarni oʻz ichiga olgan 6 oylik vaqt oraligʻida 32 ta obʼyekt tasviri olindi [16, 17]. Ba’zi ma’lumotlar to‘plamiga kiritilgan yana bir holatni ya’ni yerning o‘zgarishini hisobga olish kerak. Yurishni aniqlash to‘plamlarida fon odatda statik bo‘lsa-da, atrof-muhit tasvirga ta’sir qilishi mumkin, shuning uchun turli yerlar ma’lumotlar to‘plamiga haddan tashqari moslashishni oldini oladi. Bunday o‘zgarishlarni o‘z ichiga olgan ma’lumotlar to‘plami USF HumanID va SOTON Large ma’lumotlar bazalari shakllantirilgan [18]. Yuqorida tavsiflangan to‘plamlar mavjud bo‘lgan yagona ma’lumotlar to‘plami bo’libgina qolmay, ko‘plab boshqa ma’lumotlar bazalarida ko‘p ko‘rinishli tanib olish, kiyimni o‘zgartirish va tashish sharoitlari muammolarini hal qiladi [19-23]. Ularning aksariyati (masalan, OU-ISIR Multi-View Large Population Dataset (OU MVLP) [24]) juda kichik bo‘lib, neyron tarmoqlarini o‘qitishda foydalanishga to‘sqinlik qiladi, taklif qilingan yondashuv ishlab chiqilgandan so‘ng ular tajribalarda ham foydalanilgan. Shunga qaramay, ushbu ma’lumotlar bazalari yurishni aniqlash usullarini ishlab chiqishga ta’sir qiladigan (1.1-jadvalda) yurishni aniqlash uchun mavjud bo‘lgan video ma’lumotlar to‘plamining ba’zi tafsilotlari ko‘rsatilgan.
Ko‘pgina kompyuterli ko‘rish muammolariga o‘xshab, hozirgi vaqtda ma’lumotlar bazasidan yurish xususiyatlarini olishning ikkita usuli mavjud bo’lib, ular qo‘lda identifikatorlarni qurish va yurishning xususiyatlarni avtomatik o‘qitish jarayonlaridir.
Birinchi usul ko‘proq an’anaviy bo‘lib, odatda siluet ikkilik niqoblarining turli xususiyatlarini hisoblash yoki bo‘g‘inlar pozitsiyalarini, ularning nisbiy masofalari va tezligini, hamda boshqa kinetik parametrlarni o‘rganishga asoslanadi. Yurish xususiyatlarini o‘qitish so‘nggi yillarda odatda sun’iy neyron tarmoqlar yordamida amalga oshiriladi va ular videotasvirlarni tasniflash, tasvirlarni segmentatsiyalash, ob’yektni aniqlash, vizual kuzatishlar kabi ko‘plab kompyuterli ko‘rish masalalalarida yaxshi yechimlarni ko’rsatib kelmoqda. Neyron tarmoqlar yordamida o‘qitiladigan xususiyatlar ko‘pincha yuqori sifatli tanib olish uchun zarur bo‘lgan yuqori darajadagi abstraktsiyaga ega. Identifikatsiyaning eng yaxshi sifatiga ushbu ikki yondashuvni birlashtiruvchi usullar orqali erishiladi. Dastlab, yurishning asosiy xarakteristikalari qo‘lda hisoblab chiqiladi, so‘ngra ular ko‘proq mavhum xususiyatlarni olish uchun neyron tarmoqqa beriladi. Biroq, chuqur usullarning muvaffaqiyatiga qaramay, ba’zi mezonlarda neyron tarmoqlardan ustun bo‘lgan chuqur bo‘lmagan usullar mavjud, shuning uchun ikkala global yondashuv ham e’tiborga loyiqdir. Shu boisdan dastlab tabiiy sabablarga ko‘ra yurish deskriptorlarini qo‘lda olinadigan ba’zi klassik asosiy yondashuvlar natijalari quyidagi jadvalda ko’rsatilgan (1.1-jadval).
1.1-jadval
Ma’lumotlar to’plamlari va ularda olingan natijalar
Ma'lumotlar bazasi nomi
|
Sub’yektlar soni
|
Ketma-ketliklar soni
|
Muhit
|
Holatlar
|
TUM-GAID [7]
|
305
|
3370
|
Ichki
|
Yo'nalish (2), yuk (2), vaqt (2), poyabzal (2), kiyim (2)
|
TUM-IITKGP [10]
|
35
|
840
|
Ichki
|
Yo'nalishlar (2), yuk (2), okklyuzion
|
CASIA A [19]
|
20
|
240
|
Tashqi
|
Ko'rishlar (3)
|
CASIA B [9]
|
124
|
13640
|
Ichki
|
Koʻrishlar(11), kiyim(2), yuk(2)
|
CASIA C [11]
|
153
|
1530
|
Tashqi, termal kamera
|
Tezlik (3), yuk (2)
|
OUTM A [14]
|
34
|
612
|
TM, Ichki
|
Tezlik (9)
|
OUTM B [14]
|
68
|
2176
|
TM, Ichki
|
Kiyim (32)
|
OUTM C [14]
|
200
|
5000
|
TM, Ichki
|
Ko'rishlar(25)
|
OUTM D [14]
|
185
|
370
|
TM, Ichki
|
Yurishning o'zgarishi
|
OULP [8]
|
4007
|
7842
|
Ichki
|
Ko'rishlar(4)
|
OULP+ Age [15]
|
63 846
|
63 846
|
Ichki
|
Yosh (2 yoshdan 90 yoshgacha)
|
OU MVLP [24]
|
10307
|
javob yo'q
|
Ichki
|
Ko'rishlar(14)
|
AVAMVG [23]
|
20
|
1200
|
Ichki
|
Yoʻnalishlar(2), koʻrishlar(2)
|
CMU MoBo [12]
|
25
|
600
|
TM, Ichki
|
Ko'rish (6), tezlik (2), moyillik (2), yuk (2)
|
USF [17]
|
122
|
1870
|
Tashqi
|
Ko'rinish (2), er (2), poyabzal (2), yuk (2), vaqt (2)
|
MIT AI [16]
|
24
|
194
|
Ichki
|
Ko'rishlar (4), vaqt
|
SOTON Large [18]
|
114
|
2128
|
Ichki/tashqi, TM/statik pol
|
Ko'rinish (2), maydon (3)
|
SOTON Temporal [22]
|
25
|
26160
|
Ichki
|
Ko'rish (12), kiyim (2), vaqt (5), poyabzal (2)
|
Eng keng tarqalgan yurish xarakteristikasi - bu yurish energiyasi tasviri (GEI), ya’ni harakatlanuvchi odamning ikkilik siluet niqoblarining bir yurish siklidagi o‘rtacha ko‘rsatkichidir. Inson yurishining bunday fazoviy vaqtinchalik tavsifi, yurish paytida tananing harakatlari vaqti-vaqti bilan takrorlanadi, degan taxmin bilan hisoblanadi [25]. Olingan tasvirlar harakatlanuvchi odamning ma’lum bir holatda bo‘lish chastotasini tavsiflaydi. Ushbu yondashuv keng qo‘llaniladi va boshqa ko‘plab yurishni aniqlash usullari unga asoslanadi. Bundan tashqari, yurish energiyasi tasvirlarini to‘g‘ridan-to‘g‘ri ishlatmaydigan ko‘plab yondashuvlar boshqa asosiy xususiyatlarning o‘xshash birikmasini taklif qiladi. Misol uchun, tanib olish yurish entropiyasi tasvirlari (GEnI) orqali amalga oshirilishi mumkin, bu yerda har bir pikselning o‘rtacha entropiyasi siluet o‘rniga hisoblab chiqiladi yoki kvadrat farqi energiya tasviri (FDEI) orasidagi farqlarni aks ettiradi. Videoning ketma-ket kadrlaridagi siluetlari va ikkilik siluet niqobining vizualizatsiyasi va yurish energiyasi va entropiya tasvirlari 1.8-rasmda ko‘rsatilgan [26, 27].
Keltirilgan barcha usullarning o‘rtacha ramka xususiyatlarini hisoblash muammosi vaqtinchalik ma’lumotni qisman yo‘qotishga olib keladi, chunki ramkalar tartibi hisobga olinmaydi. Bir nechta yondashuvlar bu yo‘qotishning oldini olishga qaratilgan [28, 30]. Shunday qilib, Chrono-Gait Images (CGI) deskriptori siluetlardan konturlarni ajratib olish va ularni yurish siklidagi mos keladigan ramkaning holatiga qarab vaqtinchalik ma’lumotni kodlaydi [28]. Yana bir yurish deskriptori, Gait Flow Image (GFI) bo’lib, u ketma-ket siluet tasvirlari orasidagi binarlashtirilgan optik oqimga asoslanadi va siluetlarning bosqichma-bosqich o‘zgarishini aks ettiradi [29]. Vaqtinchalik ma’lumotni saqlaydigan siluetga asoslangan yurishni tasvirlashning yana bir usuli – bu chastotali sohada yurish entropiyasini aniqlash [30].
Ushbu yondashuv yurishning entropiyasini identfikatsiyalash usulini Furyening diskret almashtirishi (DFT) bilan birlashtiradi va bunda eksponensial kamayib borayotgan miqdorlarda ega ikkilik siluet niqoblarining o‘rta qiymati hisoblanadi. Chastotali sohada yurish entropiyasi usuli yondashuvlarning integratsiyasi bo’lib, u entropiyani yurish energiya tasviri bo’yicha emas, balki Furyening diskret almashtirishi asosida hisoblaydi [31].
Ushbu usullarning oddiyligiga va qulayliligiga qaramay, ko’p yillar davomida aynan yurish energiyasi tasviriga asoslangan usullardan foydalanib kelingan. Oddiy oq-qora tasvirlarga o‘xshab, yurish energiyasi tasviri qo‘shimcha funksiyalarni hisoblash uchun ishlatilishi mumkin, masalan, yo‘naltirilgan gradientlar gistogrammasi (HOG – deskriptorlari), yoki optik oqimning gistogrammalari (HOF – deskriptorlari), yoki yurishni aniqlash muammosining o‘ziga xos xususiyatlaridan foydalanadigan holda yanada murakkab tasniflash algoritmlarini yaratish mumkin [32, 33,34,35].
|
|
|
ikkilik siluet
|
yurish energiyasi tasviri
|
yurish entropiyasi tasviri
|
1.8-rasm. Asosiy yurish deskriptorlariga misollar.
Eng muvaffaqiyatli ko‘p ko‘rinishli yondashuvlardan biri yurish energiyasi tasviridan asosiy xususiyatlar sifatida foydalaniladi [36]. Bayes yondashuvida yurish energiya tasvirlarini tasodifiy matritsalar sifatida, yurishning o‘ziga xosligi va turli xil yurish o‘zgarishlariga (masalan, holat, turli kiyim yoki ko‘tarilgan narsalarning mavjudligi) mos keladigan ba’zi ixtiyoriy shovqinlarning yig‘indisi shaklida qaraladi.
Yurish energiyasi tasvirlari juftliklarini birlashtirilgan taqsimotini tegishli sinflar mos kelishi yoki farqlanishi farazi bilan tadqiq qilish, masalani kovariatsiya matritsalarini optimallashtirishga olib keladi va uni kutishni maksimallashtirish algoritmi yordamida yechish mumkin.
Korrelyatsiyani hisobga oladigan boshqa yondashuv yurishni tanib olish masalasi uchun kanonik korrelyatsion tahlilni moslashtirishni nazarda tutadi.
Yana bir muvaffaqiyatli yondashuv yurish energiyasi tasviri xususiyatlari sifatida ishlatadigan chiziqli diskriminant tahlilidir [38]. Xususiyatlarni ko‘proq klasterlashadigan tarzda joylashtirish g‘oyasi bir nechta tadqiqotlarda taklif qilingan [39-42]. Ko‘p ko‘rinishli diskriminant tahlili (MVDA) yondashuvida har bir ko‘rish burchagi uchun sinf ichidagi o‘zgarishlarni minimallashtirish va sinflararo o‘zgarishlarni maksimal darajada oshirish uchun alohida joylashtirishni hisoblaydigan yurish xususiyatlari o‘rganiladi [40]. Shunga o‘xshash yagona ramka mavjud bo’lgan ViDP (view-invariant diskriminative proyeksiya) yondashuvi taklif qilingan bo‘lib, u birinchidan ko‘rinishidan qat’iy nazar bir xil identifikatsiyaning xususiyatlari o‘rtasidagi farqni kamaytirishga va turli xil identifikatsiyalar orasidagi bo‘shliqlarni oshirishga qaratilgan [41, 42]. Ikkinchidan bir juft tasvirning qo‘shma intensivlik ko‘rsatkichlari va fazoviy metrikasini o‘rganish uchun taklif qilingan. Ikkala ko‘rsatkichni ketma-ket optimallashtirish, tanib olish sifati bo‘yicha asosiy diskriminant tahlil modellaridan ustun turadigan modelga olib keladi.
Ushbu yondashuvlarda bir xil ko‘rinishni tanib olish ko‘ndalang ko‘rinishga qaraganda osonroqligi taxmin qilinadi [43, 44]. Shuning uchun ko‘rinishni o‘zgartirish modellari umumiy fazoga turli xil ko‘rinishlarda mos keladigan tavsiflovchilarni joylashtirish uchun taklif etiladi.
Ta’riflangan yondashuvlar intuitiv ravishda tushunarli va matematik jihatdan sodda bo‘lib, bu yuqori tanib olish natijalariga qo‘shimcha ravishda ularga boshqa ko‘plab murakkab usullardan ustunligini beradi. Ushbu ko‘p ko‘rinishli aniqlash usullarining umumiy kamchiliklari sifatida ma’lumotlar bazasida mavjud bo‘lgan har bir ko‘rish burchagi uchun yurish deskriptorini hisoblash zarurati hisoblanadi. Shuning uchun, videoning har bir kadri uchun tortishish burchagini bilish kerak va bu har doim ham real ma’lumotlarda yaxshi natijalar bermaydi. Shu boisdan inson pozasini shakllantirish yoki uning skeletini yaratib olish ehtiyoji paydo bo’ladi.
Inson pozasini shakllantirishda siluetlarni to‘ldiruvchi yana bir muhim ma’lumot manbai – bu inson skeletidir. Tanib olishning ko‘p usullari inson pozasini o‘rganishda bo‘g‘imlarning holati va tananing asosiy qismlari va ularning yurish paytida videodagi harakatiga asoslangan.
Pozaga asoslangan yondashuvlar to’liq strukturali (pozaning kinematik xususiyatlarini hisobga oluvchi) usullardan boshlab ancha murakkab kinematik va fazoviy vaqt xususiyatlarini birlashtiruvchi usullarni ham o’z ichiga oladi.
Ushbu yondashuvda qo‘llaniladigan yurishning asosiy xarakteristikalari sifatida bo‘g‘imlar orasidagi mutlaq va nisbiy masofalar, hamda figuraning asosiy nuqtalarining ramkalar orasidagi siljishiga asoslangan xususiyatlar qaraladi. Yurish davri va yurish tezligiga qo‘shimcha ravishda, yurishni aniqlash uchun oyoqning son qismi, to‘piq va tizzalarning traektoriyalari va turli bo‘g‘inlar orasidagi nisbiy burchaklar kabi turli kinematik parametrlar taklif etiladi [46]. Bir qator boshqa tadqiqot ishlarda ham inson tanasi qismlarining holatiga asoslangan modellarni taklif qilingan, ammo ular tabiatning boshqa xususiyatlari bilan birgalikda qo‘llanilgan. Masalan, kinematik yondashuvni fazoviy yondashuv bilan birlashtiradi, bunda bo‘g‘inlar harakatining traektoriyalari ham, vaqt o‘tishi bilan siluet shaklining o‘zgarishi ham yurishning dinamik xususiyatlari sifatida hisobga olinadi [48].
Yurishni aniqlash uchun ishlatilishi mumkin bo‘lgan yana bir ma’lumot manbai tana nuqtalari traektoriyalari to‘plamidir. Fisher harakati identifikatorlari traektoriyalar bo‘yicha tuzilishi va qo‘llab-quvvatlovchi vektor mashinasi tomonidan tasniflanishi taklif etiladi [49]. Bu esa mashinaga avtomatik ravishda xususiyatlarni o‘rgatish ehtiyojini keltirib chiqaradi.
Avtomatik xususiyatni o‘rgatish nazariy jihatdan strukturaviy chuqur bo‘lmagan yondashuvlarning ko‘pligiga qaramay, konvolyutsion neyron tarmoqlari (CNN) kompyuterli ko‘rishning barcha vazifalarida, shu jumladan yurishni aniqlashda kuchli mavqega ega. So‘nggi bir necha yil ichida texnik tarmoq arxitekturasi, ortiqchalikni yo‘qotish funksiyalari, o‘qitish usullarini tanlash orqali va ma’lumotlarga ishlov berish, hamda tarmoq kiritishiga taqdim etilgan asosiy xususiyatlarni olish usuli bilan yondashuv jihatdan farq qiluvchi ko‘plab neyron tarmoqlar orqali identifikatsiyalash usullari taklif qilindi. Yurish va harakatni tanib olish masalalalarining o’xshashligi yangi kashf etilgan usullarni oldindan mavjud usullarga qo’llanilishini ta’minlaydi. Birinchi samarali usul Simonyan va Zisserman tomonidan taklif qilingan [50]. Inson harakatlarini tanib olish uchun ular ikkita o‘xshash turdagi bo’limlardan: tasvirlar va oqimlar to’plamlaridan iborat arxitekturaga ega konvolyutsion tarmoqni o‘rgatishdi. Birinchisi fazoviy taqdimotni olish uchun videoning xom kadrlarini qayta ishlaydi, ikkinchisi esa vaqtinchalik ma’lumotni olish uchun kirish sifatida ketma-ket freymlar juftligidan hisoblangan optik oqim xaritalarini (OF) oladi. Uzoq muddatli harakatlarni ko‘rib chiqish uchun bir nechta ketma-ket oqim xaritalari tarmoq kirishlari sifatida ishlatiladigan bloklarga yig‘iladi. Ushbu ramkaga asoslangan ko‘plab harakatni aniqlash algoritmlari yuqori variantli arxitekturalarni qo‘llaydi (jumladan, takroriy arxitekturalar va bir nechta oqimlarni birlashtirish usullari) [51, 52]. Optik oqimga asoslangan boshqa usulda uch o‘lchovli konvolyutsiyalardan foydalangan holda vaqtinchalik ma’lumotni ko‘rib chiqadi [53]. Aslida, optik oqim zich traektoriyalarga juda o‘xshaydi, farq shundaki, traektoriyalarni hisobga olgan holda biz boshlang‘ich “boshlanish” nuqtasini belgilaymiz, optik oqim esa har safar yangi joyda ko‘rib chiqiladi. Shunday qilib, yana bir yondashuv vaqtinchalik ma’lumotni optik oqimdan emas, balki videoda hisoblangan traektoriyalardan olishni taklif qiladi [54]. Ushbu traektoriyalarni neyron tarmoqdan olingan fazoviy xususiyatlar bilan birlashtirish yurishni aniqlash uchun yetarli ma’lumotlarni beradi.
Neyron tarmoqlarini o‘qitish uchun ishlatiladigan yana bir keng tarqalgan ma’lumot manbai siluetlarning ikkilik maskalaridir. Eng oddiy DeepGait usulida konvolyutsion arxitektura individual siluetlar orqali shaxsni bashorat qilishga o‘rgatiladi [55]. Keyinchalik, tarmoq xususiyatlarni olish uchun ishlatiladi va butun video bo‘ylab individual ramka identifikatorlarini yig‘ish, yurish sikli bo‘ylab maksimal javobni tanlash orqali hal etiladi. Bu usul barcha chuqur yondashuvlarning eng oddiysidir, chunki odamlarning siluet niqoblari mavjud bo‘lganda, qo‘shimcha va oldindan ishlov berish talab qilinmaydi. Yurish siklining uzunligi ikkilik tasvirlar
ketma-ketligining avtokorrelyatsiyasini hisobga olgan holda aniqlanadi. DeepGait yondashuvida qo‘shma Bayesian usuli siluetlaridan olingan neyron xususiyatlari uchun qo‘llaniladi [36, 56].
Siluetlarning o‘zidan foydalanishning yana bir usuli ko‘rinish – invariant yurishni tanib olish tarmog‘i (VGR-Net) taklif qilingan [57]. Ikki bosqichli algoritm birinchi navbatda videoning tortishish burchagini aniqlaydi, so‘ngra topilgan burchak uchun dastlabki ma’lumotlar va modelga asoslanib, odamni bashorat qiladi. Harakatning nafaqat fazoviy, balki vaqtinchalik xususiyatlarini ham hisobga olish uchun tarmoq kirishiga alohida niqoblar emas, balki bir nechta ketma-ket siluetlarning bloklari beriladi. Bundan tashqari, ikkala kichik vazifada tarmoq arxitekturasi tufayli ramkalar orasidagi o‘zgaruvchanlik hisobga olinadigan uch o‘lchovli tarmoqlardan foydalanilgan va ularda konvolyutsiyalar nafaqat fazoviy domenda, balki vaqtinchalik ham amalga oshiriladi.
Bundan tashqari, yuqorida aytib o‘tilgan mashhur yurish energiyasi tasviridan foydalanadigan turli usullar ham mavjud. Ularga asoslangan modellar eng oddiy yurish energiyasi tasviri tarmoqlaridan tortib, kichik tarmoq ya’ni odamni turli burchaklar uchun hisoblangan yurish energiya tasvirlaridan boshlab, yurish energiyasi tasvirlarining o‘xshashligi aniqlanadigan murakkabgacha bo‘lgan turli xil usullarni o‘z ichiga oladi [59, 60]. Energetik tasvirlardan olingan neyron tarmoqning yurish xususiyatlarini taqqoslash ham bugungi kunda jadal o‘rganilmoqda. Shuningdek boshqa tadqiqotlarda kontrastli yoki triplet yo‘qotishlarni optimallashtirish orqali o‘qitilgan ikki yoki uchta oqimga ega Siam arxitekturasidan foydalangan holda, qaysi yurish tasvirlari yaqin va bir odamga tegishli ekanligi, hamda qaysi tasvirlar turli odamlarga tegishli ekanligi aniqlanadi [61, 62]. Freym darajasidagi xususiyatlardan belgilangan darajadagi xususiyatlarni olish uchun turli agregatsiya funksiyalari va ularning kombinatsiyasini ko‘rib chiqilgan, shuningdek, ko‘p masshtabli ma’lumotlarni jamlash uchun neyron xususiyat xaritalarini turli masshtabdagi chiziqlarga bo‘luvchi “Gorizontal Piramida” xaritasi taqdim etilgan. Bundan tashqari, so‘nggi yillarda mashhur bo‘lgan arxitektura va yondashuvlarning aksariyati yurishni aniqlashda muvaffaqiyatli qo‘llanilmoqda. Masalan, tasvirni yaratish va namoyish qilishni o‘rganish uchun ishlatiladigan avtokoderlar identifikatsiyalash uchun ham qo‘llaniladi [64]. Ko‘rinishlar va olib boriladigan ob’yektlarning o‘zgaruvchanligi muammolarini turli xil avtokoderlar yordamida hal qilishda ularning har biri ko‘rinish transformatsiyasi modellariga o‘xshash o‘ziga xos transformatsiyani amalga oshiradi [43]. Shunday qilib, “kodlash” qatlamlari ketma-ketligidan o‘tib, tasvir tanib olish uchun qulayroq bo‘lgan ko‘rinishga keltiriladi. Shunga o‘xshash yondashuvlardan biri generativ raqib tarmoqlari (GAN) yordamida yurish energiyasi tasvirini “asosiy” ko‘rinishga aylantirish uchun lateral ko‘rish burchagi, sumka va palto kabi holatlar hisobga olinmaydi [65, 66].
Klassik konvolyutsion ya’ni oldinga tarqaladigan tarmoqlarga qo‘shimcha ravishda, takroriy neyron tarmoqlar yurishni aniqlash va boshqa video tahlil vazifalari uchun ishlatilishi mumkin. Takroriy arxitekturalar to‘g‘ridan – to‘g‘ri manba ma’lumotlaridan informatsion dinamik yurish xususiyatlarini hisoblash imkonini beradi. Masalan, LSTM qatlamlari dastlabki ramkalar va optik oqim xaritalari yoki siluet maskalaridan olingan xususiyatlarni birlashtirish uchun ishlatiladi [51, 67, 68]. Biroq, takroriy qatlamlarni nafaqat yashirin neyron tasvirlarga, balki oldindan o‘qitilgan aniq talqin qilinadigan xususiyatlarga qo‘llaydigan ko‘plab yondashuvlar mavjud. Shunday qilib, bir nechta usullar pozalarni baholash tarmog‘ini quradi, uning natijalari keyin LSTM qatlamiga beriladi. Bunday pozaga asoslangan yondashuvlar umumiy hisoblanadi, chunki ular inson qiyofasi shaklini hisobga olmaydi [69, 70, 71]. Italiyalik olimlar Battistone va Petrosino birgalikda takroriy neyron tarmog‘i yordamida tuzilgan ma’lumotlardan vaqtinchalik foydalanadigan grafik yondashuvni yaratishgan [72]. Bu esa video tasvirlarni vaqt rejimida raqamli tahlil qilish va qayta ishlash uchun samarali hisoblanadi.
Demak, tizimning tahlil va tanib olish jarayonlarini amalga oshirish qobiliyati ma’lum vaqt oralig‘idagi video tasvirning umumlashtirilgan funksiyasi
ketma – ketliklarini quyidagicha tasvirlanishi mumkin:
), (1.1)
bu yerda g1, g2,….gn~ sistemaning konkret masalalari.
Tizimning vazifasiga qarab (1.1) ifoda alohida komponentlarni o‘z ichiga oladi va ular bilan cheklanadi. O‘z navbatida, har bir muammo qandaydir funksiya bilan tavsiflanadi [11]. Misol uchun:
(1.2)
bu yerda x va y - ob’yektlarning spektral-energiya va fazoviy xususiyatlari;
- ob’yektlarni vizual idrok etishning o‘ziga xos xususiyatlarini va ularni hisobga oladigan ko‘rsatkich tahlili.
Muayyan tadqiqotlarda video tasvir tahlilini quyidagi mustaqil bosqichlarda amalga oshirilishi ko’rsatilgan [1, 16]:
1. Oldingi planni ajratib olish. Ushbu bosqichning vazifasi harakatlanuvchi ob’yektni aniqlashga o’xshash oldingi planga tegishli (masalan, videotasvirning hakatalanuvchi qismlari) piksellarni ajratib olish.
Shovqinga ega bo’lgan B(t) fon tasvirida fondan farqli bo’lgan yorqinlikka ega harakatlanuvchi ob’yekt paydo bo’lishini faraz qilaylik.
Agar b(i, j, t) t-vaqtda fonning (i, j) pikseli yorqinligi,
δ – harakatlanuvchi ob’yekt nuqtalarining va fonning yorqinligi orasidagi farqning qiymati bo’lsa, unda uchta gipotezani shakllantirish mumkin.
1-gipoteza: h(i,j,t)= b(i,j,t)+δ – ya’ni, (i, j) nuqta fonga nisbatan yorqinroq ob’yektga tegishli;
2-gipoteza: h(i,j,t) = b(i,j,t) – δ – ya’ni, (i, j) nuqta fonga nisbatan quyuqroq ob’yektga tegishli.
3-gipoteza: h(i,j,t)=b(i,j,t) – ya’ni, (i, j) nuqta fonga tegishli.
Harakatlanuvchi ob’yektlarni aniqlash turli xil algoritmlar yordamida amalga oshiriladi.
Oldingi plan qanchalik sifatli tanlansa, shunchalik barcha keyingi bosqichlar va butun videotahlil masalasining yechimlari aniqligi oshadi. Ushbu bosqichning murakkabligi kameraning apparat shovqinlari, yoritish o’zgarishi, fon va ob’yektning soyasi harakatlari kabi turli omillarining katta soni bilan asoslanadi.
2. Segmentatsiya jarayoni. Bunda tasvirni tashkil etuvchi ob’yektlarga bo‘lish jarayoni amalga oshiriladi. 1.9-rasmda oldingi plandagi tasvirni segmentatsiyalash jarayonining asosiy bosqichlari tasvirlangan.
1.9-rasm. Tasvirni segmentatsiyalash bosqichlari.
Olingan oldingi plandagi rasmdagi shovqinlarga (kamera shovqini, daraxt barglari harakati, yomg‘ir, qor, yorug‘lik porlashi va boshqalar) ega va tahlil uchun zarur bo’lmagan qismlarni olib tashlash uchun filtrlanadi. Buning uchun apparatli va dasturiy maxsus raqamli filtrlardan foydalaniladi.
Segmentatsiya masalasini yechish uchun ko’plab yondashuvlar mavjud [1, 16, 36]. Ularning aksariyati videotasvirdagi nuqtalarning xususiyatlari tahliliga asoslangan. Segmentatsiya jarayonida butun videokadrga nisbatan maydoni kichik bo’lgan oldingi plandagi ob’yektlar qayta ishlanishi hisobiga ishlov beriladigan ma’lumotlar hajmi kamayadi [36]. Yuqoridagilardan kelib chiqqan holda, segmentatsiyani quyidagi operator shaklida tasvirlash tavsiya etiladi:
(1.3)
bu yerda F(i,j) va s(i,j) mos ravishda oldingi plandagi va segmentlangan tasvirlarni aniqlashtiruvchi funksiyalar bo’lib,
(1.4)
bunda p – p - segmentning nomi (oldingi plandagi ob’yekt), – p -chi segmentning nuqtalari to‘plami.
Shunday qilib segmentatsiyaning vazifasi bitta harakatlanuvchi ob’yektga tegishli piksellarning bog‘langan guruhlarini ajratib olish va ularni segmentlarga birlashtirish. Segmentatsiyaning muammosi segmentlarni yig‘ish murakkabligidan iboratdir.
3. Sinflashtirish. Segmentlangan ob’yektlar apriori ma’lum sinflar bilan bu bosqichda 1.10-rasmdagidek korrelyatsiya qiladi [17]. Shakl va olingan segmentning parametrlari aniqlangan ob’yektning tasnifi muammosini hal qilish uchun ishlatilishi mumkin, ya’ni, aniqlangan ob’yektga tegishli u yoki bu sinfi qaraladi. Video ketma-ketlikning tasniflash orqali amalga oshirilishida bir yoki bir nechta ketma-ket kadrlaridan foydalanish mumkin. Bugungi kunda harakatlarni farqlash uchun ikkita asosiy yondashuv mavjud bo’lib ular ob’yektlar harakatiga asoslangan va kontur usullaridir. Birinchisi ob’yekt haqida ikki o‘lchovli fazoviy ma’lumotlardan foydalanish va ikkinchisi – ob’yektning xarakterli parametrlarini ma’lum vaqt ichida o‘zgartirishi nazarda tutiladi.
Belgilar
Segment
Segment belgilarini shakllantirish
Segment xususiyatlarini shakllantirish
Klass raqami
Segment parametrlarni hisoblash
1.10-rasm. Tanlangan segmentlarni tasniflash jarayoni.
Ob’yektlarning harakat traektoriyasini kuzatishda ramkalar ketma-ketligidagi ob’yektlar o‘rtasida bog‘lanishlar va jismlarning harakat traektoriyalari va ularning dinamik xususiyatlari o‘rnatiladi. Kuzatuv jarayonida kamera shovqini, sahna yoritilishi va shakllarini o‘zgartirish, bir nechta o‘xshash ob’yektlar, ob’yektlarning bir-birining ustiga tushishi, oldingi planni tanlashdagi noaniqliklar, segmentatsiyalar kabi ta’sir qiluvchi omillar mavjudligi aniqlandi. Harakatni kuzatishda muhim vazifa bu – izolyatsiya qilishda vaqt o‘tishi bilan o‘zgarmaydigan individual xususiyatlar va ularning parametrlari boshqariladigan ob’yektlarning har biriga xosligi o’rganiladi.
4. Ob’yektlarning harakatlarini tanib olish va tavsiflanishi. Ma’lumotlarga asoslanib ob’yektni tasniflash hamda uning harakat parametrlarini baholash, shuningdek ob’yekt harakati segmentning ekrandagi nisbiy holatini tahlil qilish mumkin. Buning uchun olingan parametrlar apriori ma’lumotlar bilan ob’yektning harakati va holati solishtiriladi. Eng oddiy tanib olish sxemasi 1.11-rasmda ko’rsatilgan bloklardan iborat [7,20, 35]. Asosiy transformatsiya bloki olingan ma’lumotlar xarakterli xususiyatlarni shakllantiradi va ushbu turdagi ob’yektlar uchun umumiy xususiyatlar olinadi. Xususiyatlarni tanlash tanib olish tizimlarini qurish bilan bog‘liq muhim vazifalaridan biri hisoblanadi. Olingan axborot va aprior ma’lumotlar asosida berilgan tanib olish algoritmi amalga oshiriladi va qaror qabul qilinadi.
1.11-rasm. Ob’yektni tanib olish sxemasi
Yuqorida sanab o‘tilgan vazifalar va bosqichlar qoida tariqasida real vaqtda hal qilinadi. Bunda vaqt rejimi algoritmlar murakkabligi bo‘yicha cheklovlar qo‘yadi. Shu bilan birga, kompleksning mavjudligi, normal bo’lmagan fon, ob’yekt haqida aprior ma’lumotlarning yo‘qligi, zaif kontrastlar va past signal-shovqin nisbati oddiy yechimlar olishga imkon bermaydi. Shu sababli qayta ishlashning samarali algoritmlarini ishlab chiqish va kelajakda foydalanish uchun mo‘ljallangan video tasvirlarni tahlil qilish va nazorat qilish tizimlari hali ham ilmiy va amaliy ahamiyatga ega vazifa hisoblanadi. Real vaqt tizimlari uchun video ketma-ketliklarni tahlil qilish usullari va algoritmlarini ishlab chiqish zarurati quyidagi ikkita sabablar bilan izohlanadi:
- tarixan alohida ajratilgan tasvirlarni qayta ishlash usullari keng tarqalgan, ammo harakatlanuvchi ob’yektlarni aniqlash, parametrlarini baholash va ularni kuzatib borish masalalarini yechish videotasvirlar ketma-ketligini tahlil qilishni talab etadi;
- ob’yektlarni aniqlash va ajratib olish, koordinatalar va ularning tezliklarni o‘lchash masalalari odatda ob’yektlar nuqtali va kichik o’lchovli bo’lgan faol radio va optik lokatsiyasi uchun an’anaviy hisoblanadi.
Video ketma-ketligini tahlil qilish tizimlaridan foydalanish imkoniyati bir vaqtning o‘zida bir nechta muammolarni hal qilish uchun real vaqt rejimi ham juda dolzarb, ayniqsa iqtisodiy cheklovlarni hisobga olgan holda har doim u yoki bu tarzda mavjud bo’ladi. Bundan tashqari quyi tizimlar bu tahdidlarni aniqlash ehtimolini sezilarli darajada oshirish imkonini beradi. Shunday qilib, real va kvazi-real vaqt rejimidagi video tasvirlarni tahlil qilishning asosiy bosqichlari quyidagicha ifodalanishi mumkin:
- kadrlarda video ketma-ketliklar kadrlarida harakat mavjudligini baholashning mavjud usullarini tahlil qilish (harakatni aniqlash);
- kadrdagi harakatlanuvchi (dinamik) ob’yektlarni segmentlashning ma’lum usullarini tahlil qilish va taqqoslash;
- harakatlanuvchi (dinamik) ob’yektlarni identifikatsiya qilish uchun informativ belgilarni ajratib olish va etalonlarni shakllantirish maqsadida sahnalarni tahlil qilishning sun’iy intellekt (shu jumladan noodatiy tabiatli) usullaridan foydalanish [7, 9, 10, 18, 21];
- ob’yektlarni tanib olish qism tizimini qurish va ularning dinamikasi va mumkin bo’lgan hodisalarni kuzatish uchun yetarli bo’lgan dastlabki (aprior) ma’lumotlarni shakllantirish;
- fazoviy - vaqtli bazisning aposterior ma’lumotlardan foydalangan holda va qabul qilingan tasvir fragmentlarini segmentlash modeliga asosan dinamik ob’yektlar (shu jumladan odamlar misolida) harakatining tabiatini baholash.
1.3-§. Inson harakati tasvirlarini intellektual tasniflash asosida shaxsni identifikatsiyalash masalasining qo’yilishi
Videoma’lumotni raqamli qayta ishlash uchun mavjud tizimlarda harakatlanuvchi ob’yektlarni tanib olish, belgilarini ajratib olish va shakllantirish muhim ahamiyatga ega. Shu boisdan hozirgi vaqtda avtomatlashtirilgan tanib olish sifatini ta’minlash videokuzatuv tizimlarining muhim maqsadlaridan biri bo’lib, unga erishish uchun o‘rganilayotgan muhitdagi vizual o‘zgarishlarni tahlil qilish va ularning mohiyatini tushunish masalalarini yechish alohida tadqiqotlarni talab qiladi. Tanib olishdan oldin videom’lumotni olish, uni mos shaklda taqdim etish va xususiyatlar to‘plamini ajratish, hamda keyin uni shakllantirish uchun izohlash amalga oshiriladi.
Ushbu taadqiqotning murakkabligi tanib olish va identifikatsiya qilish muammosini hal qilish uchun yetarli informativlikka ega bo‘lgan xususiyatlarni qidirish, ajratib olish va to’plamini (lug‘atini) shakllantirish zarurati bilan asoslanadi. Agar ushbu informativlik yetarli bo‘lmasa, qo‘shimcha funksiyalarni qidirish vazifasi paydo bo‘ladi.
Umuman olganda, harakatlanuvchi shaxsni aniqlash jarayoni 1.12-rasmda ko‘rsatilgan sxema bilan ifodalanishi mumkin.
1.12-rasm. Harakatlanuvchi shaxsni aniqlash jarayoni sxemasi
Kiruvchi ma’lumotni (videoma’lumotlarni) oldindan qayta ishlash shovqinni olib tashlash uchun video tasviri filtrlanadi. Harakatlanuvchi ob’yektni aniqlash video oqimidagi ob’yektni topish va kuzatishdan iborat. Shundan so‘ng tanib olish uchun asos bo’ladigan odamning silueti yoki konturini olish va xususiyatlarni ajratish jarayonlari amalga oshiriladi. Shovqinlarini filtrlash konvolyutsiya jarayoni yordamida amalga oshirilishi mumkinligini hisobga olib quyidagi ifoda hosil qilinadi [1, 2, 4]:
bu yerda I - tasvir (sahna, kadr);
Mf(m, n) - filtr parametrlarini o‘rnatuvchi mos o‘lchamdagi matritsa;
, - tuzatuvchi parametrlar.
Bir tomondan, bunday xususiyatlardan foydalanish yuqori darajadagi tanib olishni beradi, boshqa tomondan – barchasi ushbu xususiyatlarga asoslangan tizimlar ob’yektning tizim sensorlari bilan bevosita aloqasini talab qiladi [53].
Video tasvirni ikki o‘lchovli tekislikka proyeksiya qilishda siluetning ko‘rinishi nisbatan pozitsiyasiga qarab video detektor, yorug‘lik, shovqin va kamera o‘lchamlari sezilarli darajada farq qiladi. Bu identifikatsiya turining kamchiliklari sifatida ob’yektni maskirovkalash, jarrohlik oqibatlarini yashirish yoki imitatsiya qilish hisobiga noaniqliklar paydo bo’lishini ta’kidlash mumkin.
Bu kabi kamchiliklardan holi bo’lgan usullardan biri insonni termogrammasi orqali identifikatsiyalashdir. Termogramma (termal tasvir) infraqizil chastota diapazonida nurlanadigan issiqlik taqsimoti tasvirini aks etadi. U kameraning maxsus termal datchiklari qayd etadigan teri ostidagi qon tomirlaridan tashqi muhitga issiqlikni o’tkazish tufayli hosil bo’ladi.
Siluetni termogramma bo’yicha identifikatsiyasining quyidagi muhim afzalliklari mavjud [28, 29]:
1) noyoblik va tiklanuvchanlik: siluet termogrammasining yagonaligi haqidagi gipoteza ko'p yillik tajribaga asoslanadi, bu shuni ko'rsatadiki, hatto bir xil (bir xil) egizaklarda ham termogrammalar boshqacha;
2) maskirovkaga qarshi immunitet: termal tasvirlash tizimlari terining ostida joylashgan va soxtalashtirish mumkin bo‘lmagan yashirin mikro parametrlardan foydalanganligi sababli, termal tasvirni sun’iy maskirovka materiallari yoki jarrohlik aniqlanmasdan o'zgartirib bo'lmaydi;
3) yorug‘likka bog‘liq bo’lmaganligi: teridan issiqlik tarqalishi tashqi yorug‘lik manbalaridan bog‘liq bo’lmagan biologik xususiyatdir. Shuning uchun, termal sensorlar yordamida olingan siluetlarning tasvirlari atrof-muhit yorug‘ligiga nisbatan o‘zgarmas bo‘ladi. Bundan tashqari, tutun, chang, qum kabi salbiy atrof-muhit sharoitlari termogrammalarga deyarli ta’sir qilmaydi;
4) tashqi ko‘rinishni yoshga bog‘liq o‘zgarishlarga turg‘unligi: qon tomirlari tarmog‘i odamda tug‘ilishdan boshlab shakllanadi va, tasodifiy yaralar va jarohatlar, jarrohlik aralashuvi natijalarini hisobga olmaganda, yoshga nisbatan o‘zgarmaydi;
Termal tasvirni aniqlash tizimlarining kamchiliklari quyidagilarni o‘z ichiga oladi [28, 29]:
1) ob’yektning maxsus kiyimlari ta'siri: ayrim maxsus kiyimlani tayyorlashda ishlatiladigan materiallar issiqlik energiyasini o’tkazmaydi. Bunday materiallar ham infraqizil, ham yorug‘likning ko'rinadigan spektrida identifikatsiya uchun muammo tug‘diradi;
2) atrof-muhitdagi haroratning sezilarli o‘zgarishiga va inson tanasi haroratining o'zgarishiga sezgirlik (kasallik, stress, jismoniy faoliyat);
Ushbu muammolarni hal qilish va identifikatsiya qilishning aniqligini oshirish uchun bir nechta turli biometrik xususiyatlar bo’yicha (integrallashgan) tanib olish tizimidan foydalanish maqsadli. Bunda integratsiya jarayoni tufayli bir nechta tasvirlar bitta yangi tasvirga aylantiriladi [28].
Matematik jihatdan videotasvirning termogramma bilan integratsiyasi quyidagicha tavsiflanadi:
bu yerda – integrasiya jarayonida olingan tasvir,
– video tasvir,
– termogramma,
va – mos ravishda vizual va termal tasvirlar uchun vazn koeffitsientlari.
Gibrid tizim yuqoridagi ikkita tanib olish usulining afzalliklarini birlashtira oladi va uning ish natijalari ma’lumotlar bazasini to‘ldirish uchun ham ishlatilishi mumkin. Bunday tizimlarning afzalliklariga qaramay, shuni ta’kidlash kerakki, integral gibrid tizimlar yuqori hisoblash murakkabligi bilan ajralib turadi, bu esa tizimning tezkorligini pasaytiradi, ya’ni real vaqt rejimida ishlashni imkonsiz qiladi va qo‘shimcha hisoblash resurslaridan foydalanishni talab etadi.
Shunday qilib, fiziologik xususiyatlarga asoslangan tizimlar ishlatiladigan xususiyatlarning o‘ziga xosligi tufayli tanib olishini yuqori darajada bo’lishini ta’minlaydi, ammo video kuzatuv tizimidan sezilarli masofada harakatlanuvchi odamlarni aniqlash uchun ushbu tizimlardan foydalanish aniqlovchi qobilyati keskin pasayishi tufayli cheklangan. Shu sababli, harakatlanuvchi odamlarni tanib olish va aniqlash muammosini kompleks hal qilish uchun video tasvirlarning murakkab tuzilmasi hisoblanuvchi yurishni tanib olishga ko'proq e’tibor qaratilmoqda [42-70].
Shuningdek inson harakatining tahlil qilishga yondashuvi harakatlanuvchi odamlar o‘ziga xos xususiyatlarni (tasvirlarni) fazoviy-vaqtli tekislikda shakllantirishni kuzatish natijalariga asoslanadi [62]. Bu tasvirlar masalan, oddiy tizim modelining parametrlarini baholash uchun tahlil qilinadi, keyinchalik ular (masalan, vaqt oralig‘ida o‘rtacha olingandan keyin) muayyan shaxsni tanib olishda belgilar sifatida harakat qiladi. Quyida 1.13-rasmda frontal tekislikka parallel ravishda harakatlanayotgan inson harakati tasvirlari ketma-ketligi kub shaklidagi sxemada ko‘rsatilgan [62]. Bu “kub” video kadrlarni tasvirda ketma-ket qoplash orqali hosil bo‘ladi.
1.13-rasm. Inson yurishi traektoriyasi (“harakat kubi”).
Oyoqning to‘piq qismi darajasida olingan qatlami 1.13-rasmning pastki qismida ko‘rsatilganidek odam harakatning o‘ziga xos xususiyatini ya’ni oyoqlarning traektoriyalarini ko‘rsatadi.
Yurishdagi oyoqning to’piq darajasidagi harakat trayektoriyasiga qaraganda 1.14-rasmda ko’rsatilganidek inson bosh qismi harakat trayektoriyasi darajasida olingan qatlamidan farq qiladi .
1.14-rasm. Yurayotgan odamning boshi harakati trayektoriyasi.
Odamning chapdan o‘ngga harakat qilganda, odam oyoqlarining trayektoriyasi tasvirlari 1.15-rasmdagi ko’rinishda o’zgaradi [62].
1.15-rasm. Chapdan o‘ngga yurishda oyoq izlari trayektoriyasi
Yurish xususiyatlari biomexanika sohasida, tibbiyot hamda psixologiya sohalarida o‘rganilgan va o‘rganilishda davom etmoqda. 19-asr oxirida Edvard Maybrij harakatdagi odamlar va hayvonlarning fotografik yozuvlarini birinchi bo’lib shakllantirdi. Bundan tashqari ham shu davrda ko’plab yurish bo‘yicha tadqiqotlar aynan psixologiya nuqtai nazaridan olib borildi [60]. Ayrim tadqiqotlarda yurish noyob shaxsiy xususiyat sifatida taqdim etilgan va uning 24 ta komponentlari mavjud deb qaralganligini kuzatish mumkin.
Insonning xususiyatlarini tushunish, ta’kidlash va ulardan foydalanish bu sohalarda murakkab va istiqbolli vazifa bo’lib, real vaqt rejimida, shu jumladan harakatning xususiy belgilari bo’yicha tanib olish usullari va algoritmalrini amalga oshirishni talab qiladi. Yurishning boshqa harakatlarga nisbatan afzalliklari va biometrik xususiyatlariga quyidagilar kiradi [31]:
1) ob’yektdan sezilarli masofada aniqlash imkoniyati, hamda axborotning boshqa belgilari farqlanmaydigan kuzatuv joylari;
2) o‘rganilayotgan ob’yekt uchun ko‘rinmaslik;
3) video tasvir sifatini yaxshilashga hojat yo‘qligi;
4) niqoblashning murakkabligi.
Yaratilgan verbal modelda yurish orqali odamni aniqlash jarayoni ifodalanishi muhim ahamiyatga ega (1.16-rasm) [25]. Quyidagi modellarni qurish orqali vizual axborotni tahlil qilishning dastlabki bosqichi – aniqlash, video ketma-ketlikda harakatlanuvchi ob’yekt sifatida qaraladi. Bir nechta yondashuvlar ma’lum bo’lganligi bois harakatlanuvchi ob’yektni aniqlash uchun ular orasida biz quyidagilarni ajratib olamiz [32]:
1) Vaqt farqlaridan foydalanishga asoslangan usullar qo‘shni kadrlarni taqqoslashga asoslanadi. Ushbu usullar nisbiy soddalik va yuqori bo’lmagan hisoblash murakkabligida past shovqinlarga qarshilik qobilyati va yorug‘likdagi o‘zgarishlarga bog‘liqlik bilan tavsiflanadi;
2) O‘zgaruvchan optik oqimning xususiyatlariga asoslangan usullar. Bu yerda harakatlanayotgan kamera sharoitida harakatlanuvchi ob’yektlarni aniqlash uchun optik oqimidan foydalaniladi, biroq, bu usullarning aksariyati ancha murakkab
hisoblashlarni talab qiladi, jismoniy jihatdan yetarli real vaqtda kuzatishda amalga oshirish qiyin, hamda ixtisoslashtirilgan apparat vositalari talab qiladi;
1.16-rasm. Yurishning xarakterli belgilari bo‘yicha harakatlanuvchi shaxsni aniqlash modeli.
3) Modellashtirish va fonni olib tashlashga asoslangan usullar. Birinchi video kadrning ma’lumotlari eng oddiy model sifatida ishlatiladi. Uni keyingi kadrlardan ayirish harakatlanuvchi ob’yektni ajratib ko‘rsatishi mumkin. Fon modeli ma’lum vaqtdan keyin yangilanadi. Bu model oldingi fondagi o‘zgarishlarni aniqlashda fonni olib tashlash uchun ishlatiladi. Ko‘pchilik odamlarni aniqlash va kuzatish algoritmlari fonni ajratib olish usullariga asoslanadi;
4) Statistik usullar. Bu yerda harakatlanuvchi ob’yektni aniqlash jarayoni tahlilning segmentatsiya bosqichini ob’yekt silueti, konturlari va uning harakatlarini tanib olish uchun bajarishga imkon beradi. Inson harakatlar orqali boshqa ob’yektlarning tana shakli va tashqi ko‘rinishi bilan farq qiladi. Shunday qilib, harakatlanyaotgan odamlarni boshqa ob’yektlardab farqlash uchun statik (o‘lchamlar nisbati, maydon, perimetr) parametrlari tahlili bilan birga dinamik (harakat tezligi yoki chastotasi) parametrlari tahlilidan ham foydalanish mumkin. Segmentatsiyadan so‘ng, informative belgilarni ajratib olish amallari bajariladi. Yurishni tavsiflaydigan parametrlarni ratsional tanlash tanish algoritmining murakkabligini va aniq identifikatsiyalash ehtimolligi darajasini belgilaydi. Absolyut xatosiz tanib olishni ta’minlaydigan algoritmni ishlab chiqish mumkin emasligi ma’lumligi sababli aniq identifikatsiyalash ehtimolligini oshirishga intilish maqsadli hisoblanadi.
Inson yurishini aniqlash va tahlil qilish uchun ishlatiladigan keng tarqalgan yondashuv harakatlanuvchi tuzilmani seleksiyasi va harkatlanuvchi qomatning quyi qismini (oyoqlarga nisbatan) harakat bajarilishiga tekshirishni nazarda tutadi.
Algoritmni amalga oshirish inson qomati konturlarini ajrratib olishga mo’ljallangan va bunda konturlar inson qomati tarkibiga kiradigan cheklangan sohaning barcha qatlamlari darajasida tiklanadi.
Hosil qilingan konturlar inson modelining mumkin bo’lgan shakllaridan birini, masalan, identifikatsiyaning keyingi bosqichini amalga oshirish uchun ishlatiladigan skelet modelini tavsiflashda ishlatiladi.
Dastlabki shartlar sifatida quyidagilar qabul qilinadi:
- kamera - statsionar turida, harakatlanmaydi;
- nisbatan doimiy harakat tezligi;
- inson harakatlari videokameraga (video sensori) nisbatan frontal tekislikka parallel ravishda amalga oshiriladi;
- odam qo‘llarida yuk va boshqa narsalar mavjud emas.
Quyidagi 1.17-rasmda talklif qilingan algoritmning ishlash jarayonining tuzilmaviy sxemasi berilgan. Bunda algoritmning bosqichlari quyidagicha:
1) yurishni aniqlash, taxminiy modelni qurish;
2) to‘rtburchak bilan chegaralangan inson qomati konturini ajratib olish;
3) harakatlanuvchi qomat konturining aniq modelini hosil qilish, yurishni shablon asosida modellashtirish;
4) signal belgilari shablonga mos kelgan holatda ikkita signal tahlil qilinadi: chap oyoqning x - koordinatasi va o‘ng oyoqning x - koordinatasi;
5) tanib olish bosqichi k - yaqin qo’shnilar mezoni bo‘yicha bajarilishi mumkin: Evklid masofasining o‘lchovi ishlatiladi. Hosil qilingan yurishning V1, V2,...,Vm vektorlariga ega muayyan tasvirlar ketma-ketligini xotirada oldindan yozib qo’yilgan yurishning We1,We2,...,Wen etalonlari asosida tasniflash uchun har bir Vi vektor mustaqil ravishda tasniflanadi.
Bunda berilgan tahlil qilinayotgan videoketma-ketlikni konkret Wj sinfiga mansubligini aniqlash mojaritar prinspi bo’yicha amalga oshiriladi. Har bir vektor Evklid masofaning minimum mezoni bo’yicha tasniflanishi quyidagicha ifodalanadi:
1.17-rasm - Yurish orqali odamni tanib olish algoritmi bosqichlari.
Yurish belgilarini aniqlashning ko‘plab usullarini odatda uchta guruhga birlashtirish mumkin (1-jadval) [33]:
1-jadval
Dostları ilə paylaş: |