7. Bashorat qilish (Prediction) Kredit olish uchun ariza beruvchilardan biri qarzni to'lashda aybdorligini hisoblash uchun bankning misolini ko'rib chiqing. Nosozlik ehtimolini hisoblash uchun tizim avval ma'lum guruhlarda mavjud ma'lumotlarni tasniflashi kerak. Bu tahlilchilar tomonidan belgilangan qoidalar to'plami bilan tavsiflanadi. Tasniflashni amalga oshirgandan so'ng, ehtiyojga qarab, ehtimollikni hisoblashimiz mumkin. Ushbu ehtimoliy hisoblashlar turli maqsadlar uchun barcha sektorlar bo'yicha hisoblashi mumkinHozirgi bashorat eng mashina o'rganish algoritmlaridan biridir. Chakana savdoni misol qilib olaylik, ilgari biz o'tgan oy / yil / 5-yil / Diwali / Rojdestvo haqidagi hisobot kabi ma'lumotlarga ega bo'ldik. Ushbu turdagi hisobot tarixiy hisobot deb nomlanadi. Ammo hozirgi vaqtda mening biznesim kelgusi oy / yil / Diwali va boshqalar nima bo'lishimni aniqlashga ko'proq qiziqadi.Shunday qilib, biznes kerakli qarorni (xaridlar, zaxiralar va boshqalar bilan bog'liq) o'z vaqtida qabul qilishi mumkin.
8. Ekstraktsiya (Extraction) Informatsion ekstratsiya (Information Extraction IE) - bu mashinalarni o'qitishning yana bir qo'llanmasi. Bu struktura qilinmagan ma'lumotlardan tarkibiy ma'lumotlarni olish jarayoni. Masalan veb-sahifalar, maqolalar, bloglar, biznes hisobotlari va elektron pochta xabarlari. Nisbatan ma'lumotlar bazasi ma'lumot olish natijasida hosil bo'lgan ma'lumotlarni saqlab turadi. Ekstraksiya jarayoni hujjatlar to'plami sifatida kiritishni talab qiladi va tarkibiy ma'lumotlarni ishlab chiqaradi. Ushbu natija relelatsion ma'lumotlar bazasidagi Excel jadvali va jadval kabi umumlashtirilgan shaklda mavjud. Hozirgi vaqtda ekstraktsiya katta ma'lumot sanoatida muhim kalitga aylanmoqda. Ma'lumki, katta hajmdagi ma'lumotlar ishlab chiqarilmoqda, ularning aksariyati struktura qilinmagan. Birinchi muhim vazifa - bu tuzilmagan ma'lumotlarga ishlov berish. Endilikda RDBMS-da saqlanishi mumkin bo'lgan tuzilishga ega bo'lmagan ma'lumotlarni ma'lum bir naqsh asosida tuzilgan shaklga o'tkazish.Bundan tashqari, hozirgi kunlarda ma'lumotlarni yig'ish mexanizmi ham o'zgarmoqda. Ilgari biz ma'lumotni End-of-Day (EOD) kabi to'plamlarda yig'ardik, ammo endi biznes ma'lumotni u yaratilishi bilanoq, ya'ni real vaqtda istaydi.