Referat Qrup: m 1433 ae magistr: Bayramova Ceyran. Bakı- 2014 MÜNDƏRİcat giriş



Yüklə 37,93 Kb.
səhifə7/13
tarix10.01.2022
ölçüsü37,93 Kb.
#109391
növüReferat
1   2   3   4   5   6   7   8   9   10   ...   13
3. İstisnaların analizi. DATA MİNİNG prossesinin 3-cü mərhələsində əvvəlki mərhələlərdə tapılan qanunauyğunluqlardakı İstisnalar və ya anomaliyalar analiz edilir. Bu mərhələdə yerinə yetirilən əməliyyat sapmaların üzə çıxarılmasından ibarətdir. Bunun üçün sərbəst axtarış mərhələsində hesablanan normaları təyin etmək lazımdır.

Verilənlərin təmizlənməsi DATA MİNİNG texnologiyasının mühüm problemlərindən biri hesab olunur. Verilənlərin təmizlənməsi üçün mövcud olan vasitələri 3 sinfə ayırırlar: 1 .Verilənlərin analizi və yeniləşdirilməsi vasitələri;

  1. Xüsusi təmizləmə vasitələri: -spesifik sahənin təmizlənməsi; -təkrarlanmaların aradan qaldırılması;

  2. ETL instrumental vasitələri.

1-ci sinif vasitələrə verilənlərin faylyönlü vasitələri və DATA MİNİNG vasitələri daxildir. Verilənlərin fayl-yönlü təmizlənmə vasitələrinin tipik nümayəndəsi MİGRATİONARC- HİTECT kommersiya instrumentidir. Hər bir atribut üçün o, aşağıdakı metanverilənləri təyin edir: verilənlərin tipi, ölçüsü, elementlər çoxluğu, diskret qiymətlər, minimal və maksimal qiymətlər, itirilmiş qiymətlər və unikallıq. DATA MİNİNG vasitələrinə aid olan WİZRULE və DATAMİNİNG SUİTE proqramları atributlar və onların qiymətləri arasındakı münasibətləri üzə cıxarır və düzgünlük səviyyəsini hesablayırlar. WİZRULE üç cür qaydanı analiz edə bilir: riyazi düsturları, «əgər-onda» qaydasını və yazılış qaydasını. Verilənlərin yeniləşdirilməsi vasitələri, məsələn, İNTEGRİTY proqramı aşkarlanan şablonlardan və qaydalardan təmizləyici çevrilmələrin təyini və yerinə yetirilməsi üçün istifadə edir.

ETL instrumental vasitələri (Extracttion, Tranformation, Loading (Çıxarılma, Çevrilmə, Yüklənmə)) verilənlərin çevrilməsi və təmizlənməsi texnoloji prosesinin əsas hissəsini yerinə yetirirlər. ETL vasitələrinin çatışmazlığı ondan ibarətdir ki, metaverilənlər üçün özlərinin xüsusi formatlarından istifadə etdiklə- rindən, digər təmizləmə vasitələri ilə qarşılıqlı əlaqələr yaratmaq və onlarla birgə istifadə olunmaları mümkün olmur.

Bir sıra kommersiya vasitələri verilənlər anbarları üçün kompleks səviyyədə ETL prosesini təmin edirlər, məsələn, COPYMANAGER, DATASTAGE, EXTRACT, POWERMART, DECİSİONBASE, METASUİTE, WAREHOUSEADMİNSTRATOR və s. Verilənlər mənbələri və verilənlər anbarı üzrə bütün meta- verilənlərin həmahəng idarə olunması üçün onlar VBİS əsasında yaradılmış repozitorilərdən istifadə edirlər. Operativ verilənlər mənbələrindən verilənlər və sxemlər həm sistemin öz faylı və DMBS şlüzü vasitəsilə, həm də ODBC və EDA standart interfeyslər vasitəsilə çıxarılır. Verilənlərin çevrilməsi sadə qrafık interfeys vasitəsilə təyin olunur.




Yüklə 37,93 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   ...   13




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin