Universitatea babeş-bolyai cluj-napoca facultatea de matematicǎ Şi informaticǎ specializarea informatică



Yüklə 465,96 Kb.
səhifə11/14
tarix03.01.2019
ölçüsü465,96 Kb.
#89267
1   ...   6   7   8   9   10   11   12   13   14

Clasificarea solurilor agricole

Un alt domeniu care necesită aplicabilitatea unor algoritmi de învățare automată este acela al agriculturii, în vederea determinării unor șabloane reprezentative diverselor profile de soluri existente.

Acesta reprezintă un subiect dinamic, având în vedere structura sistemului, definirea claselor, precum și aplicabilitatea practică a problemei în sine, iar sistemele de clasificare moderne care îl abordează sunt construite astfel încât să permită tranziția ușoară între observațiile făcute în teren și predicția proprietăților solurilor.

Cel mai cunoscut sistem de clasificare al solurilor din America de Nord este Unified Soil Classification System (USCS), având trei mari categorii de clasificare: soluri cu textură grosieră (de exemplu: nisipuri și pietrișuri), soluri cu textură fină ( de exmplu: aluviuni și argile) și soluri organice.

Un grup de cercetători din Madanapalli, respectiv Tirupati au ales să realizeze un sistem asemănător, prin folosirea învățării Bayesiene. În urma unor sondaje de sol realizate în numeroase locații agricole din Chandragiri Mandal și Chittoor District, a fost obținut setul de date, acesta conținând diverse informații despre clasificarea profilelor de sol, precum și despre caracteristicile chimice ale acestora [18].

În urma unor experimente realizate care utilizau un set mic de date, clasificatorul naiv Bayes a reușit să clasifice toate instanțele corect. Acuratețea sistemului, precum și timpul de execuție au fost mult mai bune comparativ cu alte metode de învățare automată, precum rețelele Bayesiene.



    1. Procesarea limbajului natural

Sistemele actuale de recunoaștere a vorbirii nu sunt lipsite de erori, fapt pentru care este necesar să cunoaștem fiabilitatea fiecărui cuvânt ipoteză [16]. Această abordare ar putea fi văzută ca o problemă de recunoaștere convențională, în care fiecare cuvânt ipoteză să fie transformat într-un vector de caracteristici și clasificat ulterior ca fiind corect sau incorect. Deciziile importante care trebuie luate în conceperea unui astfel de sistem, țin de alegerea șablonului de recunoaștere și a modelului de clasificare.

Clasificatorul naiv Bayes a venit în rezolvarea acestei probleme, parametrii fiind estimați prin intermediul unor tehnici de netezire sofisticate preluate din modelarea limbajului statistic. Pentru a putea fi realizate experimentele necesare, au fost preluate mai multe conversații purtate în limba italiană de către recepționerul unui hotel.

Criteriul folosit pentru măsurarea performanței clasificatorului se numește Rata de încredere a erorii (CER) și constă în numărul de erori de clasificare divizat la numărul total de cuvinte recunoscute corect. Prin utilizarea șabloanelor de recunoaștere în mod individual, a fost obținută o rată de aproximativ16,4. Modelul naiv Bayes a avut rolul de a determina performanța clasificatorului, luând în considerare mai multe combinații de astfel de șabloane. În continuare, va fi prezentat un tabel care surprinde rezultatele obținute [16]:




Features

CER(%)

red.(%)

AcScore + WgTOTmax + WTSmax + Dur + AS + WgLMavg

13.1

37.6

WTSmax + Dur + AS + WgLMavg

13.6

35.2

Dur + AS + WgLMmax

14.4

31.4

AS + WgLMmax

14.5

31.0

AS + WgLMmax

16.4

21.9

Baseline

21.0

-
  1. APLICAȚIA PRACTICĂ




    1. Enunț

În capitolele anterioare au fost prezentate diverse metode de Învățare Bayesiană, alături de importanța și necesitatea folosirii lor în anumite domenii. Alături de o fundamentare matematică solidă și în ciuda simplității aparente, acești algoritmi de învățare automată sunt capabili să detetemine o reducere vizibilă a timpului de execuție, fără a influența însă foarte mult acuratețea sistemului.

În vederea demonstrării acestor caracteristici, vom lua în considerare contextul clasificării textuale. Ne dorim așadar, să concepem un sistem care să fie capabil să asigneze categorii predefinite unor documente de tip text noi. O astfel de abordare, care informatizează de altfel procesul de clasificare textuală pe baza raționamentului uman, este foarte utilă în ceea ce privește reducerea timpulul consumat, alături de eliminarea posibilelor erori apărute datorită oboselii.

De exemplu, știrile sunt de obicei clasificate în funcție de categoriile subiectelor, documentele academice sunt împărțite în domenii tehnice și sub-domenii ale acestora, fișele medicale ale pacienților din instituțiile medicale sunt deseori indexate pe baza unor aspecte reprezentative precum: tipurile de proceduri chirurgicale. De asemenea, filtrarea automată a email-urilor în categorii precum ham, spam este foarte des utilizată în prezent, având de asemenea un grad ridicat al importanței, în ceea ce privește ușurarea activităților noastre zilnice.

Având în vedere aceste lucruri, existența unui soft care să poată fi antrenat în vederea recunoașterii oricâtor categorii de documente, de ori câte ori, fără modificări ale codului sursă (adică o aplicație care să poată fi utilizată de către oricine indiferent de cunoștințele din domeniul informaticii) ar fi de un real folos, ajutându-ne să ne clasificăm documentele în ce categorii dorim, condiția fiind să dispunem de un set de documente relevante acestui scop, necesare procesului de antrenare.

Se va folosi deci, o metodă de învățare Bayesiană pentru rezolvarea acestei probleme, testându-se algoritmul final atât pentru clasificarea binară, cât și pentru clasificarea în mai mult de două categorii. Softul va putea fi folosit în orice domeniu, cât timp se pretează categorizării de natură textuală.




    1. Yüklə 465,96 Kb.

      Dostları ilə paylaş:
1   ...   6   7   8   9   10   11   12   13   14




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin