Universitatea babeş-bolyai cluj-napoca facultatea de matematicǎ Şi informaticǎ specializarea informatică


Proiectarea produselor alimentare



Yüklə 465,96 Kb.
səhifə10/14
tarix03.01.2019
ölçüsü465,96 Kb.
#89267
1   ...   6   7   8   9   10   11   12   13   14

Proiectarea produselor alimentare

Chiar dacă pare greu de crezut, domeniul învățării automate s-a extins atât de mult, încât a reușit să atragă atenția chiar și specialiștilor din industria alimentară. Competitivitatea ridicată, precum și lupta pentru supraviețuire într-un astfel de mediu aflat în continuă schimbare, a determinat necesitatea dezvoltării unui sistem artificial, capabil să facă față cerințelor diverse ale consumatorilor.

În mod normal, dezvoltarea unui produs alimentar nou, implică prelevarea anumitor informații din trei surse diferite: panouri senzoriale, panouri preferențiale și date instrumentale [5].

Panoul senzorial este reprezentat de un grup de aproximativ 10-20 de persoane atent selectate și antrenate pentru o periadă de mai multe luni. În urma unor discuții, sunt extrași între 8 și 20 de descriptori care sunt mai apoi folosiți în vederea descrierii mai multor varietăți de produse, selectate astfel încât să reprezinte o gama largă de arome, culori șamd. Aceste produse le sunt mai apoi oferite spre testare membrilor grupului, care pe baza propriilor simțuri precum și pe baza elementelor învățate vor completa panoul senzorial, prin atribuirea unei valori fiecărui descriptor.

Panoul preferențial este reprezentat de un grup de 50-500 de oameni necalificați, potențiali consumatori, aceștia fiind supuși unui test asemănător cu cel prezentat anterior, diferența constând în abordarea simplistă a descriptorilor, astfel încât să nu fie necesară o pregătire anterioară a subiecților.

Datele instrumentale se referă la caracteristici specifice produselor, putând include imagini digitale, precum și detalii despre compușii chimici folosiți.

După cum se poate observa, întregul proces de prelevare al acestor informații este unul costisitor atât din punct de vedere financiar, cât și din punct de vedere al timpului utilizat. De asemenea, subiectivitatea oamenilor determină o anumită inconsistență a descriptorilor.

Un studiu recent a arătat că 90% din cele aproximativ 13000 de produse noi care apar în fiecare an în US sunt destinate eșecului. Acest procent deloc scăzut a determinat apariția unui studiu, prin intermediul căruia să se poată proiecta un sistem care să ajute la conceperea ”produselor ideale”, realizându-se pe această cale o comparație între 3 tehnici utilizate: rețelele neuronale, clasificatorul naiv Bayes și rețelele Byesiene.

A fost utilizat un set de 20 de înregistrări, fiecare înregistrare reprezentând informațiile complete pentru un singur aliment (o valoare preferențială P1 reprezentând funcția target, și opt valori senzoriale S1...S8 care au fost folosite pentru predicție). Pentru determinarea performanțelor sistemului, s-a recurs la validarea încrucișată: 19 instanțe pentru antrenare și o instanță pentru testare. Acest experiment a fost repetat de 20 de ori, astfel încât fiecare posibilitate să fie luată în calcul și a fost obținut următorul tabel (între paranteze rotunde este prezentată deviația standard a fiecărei valori) [5]:





Acuratețe

Probabilitate comună înregistrată

Rețelele neuronale

0,796 (0,05)

N/A

Clasificatorul naiv Bayes

0.800 (0,00)

-123,08 (0,00)

Rețelele Bayesiene

0.800 (0,00)

-107,51 (1,03)

După cum se poate observa, rețelele neuronale, clasificatorul naiv Bayes, precum și rețelele Bayesiene dau rezultate similare când vine vorba de prezicerea preferințelor anumitor produse pe baza panourilor senzoriale.

Totuși, este de remarcat faptul că rețelele Bayesiene sunt construite astfel încât să poată modela întregul set de date și nu se bazează pe găsirea unei singure relații reprezentative, spre deosebire de celelalte două tehnici utilizate, care se axează concret pe construirea unui model care să evidențieze problema de față. Acestea aduc așadar un plus sistemului, întrucât pot fi construite dintr-un set de date modest, cu sau fără cunoștințe anterioare, fiind totuși scalabile datorită faptului că permit optimizare locală [5].

    1. Clasificarea imaginilor satelitare

La Goddard Earth Sciences Distributed Active Archive Center (GES DAAC) sunt încărcate zilnic aproximativ un Tb de imagini preluate de la sateliți, acestea fiind ulterior distribuite mai multor centre de cercetare și analiză, în funcție de domeniul vizat [11].

Dificultatea apare însă în momentul în care se dorește găsirea acelor imagini care corespund unui scop concret. Volumul de date este foarte mare, minimizând posibilitatea de identificare a informațiilor relevante dintr-un anumit punct de vedere. De asemenea, datorită resurselor limitate, doar un număr mic de imagini ar putea fi stocate pe disk în vederea accesului direct.

Deși există deja diverși algoritmi științifici de prelucrare a informațiilor utile din surse directe (pământ, oceane, atmosferă), timpul necesar obținerii unor rezultate variază de la 30 de minute până la câteva zile, fapt pentru care, de cele mai multe ori, informațiile neclasificate ajung să fie folosite și chiar șterse din memorie. Astfel a apărut necesitatea folosirii unor algoritmi de învățare automată, scopul fiind acela de a reduce atât timpul de procesare, cât și cerințele de calcul, astfel încât estimările realizate să poată fi integrate în fluxul de date, iar deciziile să poată fi luate în timp util.

Aplicarea metodelor de învățare automată în cadrul aplicațiilor științifice poate fi dificilă, dacă ne gândim la constrângerile de discretizare, la inexistența bazelor fizice, precum și la construirea setului de antrenament. Totuși, aceste dificultăți se diminuează când vine vorba despre suportul decizional. De cele mai multe ori este suficient să știm dacă un anumit atribut depășește un prag anume, valoarea concretă a acestuia fiind mai puțin importantă. De asemenea, un alt avantaj al utilizării acestor metode este constituit de timpul relativ scurt de execuție, odată ce sistemul a fost antrenat.

În vederea conceperii unui sistem care să satisfacă cerințele prezentate anterior, un grup de cercetători de la NASA au ales clasificatorul naiv Bayes, oferindu-i ca date de antrenament rezultatele obținute de la algoritmii științifici existenți în momentul respectiv, dar care nu erau eficienți din punct de vedere al timpului de rulare. Instanțele urmau să fie clasificate în categorii precum: nori, zăpadă, lumină solară, apă puțin adâncă, apă adâncă, foc, ghețari, deșert și pământ.

Procesul de antrenare al acestui algoritm consta în estimarea funcției de distribuție a probabilităților pe baza unor histograme corespunzătoare diferitelor clase de pixeli, iar determinarea probabilităților condiționale era influențată atât de sezon, cât și de poziționarea geografică [11].

În urma evaluării sistemului, clasificatorul naiv Bayes s-a dovedit a fi mai puțin eficient decât algoritmii tradiționali, discrepanțele dintre cele două abordări fiind totuși suficient de mici astfel încât să se poată permite utilizarea clasificatorului pentru gestionarea informațiilor. În ceea ce privește însă timpul de execuție, îmbunătățirile au fost considerabile.

Conceptual simplu și robust în practică acest algoritm a demonstrat încă o dată că poate fi scalabil la mai multe domenii, necesitând intervenție minimă din partea utilizatorului. În plus, rezultatul nu este reprezentat de o simplă clasificare nominală, incluzând de asemenea și câte o probabilitate atribuită fiecărei clase.


    1. Yüklə 465,96 Kb.

      Dostları ilə paylaş:
1   ...   6   7   8   9   10   11   12   13   14




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin