Un motor eficient de căutare în e-commerce



Yüklə 367,98 Kb.
səhifə2/11
tarix02.08.2018
ölçüsü367,98 Kb.
#66424
1   2   3   4   5   6   7   8   9   10   11

Lista tabelelor


Tabel 2.1.1 Primele câteva iterații ale ecuației anterior prezentate asupra grafului (Langville și Meyer, 2006)..........................................................................................12

Tabel 2.1.2 Cota de piață la nivel mondial, motoare de căutare (StatCounter Global Stats, 2018)................................................................................................................15

Tabel 2.4.1 Comparație între funcțiile oferite pentru diferite tipuri de căutări în unele motoare de căutare.....................................................................................................22

Tabel 2.5.1 Tipuri de conținut web invizibil (Sherman și Price, 2001)..........................26

Tabel 3.4.1 Indicatori pentru a măsura fiabilitatea programului propus (Littlefair, 2018)..........................................................................................................................34

1. Introducere


Lucrarea de față, prin conținut și aplicația realizată, se încadrează în domeniul de mare actualitate al motoarelor de căutare. Alegerea temei este motivată și susținută de experiența de lucru de peste 10 ani în domeniu. Am putut identifica principalele probleme ale motoarelor de căutare din magazinele online (de exemplu, o persoană poate naviga pe site-ul Amazon și căuta o carte; unele rezultate, nerelevante, apar mai sus ca altele, relevante, și uneori nu se obțin prin căutări rezultatele dorite).

Motivația principală a lucrării este dată de experiența negativă avută pe principalele motoare de căutare pentru magazine online, fie ele din România sau pe plan internațional. Filtrele Amazon nu funcționează întotdeauna corect (din perspectiva noastră), iar căutarea de produse pe site uneori nu returnează lucrurile potrivite (o persoană poate căuta ceva și fie nu obține niciun fel de rezultate, fie obține rezultate nedorite). Iar aici este vorba de probleme pe site-ului unei companii gigant, care a avut în 2017 vânzări de 177,9 miliarde de dolari (Kim, 2018). Întreaga piață românească de e-commerce a fost estimată de GPeC (Gala Premiilor eCommerce, un eveniment major pentru piața de e-commerce din România) la 2,8 miliarde de euro (Radu, 2018), așa că, în mod firesc, magazinele online românești au avut bugete mai mici pentru investiția în motoare de căutare eficiente. Unele probleme sunt mai mari pe site-urile românești de comerț online. Am vrut să arătăm o modalitate practică prin care se pot face unele îmbunătățiri la un motor de căutare cu resurse puține. Vom prezenta în lucrare inclusiv idei noi, potențial utile de folosit pentru magazinele online în viitor.

În ceea ce privește gradul de noutate al lucrării – soluția propusă de noi vine ca element de noutate cu un grad de predicție asupra termenilor introduși de utilizator. Soluția există deja în motoare de căutare generaliste (Google, Bing, Yahoo!, Yandex, Baidu), sau în unele tastaturi pentru telefoanele mobile (SwiftKey pentru Android și iOS). Ea însă nu a fost implementată în magazinele online suficient de mult. Un exemplu foarte bun de predicție este cel oferit de tastatura de mobil a celor de la SwiftKey. Am dorit cu programul propus de noi să simulăm unele din funcționalitățile de predicție pentru un eventual motor de căutare pentru produsele din magazinele online. O mare parte din facilitățile prezentate sunt deja incluse în SwiftKey.

Scopul de la care am pornit lucrarea a fost atât de a implementa ideile pe care le am în domeniul căutării pentru motoarele de căutare, de a da un model practic și verificabil, cât și de a veni cu noi idei, ca posibile rute de prospectat pentru aplicații viitoare. Acestea au rămas în plan pur teoretic, urmând a fi implementate de alte entități, în încercarea de a îmbunătăți performanțele motoarelor de căutare din prezent.



Descrierea fiecărui capitol:

  • 2. Istoric și motivație - acest capitol are o abordare mai degrabă teoretică, am prezentat aspecte ce țin de părțile legate de teorie (istoric, motivație) ale unui motor de căutare pentru magazine online.

  • 2.1 Istoric al căutării informației - am prezentat în acest subcapitol evoluția tehnică, de la primele colecții de documente de pe pereții pictați ai peșterilor, mai departe pe papirus, pergament, hârtie și, în final, suport electronic. Am prezentat sistemele de organizare a informației, diferite soluții pentru a cataloga informațiile. Apoi au fost prezentate detalii despre cum primele motoare de căutare aveau dificultăți în sortarea informațiilor de pe Internet. S-a continuat cu doi algoritmi de sortare a datelor - PageRank (1998), motorul din spatele Google, și HITS (tot 1998), un algoritm folosit inițial de motorul de căutare Teoma. Am discutat în continuare despre RankBrain, unui sistem de inteligență artificială bazat pe machine learning pentru a genera rezultatele căutărilor. Au fost prezentate apoi cotele principalelor motoare de căutare, Google având peste 90% din piață, și principalele motoare de căutare având aproape 99% din piața motoarelor de căutare la nivel mondial. Am discutat și despre platforma de căutare din spatele YouTube și cea a Facebook.

  • 2.2 Modalitatea de funcționare a unui motor de căutare - în acest subcapitol am arătat pentru început unde pornesc căutările internauților (Amazon, alte motoare de căutare importante, retaileri). S-a prezentat și Teoria Setului Difuz (Fuzzy Set Theory), o ramură a logicii difuze, și rolul ei în căutări. Au fost descrise în continuare tipurile de căutări în metodele de obținere a informației - căutări de proximitate / logică difuză / căutări booleene / puterea dată unor termeni.

  • 2.3 Evaluarea eficienței unui motor de căutare - în subcapitolul 2.3 au fost prezentați diferiți KPI (indicatori cheie de performanță, key performance indicators) folosiți pentru evaluarea unui motor de căutare - procentul de utilizatori care folosesc căutarea / numărul de căutări per vizită / procentul de ieșiri din pagina rezultate căutări / numărul mediu de itemi pentru o vizită cu căutări vs. vizitele care nu au căutări / procentul căutărilor fără niciun rezultat / căutările cele mai frecvente / intenția de căutare.

  • 2.4 Starea actuală a domeniului – în începutul subcapitolului a fost prezentată o comparație între funcțiile oferite pentru diferite tipuri de căutări în unele motoare de căutare - abilitatea de a interpreta termenul scris greșit „Latpop” / filtrare în rezultate / sortare rezultate / abilitatea de a interpreta „procesor laptop” (inclusiv în engleză). Motoarele comparate au fost Google.com / Bing.com / Amazon.com / Target.com / eBay.com / olx.ro / eMAG.ro / Elefant.ro / F64.ro / evoMAG.ro. A fost descris apoi un studiu de uzabilitate din 2015 realizat de echipa de la Baymard Institute, în care au fost analizate cele mai importante 50 de site-uri de e-commerce de pe piața Statelor Unite.

  • 2.5 Limitările unui motor de căutare generalist - în subcapitolul acesta au fost expuse unele din limitările motoarelor de căutare generaliste (motoarele de căutare generaliste sunt motoare de tipul Google, Bing, Yahoo!, care caută în surse de date diverse, spre deosebire de cele specializate, cum sunt YouTube sau Amazon, care caută doar anumite tipuri de date). Există diferite tipuri de conținut care nu sunt indexabile de motoarele de căutare generaliste, și înțelegerea acestor lucruri ajută la alegerea unui motor de căutare pentru nevoi specifice. Capitolul și-a propus să arate că există anumite căutări pentru care motoarele de căutare generaliste (Google, Bing, Yahoo!, Yandex, Baidu etc.) nu sunt cele optime.

  • 2.6 Soluții potențiale pentru paginile de rezultate căutări fără niciun rezultat – în acest subcapitol am dat niște soluții pentru căutările care în mod tipic nu returnează niciun rezultat (de exemplu, cineva caută un produs care nu există pe site, sau tastează un cuvânt greșit, rezultând un cuvânt pentru care nu există rezultate în mod tipic). De asemenea, am prezentat concluziile unui studiu comparativ între mai multe motoare de căutare.

  • 2.7 Viitorul motoarelor de căutare ale magazinelor online - am prezentat aici primele încercări de aplicare a unor metode de machine learning asupra eficienței motoarelor de căutare. Am folosit pentru aceasta o resursă de pe site-ul Loop54, care este un SaaS (software ca serviciu, software as a service) folosit de diferite site-uri pentru a crește vânzările și ratele de conversie prin îmbunătățirea experienței vizitatorilor (CX, Customer eXperience).

  • 3. Soluția propusă - am scris în acest capitol despre soluția software propusă de către noi pentru rezolvarea unor părți din problemele identificate în partea teoretică.

  • 3.1 Scop și obiective - în subcapitol au fost descrise, în mod sumar, care a fost scopul și care au fost obiectivele cercetării noastre - se poate face relativ simplu un instrument care să folosească predicția rezultatelor posibile, și apoi să filtreze rezultatele obținute.

  • 3.2 Descrierea algoritmului - am descris în acest subcapitol, pas după pas, cum funcționează algoritmul meu. Se citește de la tastatură un text. Se verifică dacă programul poate prezice niște termeni alternativi: de exemplu, inversarea unor litere în cuvânt („latpop” vs. „laptop”) – au fost prezentate mai multe soluții de acest tip. O altă funcție a programului este de a căuta și sorta cuvintele în varianta finală introdusă de la tastatură în baza de date de laptopuri.

  • 3.3 Utilitatea metodei - în subcapitol am prezentat utilitatea demersului. În primul rând, funcția de auto-completare termeni, iar apoi, funcția de validare date. Mai departe, odată realizată procedura pe un set de date (programul a fost făcut să funcționeze pe o bază de date pentru laptop-uri), se pot imagina ușor soluții pentru alte tipuri de date de pe site-uri de tip e-commerce.

  • 3.4 Analiza implementării algoritmului - subcapitolul prezintă de ce a fost ales limbajul de programare C++ și paradigma de scriere cod programare funcțională, apoi procedura, pas cu pas, prin care a fost făcut programul. Ulterior, au fost prezentați câțiva indicatori folosiți pentru a măsura fiabilitatea software-ului, folosind un program numit CCCC. Au fost detaliați indicatorii folosiți, sumar.

  • 3.5 Posibilități de extindere a algoritmului - este un subcapitol în care am prezentat diferite posibile viitoare soluții prin care se poate perfecționa aplicația noastră.

  • Lucrarea se încheie cu un capitol de concluzii și bibliografia aferentă.



Yüklə 367,98 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin