Documentul este o unitate de text documentul este o unitate de text



Yüklə 527 b.
tarix25.12.2017
ölçüsü527 b.
#35937







documentul este o unitate de text.

  • documentul este o unitate de text.

  • - un articol din ziar, un capitol din carte, un paragraf, o pagină WEB ş.a.m.d.

  • colecţie este un set de documente.

  • cuvinte-cheie (key-words) prezintă unităţi lexicale după care se face selectarea documentelor.

  • - unităţile lexicale pot fi cuvintele, îmbinările de cuvinte.

  • interogarea (query) utilizatorului : informaţia prezentată de către utilizator motorului de căutare în baza căruia se execută selectarea documentelor.



documentul relevant unei interogări

  • documentul relevant unei interogări

  • similaritatea între interogare și document

  • sau între două documente



documente relevante interogărilor

  • documente relevante interogărilor



  • similaritatea între interogare și document

  • interogare: ce este prelucrarea limbajului natural

  • document:



  • similaritatea între interogare și document

  • sau între două documente









În IR interogarea utilizatorului şi documentele

  • În IR interogarea utilizatorului şi documentele

  • sunt prezentate ca

  • vectori (seturi) de caracteristici (features)

  • de fapt, cuvintele-cheie care apar

  • în interogare sau în document.



În IR interogarea utilizatorului şi documentele

  • În IR interogarea utilizatorului şi documentele

  • sunt prezentate ca

  • vectori (seturi) de caracteristici (features)

  • de fapt, cuvintele-cheie care apar

  • în interogare sau în document.

  • dj = ( t1,j, t2,j, t3,j, ... tN,j ) qk = ( t1,k, t2,k, t3,k, ... tN,k )

  • Atunci relevanţa documentului interogării

  • se calculează ca

  • similaritatea între document şi interogare:

  • sim (qk, dj ) =  ti,k × ti,j i=1,N



În IR interogarea utilizatorului şi documentele

  • În IR interogarea utilizatorului şi documentele

  • sunt prezentate ca

  • vectori (seturi) de caracteristici (features)

  • de fapt, cuvintele-cheie care apar

  • în interogare sau în document.

  • sim (qk, dj ) =  ti,k × ti,j i=1,N

















Indexarea booleana

  • Indexarea booleana



de în şi la a să cu nu pe se ce că mai o un din dar când ca el iar eu lui care sunt cum tot prin nici pentru mă este tu ei căci lor au le am te numai fi asa noi însă fost prea fără îi toti apoi sau ai face cel voi decât poate ea ne pot

  • de în şi la a să cu nu pe se ce că mai o un din dar când ca el iar eu lui care sunt cum tot prin nici pentru mă este tu ei căci lor au le am te numai fi asa noi însă fost prea fără îi toti apoi sau ai face cel voi decât poate ea ne pot



  • similaritatea între

  • interogare: speech and language processing

  • q = ( 1 1 1 )

  • și document doc1, doc2, doc3

  • sim (q, d) = d x q



  • similaritatea între

  • interogare: speech and language processing

  • q = ( 1 1 1 )

  • și document doc1, doc2, doc3

  • sim (q, d) = d x q















Opriți-vă copiii până-n 12 ani

  • Opriți-vă copiii până-n 12 ani

  • Opriți-vă , până-n - un cuvînt sau două?

  •  Rowan dă exemplu jocul Grand Theft Auto V 

  • impărțim Grand Theft Auto V în cuvinte?

  • Potrivit Ministerului Dezvoltării Regionale și Construcțiilor, ...  - impărțim?



Ce facem cu abrevieri?



Caut informația despre pește

  • Caut informația despre pește

  • caut

  • informatia

  • despre

  • peste

  • măi – mai, român – roman, in - în



U.S.,  3/12/91 

  • U.S.,  3/12/91 

  • U.S.,  Mar. 12, 1991.

  •   Europa, 3 Dec 1991



work

  • work

  • worked work

  • working

  • worker ???



lucra

  • lucra

  • lucrai

  • lucram

  • lucrară

  • lucrarăm

  • lucrarăți

  • lucrași



From Wikipedia, the free encyclopedia

  • From Wikipedia, the free encyclopedia

  • Washington commonly refers to:

  • George Washington (1732–1799), first president of the United States

  • Washington (state), United States

  • Washington, D.C., the capital of the United States

  • Washington (name), including a list of people with the given name or surname Washington

  • Washington may also refer to:

  • The Washington metropolitan area

  • A metonym for the Federal government of the United States



















Un proces de favorizare a vizibilității site-urilor web sau paginilor web în cadrul ordonării rezultatelor căutării în lista făcută de motorul de căutare

  • Un proces de favorizare a vizibilității site-urilor web sau paginilor web în cadrul ordonării rezultatelor căutării în lista făcută de motorul de căutare



Se spune că Google are peste 300 de factori în componența algoritmului de afișare a rezultatelor însă nici o companie ce dezvoltă motoarele de căutare nu dezvăluie algoritmele sale de indexare a paginilor web.

  • Se spune că Google are peste 300 de factori în componența algoritmului de afișare a rezultatelor însă nici o companie ce dezvoltă motoarele de căutare nu dezvăluie algoritmele sale de indexare a paginilor web.



On-site SEO*

  • On-site SEO*

  • optimizarea elementelor paginilor - meta data, titlul paginii, contentului, etc.

  • Off-site SEO*

  • optimizarea elementelor în afară paginilor – link-uri ce vin pe pagină, social media, etc.

  • Google Webmaster Tools

  • http://www.webdesignstuff.co.uk/fc103/











http://intime.dlsi.ua.es:8080/Smile/pages/

  • http://intime.dlsi.ua.es:8080/Smile/pages/





Căutarea semantică are scopul să îmbunătățească relevanța rezultatelor prin înțelegerea intenției utilizatorului și semnificația contextuală a termenilor întroduși analizînd apariția lor în spațiu de date căutate.

  • Căutarea semantică are scopul să îmbunătățească relevanța rezultatelor prin înțelegerea intenției utilizatorului și semnificația contextuală a termenilor întroduși analizînd apariția lor în spațiu de date căutate.









Bărcile pot tranversa mici curgeri de apă 

  • Bărcile pot tranversa mici curgeri de apă 











A new feature in Google's Inbox app can recognise the content of emails and tailor responses using natural language, without a human being having to do a thing.

  • A new feature in Google's Inbox app can recognise the content of emails and tailor responses using natural language, without a human being having to do a thing.

  • Machine learning is used to scan emails and understand if they need replying to or not, before creating three response options. An email asking about vacation plans, for example, could be replied to with "No plans yet", "I just sent them to you" or "I'm working on them".

  • The feature, dubbed Smart Reply, is only available in Google's Inbox app for Android and iOS. It has been designed for emails that can be answered with a short reply such as "I'll send it to you" or 'I don't, sorry'.

  • http://www.wired.co.uk/news/archive/2015-11/03/google-smart-reply-machine-learning-email



Google is not selling access to its deep learning engine. It’s open sourcing that engine, freely sharing the underlying code with the world at large. This software is called TensorFlow, and in literally giving the technology away, Google believes it can accelerate the evolution of AI. 

  • Google is not selling access to its deep learning engine. It’s open sourcing that engine, freely sharing the underlying code with the world at large. This software is called TensorFlow, and in literally giving the technology away, Google believes it can accelerate the evolution of AI. 





Yüklə 527 b.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin