Əsas anlayışlar. Təbii dilin məzmun müxtəlifliyi olduqca genişdir. Belə ki, bu material qəzet və
jurnallarda çap edilmiş məqalələr, müxtəlif texniki sənədlər, hesabatlar, kitablar,
dissertasiyalar, məktublar, qanunvericilik aktları və s. ola bilər.
Mətni axtarış sistemlərində əsas informasiya vahidi sənəddir. Sənəd – bu və ya
digər təbii dildə təqdim edilən bitkin məzmunlu hüquqi mahiyyətdir.
Tammətnli axtarış sistemləri elektron sənədləri ilə, yəni kompüter yaddaşında
saxlanan və avtomatlaşdırılmış emal üçün hazır olan sənədlərlə işləyir. Bunlara ―sənədlər
kolleksiyası‖ deyilir. Mətni axtarış istifadəçi sorğuları ilə aktuallaşır. Sorğu axtarış kriterisi şəklində formalaşdırılır. Axtrış çoxaspektliliyinin vahidi sənəddir. Axtarış
kriterisi termlər yığımı (söz və ya sözbirləşməsi) və ya məntiqi operator simvolları (VƏ,
VƏ YA, DEYİL) ilə birləşdirilmiş termlər ola bilər. Sorğuya uyğun elektron sənədi
relevant sənəd,yəni, tanına bilən sənəd adlanır. Bu, sadə halda ―hə-yox‖ məntiqi ilə,
mürəkkəb sistemlərdə isə ―qeyri-səlis‖ məntiqlə reallaşdırılır. Sonuncu halda tanıma dərəcəsi mühüm rol oynayır. Bəzən sorğu kompüter tərəfindən səhv anlaşılır, lazım olan
sənəd əvəzinə başqa sənəd təqdim edilir. Bu hadisə informasiya küyü adlanır.
Axtarışın keyfiyyət göstəricisi tamlıq və dəqiqlikdir. Axtarışın tamlığı sorğulara
təqdim edilən relevant sənədlərin sayının yaddaşdakı relevant sənədlərin ümumi sayına
nisbətidir. Axtarışın dəqiqliyi sorğuya cavab verən relevant sənədlərin sayının sorğuya
cavab olacaq sənədlərin ümumi sayına nisbətidir.