dağıtık ağlar: 14 saniyede Kongre Kütüphanesi’nin içeriğini bir yerden bir yere iletmek mümkün
Bilgi işleme ortamları
beyin, bilgisayarlar, insanlardan daha “akıllı” makineler, “yapay beyin”
Ekonomi: Kıt kaynakların tahsisi
Ekonomi: Kıt kaynakların tahsisi
“. . . Bilginin yeni rolü tam olarak değerlendirilmeden, zenginliğin rolü konusundaki hiçbir tahmin tutarlı olmayacaktır.”
“. . . İşleri hızlandırarak zamanla ilişkimizi değiştirdiğimizde, bilginin bir bölümünü kaçınılmaz bir şekilde eskitiyoruz. Dolayısıyla, etrafımızda sürüklediğimiz eski bilgi miktarını artırıyoruz.”
Bilgi düzenleme ve bilgi erişim de dil kullanımının özel bir türü
Bilgi düzenleme ve bilgi erişim de dil kullanımının özel bir türü
Dilbilimsel yapılar
Sözdağarı
Anlambilim
Sözdizimi
Kataloglama, sınıflama, dizinleme
Sınıflama dile dayanıyor
Sınıflama dile dayanıyor
Dil belirsizlikler içeriyor
Kavramlar üzerinde anlaşma sağlamak zor
Domates “meyve” mi “sebze” mi?
“Alternatif tıp” hangi konuya girer?
Felsefe?
Din?
Sağlık ve tıp?
4000 yıldan fazla bir zamandır insanoğlu bilgiyi düzenleme derdinde.
4000 yıldan fazla bir zamandır insanoğlu bilgiyi düzenleme derdinde.
Neden?
Daha sonradan erişmek ve kullanabilmek için
En tipik örnek?
Bir kitabın içindekiler sayfası
Zaman içinde üretilen bilgi miktarı üç-beş kitabın çok ötesine geçecek kadar arttığı için depolanan/biriktirilen/yığılan bilgiye daha hızlı ulaşmak için daha özel veri yapıları inşa etme zorunluluğu ortaya çıktı.
Bu yapıların en eski ve bilinen örneklerinden biri de indeks/dizinler.
Dizin; depolanan bilgi ya da belgelerle ilgili olacak, onları en hızlı erişim için tanımlayabilecek biçimde seçilmiş sözcük ya da kavramlar listesi.
Dizin; depolanan bilgi ya da belgelerle ilgili olacak, onları en hızlı erişim için tanımlayabilecek biçimde seçilmiş sözcük ya da kavramlar listesi.
Temel amaç bilgiye daha hızlı ulaşmak.
Hangi türde olursa olsun dizinler tüm modern bilgi erişim sistemlerinin temelini oluşturur.
“Sorgu işleme” (query processing) sürecinin hızlandırılmasını ve veriye daha hızlı erişmeyi sağlarlar.
Yüzyıllar boyunca dizinler otomatik sistemler yerine insan eliyle üretildi. (Hala insan eliyle dizinlenen dermeler var)
Yüzyıllar boyunca dizinler otomatik sistemler yerine insan eliyle üretildi. (Hala insan eliyle dizinlenen dermeler var)
Nasıl?
Metin/kaynak içindeki önemli sözcük ve kavramların belirlenmesi
Hiyerarşik kategorizasyon/düzenleme
Kavramsal hiyerarşiye nasıl karar verilecek?: “Domates meyve mi sebze mi?”
Sınıflama sistemleri
Thesaurus’lar
Günümüzde modern bilgisayar sistemleri çok geniş çaplı dizinleri otomatik olarak üretmeye imkan tanıyor.
Günümüzde modern bilgisayar sistemleri çok geniş çaplı dizinleri otomatik olarak üretmeye imkan tanıyor.
Otomatik dizinler “bilgi erişim” sorununa yeni bir bakış açısı getiriyor:
Bilgisayar odaklı bilgi erişim sorunları
İnsan odaklı bilgi erişim sorunları
Otomatik üretilen dizinlerin etkinliği (kelimelerin geçiş sıklığı, kullanıcı geri bildiriminin dizin terimlerinin ağırlıklandırılmasına etkisi, bu bilgilerin nasıl elde edilip derleneceği, sistem tasarımı ..)
Otomatik üretilen dizinlerin etkinliği (kelimelerin geçiş sıklığı, kullanıcı geri bildiriminin dizin terimlerinin ağırlıklandırılmasına etkisi, bu bilgilerin nasıl elde edilip derleneceği, sistem tasarımı ..)
Kullanıcı sorgularını (user queries) en doğru şekilde “anlama” ve işleme (processing)
Sıralama algoritmaları (ranking algorithms) geliştirerek en etkin sonuç listesini getirme
Etkin sıralama algoritmalarının yararı?
Sonuç listesinin niteliğini artırıyor.
Kullanıcıların bilgi arama davranışlarındaki çeşitlilik
Kullanıcıların bilgi arama davranışlarındaki çeşitlilik
Farklı tür kullanıcıların bilgi ihtiyaçlarını anlamadaki zorluklar
Mümkün olduğunca “doğal dil” e yakın ve kullanıcı algısına uygun, “öğrenebilen” sistemler geliştirebilme
“Sözlük” kelimesinin anlamını bilmeyen bir kişinin içinde bulunduğu durum…?
“Sözlük” kelimesinin anlamını bilmeyen bir kişinin içinde bulunduğu durum…?
“Hakkında bilgi bulmak için bilmediğin bir şeyi tanımlama gereği” (Hjerrpe)
Baeza-Yates, R. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. (Tam metin)
Baeza-Yates, R. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. (Tam metin)
Tonta, Y., Bitirim, Y. ve Sever, H. (2002). Türkçe Arama Motorlarında Performans Değerlendirme. (Tam metin)
Manning, C.D., Raghavan, P. and Schütze, H. (2009). Introduction to Information Retrieval. (Tam metin)