SEMANTİK WEB TEKNOLOJİLERİ
Cumali YAŞAR*
(*) Çanakkale Onsekiz Mart Üniversitesi Enformatik Bölümü, Çanakkale
ÖZET
Web teknolojileri, ilk ortaya çıktığı 1990’ların başlarından itibaren kazanmış oldukları hızlı gelişim süreçlerini ivmelendirerek devam ettirmektedirler. Bu gelişim sayesinde gündelik yaşamımızı kolaylaştıran birçok yenilik insanoğlunun hizmetine sunulmaktadır. Bu yeniliklerin ilk sıralarını elektronik haberleşme, bankacılık ve internet üzerinden yapılan alışveriş işlemlerimiz almaktadır. Bu işlemler yardımıyla gündelik hayatımızda bize çok zaman kaybettiren işlemler daha kısa sürelerde gerçekleştirilmektedir. Gelişmelerin verilen bu örneklerle kısıtlı kalmayacağı çok açıktır. Gelecekte Web teknolojilerini daha anlamlı kılabilmek için birçok yeni çalışma yapılmaktadır. Bu yeniliklere önemli bir katkısı bulunacağına inanılan Semantik Web (Anlamsal Ağ) teknolojileriyle Web’ de bulunan yaklaşık 3 milyar statik sayfaya erişen 500 milyon üzerindeki kullanıcılara daha anlama dayalı hizmetler sunulması planlanmaktadır.
Anahtar Kelimeler: Semantik Web, Ontoloji, XML, HTML
1.1.Semantik Web
Semantik Web, akıllı verilerin işlenebildiği ağ şeklinde tanımlanabilir. Akıllı veri, uygulamalardan bağımsız oluşturulabilen, sınıflanabilen ve daha büyük bir bilgi ekosisteminin (ontoloji) bir parçası olarak tanımlanabilen bir sistem olarak ele alınabilir (Berners- Lee ve diğ, 2001). Semantik Web, World Wide Web Konsorsiyum (W3C) tarafından bir araya getirilen araştırma gruplarının katılımıyla oluşturulan yol haritasına göre geliştirilmeye devam edilmektedir.
Berners-Lee ve diğerleri (2001)’e göre Web’in gelecekte iki evreye sahip olacağı öngörülmektedir. Birinci evrede Web, diğer ağlar ile işbirlikçi bir araç haline getirilecektir. İkinci evrede ise Web, makineler tarafından anlaşılabilir ve işlenebilir bir şekle sokulacaktır. Şekil 1 -1 de Berners-Lee’nin görüşleri doğrultusunda Web’de geçen kavramlar görsel olarak açıklanmaktadır. Bunlar açık olarak Hypertext Markup Language (HTML) sayfalarının Web sunucularından alınmasının ötesinde bir işleme tabi tutulması gerektiğini ortaya koymaktadır.
Şekil 1 1 Berners-Lee’nin çizmiş olduğu Semantic Web
’deki bilgi bölümleri arasındaki, includes (içerir), describes (tanımlar) ve wrote (yazdı) gibi ilişkiler görülmektedir. Maalesef, kaynaklar arasındaki bu ilişkiler hali hazırda var olan Web üzerinden elde edilmemektedir. Böyle ilişkileri yakalayacak teknoloji, Kaynak Tanımlama Çerçevesi (Resorce Description Framework, RDF) olarak adlandırılmaktadır. ile ilgili anlaşılması gereken önemli bir nokta; şu anki Web’i oluşturan parçalar içerisinde yukarıdaki ilişkileri tam olmasa da oluşturabilecek ek meta veriler içermek zorunda olduğudur.
Klasik web ile Semantik web arasındaki temel fark Şekil 2 -2 ve karşılaştırılarak yapılabilir. Şekil 2 -2 de nesneler birbirlerine bağlanırken bir eylem ile niteliği pekiştirilmektedir. Nitelik eylemi için bir Semantik Web’i kullanılmıştır. Oysa de nesneler arasında sadece bir bağlantı vardır. Bağlantının eylemi belirtilmemiştir.
Şekil 2 2 Semantik Web in nesneler arasındaki bağlantı.
Şekil 2 3 Klasik Web
Veriler, kurumun kendi istediği veri tanımlamaları ile anlamlandırılabilmektedir. Semantik Web XML dili (Extensible Markup Language) ile veriyi tanımlarken, uygulamalardan verilere doğru bir güç kayması meydana getirmiştir. Bu yaklaşım, Semantik Web’i daha anlaşılır hale getirmektedir. Verilerin makineler tarafından işlenebilmesinin tek yolu veriyi daha akıllı hale getirmekten geçmektedir. Bütün Semantik Web teknolojileri, akıllı verileri oluşturmaya yönelik sistemli, Şekil 2 -4’ deki gibi, bir çizelge boyunca verinin ilerlemesini sağlarlar (Berners-Lee ve diğ, 2001).
Şekil 2 4 Akıllı veriye doğru ilerleme süreçleri.
Bu şekildeki dört aşamanın sırası en düşük anlamlı verilerden makinelerin sonuçlar çıkarabileceği, yeterince anlamlı verilere doğru ilerlemeyi göstermektedir. Bu dört aşamadan kısaca bahsetmek gerekirse:
1. Metin ve Veri Tabanları (XML öncesi): Çoğu verinin bir uygulamaya ait olduğu ilk aşamadır. Bu aşamada “akıllı veriler” uygulamalardadır. Veriler akıllı değildir.
2. Tek Bir Domain için XML Belgeleri: Verilerin özel bir alanda uygulama bağımsızlığına kavuştuğu aşamadır. Veri tek bir alandaki uygulamalar arasında hareket edebilecek kadar akıllıdır. Bunu şu şekilde örneklendirebiliriz. Emniyet otelde kalan müşterilerin verilerini tanımlama yaparak suç hareketi verisini ortaya çıkarabilir. Burada müşteri bilgilerini XML olarak tanımlayan otel uygulamaları ve emniyet birimlerinin kullandığı ortak veri tanımlama sitemi bu sorunların üstesinden gelebilmektedir.
3. Karışık Söz Dağarcığına Sahip Belgeler ve Sınıflamalar: Bu aşamada veri, çoklu alanlardan oluşturulabilir ve doğru biçimde hiyerarşik bir sınıflamaya yerleştirilebilir. Hatta verinin keşfedilmesi için sınıflama sistemi kullanılabilir. Sınıflandırma sistemi oluşturulurken, kategoriler arasındaki basit ilişkiler verileri birleştirmek için kullanılabilir. Bu nedenle bu aşamada veri kolayca keşfedilebilecek ve mantıklı olarak diğer verilerle birleştirilebilecek kadar akıllı durumdadır (Kim ve Seo, 1991).
4. Ontoloji ve Kurallar: Bu aşamada yeni veriler, mevcut verilerden mantık kurallarına göre ayrıştırılabilir durumdadır. Veriler, mantıksal hesaplamalar ve somut ilişkiler, karmaşık düzenlemelerde tanımlanabilecek kadar akıllıdır. Bu, daha atomik bir seviyede verinin birleştirilmesi ve yeniden birleştirilmesine ve verinin çok ince ayrıntılı analizinin yapılmasını sağlar (Berners-Lee ve diğ., 2001).
1.2.Semantik Web’e Neden İhtiyacımız Var?
Şu anki bilgi teknolojisi mimarilerinin karşılaştığı çok önemli birkaç sorunu çözebileceğinden Semantik Web’e ihtiyacımız vardır. Bu sorunların başında bilginin aşırı yüklenmesi, anlamsız içeriklerin oluşması gibi sorunları sayılabilir (Berners-Lee ve diğ., 2001). Farklı kaynaklardan toplanan bilgiler içerisinde formatı (yazı boyutu, paragraf arası boşluk v.b.) tanımlayan, ancak bir belgenin anlamıyla ilgili ipucu vermeyen HTML’de yazılmış bilgiler bulunmaktadır. Bu sorunlar için Semantik Web teknolojileri temelde veriyi tanımladıkları için çözüm olacaktır.
Çok farklı tipteki verileri orijinal formatlarında tek bir havuzda tutabilen XML, bilgiye hızlı, kolay ve ortamdan bağımsız olarak erişebilme imkânı sunar. Günlük yaşantımızda kullanmakta olduğumuz verilerin %80'ini oluşturan ve yapısal olmama özellikleri nedeniyle kendi bulundukları medya dışında veri özelliklerini koruyamayan (kelime işlem, elektronik tablo çıktıları, PDF dokümanları, ses, resim v.b.) farklı tipteki verilerin, uyumuna gerek duymadan hiyerarşik bir yapıda kullanılabilmelerine imkân tanımaktadır. Bu tanımlı verilerin hızlı bir şekilde sorgulanabilmelerini sağlamaktadır. Öncelikle veri transferinin kolaylaşmasını ve verinin içerik bilgisiyle saklanabilmesini hedefleyen XML, içerik ve sunum bilgilerini birbirinden ayırır. Bu özelliğiyle de HTML' den farklılaşır. Sonuç olarak XML için aşağıdaki temel özellikler sayılabilir:
-
XML yapılandırılmış belge ve verilerin evrensel formatıdır.
XML, Semantik Web’in söz dizimsel temel tabakasını oluşturmak için kullanılmaktadır. Semantik Web için özellikleri sağlayan tüm diğer teknolojiler, XML üzerinde yapılacaktır. XML üzerinde diğer Semantik Web teknolojilerinin (Kaynak Tanımlama Çerçevesi, RDF v.b.) tabakalandırılmasını sağlamak, temel bir ara işlem yapılabilirlik düzeyini garanti eder (Berners-Lee ve diğ., 2001).
XML’nin üzerine inşa edildiği teknolojiler Unicode karakterler ve Düzgün Kaynak Tanımlayıcılarıdır (Uniform Resource Identifier, URI). Unicode karakterler, XML‘nin uluslararası karakterleri kullanmasına izin verir. XML yeterli midir? Cevap verecek olursak yanıtımız maalesef hayırdır. Çünkü XML sadece sözdizimsel ara işlerin yapılabilmesini sağlar. Başka bir deyişle bir XML dosyasını paylaşmak içeriğe anlam kazandırır. Ancak sadece her iki taraf elaman adlarını tanıyıp anladığında bu durum gerçekleşir. Örneğin bir şeye 12$ ve siz de bu alanı 12$ olarak ifade ettiğinizi düşünelim. Bu iki alan arasındaki ilişkiyi ifade eden ontoloji gibi Semantik Web teknolojileri eklenmezse bu iki alanın aynı anlama geldiğinin makine tarafından anlaşılması imkânsızdır.
Semantik Web teknolojilerini oluşturan önemli öğeler Şekil 2 -5 de şematik olarak ifade edilmektedir. Bu teknolojileri barındıran sisteme Semantik Web Teknolojileri denir. Semantik Web teknolojileri günümüzde uygulamaya konulan WEB 2.0 denilen yapıyı oluşturmaktadır.
Şekil 2 5 Semantik Web teknolojisi kullanılarak arama yapan sistem
Semantik Web teknolojilerini hiyerarşisini göstermektedir. Bu teknolojinin tüm basamakları birbirleriyle bağlantılıdır. XML hariç hepsinin kendi içinde sınıf modeli mevcuttur. Bu teknolojilerden kısaca bahsetmek gerekirse; RDF yani Kaynak Açıklama Altyapısı (Resource Description Framework) Semantik Web için temel veri modelidir. Bu model, farklı değişim formatları olan RDF/XML, N-Triples, N3 ve Turtle için temel teşkil etmektedir. Semantik Web’in kalbini ise Ontoloji’ler oluşturmaktadır. Bu yüzden de OWL yani Web Ontoloji Dili, tanımlamalar ve veriler arasındaki ilişkileri kurabilmek için kullanılmaktadır (Çankaya, 2007).
Semantik Web’in de tıpkı bilim gibi bir gelişim süreci sonunda oluşacağı gözükmektedir. Yani, en başta mükemmel ve tam olarak işleyen bir sistem yapmak yerine temel işlevleri gerçekleştiren basit ve sağlam bir sistemle başlayarak daha sonra bu sistemi daha karmaşık bir yapıya kavuşturmak hedeflenmiştir. Öncelikle bilginin gösterimi için bir biçim olan HTML üretilmiş ve bu bilginin transferi için http protokolü yazılmıştır. Daha sonra bunların üstüne bu bilgiye ait yapısal bilgisini ve anlamını ekleyebilmek için XML ve RDF dilleri eklenmiştir (Berners-Lee ve diğ, 2001).Son aşamada ontoloji tanımlamalarını oluşturan, işaretleme dilleri (OIL, DAML+OIL, OWL) verilmektedir. Her aşamada baştaki çekirdek sisteme yeni özellikler ekleyerek sistem genişletilmektedir. Bununla beraber önceden eklenen her sistemde tıpkı son eklenen sistem gibi gelişmesine devam edecektir. Örneğin şu anda OWL Dili ile ilgili çalışmalar sürerken, RDF dili ile de ilgili çalışmalar sürmektedir. Hatta OWL “Candidate Recommendation” aşamasına gelmişken; RDF hala “Working Draft” aşamasındadır. Yani gelişme sürecinde daha geri aşamadadır. Sonuç olarak, Error: Reference source not found görüldüğü gibi Semantik Web’in hayata geçirilebilmesi için yaklaşık 20 yıllık bir sürenin geçmesi gerektiği tahmin edilmektedir.
Kaynakçalar
Akyokuş S., (2003). Bilişim Kurultayı. (15 Mart 2007), http:// http://www.akyokus.com/Presentations/
Berners-Lee, T., Hendler, J. and Lassila O. 2001. The Semantic Web: A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, 284 (5): 34-43.
Cardoso, J. and A. Sheth. 2003. Semantic e-Workflow Composition. Journal of Intelligent Information Systems 21(3): 191-225.
Cimiano, P., 2006. Ontology Learning and Population from Text, Algorithms, Evaluation and Applications. Springer Press Inc., Philipp. 347 p.
Çankaya, N. (1 Mart 2007). Semantik Web 3.0. Temmuz 2007, http://www.nuricankaya.com/
Davies, J., Fensel, D., Harmelen, F. 2003.Towards The Semantic Web. John Wiley&Sons, Canada. P: 10-31.
Gruber, Tom R. 1993. A translation approach to portable ontologies. Knowledge Acquisition, 5(2):199-220.
Hammond, B., A. Sheth, 2002. Semantic Enhancement Engine: A Modular Document Enhancement Platform for Semantic Applications over Heterogeneous Content. Real World Semantic Web Applications. lOS Press: p:29-49.
Kaon, 2001 KAON is an open-source ontology management infrastructure targeted for business applications, March 2007, http://kaon.semanticweb.org/
Kim, W. and J. Seo. 1991. Classifying schematic and data heterogeinity in multidatabase systems. IEEE Computer 24(12): 12-18.
Klein, M. and A. Bernstein (2001). Searching for Services on the Semantic Web Using Process Ontologies. International Semantic Web Working Symposium (SWWS), Stanford University, California, USA.
Maedche, A. and Staab, S. 2001. Ontology Learning for the Semantic Web. IEEE Intelligent Systems, 16 (2): 72–79.
Maedche, A., Staab, S. 2000. Semi-automatic Engineering of Ontologies from Text. In: Proceedings of the 12th International Conference on Software Engineering and Knowledge Engineering.
Owl (2007). OWL Web Ontology Language Reference, Retrived 2007, Recommendation, World Wide Web Consortium, http://www.w3.org/TR/owl-ref/. 2004.
Protégé, 2007, Protégé is a free, open source ontology editor and knowledge-base Framework, Retrived 2007, http://protege.stanford.edu/.
Smith, B. and Welty, C. 2001. Ontology: Towards a New Synthesis, Proc. Formal Ontology in Information Systems (FOIS 2001). ACM Press, New York. 3–9.
TBV, (1995). Türkiye Bilişim Vakfı. (15 Temmuz 2007)., http://www.tbv.org.tr.
W3C, (2007). The World Wide Web Consortium. (Mart 2007). http://www.w3.org/.
Wikipedia, (2003). Açık kaynak kodlu ansiklopedik sözlük. (Eylül 2007), http://tr.wikipedia.org.
Dostları ilə paylaş: |