Anlamsal Ağ Projesi 3. Bölüm — Veriyi İnceliyoruz!

Geçen yazımızda “Öneri” sınıfımıza bir Örnek yani Instance oluşturmuştuk.

Titanik adlı Örnek’imiz

Bu yazımızda Ontoloji dosyamızı Not Defteri uygulamasıyla açarak içindeki veriyi inceleyeceğiz.

Ontoloji dosyanızı henüz kaydetmediyseniz Protege programında sırasıyla şunlara tıklayın

File → Save As → Turtle Syntax (Bunu seçip OK’e basın, normalde RDF(XML) seçeneği seçilidir.) → Save In (Masaüstünü bulun) → Save

Kaydettikten sonra masaüstünde oluşan Ontoloji dosyasını bulun.

Ontoloji Dosyamız

Böyle bir dosya olması lazım.

Sağ tıklayıp Birlikte Aç seçeneğine basın ve Internet Explorer veya Google Chrome gibi bir uygulamayı seçin.

Birlikte Aç seçeneğine ilk bastığınızda Internet Explorer’ı veya Google Chrome’u göremeyebilirsiniz, “Diğer Uygulamalar” seçeneğine tıklayarak Internet Explorer’ı bulabilirsiniz.

Dosyayı Internet Explorer veya başka bir tarayıcı ile açtığınızda şöyle bir şey göreceksiniz:

Ontolojiyi Internet Explorer’da açtık.

İşte Ontolojimiz aslında bu şekilde metin olarak tutulan bir veri.

Bu metnin kurallarına (syntax) tam hakimseniz, Protege’yi kullanmadan yani sadece Not Defterine yazı yazarak da Ontolojinizi geliştirebilirsiniz. Ve doğru yaparsanız Protege’den hiçbir eksiğiniz olmaz.

Ama bunu yapmak çok zahmetli olur, çok zamanınızı alır, muhtemelen yazarken hatalar yaparsınız ve çok zaman almasından dolayı yeterince fazla şeyi yaratamazsınız. (Titanik gibi binlerce şeyi elinizle yazmak haftalarınızı alır.)

Biz bu yüzden tüm Örnekleri(Instance) bir kod ile otomatik olarak Ontolojiye yükleyeceğiz. Kullanacağımız kodun adı RDFLib ve kod Python dilinde yazılmış.

Vikipedi’yi (Wikipedia) bilirsiniz. Verilerimizi onun verileri ile beslenmiş bir veri bankası olan DBpedia’dan yükleyeceğiz.

Ama şimdilik konumuza dönelim ve Titanik Örneğini ontolojimizin içinde bulmaya çalışalım. Internet Explorer ile dosyayı açtıktan sonra Ctrl ve F tuşlarına birlikte basarak yani Ctrl+F yaparak arama çubuğunu açın.

Arama Çubuğu kırmızı ile işaretlediğim yer. İnternet Explorerdaki site çubuğu ile karıştırmayın. :)

Arama çubuğuna Titanik (veya Örneğinizin adını ne koyduysanız) yazın.

Arama yaptım ve Internet Explorer en altta Titanik’i işaretledi.

Fark ettiyseniz, Titanik satırlarının hemen üstünde “Individuals” yazan bir başlık var.

Sayfanın en üstüne çıkarsanız da “Classes” adlı bir başlık görürsünüz.

İşte yarattığımız Tipler (Classes), Örnekler (Instances veya Individuals), ve Bağlar (Relations) farklı farklı yerlerde hep metin olarak tutuluyor. Bir sonraki yazımızda bir Bağın metin olarak nasıl tutulduğunu öğreneceğiz.

Neden bir Bağın metin olarak nasıl tutulduğunu bilmek önemli? Çünkü projemizi oluştururken öneri sistemimizi bu bağlara göre kodlayacağız, kodlarken de Bağların metin olarak nasıl yazıldığını bilmek durumundayız, yoksa size anlatacağım kodu anlayamayabilirsiniz.

Bağları incelediğimiz bir sonraki yazımız:

ml engineer @primer ai | sharing thoughts on computers and other geeky stuff

ml engineer @primer ai | sharing thoughts on computers and other geeky stuff