Türkçe İçin Doğal Dil İşleme  Çalışmaları – 1

(Biçimbilimsel ve Morfolojik Analize Çözüm Önerileri)

 

Dil yeteneği, insan beyninin nasıl çalıştığına ışık tutan insan türüne özgü tek özellik olduğu için dilbilim bilişsel bilimlerde önemli bir yer tutar.

 

Dilin bilgisayar ortamında modeli oluşturulabilirse iletişim için oldukça yararlı bir araç elde edilmiş olur. Doğal Dil İşleme (DDİ), ana işlevi bir doğal dili çözümleme, anlama, yorumlama ve üretme olan bilgisayar sistemlerinin tasarımını ve gerçekleştirilmesini konu alan bir mühendislik alanıdır. Doğal dil işleme, yapay zeka (bilgi gösterimi, planlama, akıl yürütme, vb.) biçimsel diller kuramı (dil çözümleme), kuramsal dilbilim ve bilgisayar destekli dilbilim, bilişsel psikoloji gibi çok değişik alanlarda geliştirilmiş kuram, yöntem ve teknolojileri bir araya getirir. 1950 ve 1960’larda yapay zekanın küçük bir alt alanı olarak görülen bu konu, araştırmacıların ve gerçekleştirilen uygulamaların elde ettiği başarılar sonunda artık bilgisayar bilimlerinin temel bir disiplini olarak kabul edilmektedir. DDİ alanındaki temel araştırmalar şunlar olmuştur:

 

- Doğal dillerin işlev ve yapısının daha iyi anlaşılması;

 

- Bilgisayarlar ile insanlar arasındaki arabirim olarak doğal dil kullanmak ve bu şekilde bilgisayarlar ile insanlar arasındaki iletişimi kolaylaştırmak;

 

- Bilgisayar ile dil çevirisi yapmak.

 

Japonya, İngiltere, ABD, Almanya, Hollanda, Fransa gibi ülkelerde bu teknolojiyi kullanan çeşitli yazılımlar ve bilgisayar sistemleri kullanıcıların hizmetine sunulmuştur. Bilim ve iş alanında her yerde geçerli bir dil olması açısından İngilizce bu gibi ürünlerin en fazla uygulandığı dil olmuştur. Ancak bu teknolojileri Türkçe’ye uygulamak ve Türkçe’de bir araştırma altyapısı oluşturmak için daha çok çalışma yapılması gerekmektedir. İngilizce için kullanılan kurallar ve algoritmaların aynen Türkçe’ye taşınması  dillerin yapısının farklılığından dolayı mümkün değildir. Dolayısıyla Türkçe için yapılacak çalışmalar ya Türk dilbilimciler ve bilgisayar bilimciler tarafından ya da Türkçe’yi çok iyi bilen diğer ülke bilim adamları tarafından yapılabilir.

 

DDİ, önümüzdeki yıllarda insanların bilgisayarlar ile etkileşimlerinde temel bir takım değişiklikler getirmeye aday teknolojilerden biridir. Bilgisayarlar ile doğal dil işleme çok değişik alanlarda uygulama alanı bulmaktadır. Örneğin çoğumuzun kullandığı kelime işlemci gibi programlarda bulunan hatalı sözcüklerin bulunması ve düzeltilmesi işlevi bu tip uygulamaların en basitlerinden biridir. Daha karmaşık bir uygulama olarak bir veri tabanına SQL ile değil,  örneğin doğal dil ile sorgu yöneltmeyi ve sistemin bunu çözümleyerek bir SQL sorgusuna dönüştürüp işledikten sonra sonuçları kullanıcıya vermesini düşünülebilir.

 

Bilgisayarla dilden dile yarı otomatik metin çevirisi yapmak, dil öğretmek, tek veya çok dilli sözcüklere erişmek , doğal dilde cümle ve metin üretmek gibi uygulamaları doğal dil işlemenin en önemli örnekleri olarak görülebilir. Çok daha genel bir bakış açısı ile de konuşma tanıma ve konuşma üretmeyi de kullandıkları temel teknolojiler farklı olsa da bu alan içinde görmek mümkündür. Bugün Japonya'da 5. nesil bilgisayarlar üzerinde çalışılmaktadır ki bunlar klavyesiz bilgisayarlardır; yani buna ses yardımıyla bilgisayarın kontrolü de denebilir. Bu tür bilgisayarlar insan gibi NP problemleri çözebilir. DDİ, sabit algoritmalar içermediğinden, belirsizliklere sahip olduğundan NP problemdir. Bu çalışmalarda bilgisayardan istenen bir problemi bilgisayarın algılaması, istenenleri kaydedip problemin çözümüne ilişkin programı kendisinin yazması gibi işlemler de düşünülmektedir.

 

Yurt dışında yapılan  çalışmalardan en önemlilerinden biri de cümlelerin anlamsal analizinin yapılmasıdır. Anlamsal analizdeki amaç bilgi tabanının bilgisayar tarafından yorumlanabilir bir biçime dönüştürülmesidir. Bu çalışmalar belli düzeyde başarı sağlamış ve bilgisayarın anlaması gerçeklenebilmiştir. Gelişmiş ülkelerde bu çalışmalar özürlülerin eğitiminde, ilk ve ortaöğretim okullarında, ticarette, alışverişte, bankacılık işlemlerinin otomatikleştirilmesinde, daha bir çok yerde uygulama alanına taşınmış ve artık hayatın parçası durumuna gelmişlerdir. Örneğin büyük alışveriş merkezlerinde belirli yerlere konulan bilgisayarlar yardımıyla müşterilerin malın yerini, fiyatını, vb. gibi özelliklerini öğrenmelerinde bu tür çalışmalar kullanılmaktadır. Buralarda insanlar kendi konuştukları dilde karşılarında bir insanla konuşurmuş gibi bilgisayara istediklerini yazarlar veya söylerler, bilgisayar da onların isteklerini anlar ve isteklerini yerine getirir.

 

Yapısal (morfolojik ve sözdizimsel) olarak Türkçe’nin bilgisayarla modellenmesi üzerine bazı çalışmalar olmasına rağmen Türkçe’de bilgisayarla cümlenin anlamını çözümlemeye yönelik kullanılabilir bir model gerçekleştirmiş değildir. 

Dilin Matematiksel Modellenmesi 

Dilin işlenebilmesi için dilin kurallı veya kuralsız bütün yapılarının matematiksel (algoritmik) olarak ifade edilebilmesi gerekir. Bunun için dilin içerdiği yapıların değişik şekillerde gösterimleri yapılmış ve bunları işleyen (yapıların dile uygunluğunu kabul veya ret eden) makineler üretilmiştir. Aşağıda bunların en çok kullanılanlarından olan Genişletilmiş Geçiş Ağlarından bahsedilmektedir.    

Genişletilmiş Geçiş Ağları (Augmented Transition Networks) 

Genişletilmiş geçiş ağları (GGA) aşağıdaki üç bileşenden oluşur:

1. En az başlangıç ve son (/s) durumları olan sonlu sayıdaki durumlar kümesi,

2. Belli bir metindeki mümkün olan harflerden oluşan alfabe (e),

3. Sonlu sayıdaki bir durumdan diğer bir duruma geçişi sağlayacak geçişler kümesi.

GGA’da, bir durumdan diğer bir duruma geçmek için gerekli harf okunur ve bu harf geçilecek olan duruma geçmek için gereken harfle karşılaştırılır; uygun ise diğer duruma geçilir. Geçiş ağlarında doğru bir yol, bir başlangıç durumundan başlayıp, son duruma ulaşan geçişler sağlandığında tamamlanır. Harflerin birbirine eklenmesiyle oluşan metin, ağın kabul etmesi için verilen metin ise, bu metin ağ tarafından kabul edilmiş demektir. Aşağıda genişletilmiş geçiş ağlarında örnekler sunulmaktadır:

Örnek: ‘abb’ metnini kabul eden GGA.

 

Şekil1. GGA örneği

Bu GGA 4 durumdan oluşmaktadır. Başlangıç durumu 1. durum, bitiş durumu 4. durumdur. Bu ağa göre; 1. durumdan 2. ve 4. durumlara geçiş vardır. 1. durumdan 2. duruma geçmenin şartı metnin ilk üç harfinin "abb" olmasıdır. 2. durumdan 3. duruma geçişte "^" sembolü kullanılmıştır. Bu sembolün anlamı herhangi bir harf alma ihtiyacı olmadan diğer duruma geçmektir. 3. durumda 1. duruma ve son (4.) duruma olmak üzere iki geçiş söz konusudur. 1. duruma dönmenin şartı gelen iki harfin "aa" olması, 4. duruma geçmenin şartı gelen harfin "a" olmasıdır. 4. durum son (/s) durumdur. Son duruma kadar bütün geçişler başarıyla geçilmişse istenen metin bu GGA tarafından tanınmış veya kabul edilmiştir demektir.

Örneğin 1. durumdan 2. duruma, 2. durumdan 3. duruma, 3. durumdan 1. duruma, 1. durumdan son duruma yapılan geçişler için bu GGA tarafından tanınacak metnin gösterimi: (abb)(^)(aa)(b) şeklinde olmalıdır.Bu  ağda tanınabilecek ve tanınamayacak birkaç metin örneği aşağıdadır:

"abba" ,"abbaaabba", "abbaab" ,"b" gibi metinler GGA tarafından tanınır.

"abbab", "baab"gibi metinler ise bu ağ tarafından tanınamayacaktır.

"abbab" metni bu ağdan geçirilirse; 1. durumdan başlamak için ya 2. duruma "abb" ile veya 4. duruma "b" ile geçilmelidir. Girilen metnin ilk üç harfi "abb" olduğundan 2. duruma geçiş şartı sağlanır ve 2. duruma geçilir. Geriye "ab" kalır. 2. durumdan 3. duruma geçmek için herhangi bir harfe gerek yoktur. Dolayısıyla 3. duruma geçilir. 3. durumdan 4. duruma geçmek için "a" gerekirken, 1. duruma dönmek için gelen iki harfin "aa" olması gerekmektedir. Kalan "ab" metninden "a" alınarak 4. duruma geçilir. 4. durum son durum olduğundan artık başka harf geçirilemeyecektir. Ancak hiçbir durumdan geçmemiş "b" harfi kaldığından bu GGA "abbab" metnini kabul etmemiştir. 

Morfoloji

Türkçe morfolojisinin içeriği hakkında bilgi edinmek için aşağıdaki "ekmeği" kelimesinin analizine bakılabilir.

1. ekmeği , ekmek kelimesinden çekimlenmiştir.

2. ekmeği kelimesi belirtme (accusative)-(y)H son ekinin, ekmek köküne eklenmesiyle  oluşmuştur, kısaca (ekmek + durum_eki), veya 3.tekil şahısın (possesive)-(s)H ekinin ekmek köküne eklenmesiyle, kısaca (ekmek + tamlanan_eki) oluşmuştur.

3. ekmeği kelimesinin oluşumunda /k/ sessizi /ğ/ sessizine dönüşmüştür.

Bu üç maddede morfolojinin ilgi alanları göz önüne getirilmektedir.

İlk olarak morfolojinin fonksiyonu ile ilgilenilir.(Morfolojik yapının ne tür bilgiyi açığa çıkardığı). Bu örnekte ekmek kelimesinden çekimlenmiş ekmeği kelimesi "birisine ait ekmek" veya "ekmek + belirtme_eki" anlamlarındadır. Birincisinde isim tamlaması görevindeyken, ikincide belirtili nesne görevindedir. İkinci olarak, kelimelerin ne tür parçalardan oluştuğu belirlenir. Üçüncü olarak fonolojik kuralların morfoloji ile ne tür ilişki içinde oldukları belirlenir.

Morfolojik analizde amaçlananlar aşağıda sıralanmıştır:

1. Kelimelerin soylarını araştırmak: Bu işlemde kelimelerin isim, sıfat, fiil, zamir, edat gibi kelime türlerinden hangilerine karşılık geldiği tespit edilir. Kelime türlerinin her birinin cümleye katabilecekleri anlam kümesi genelde bellidir. Dolayısıyla kelime türünü tespit etmek, cümleye katılacak olan anlamı anlama açısından önemli ipuçları sağlar.

2. Kelimelerdeki ekleri araştırmak: Bu işlemde kelime, kendisini oluşturan kök ve ek morfemlerine ayrılır. Tespit edilen eklerin oluşturacakları kelimenin türü kümesi dilbilimciler tarafından tanımlanmış ve büyük ölçüde sabitleşmiştir. Dolayısıyla kelimenin ekleri bulunursa kelime, tanımlanmış alan kelime türü kümesinin içine konabilir.

3. Eklerin türünü araştırmak: Bazen aynı ek farklı kelime türü  oluşmasını sağlayabilir. Örneğin "Armudu yedim" cümlesi ile "Ali’nin armudu" cümlelerindeki "armudu" kelimesindeki "-u" eki birincide nesne_eki iken diğerinde tamlanan_eki durumundadır. Dolayısıyla cümleye kattıkları anlam farklı olmuştur. Bu tür farklılıkların farkına varabilmek için ekin türünün araştırılması gerekmektedir.

Söz Dizimsel Analiz

 

Sözdizimsel işlem, cümlenin anlamını oluşturan birimlerin bir hiyerarşik yapıda ifade edilmesidir. Bu safhaya ihtiyaç duymayan doğal diller olsa da bir çok doğal dil bu işlemi zorunlu kılar. Sözdizimsel analiz için bir çok çözüm düşünülmüş olsa da en çok aşağıdaki çözüm şekilleri kullanılmıştır:

 

1. Dilin sözdizimsel yapısının gramer adı verilen tanımlayıcı şeklinde gösterimi,

 

2. Dilin tanımlanmış grameri temelinde onun genel yapısının oluşturulması.

 

Bilgisayarla doğal dilin modellenmesinde anlamsal analizden önce kelimelerden oluşturulan yapının cümle olup olmadığı test edilmelidir. Cümle oluşturmayan ifadelerden anlam çıkarmak insanlar için dahi zordur, hatta zaman zaman imkansızdır. "Kalem sarı koş kitap" ifadesi insanlar için dahi bir anlam ifade etmemektedir. İnsan için anlam ifade etmeyen yapılardan bilgisayarın bir anlam çıkarmasını beklemek de elbette imkansızdır. Rastgele kelimelerin yan yana gelmesiyle cümle oluşmaz. Cümleler oluşturan kelimelerin bir sonu olmalıdır. Cümleler de sonlu yapılar olduğuna göre Sonlu Otomatalar (SO) ile ifadelendirilebilirler. Bunun  amacı, ardarda gelen kelimeler yığınını bu kelimelerin ifade ettiği cümle unsurlarını tanımlayan bir yapıya dönüştürmektir. Türkçe’deki cümleler için mümkün olan tüm sözdizimsel unsurlar dikkate alınmalıdır. Cümle  unsurları, kelimeler, tamlamalar veya buna benzer cümle parçacıkları olabilir. Bu cümle parçacıklarını tespiti, anlamsal analiz için yararlı ipuçları verir. Genellikle bir cümlede cümle parçacıkları ortak görev yaparlar.

 

SO ile cümle unsurlarını ifadelendirmek için öncelikle cümleyi oluşturan unsurları bulunup, Backus-Nour tarafından gerçekleştirilmiş olan biçimde gösterilmesi gerekmektedir. Bu gösterime göre örneğin; <sıfat tamlaması>::= <sıfat>, <isim> şeklinde kısaca tanımlanabilir. Bu ifade biçiminde "," mantıksal "ve" ; "|" mantıksal "veya" anlamı taşır. Türkçe cümleler için yapılacak bu şekildeki gösterimde tüm unsurlar bu şekilde ifadelendirilmelidir.

Türkçe’de cümleler en genel şekliyle özne, nesne ve yüklem unsurlarından oluşur. Cümleye eklenmek istenen anlamlar arttıkça cümleler; özne, yer tamlayıcısı, zarf tamlayıcısı, nesne ve yüklem gibi unsurları içerir. Ayrıca cümlenin anlamını kuvvetlendiren cümle dışı unsurlar da (bağlaç, edat, vb.) cümlede bulunabilir. Bu unsurlara örnek olarak "ile, için, ama, çünkü" kelimeleri verilebilir. Türkçe’de özne ile yüklem cümlenin temel unsurlarıdır ve genelde tüm cümlelerde yer alırlar. Yer tamlayıcısı, zarf tamlayıcısı, nesne gibi unsurlar bazı cümlelerde yer almayabilirler veya bazı cümlelerde sadece biri, bazılarında sadece ikisi bulunabilir. Bu unsurların cümle içindeki sıralanışları da değişebilir.

GGA’lar, SO’lara benzemektedirler; dolayısıyla sonlu olan cümleler GGA yapısı şeklinde ifade edilebilir GGA’ların cümleyi kabul edişi cümlenin sözdiziminin hiyerarşik yapısındaki ilişkilerinin belirlenmesiyle olur. Bu ilişkiler kapsama, kapsanma veya eşitlik şeklinde olabilir. "veya" mantıksal işlemi eşitliği, tanım satırının sağ tarafında bulunma kapsanmayı, tanım satırının sol tarafında bulunma kapsayan olmayı belirler. Tanım satırının sol tarafındaki ifadeler aynı zamanda bir başka ifade için kapsanan durumunda da bulunabilir. Bu durumda; örnek kümesini mümkün olduğu kadar geniş tutup, kullanılan GGA’nın mümkün olduğu kadar çok cümleyi içermesi sağlanmalıdır.

Türkçe’nin anlamsal yapısının özelliğinden dolayı önemsenen unsurun yükleme yaklaştırıldığı bilinmektedir. Dolayısıyla oluşturulacak olan GGA’de özne her zaman başta, yüklem her zaman sonda kabul edilip, diğer unsurlar da önemsenme derecelerine göre yükleme yaklaştırılırsa çözümlenebilen cümle sayısı artacaktır. Aşağıda özne, zarf tümleci, dolaylı tümleç, nesne, yüklem gibi beş unsurdan oluşacak cümleleri kabul edebilen bir GGA tanımlaması yapılmıştır. Bu unsurlar dışındaki unsurlar ile cümle dışı unsurlar içeren cümleler bu GGA dışında tutulmuştur. Buna göre:

Ö:Özne, Z:Zarf Tümleci, D:Dolaylı Tümleç, N:Nesne,Y:Yüklem olmak üzere; bu unsurlardan oluşabilecek cümleler; unsurlarının sıralanışlarına göre bir çok varyasyonlar oluşturabilirler. Bu varyasyonlar; Ö-D-Z-N-Y, Ö-D-N-Z-Y, Ö-Z-D-N-Y, Ö-Z-N-D-Y, Ö-N-Z-D-Y, Ö-N-D-Z-Y olabilir. Bunlara tüm unsurları içermeyen iki, üç veya dört unsurdan oluşan cümleler de eklenebilir. Bu cümleler; iki unsur için: Ö-Y, üç unsur için Ö-N-Y, Ö-D-Y, Ö-Z-Y, dört unsur için Ö-N-D-Y, Ö-N-Z-Y, Ö-D-N-Y, Ö-D-Z-Y, Ö-Z-N-Y, Ö-Z-D-Y şeklindedir. Bu varyasyonların hepsi {ÖλλλY} şeklinde gösterilebilir. Bu şekildeki cümle varyasyonlarını kabul edebilecek bir GGA tanımlanırsa analiz edilebilecek cümle kümesi genişletilmiş olur. Ancak bu kümenin eleman sayısı, Türkçe’de mümkün olan tüm cümlelerin sayısının yanında çok az olduğu açıktır. Burada üzerinde durulan tanımlamalar, birkaç örnek cümleyi kapsayacak biçimde düşünülmüştür. Tanımlamalarda "Bunu sana yazdığımı bilmiyorsun." gibi bileşik cümleler ve "Ayşe geldi, bekledi ve gitti." gibi sıralı cümleler göz önüne alınmamıştır. Bu tanımlanmaların Türkçe’ye oluşturulacak model için bir prototip olması beklenmektedir.

Özne, nesne, dolaylı tümleç, zarf tümleci ve yüklem unsurlarından oluşacak tanımlamalar aşağıdaki gibi düşünülmüştür.

Ana unsurlar:

<cümle>::= <özne>, <dolaylı tümleç>, <zarf tümleci>, <nesne>, <yüklem>

Buradaki cümle tanımında sadece Ö-D-Z-N-Y varyasyonu gösterilmiştir. Diğer varyasyonlar da benzer  şekilde ifade edilebilir. GGA yapısında cümle için düşünülen tüm varyasyonlar gösterilecektir.

<özne>::= <isim grubu> | <sıfat grubu> | <isim>

<dolaylı tümleç>::= <isim grubu >, <dolaylı tümleç_eki> | <sıfat grubu >, <dolaylı tümleç_eki>

<zarf tümleci>::= <zaman belirteçleri> | <isim grubu>, <diğer_zarflar>

<nesne>::= <isim nesnesi> | <sıfat nesnesi>

<yüklem>::= <fiil>, <zaman_eki>, <kip_eki> | <isim>, <ek_fiil>

Ana unsurları oluşturan  öğeler:

<isim grubu>::= <tamlayan>, <tamlanan> | <isim> | <zamir>

<sıfat grubu>::= <sıfat>, <isim grubu>

<isim nesnesi>::= <isim grubu>, <nesne_eki>

<sıfat nesnesi>::= <sıfat grubu>, <nesne_eki>

<tamlayan>::= <isim>, <tamlayan_eki> | <zamir> , <tamlayan_eki>

<tamlanan>::= <isim>, <tamlanan_eki>

Öğeleri oluşturan kelimeler:

<zaman belirteçleri>::=  şimdi | bugün | yarın | bu sabah | geçen yıl | dün

<diğer_zarflar>::= için | ile

<sıfat>::= beyaz | kırmızı | küçük | şirin | güzel | uzun | sarı 

Bu GGA tanımlaması ile;

"Ahmet’in babası beyaz şirin koyunu araba ile köye getirdi." cümlesinin çözümlenme işlemi için;

1. Cümle durumundan başlanır.

2. Cümleden bir sonraki duruma geçmenin şartı <özne> isimli duruma ait alt GGA’dan başarıyla dönülmesidir. Bu nedenle <özne>ye gidilir.

3. <özne> durumundan bir sonraki duruma geçmenin şartı kelimelerin <isim grubu> veya <sıfat grubu> oluşturmasıdır."Ali": isim, "nin": tamlayan_eki, "baba": isim, "sı": tamlanan_eki olduğu tanımlanmış olan veritabanından anlaşılır. Bu kelimelerden oluşan "Ali’nin babası" kelime grubu <isim grubu> alt GGA’sına uygundur. "Ahmet’in babası" kelime grubu <isim grubu> olarak atanır ve sonraki duruma (Q1) geçilir.

4. Q1’den diğer durumlara geçişin bir çok farklı şartı vardır. Bu şartlardan herhangi biri sağlandığında diğer durumlara geçilecektir. "beyaz şirin koyunu" kelime grubunda; "beyaz": sıfat, "şirin": sıfat, "koyun": isim  olduğu veritabanından anlaşılır ve bu üç kelime <sıfat grubu> testini başarıyla geçer. "koyunu" kelimesindeki "u" nesne_eki tanımına uygundur. "beyaz şirin koyun" kelime grubu, "u" ekiyle birleşince <sıfat nesnesi> tanımına uyar. <nesne> testini geçmenin şartlarından biri de <sıfat nesnesi> olmak olarak tanımlandığından "beyaz şirin koyunu" kelime grubu <nesne> olarak atanır ve bir sonraki duruma geçilir. Bir sonraki durum yüklem, zarf tümleci veya dolaylı tümleç olmalıdır.

5. "araba" kelimesi <isim> olarak tanımlanan kelimeler arasındadır. <isim grubu> olmanın şartlarından biri de <isim> olmaktır. "ile" kelimesi <diğer_zarflar> arasında olduğundan "araba ile" kelime grubu <zarf tümleci> testini başarıyla geçer ve "araba ile" kelime grubu <zarf tümleci> olarak atanır.  Bu durumdan sonra GGA’ya göre yüklem veya dolaylı tümleç gelmelidir.

6. "köy" kelimesi <isim> olarak tanımlanan kelimeler arasındadır. "e" eki ise <dolaylı tümleç_eki>dir. Dolayısıyla "köye" kelimesi <dolaylı tümleç> olarak tanınır ve atanır. Bir sonraki durum GGA’ya göre <yüklem> olmalıdır.

7. "getir" kelimesi veritabanına göre <fiil>dir. "di" eki de <zaman_eki> olarak tanımlandığından "getirdi" kelimesi <yüklem> olarak kabul edilir ve atanır.

8. Böylelikle cümlenin unsurları olan <özne>, <nesne>, <zarf tümleci>, <dolaylı tümleç>, <yüklem> sırasıyla kabul edilmiş olur ve bu unsurlardan oluşan yapı cümle olarak kabul edilir ve atanır.

"Ahmet’in babası, beyaz şirin koyunu araba ile köye getirdi." cümlesinin hiyerarşik yapısı aşağıda görülmektedir. Burada kullanılan kısaltmalar:

Ö: özne, D: dolaylı tümleç, Z: zarf tümleci, N: nesne, Y: yüklem, İG: isim grubu,

SG: sıfat grubu, İN: isim nesnesi,  SN: sıfat nesnesi,  DZ: diğer_zarflar,  S: sıfat,  İ: isim, ZB: zaman_belirteçleri, T: tamlayan, TN: tamlanan, ZM: zamir, NE: nesne_eki, TE: tamlayan_eki, TNE: tamlanan_eki, KE: kip_eki, ZE: zaman_eki, DE: dolaylı tümleç_eki, EF: ek_fiil şeklindedir.

Şekil2. Örnek cümlenin hiyerarşik yapısı

Burada söz edilen morfolojik ve sözdizimsel modeller, Türkçe için gerçekleştirilecek olan anlamsal analiz modeline temel teşkil edebileceklerdir.

Bahsi geçen modellerin ışığında bir yazılım yazılmış durumdadır. Bu yazılım belli sınırlılıkta bir veri tabanındaki cümleleri morfolojik ve sözdizimsel olarak çözümlemekte ve programın bir diğer modülü olan anlamsal analiz modülüne bilgi tabanı hazırlamaktadır. Bu yazılım sonraki yazılarımızda tanıtılacaktır.

Kabul etmek gerekir ki, kurallı yapısıyla bir çok dilden daha programlanabilir olan Türkçe'mizin bilgisayarla işlenmesi konusunda ciddi araştırmalar yeni yeni başlamıştır. Ümit edilmektedir ki; bir model olarak ortaya çıkan bu yazılım, yapılan doğal dil çalışmalarına katkı sağlayacaktır.

Bir çok bilim dalını ilgilendiren doğal dil konusunun araştırmacılarımız tarafından yeterince ilgi görmesi ve yapılan çalışmaların artmasıyla Türkçe’nin bilişim dünyasında daha çok kullanılır dil olacağı beklenmektedir.


Ünal Çakıroğlu

 
Bu yazıyla ilgili görüş ve yorumlarınızı yorum@teknoTurk.org ve unalts@hotmail.com adreslerine yollayabilirsiniz.