43
İTÜ Bilgisayar ve Bilişim Fakültesi

Türkçe'den-Türk İşaret Diline Otomatik Çeviri Sistemi ve Avatar Animasyonu

Türkçe'den-Türk İşaret Diline Otomatik Çeviri Sistemi ve Avatar Animasyonu
(TÜBİTAK 1003, 15.10.2014 - 15.10.2016)

Ülkemizde, İşitme engelli öğrenciler Milli Eğitim Bakanlığı (MEB) müfredatında kullanılan yazılı Türkçeyi anlamakta zorlanmakta ve ders içeriklerini takip edememektedirler. Öğrenciler 4. sınıfa geldiklerinde halen normal gelişimli öğrencilerin 1. sınıfta eriştikleri yazma ve yazılı dokümanları okuma becerisine sahip olamamaktadırlar. Bu öğrencilerin, bir kısmı okul dışında ek eğitim alarak bu açığı kapatmaya çalışmakta ancak bu konuda destekleyici eğitim materyali bulunmadığı için zorlanmakta, diğer kısmı ise eğitim hayatlarını sonlandırmaktadır. Bu durum işitme engelli öğrenci ve ailesi için olduğu kadar sınıflardaki normal gelişimli öğrenciler ve sınıf öğretmenleri için de zorluk yaratmaktadır. 2010 yılında yayınlanan “İlköğretim Okullarındaki Kaynaştırma Uygulamalarının Değerlendirilmesi Raporu” nda (MEB, 2010)  kaynaştırma sınıflarında yaşanan problemler net bir şekilde ortaya konmaktadır. Projemizin konusu, Fatih projesi teknolojik altyapısına uyumlu bilgisayar destekli bir arayüz geliştirerek bu altyapı üzerinde verilecek müfredatı işitme engelli öğrencilerin anlayabileceği bir şekle çevirmektir. Özetle yazılı Türkçe’yi yazılı Türk işaret dili’ne (TİD) çevirecek bir sistem tasarlanacaktır. Sistem aynı zamanda bu yazılı dili (TİD) sanal karakterler (animasyon) ile gerçeklemek suretiyle görsel TİD’e de çevirecektir.  Böyle bir çalışma Türk İşaret Dili için mevcut değildir. Bu çeviri için yazılı Türkçe ve TİD gramer yapılarına hakim olunması gereklidir. Ancak TİD grameri henüz tam anlamıyla anlaşılabilmiş ve formalize edilmiş değildir. Bu nedenle, proje, seçilen bir derlem ve bu derlemde en sık kullanılan dilbilimsel yapılar temel alınarak gerçekleştirilecektir. Türkçe, zengin biçimbilimsel yapısı ve cümle içi öğe dizilişleri serbest bir dil olması itibari ile üzerinde çokça çalışılan İngilizce gibi dillere kıyasla doğal dil işleme konusunda çok farklı problemler ortaya koymaktadır. Dolayısı ile diğer diller üzerinde yapılan çalışmalar Türkçe’ye doğrudan uygulanabilir durumda değillerdir. Çalışmamız bu yönü ile Türkçe ve Türkçe’ye benzer özellikler gösteren diğer diller (Fince, Macarca, Korece vs.) için özgün bir yere sahip olacaktır. Bu çalışma işitme engelli öğrencilerin eğitim hayatlarındaki eksikliği önemli ölçüde kapatmayı planlamaktadır.

Her ülkede o ülkeye özgü farklı işaret dilleri kullanılmakta (örn: Türkiye’de TİD, Amerika’da ASL vs.) ve bu diller o ülkenin ana dilinden farklılık göstermektedirler. Farklı işaret dilleri için resmi dokümanları ve eğitim materyallerini işitme engelli bireyler için yazılı dilden işaret diline otomatik çevirme çalışmaları sürdürülmektedir.  Tunus, Alman, İngiliz, Hollanda, Fransız ve Amerikan işaret dilleri için animasyon ortamında sanal karakterlerle (avatar) işaret dili görselleştirme konusunda aktif çalışmalar yürütülmektedir. Ancak konuşma dillerinde olduğu gibi işaret dilleri de ciddi farklılıklar göstermektedir. Bu yüzden herhangi bir dil için yapılan çalışmanın Türkçe için kullanılması mümkün değildir. Gerçek bir çeviri sisteminin TİD’in dilbilim yapısına uygun olarak üretilmesi gerekmektedir. Bu konuda Türkçe üzerine son zamanlarda başlayan ender çalışmalarda ise, sadece sözcüklerin, (görseller, video veya avatar animasyonları ile) TİD işaretlerine çevrilmesi konusunda çalışıldığı görülmektedir. Ancak bu yaklaşım, cümle düzeyinde anlamsal olarak tamamen yanlış bir çeviri yapılmasına yol açmaktadır. Türkçe ve TİD birbirlerinden tamamen farklı dillerdir ve tüm diğer sözlü dil ve işaret dilleri arasındaki çevirilerde olduğu gibi, bu iki dil arasındaki çeviri sentaks ve semantik düzeyde çalışılması gereken bir otomatik çeviri problemidir. Bu nedenle makine çevirisinin tüm zorluklarını içerisinde barındırmaktadır. Yine bu sebeple, Türkçe için geliştirilmeye çalışılan sistemler günümüzde kısıtlı sayıda sözcük için işaretlerin karşılıklarının bulunduğu sözlük benzeri bir çalışmadan öteye geçememektedir. Bu konuda araştırma yapabilmek için Türkçe doğal dil işleme, TİD dilinin dilbilimsel açıdan araştırması ve insan-bilgisayar etkileşimi konusunda uzmanlığa sahip bir ekip çalışması gereklidir. Projemizde bu farklı disiplinlerdeki uzmanlıklara sahip İTÜ ve Boğaziçi üniversitelerinden üç farklı çalışma grubu bir araya gelmektedir. Bu ekip, hali hazırda proje altyapısını destekleyici birçok ulusal ve uluslararası projeyi yürütmektedir. Önerisini yaptığımız bu projede, bu çalışma gruplarının uzmanlıkları bir araya getirilerek Türkiye’de ilk defa Türkçe ve TİD arasında gerçek bir otomatik çeviri sistemi çalışması yapılacaktır.

​Proje Ekibi
Doç. Dr. Hatice Köse (Yürütücü)
Y. Doç. Dr. Gülşen Eryiğit (İstanbul Teknik Üniversitesi)
Doç. Dr. Meltem Kelepir (Araştırmacı, Boğaziçi Üniversitesi)