March 12, 2016

MaryTTS Deneyimlerim 3

En son MaryTTS için Türkçe lexicon wordlisti hazırlamıştım. Üzerinden bayağı zaman geçtiği halde cevap gelmemesi ve bu arada başka işlerim olması nedeniyle bu ara MaryTTS projesiyle fazla ilgilenemedim. Fakat 1 hafta önce, gönderdiğim yama kabul edilmiş ve MaryTTS Deneyimlerim 1 yazımda bahsettiğim hata kaydı kapatılmış ^_^

Bunun üzerine şapkalı harfler (circumflexes) üzerinde yoğunlaşmaya karar verdim. Çünkü şuanki allophones.tr.xml dosyası şapkalı harflere izin vermiyor. Bu konuda yoğunlaşmak istememin sebebiyse şapkalı a harfinin (â) Türkçede kritik bir rol oynaması. Modern yazı dilinde â harfini fazla kullanmasak da konuşma dilinde farklı anlamlardaki benzer sözcükleri birbirinden ayırmak için hâlâ kullanıyoruz –farkettiyseniz hala kullanmıyoruz; hâlâ kullanıyoruz :D –. Günlük hayatımızda bu kurala uyan hâlâ,kâr, âdet, vb. sözcükleri sıkça kullandığımızdan bu kelimelerin doğru okunması önemli.

Fonetik Meseleler

MaryTTS Türkçe lexicon[1] dosyaları için SAMPA formatını kullanıyor. Bu formata göre uzatma işareti olarak /:/ kullanılması gerekiyor. Örneğin â harfinin Sampa’ya göre fonetik[2] gösterimi /a:/ dır. [Kaynak]

Fakat düzeltme harfi (şapka) harfin sadece uzun söylenmesini değil tonunun da normalden daha ince olmasını sağlıyor. Proje yöneticisi @psibre nin söylediklerine göre bu Suprasegmental Seviyede (Türkçe karşılığını bulamadım, ama vurgu,uzunluk ve ton ile alakalı bir şeymiş.) modelleniyormuş. Ama ince tonla bağlantılı bir allophone[3] prozodi[4] modelini de geliştirirmiş. En yakın zamanda yeni bir Türkçe dil dosyası yapıp sonuçları aktaracağım.


Terimler:

1 Lexicon: Sözlük, kelime listesi

2 Fonetik alfabe(Phonetic transcription): Bir dildeki seslerin görsel olarak gösterimi.

3 Allophone: Farklı dillerde bir sesin (phoneme) farklı telaffuzlarıdır.

4 Prozodi(Prosody): Seslerin tanımlanması ve bu seslerin, sözcük hecelerindeki kullanımı.

Furkan KALKAN Tarafından yazılmıştır.