Türkmüsün.Net Portalı - Geçitteki Ülke: Gece Vakti Gündönümü, Türkün Günü mü? Ölümü mü?
TURKISH TEXT DEASCIIFIER
Yazım Türkçeleştirme Programı
Turkish Text Deasciifier
Pek çok kişi çeşitli sebeplerle, Türkçe yazı yazarken Türkçe karakterleri kullanmaktan kaçınıyor. Gökhan Tür
tarafından 2000 yılı Ocak ayında yazılan bu program, Türkçe karakterler kullanılmadan yazılmış bir metni,
Latin-5 formatında normal bir Türkçe yazıya dönüştürüyor. Program, beşer harflik öbeklerin istatistik yöntemleriyle
analiz edilmesi esasına dayanıyor. 100.000 civarında kelimeden oluşan büyük metinler üzerinde yapılan çalışmalar,
kelimelerin neredeyse üçte birinin bu şekilde düzeltilmesi gerektiğini ortaya çıkarıyor. Bu program, bazı örneklerde
bir hayli belirsizlik yaratabilen bu gibi durumlarda %99 başarı sağlıyor.
Program kullanılarak düzeltilmiş örnek bir cümlenin ilk halini ve düzeltilmiş halini aşağıda bulabilirsiniz.
Türkçe karakterler kullanılmadan yazılmış metinlerinizi Türkçeleştirmek için, metni aşağıdaki kutuya yazın
veya yapıştırın ve "Metni Gönder" tuşuna basın. Sonuçları kopyalayarak dilediğiniz programda kullanabilirsiniz.
Türkçe harfler kullanılarak yazılmış metinleri Türkçe harfleri tanımayan bilgisayarlara gönderirken yaşadığınız
sorunlardan kurtulmak için de, buradaki işlemin tersini yapan Türkçe Karakter Temizleme Programı sayfamızı ziyaret edin.
Due to encoding problems, lack of a Turkish keyboard, or mere habit, Turkish texts are usually typed using
an ASCII character set, where non-ASCII Turkish characters are typed using their nearest ASCII equivalent,
e.g., 'ü' is entered as 'u', 'ğ' as 'g', etc.
This program, developed by Gökhan Tür in January 2000, takes in such text and converts it to Latin-5 using
a statistical 5-gram letter language model. Experiments on texts totaling about 100.000 words indicate that
nearly a third of the words need such fixing and that the program successfully corrects about 99% of such
cases (some of which are quite ambiguous).
Below is a sample original sentence and the corresponding output. You can type in or copy&paste your own text
into the textbox below and "deasciify" or "Turkify" it by clicking "Submit Text". You can copy the resulting
text and reuse it in any application you want.
To send Turkish text to computer systems which do not recognize Turkish characters,
visit Turkish Text Asciifier which does just the opposite.
İlk Hali--Original:
"Bu kosullarda Turkiye'nin benimseyecegi akilci hareket tarzi elindeki
kozlari heba etmeden AB'ye tam uyelik icin yesil isik yakilan ikinci grup
ulkelerin en basinda yer almayi hedeflemektir."
Düzeltilmiş Hali--Deasciified:
"Bu koşullarda Türkiye'nin benimseyeceği akılcı hareket tarzı elindeki
kozları heba etmeden AB'ye tam üyelik için yeşil ışık yakılan ikinci grup
ülkelerin en başında yer almayı hedeflemektir."
gokhan@speech.sri.com adresine yorum ve düşüncelerinizi bildirebilirsiniz
Please send any bug reports by mail to gokhan@speech.sri.com. Your
comments will be most appreciated.