Türkmüsün.Net Portalı - Geçitteki Ülke: Gece Vakti Gündönümü, Türkün Günü mü? Ölümü mü?
   



TURKISH TEXT DEASCIIFIER

Yazım Türkçeleştirme Programı

Turkish Text Deasciifier

Pek çok kişi çeşitli sebeplerle, Türkçe yazı yazarken Türkçe karakterleri kullanmaktan kaçınıyor. Gökhan Tür tarafından 2000 yılı Ocak ayında yazılan bu program, Türkçe karakterler kullanılmadan yazılmış bir metni, Latin-5 formatında normal bir Türkçe yazıya dönüştürüyor. Program, beşer harflik öbeklerin istatistik yöntemleriyle analiz edilmesi esasına dayanıyor. 100.000 civarında kelimeden oluşan büyük metinler üzerinde yapılan çalışmalar, kelimelerin neredeyse üçte birinin bu şekilde düzeltilmesi gerektiğini ortaya çıkarıyor. Bu program, bazı örneklerde bir hayli belirsizlik yaratabilen bu gibi durumlarda %99 başarı sağlıyor.

Program kullanılarak düzeltilmiş örnek bir cümlenin ilk halini ve düzeltilmiş halini aşağıda bulabilirsiniz. Türkçe karakterler kullanılmadan yazılmış metinlerinizi Türkçeleştirmek için, metni aşağıdaki kutuya yazın veya yapıştırın ve "Metni Gönder" tuşuna basın. Sonuçları kopyalayarak dilediğiniz programda kullanabilirsiniz.

Türkçe harfler kullanılarak yazılmış metinleri Türkçe harfleri tanımayan bilgisayarlara gönderirken yaşadığınız sorunlardan kurtulmak için de, buradaki işlemin tersini yapan Türkçe Karakter Temizleme Programı sayfamızı ziyaret edin.
Due to encoding problems, lack of a Turkish keyboard, or mere habit, Turkish texts are usually typed using an ASCII character set, where non-ASCII Turkish characters are typed using their nearest ASCII equivalent, e.g., 'ü' is entered as 'u', 'ğ' as 'g', etc.

This program, developed by Gökhan Tür in January 2000, takes in such text and converts it to Latin-5 using a statistical 5-gram letter language model. Experiments on texts totaling about 100.000 words indicate that nearly a third of the words need such fixing and that the program successfully corrects about 99% of such cases (some of which are quite ambiguous).

Below is a sample original sentence and the corresponding output. You can type in or copy&paste your own text into the textbox below and "deasciify" or "Turkify" it by clicking "Submit Text". You can copy the resulting text and reuse it in any application you want.

To send Turkish text to computer systems which do not recognize Turkish characters, visit Turkish Text Asciifier which does just the opposite.

İlk Hali--Original:

"Bu kosullarda Turkiye'nin benimseyecegi akilci hareket tarzi elindeki kozlari heba etmeden AB'ye tam uyelik icin yesil isik yakilan ikinci grup ulkelerin en basinda yer almayi hedeflemektir."

Düzeltilmiş Hali--Deasciified:

"Bu koşullarda Türkiye'nin benimseyeceği akılcı hareket tarzı elindeki kozları heba etmeden AB'ye tam üyelik için yeşil ışık yakılan ikinci grup ülkelerin en başında yer almayı hedeflemektir."

Lütfen metni aşağıdaki kutuya yazın -- Please enter your text below

gokhan@speech.sri.com adresine yorum ve düşüncelerinizi bildirebilirsiniz
Please send any bug reports by mail to gokhan@speech.sri.com. Your comments will be most appreciated.

BU SAYFA İÇERİĞİ hlst.sabanciuniv.edu ADRESİNDEN SAĞLANMAKTADIR.


Türkmüsün.net

Copyright © 2005 Türkmüsün.net    Tüm hakları saklıdır.