ocr-buyusu
OCR
OCR Büyüsü
Yazıya Dönüşen Resimler
Eğer elinizin altında bilgisayarda yazılması gereken yüzlerce sayfalık belge bulunuyorsa, maalesef sadece iki seçeneğiniz var: Ya günlerce, sabah akşam demeden bunları yazacaksınız ya da belgenin tümünü OCR tekniği ile okutarak tüm işi bir günde bitireceksiniz. Seçim sizin!
• Bilgisayarınızın içinde bulunan donanımlar ve yüklemiş olduğunuz yazılımların hepsi, tek bir amaç doğrultusunda, kullanıcıların işlerini kolaylaştırmak için üretilmiş yardımcılardır. Bir donanım parçası olan yazıcı, sizi tüm belgeleri oturup el ile yazmaktan kurtarırken, bir yazılım olan Word ise yazıya istediğiniz şekli vermenizi sağlar... Sonuçta donanımlar ve bunları kullanmak için yazılmış olan yazılımlar hep ikili olarak çalışarak işlerinizi kısa zamanda, hatasız ve zahmetsiz bir şekilde tamamlamanıza yardımcı olurlar.
Size çok zaman kazandıracak muhteşem teknoloji: OCR
Donanım olarak tarayıcı ve OCR yazılımları da işte bu ikililer içinde yer alır. Optical Character Recognization (optik karakter tanıma) kelimelerinin baş harflerinden oluşan OCR teknolojisi, kısaca resim formatındaki herhangi bir dosya içindeki yazıyı tanıyarak sonradan tekrar düzenlenebilecek metin biçimine dönüştürebilir. Yani eğer elinizde, içinde yazı bulunan bir JPG, GIF, TIF ya da BMP dosyası varsa OCR teknolojisi bunu içinden çıkartıp TXT ya da DOC olarak kaydedebilir.
Tabii ki bu resim dosyasını elde etmek için bir de tarayıcıya ihtiyacınız olacak. Bu şekilde önce herhangi bir kitabı, dergiyi ya da kağıt üzerine yazılmış yazıyı tarayıcınızı kullanarak bilgisayara bir resim dosyası olarak aktardıktan sonra kullandığınız OCR yazılımı diğer tüm işlemleri yapacaktır. Hesaplayacak olursanız bir A4 sayfasının bilgisayara aktarılması; taranması için ortalama 40, 45 sn. ve karakterlerin tanımlanması için de l dakika olacak şekilde 2, hataların düzeltilmesini de eklerseniz ortalama 2,5 dakika içinde bitecektir. 10 parmak klavye kullanan profesyonellerin bile zor eriştiği bu süre, özellikle bu konuda çok iyi değilseniz gerçekten muhteşem olarak nitelendirilebilir.
Çalışacağınız dile göre OCR yazılımının seçimi önemli
Ancak öncelikle yapmanız gereken bazı ayarlar ve bilmeniz gereken bazı ön bilgiler mevcut. Bu konuda ilk dikkat etmeniz gereken, tarayacağınız metinlerin diline uygun bir OCR programı seçmek olmalıdır. Bu konuda özellikle Fine Reader ve Recognita gibi yazılımlar, destekledikleri dillerin fazlalığı açısından başı çekmektedirler. Bu yazılımların yanında eğer İngilizce metinler ile ağırlıklı olarak çalışacağınızı düşünüyorsanız, Text Bridge ve Pagegenie gibi benzeri birçok farklı yazılımı da deneyebilirsiniz. Bu yazıda ise çok fazla sabit disk alanı kaplamaması ve Türkçe dahil 50'den fazla dil desteği ile Fine Reader programının kullanılması anlatılacaktır. Yazılımı bu ayki Chip CD'si içinden sisteminize kurabilirsiniz.
Taradığınız resimler içinde yer alan düzgün okunan hemen her türlü yazının OCR tarafından tanınması mümkün oluyor. |
Eğer tarayıcınızı sisteminize tanıtıp, CD'den de Fine Reader yazılımım kurduysanız artık işlemlere başlayabilirsiniz, ilk etapta eğer biraz önce bahsettiğimiz gibi İngilizce dışında bir dilin tanımım yapacaksanız Fine Reader'ın sitesinden istediğiniz dile ait yama dosyasını indirmeniz gerekiyor, http:/ /www.abbyy.com/download/index.htm adresinden boyları l ile 2 Mb arasında değişen yamayı kurduğunuz an artık yazılımınız o dili de tanır. Şimdi Başlat menusu altından ABBYY FineReader klasöründeki yazılımın kısayolu ile programı çalıştırabilirsiniz.
Sihirbazların kullanımı ile kolaylaşan tanımlama işlemleri
Programın oldukça sade ama kullanışlı ana ekranı üzerinde menüler ve araç çubuğunun yanı sıra bir OCR sihirbazı da bulunuyor. Bunun yanı sıra ilk açılışta çalışma penceresi, solda taranan sayfaların ikonları sağda ise içeriği olacak şekilde ikiye ayrılmış olarak görünür. Taranacak sayfayı tarayıcıya yerleştirdikten sonra buradan isterseniz F9 kısayolu ile ya da sihirbazın en başında yer alan Scan&Read simgesi ile otomatik ve hızlı bir şekilde hem tarama hem de tanımlamayı gerçekleştirebilirsiniz. Ancak bu işlemi ilk tarama için yapmanız pek tavsiye edilmez. Çünkü karakterlerin başarılı bir şekilde tanımlanması için önce tarayıcınız ile ilgili birkaç ince ayar gerekebilir. İlk birkaç taramada en iyi sonucu alana kadar uzun yoldan ayarları yaptıktan sonra diğer sayfalar için bu tuşu kullanmanız daha iyi olacaktır.
İyi sonuç için yapılması gereken ön ayarlar
Şimdi sayfa tarayıcı içindeyken birinci adım olarak üzerinde "l" yazan Scan simgesine tıklayın. Tarayıcınızın arabirimi karşınıza gelecektir. Fine Reader tarayıcınıza gerekli bilgileri yolladığından burada tarama modu olarak 256 renk gri, çözünürlük olarak 300 dpi ve orta derece parlaklık ayarları otomatik olarak seçili olacaktır. Aksi durumda bu ayarları el ile yapmanız gerekebilir. Tarayıcıların markasına göre yeri değişebilecek bu ayarlar için tarayıcınızın kullanma kılavuzuna bakabilirsiniz. Bizim örnek olarak kullandığımız Genius marka tarayıcıda bu ayarlar oldukça renkli bir arabirim üzerinde sağ tarafta bulunmaktaydı.
Taramadan önce sayfanın doğru konumda olduğunun kontrolü
işlem sona erdiği zaman program yazıyı sütunlar hariç neredeyse birebir düzeyde tanıyabiliyor. |
Gerekli ayarlan yaptıktan sonra yine tarayıcınıza göre değişecek "Preview" ya da "Prescan" gibi tuşlar ile önce bir ön izleme alıp sayfayı düzgün yerleştirip yerleştirmediğinizi kontrol edin. Daha sonra "Scan" yani tarama tuşu ile taramayı gerçekleştirebilirsiniz. Tarama işleminin ardından, taranan resim Fine Reader'a gönderilecek ve programa geri dönülecektir. Bundan sonra artık 3 parçaya bölünmüş olarak çalışacak olan çalışma penceresinde sağ tarafta üst bölümde taranmış olarak bulunan siyah beyaz sayfa yer alır. Alttaki bölüm ise navigasyona yarar. Şimdi artık "2" no'lu Mark Blocks simgesine tıklayabilirsiniz.
Bu işlem otomatik olarak içinde yazı bulunan bölümlerin bloklanarak seçilmesini sağlayacaktır. Böylelikle tanımlama esnasında programın sadece yazıların olduğu bölümlere odaklanarak daha hızlı çalışmasını sağlayabilirsiniz.
İsterseniz bu adım atlanarak 3. adıma da geçilebilir. Ancak bu süreyi uzatacağı için pek tavsiye edilmez. 3. adımda "Recognize" tuşuna basıldığı zaman tanımlama işlemi başlayacak ve bittiği zaman da yeni bir pencere açılıp sonuç burada font boyları ve yazı biçimi büyük bir oranda korunmaya çalışılarak görüntülenecektir. Bu adımdan sonra yapmanız gereken, artık dönüştürülmüş metin üzerinde olası hataları tespit edip düzeltmekten ibaret.
Ne kadar başarılı olsa da siz kontrolü elden bırakmayın
Eğer kendi gözünüze güvenmiyorsanız, metni kaydedip sonradan herhangi bir metin editörü ile düzeltmeleri yapabilirsiniz. Ancak eğer isterseniz bu işlem için de Fine Reader size yardımcı olabiliyor. 4. adımda yer alan "Check Re-sults" simgesi, kendince hatalı gördüğü ya da tanımakta zorluk çektiği kelimeleri sıralayacağı bir pencere açacaktır. Burada şüpheli kelimeleri bir bir düzeltip devam edebilirsiniz. Pencere içinde yer alan oldukça geniş sözcük dağarcığı da istediğinizi bulmanızda size yardımcı olacaktır. "Change to" bölümünde yer alan alana düzeltmeyi yapıp "Replace" olarak değişecek Confirm tuşuna bastığınızda düzeltme yapılacak ve bir sonraki kelimeye geçilecektir. Alt bölümde bulunan "Suggest" alanı ise biraz önce de bahsettiğimiz sözlük içinden benzer kelimeleri listeleyerek size tavsiyelerde bulunacaktır.
Tarayıcılara göre tarama arabirimi değişse de hemen hepsinde dpi, parlaklık ve renk modu ayarı mutlaka bulunur. |
Eğer yaptığınız düzeltme tavsiyeler arasında yoksa "Add" tuşunu kullanarak bunu listeye eklemeniz de mümkün. Bu durumda aynı kelime üzerine bir sonraki düzeltmede önerilenler arasında bu kelime de yer alacaktır. Eğer düzeltme gerekmiyorsa "Confirm" ya da "Ignore" tuşunu kullanıp bu kelimeyi geçebilirsiniz. Close ile bu pencereden çıkabilirsiniz. Türkçe sözlük kullandığınız için program tüm İngilizce kelimelerde hata varmış gibi gösterebilir. Bunu göz ardı edebilirsiniz.
Sihirbazın en son adımı olan 5. adımda ise, tüm sonuçları listede yer alan Word ya da Excel gibi bir programa gönderebilirsiniz. Sonuçların rtf, doç, txt ve htm gibi tüm metin biçimlerinde dosya olarak kaydedilmesi, varsayılan e-mail programına ya da panoya gönderilmesi de buradan mümkün olmaktadır. Eğer bu seçenekler arasından Word'ü seçtiyseniz, Fine Reader'ın neredeyse sayfanın birebir tasarımını belge içinde de oluşturduğunu da görebilirsiniz. Program burada yazıların dışında resimleri de ayıklayarak doğru yerlerine yerleştirecektir.
Önceden taranmış resimlerin tanımlanması da çok farklı değil
Eğer taramaya gerek duymuyorsanız, yani zaten hazırda olan bir resmi yazılım içinde kullanmak istiyorsanız, ilk adım hariç diğer adımları aynen uygulayarak da sonuca ulaşabilirsiniz. Bu durumda ilk adımda gerçekleştirdiğimiz l nolu "Scan" işlemi yerine bunun hemen solunda yer alan Scan&Read'in alt seçeneklerinden birini kullanmamız gerekecektir. Simgenin hemen yanındaki aşağı ok tuşuna bastığınızda açılacak olan menüden "Open&Read" seçeneğini kullanarak sabit diskinizdeki herhangi bir resim dosyasını seçebilirsiniz.
Ancak tabii ki en iyi sonucun alınması için seçeceğiniz resmin de bazı niteliklere sahip olması gerekir. Dolayısıyla daha yüksek çözünürlüklü ve daha okunaklı resimlerin düşük çözünürlüklü ve karmaşık yazılar içeren resimlere göre daha fazla şansı olacağını da unutmayın. Ayrıca seçeceğiniz resmi daha önceden bir resim düzenleme yazılımı ile 256 renk gri tonlamaya ya da sadece yazı ise siyah beyaz renk modu-na çevirerek programın tanımlama kalitesini artırabilirsiniz.
Çok fazla hata yapmasa da Fine Reader içinde yer alan hataları 4 adımda düzeltebilirsiniz. |
Sihirbaz içindeki sihirbaz ile hızlı sayfa tanımlamaları
Daha önce yazının başında da belirttiğimiz gibi eğer tüm sihirbaz adımlarını izleyerek başarılı bir şekilde tanımlama yapmaya başladıysanız artık Scan&Read'i kullanıp, tarayıcınız varsa ilk 3 adımın yoksa da 2 ile 3. adımların otomatik olarak gerçekleştirilmesini sağlayabilirsiniz. Bunun yanı sıra bu ilk simgenin yanındaki aşağı ok tuşunu kullanarak da sihirbaz içindeki Scan&Read adlı diğer bir sihirbazı da devreye sokabilirsiniz. Bu durumda eğer sisteminizde tarayıcı varsa onunla ilgili yapmanız gereken ön ayarları program size gösterecektir.
OCR teknolojisinin yapıp yapamayacakları ve hataları
Sonuç olarak tarayıcılar ile birlikte kullanılan OCR yazılımları, basılı metni bilgisayara aktarmak için kullanılabilecek inanılmaz programlardır. Üstelik sadece matbu harfleri değil, düzenli yazılmış el yazısını da tanıyabilirler. Ancak bu işlem, biraz daha uzun sürebilir. Sonuçta el yazınıza alışık olmayan programın tanıyamadığı her harf ya da kelime için öğrenme ile geçecek bir zamana hazır olmanız gerekebilir. Ayrıca çoğu OCR programında rastlandığı gibi Fine Reader'da da bulunan doğal bir hata birbirine çok yakın karakter tiplerinde harflerin yanlış algılanmasına yol açabilir.
Sonuçları Word'e gönderdiğimizde taradığınız sayfanın resimler ile birlikte neredeyse birebir kopyasına ulaşabiliyorsunuz. |
Bu durumda yazının dönüştürülmesinin ardından "d" olarak algılanmış "ol", "m" gibi algılanmış "rn" ya da olabilecek benzeri kombinasyonlara da dikkat etmek gerekir. Karakter tiplerinin tanımlanması ve bunların korunarak dönüştürme işleminin yapılabilmesi için bu karakter tiplerinin bilgisayarınızda yüklü olması gerektiğini de unutmayın. Aksi takdirde buna en yakın karakter tipi seçilecektir.
Chip Dergisi Kasım 2000
Mahmut Karslıoğlu (mkars@chip.com.tr)