Optik Karakter Tanıma (OCR) Nedir?

Abdullah Şahin

Altın Üye
Altın Üye
Kayıt
3 Nisan 2008
Mesaj
2.630
Tepki
89
Optik Karakter Tanıma (OCR) Nedir?

Optik Karakter Tanıma (OCR), elektronik görüntüler üzerindeki karakterlerin ya da metin bilgilerinin okunarak ASCII koda dönüştürülmesi işlemidir. OCR metodolojileri kullanılarak makineler tarafından yazılmış karakterler, elyazısı karakterler ve işaretler kolaylıkla okunup ASCII koda dönüştürülebilirler. OCR, makineler tarafından yazılmış karakterlerin okunup tanınmasında kullanılan teknolojidir. ICR (Intelligent Character Recognition) ise elyazısı karakterlerin okunup tanınmasında kullanılan teknolojidir.

Optik Karakter Tanıma (OCR) Neleri Kapsar?

OCR iki sınıfa ayrılır: Otomatik Karakter Tanıma (ADC-Automatic Character Recognition ) ve metin tanıma (TR-Text Recognition). ADC ile her karakter doğru olarak tanınır ve karşılığında bir ASCII kod atanır. Örneğin; OCR ile bir çek üzerindeki resmi olmayan miktar alanı tanınıp, MICR teknolojisi ile kodlanarak bir bankacılık sisteminde işlenebilir. Para alanı ise genelde elyazısı ile doldurulur ve bu karakterler sınırlı bir doğrulukla tanınabilirler. Bir ADC uygulamasında, başarılı bir tanımanın göstergesi %99.98 tanıma doğruluk derecesine ulaşılmasıdır. ADC sürecinin başlangıcında bu değer genellikle daha düşüktür ve ardından yapılan görüntü işleme algoritmalarıyla yükseltilir.

Bazı durumlarda, full text search işlemi gerçekleştirmek için, verilen bir sayfa üzerindeki metnin TR OCR ile tanınması gereklidir. Burada OCR makine yazısı olan alfanümerik karakterlerin tanınmasında kullanılır. TR ile ise sözlükler de kullanılarak cümlelerin içerikleri de karakter tanımaya etkide bulunur.

Optik Karakter Tanıma (OCR) Nasıl Çalışır?

Karakterlerin tanınmasında birkaç OCR metodolojisi kullanılır. Bunlar arasında topolojik tabanlı olan, yapay sinir ağlarına dayanan, matris eşleme ile gerçekleşen, öznitelik analizi ile çalışan ve eğrileri izleyerek karakter tanıma işlemini gerçekleştiren metodolojiler yer almaktadır. Karakterlerin daha büyük doğrulukla tanınması için, okunan verilere ön işleme ve son işleme algoritmaları uygulanmaktadır. Bu algoritmalar, formların belirlenmesinde, formlar üzerindeki belirli alanların silinmesinde, form ve karakterlerin düzeltilmesinde (deskew) ve görüntünün iyileştirilmesinde kullanılırlar. Karakterlerin büyük doğrulukla okunmasında, sisteme sunulan elektronik görüntünün mümkün olduğunca keskin (sharp), temiz ve düzgün olması oldukça büyük önem taşımaktadır. Buna rağmen, günlük yaşamda kullanılan dokümanlar ve formlar genellikle kirli, yıpranmış ve katlanmıştırlar. Tanıma işleminden önce uygulanacak ön işleme algoritmaları ile formun elektronik görüntüsü temizlenir ve karakterler mümkün olduğunca iyileştirilir.

Karakterlerin tanınması sırasında, kullanıcı tarafından kabul edilmeyen ya da doğruluk kriterini yakalayamayan karakterler reddedilmelidir (tanınmıyor olarak değerlendirilmelidir). Örneğin doğruluk kriteri olarak % 99.98 kabul edilirse, doğru olmadığı kabul edilen birçok karakter reddedilecektir. Eğer doğruluk kriteri daha aşağı sınırlara çekilirse, tanınan karakter sayısı artacaktır. Buna rağmen % 99 oranındaki doğruluk kriterleri sıklıkla kullanılmaktadır.

İçinde OCR tarafından okunamayan karakterler de bulunan reddedilen karakterler doğrulukla belirlenebilmelidir. Bu işlem genelde karakterin ekrana getirilerek el ile girişi yapılması süreci ile gerçekleştirilir.

Doğruluğu iyileştirmenin en son basamağı ise OCR ya da el ile girişi yapılmış tüm karakterlerin işlenmesi, doğruluğunun istenilen kriteri yakaladığının sınanması ya da kullanıcı gereksinimini karşılayıp karşılamadığının belirlenmesidir. Son işleme işlemleri ile sözü edilen son basamak gerçekleştirilebilir. Ticari olarak var olan algoritmalar ile bu adım kolaylıkla uygulanabilir. Verinin arıtılması adı da verilen bu işlemler, karakter tanımadaki doğruluğu büyük oranda arttırmaktadır.

Optik Karakter Tanıma (OCR) Sistemlerini Kimler Kullanır?

Günümüzde, doküman işleme işlemleri ile ilgilenen kişiler, operasyon maliyetlerini düşürmek ve verimlilik oranlarını arttırmak isteyen her kullanıcı OCR ya da ICR teknolojilerini göz önüne alırlar.

OCR teknolojisi sıklıkla şu alanlarda kullanılır :
  • Masaüstü Yayıncılık
  • Mahkemelerle İlgili Alanlar
  • Vergilendirme ve Tahsilat
  • Personel Kayıt Yönetimi
  • Nüfus Sayımı Formlarının İşlenmesi
  • Çek İşleme
  • Ödeme İşleme
  • Emekli Fonu İşleme
  • Sipariş İşleme
  • Tıbbi İstekler
Günümüz ekonomisinde, elektronik doküman yönetimi sistemlerinin, hem iş dünyasında hem de devletin yönetim mekanizmalarında, görüntüleme ve OCR teknolojilerini birlikte kullandıklarını görebiliriz. İçinde yaşadığımız çalkantılı, dinamik ve maliyetlerin önem taşıdığı günümüz çalışma ortamlarında, OCR ile tanıma işlemleri görüntüleme teknolojisi ile birleştirilerek 21. yüzyıla geçişte kullanılan önemli bir basamaktır.

Kaynak
Kets.Com
 
Yukarı Alt