OCR ve OCR Teknlojisi nedir

Farz edelim ki, bir dergi makalesini veya kâğıda basılmış bir sözleşmeyi dijitalleştirmek istiyorsunuz. Yeniden yazmak ve daha sonra yazım hatalarını düzeltmek için saatler harcayabilirsiniz. Veya gerekli tüm materyalleri, tarayıcı (ya da dijital kamera) ve Optik Karakter Tanıma (OCR) yazılımı kullanarak birkaç dakika içinde dijital biçime dönüştürebilirsiniz.



Box_FR12PE_L_EN_95_transparent.png

OCR programı ABBYY

ABBYY FineReader 12 Belgeleri düzenlenebilir ve aranabilir dosyalara dönüştürmek için akıllı bir yazılım.

Satın al | Ücretsiz deneme | Teknik özellikler | Kurumsal lisanslama

OCR tam olarak ne anlama gelir?

Optik Karakter Tanıma veya OCR, taranmış kâğıt evrakları, PDF dosyaları veya dijital bir kamerayla çekilen resimler gibi değişik belge türlerini düzenlenebilir ve aranabilir verilere dönüştürmenize olanak sağlayan bir teknolojidir.

Farz edin ki elinizde kâğıt bir evrakınız var - örneğin bir dergi makalesi, broşür veya iş ortağınızın size elektronik postayla yolladığı PDF formatında bir sözleşme. Elbette bu bilgileri, mesela, Microsoft Word’de düzenlemek için bir tarayıcı yeterli olmayacaktır.  Bir tarayıcının tüm yapabileceği şey, belgenin resmini oluşturmaktır, ki bu raster görüntüsü olarak bilinen siyah beyaz veya renkli noktalar topluluğundan başka bir şey değildir. Taranmış belgelerden, kamera resimlerinden veya sadece resim içeren PDF dosyalarından verileri çıkartmak ve başka bir amaç için düzenlemek amacıyla resimlerdeki harfleri seçip ayıracak, onlardan kelimeleri ve kelimelerden de cümleleri oluşturup bu sayede orijinal belgenin içeriğine erişmenize ve düzenlemenize olanak tanıyacak bir OCR yazılımına ihtiyacınız vardır.

OCR’ın arkasında hangi teknoloji yatıyor?

İnsanların nesne tanımasını sağlayan asıl mekanizma henüz bilinmemektedir fakat üç ana prensip, bilim adamları tarafından artık bilinmektedir — bütünlük, amaçlılık ve uyarlanırlık (BAU*). Bu prensipler ABBYY FineReader OCR’ın çekirdeğini oluşturmakta ve ona doğal veya insani tanıma kabiliyetini taklit etme imkânını vermektedir.

FineReader OCR’ın metinleri nasıl tanıdığına bir bakalım. İlk olarak, program belge görüntüsünün yapısını incelemektedir. Sayfayı, metin blokları, tablolar, resimler gibi parçalara bölmektedir. Satırlar önce kelimelere sonra da karakterlere bölünmektedir. Karakterler seçilip ayrıldıktan sonra, program onları bir takım örnek resimlerle karşılaştırır. Bu şekilde karakterin ne olduğu konusunda çok sayıda varsayım geliştirilir. Bu varsayımlara dayanarak, program, satırların kelimelere, kelimelerin de karakterlere bölünmesinin çeşitli değişkenlerini incelemektedir. Bu gibi olasılıklı varsayımları çok yüksek miktarda işledikten sonra son olarak program bir karar alır ve tanınan metni size sunar.

Ayrıca, ABBYY FineReader 36 dil için sözlük desteği sağlamaktadır. Bu da metin öğelerinin kelime düzeyinde ikincil analiz olanağını sağlar. Sözlük desteğiyle program, belgelerin daha da doğru analizini ve tanınmasını sağlamakta ve tanıma sonuçlarının doğrulamasını kolaylaştırmaktadır.


* BAU      
FineReader OCR hangi prensiplere dayanmaktadır?

ABBYY FineReader OCR gibi ileri seviye tanıma sistemleri, doğal veya “canlı varlıklara özgü” tanımayı taklit etmeye odaklanmıştır. Bu sistemlerin özünde üç temel prensip bulunmaktadır: Bütünlük, Amaçlılık ve Uyarlanırlık. Bütünlük prensibi, gözlemlenen nesnenin birbiriyle bağlantılı birçok parçadan oluşan bir “bütün” olarak dikkate alınması gerektiğini söylemektedir. Amaçlılık prensibi, herhangi bir veri tercümesinin bir amaca hizmet etmesi gerektiğini varsaymaktadır. Ve uyarlanırlık prensibi programın kendi kendine öğrenebilir olması gerektiği anlamına gelmektedir.

BAU prensiplerine dayanarak kurulan bir OCR uygulamasının avantajlarını görebilmek için OCR uzmanı olmanıza gerek yok. Bu prensipler, programı insan tanımasına mümkün olduğu kadar yakınlaştırarak ona maksimum esneklilik ve zekâ kazandırır.

ABBYY, yıllar süren araştırmalardan sonra yukarıda tarif edilen BAU prensiplerini kendi OCR teknolojilerinde uygulayabilmiştir.

Dijital kamera resimlerinin tanınması

Dijital bir kamerayla çekilen resimler, taranmış belgelerden veya sadece resim içeren PDF dosyalardan farklıdır. Çoğu OCR uygulaması için doğru şekilde metin tanımayı zorlaştıran, köşelerde çarpıklık soluk ışık gibi kusurlara sahiptir ABBYY FineReader’ın son sürümü, özellikle kamera resimlerini işlemek için tasarlanmış uyarlanabilir tanıma teknolojisini desteklemektedir. Dijital cihazlarınızın kabiliyetlerini tam olarak kullanma yeteneğini sağlayarak resimlerin özelliğini geliştirmek için bir dizi özellik sunmaktadır. 

Dijital Kamera OCR’ın tanıma özelliği hakkında daha fazla bilgi burada mevcuttur.

OCR yazılımı nasıl kullanılır?

ABBYY FineReader OCR’ı kullanmak çok kolay: Süreç genellikle üç aşamadan oluşmaktadır: Belgeyi açma (tarama), tanıma ve uygun bir biçimde (DOC, RTF, XLS, PDF, HTML, TXT vb.) kaydetme veya verileri doğrudan Microsoft Word, Excel veya Adobe Acrobat gibi uygulamaların birine aktarma.

Bunun yanında, ABBYY FineReader’ın son sürümü, rutin görevlerle düzenli olarak uğraştığınız zaman gerekli olan Otomatikleştirilmiş Görev modunu desteklemektedir. Bu özellikle, tanıma görevleri, yukarıda bahsi geçen aşamaların hiçbirini elle yapmanıza gerek kalmadan otomatik olarak çalışır.

OCR size ne gibi avantajlar sunuyor?

FineReader OCR ile tanınan belge, aynen orijinali gibi görünür. İleri seviye ve etkili OCR yazılımı, çeşitli belgeleri oluştururken, işlerken ve başka bir amaç için değiştirirken çok fazla zaman ve çabadan tasarruf etmenize olanak sağlar. ABBYY FineReader OCR ile ilave düzenleme yapmak ve meslektaşlarınızla, ortaklarınızla paylaşmak için kâğıt evrakları tarayabilirsiniz. Yeniden yazmaya gerek kalmadan, kitaplardan ve dergilerden alıntılar aktarabilir ve onları ders çalışmalarınızı ve raporlarınızı oluşturmak için kullanabilirsiniz. Dijital kamera ve FineReader OCR ile birlikte dışarıdaki afişlerden, posterlerden, zaman çizelgelerinden metinleri yakalayabilir ve daha sonra yakalanan bilgiyi kendi ihtiyaçlarınız için kullanabilirsiniz. Aynı şekilde, eğer yakınınızda tarayıcı yoksa veya kullanamıyorsanız, kitaplar ve kâğıt evraklardan bilgi aktarabilirsiniz. Bunun yanında OCR yazılımını aranabilir PDF arşivleri oluşturmak için kullanabilirsiniz.

Orijinal kâğıt evraktan, resimden veya PDF dosyadan bilgi dönüştürme sürecinin tamamı bir dakikadan az sürmektedir ve tanınan tamamlanmış belge aynen orijinali gibi görünür!

OCR yazılımının günlük hayatta size nasıl yardımcı olabileceği hakkında daha fazla bilgi burada mevcuttur.

Box_FR12PE_L_EN_95_transparent.png

OCR programı ABBYY

ABBYY FineReader 12 Belgeleri düzenlenebilir ve aranabilir dosyalara dönüştürmek için akıllı bir yazılım.

Satın al | Ücretsiz deneme | Teknik özellikler | Kurumsal lisanslama