JavaScript

Tesseract.js – Tarayıcılara Resim OCR Çevirisi Kazandırmak

Yazan Fatih

OCR çevirisi hala mükemmel değil lakin son birkaç yıldır önemli ölçüde gelişti. Bu gelişmeye öncülük eden bir yolda C++ kaynaklı Tesseract çeviri motorudur.

Tesseract, inanılmaz bir kütüphane olsa da yazılımla sınırlıdır. Biri çıkıp Tesseract’in bir bağlantı yolunu JavaScript’e dönüştürdü. Buna Tesseract.js adı verildi. 60 dile kadar destek sağlamaktadır. Kesin olarak mükemmel sonuç vermemesine rağmen iyi iş yapmaktadır.

OCR kısaltmasının Türkçe’de kısaltma olarak bir karşılığı bulunmamaktadır ve tüm dünyada kullanıldığı gibi dilimizede OCR olarak geçmiştir. Optical Character Recognition kelimeleri Türkçe’ye Optik Karakter Tanımlama olarak çevrilebilir.

Sayfada hedeflediğiniz herhangi bir görüntü öğesini Tesseract.recognize() fonksiyonuyla çalıştırabilir. Görüntü türünü alıp tarayıcıda otomatik olarak sıkıştıracak ve çevirecektir.

Canlı bir demo görmek istiyorsanız Tesseract.js sayfasını inceleyebilirsiniz. Otomatik OCR çevirisi almak için taranan herhangi bir görüntü metnini sürükleyip bırakabilirsiniz.

tesseractJS-translation-demo

Bu örneği ayrıca GitHub sayfası aracılığıyla yerel olarak da indirebilirsiniz. Yada Tesseract.js script dosyasını CDN’den doğrudan dahil ederek kendi uygulamanızı oluşturabilirsiniz.

Not: CDN servislerini tercih etmeniz daha iyi performans almanızı sağlayabilir. Sonuç olarak bu servisler sadece bu amaca hizmet etmek için çalıştıkları için çoğu zaman daha düşük bir performansta çalışacağı için CDN’leri kullanarak zaman ve performans kazanabilirsiniz.

Basit kod örneği olarak bir HTML resim elementi olan myImage‘i doğrudan referans alırsak aşağıdaki gibi görünür.

Mükemmel olmaktan uzak olsa da dinamik sayfa içi OCR işlevselliği isteyen web geliştiricileri için en iyi kaynaklardan bir tanesidir.

Daha fazla bilgi edinmek için online dokümantasyonlara göz atabileceğiniz Tesseract.js GitHub sayfasını ziyaret edebilirsiniz.

Geri bildiriminizi aşağıdaki yorum bölümüne bırakmayı unutmayın. Umarım faydalı olmuştur. Herkese iyi çalışmalar diliyorum. Webmaster Mutfakta kalın. ?

İşin mutfağını öğrenmek herkesin hakkı! Webmaster Kitchen işin mutfağını öğrenin.  ?



Yazar hakkında

Fatih

Çırak JavaScript Engineering @universe

Yorumlar

Bir yorum yaz