Tutorial Cara Melakukan Ekstrak atau Konversi Gambar ke Format Teks di Linux


Hallo Sobat,

Tutorial kali ini adalah Cara Melakukan Ekstrak atau Konversi Gambar ke Format Teks di Linux, cara ini berguna jika sobat ingin melakukan konversi gambar yang berisi teks. Atau secara sederhana, misalnya sobat memiliki dokumen hasil scan menggunakan scanner, secara umum output dari hasil scan berbentuk file gambar (jpg/png) maupun format pdf. Tapi sobat ingin mengambil maupun mengedit teks yang berada pada gambar hasil scanner tersebut yang pasti sobat akan kesulitan jika harus mengeditnya menggunakan aplikasi editor foto/gambar.

Bagi sobat pengguna Linux, terlebih khusus yang menggunakan Distro Ubuntu, Linux Mint dll. Sobat bisa mencoba menggunakan salah satu tool yang lumayan bagus dan berguna, nama tool tersebut  “Tesseract” tool ini berguna untuk melakukan konversi gambar yang berisi teks kemudian mengubahnya menjadi Format Text. Sebenarnya ada tool-tool lain yang serupa, ibarat cinta pada pandangan pertama, saya terlanjur jatuh hati dengan tool ini… (Lebay, Mode On 😀 :D).

Ok. Langsung saja….





Untuk menggunakan tool ini, langkah pertama sobat harus meng-instal terlebih dahulu tool tersebut dengan perintah :

        sudo apt-get install tesseract-ocr

install

 

Setelah tool tersebut ter-install selanjutnya jalankan tool tersebut untuk melakukan konversi. Cukup dengan perintah yang sederhana : ~$ tesseract nama_file_gambar.jpg hasil_output_text.txt

Sebagai percobaan, saya melakukan konversi sebuah gambar yang saya foto menggunakan kamera ponsel :

img

 

Kemudian eksekusi dengan perintah  ~$ tesseract img.jpg hasil_output_img.txt dan tekan enter. (nb: yang warna merah merupakan nama file gambar, dan yang berwarna hijau untuk menampung hasil konversi)

eksekusi

Tunggu beberapa saat, prosesnya tergantung ukuran file serta kualitas gambar, semakin tinggi ukuran file tersebut maka akan sedikit lama prosesnya, begitu pula dengan kualitas gambarnya, semakin  rendah kualitas gambarnya maka prosesnya akan sedikit lama.

hasil

Tool ini hanya bisa melakukan konversi untuk gambar yang berisi text huruf standar, untuk tulisan tangan maupun jenis huruf kaligrafi masih belum bisa di konversi oleh tool ini.

Untuk hasil outputnya kurang lebih 90% sesuai dengan file gambar yang asli tergantung kualitas dari gambar tersebut. Seperti percobaan diatas, untuk outputnya masih ada sedikit huruf maupun kata yang tidak sesuai. Semakin jelas sebuah gambar akan semakin bagus hasilnya.

Untuk tutorial videonya, bisa sobat lihat dibawah ini :