4 Alat OCR Dalam Talian Percuma untuk Uji Muktamad

4 Alat OCR Dalam Talian Percuma untuk Uji Muktamad

Sekiranya anda ingin menukar teks yang dicetak menjadi teks digital yang boleh anda salin, tampal, edit, dan cari, anda perlu menggunakan pengimbas Pengecam Karakter Optik (OCR).



Apabila anda memilih untuk mengimbas atau mengambil gambar dokumen, ini akan disimpan dalam format seperti JPEG atau PDF. Perisian OCR kemudian dapat mengenali huruf dan angka dalam dokumen ini, dan mengubahnya menjadi PDF yang dapat dicari, atau ke dalam fail yang dapat anda edit dalam program seperti Microsoft Word.

Masalahnya ialah, beberapa pengimbas OCR berfungsi jauh lebih baik daripada yang lain, dengan yang terbaik cukup berat di dompet.





Omnipage18 misalnya, berharga $ 150, tetapi sangat baik dalam mengenali bahasa yang berbeza. Adobe Acrobat Pro DC berharga $ 400 tetapi mempunyai ketepatan yang luar biasa. ABBYY FineReader berharga $ 150, tetapi hebat menukar dokumen seperti majalah dan brosur menjadi teks yang boleh dicari. Kami akan menguji tawaran dalam talian ABBYY nanti dalam artikel ini.

Walau bagaimanapun, jika anda memerlukan alternatif percuma yang anda boleh muat turun dan gunakan pada Windows atau OS X, anda harus mencuba OCR Tools ini. Tetapi jika anda lebih suka menggunakan percuma, dalam talian Alat OCR, teruskan membaca, kerana kami telah mencuba beberapa yang teratas, dengan hasilnya di bawah.



Ujian itu

Nampaknya kebanyakan orang kini menggunakan telefon pintar mereka untuk melakukan imbasan untuk mereka, saya memutuskan untuk menggunakannya Aplikasi Evernote's Scannable (Percuma di iOS dan Android). Saya mengimbas halaman pertama Richard Dawkin's Mendaki Gunung Mustahil , untuk melihat apa hasil yang kita dapat dengan pemformatan yang sangat asas. Saya juga mengimbas halaman Tim Ferriss ' Chef 4 Jam untuk mencuba pengimbas dengan format yang sedikit lebih rumit. Saya menyimpan setiap fail ini sebagai PDF.

Dokumen-dokumen ini kemudian dijalankan melalui beberapa alat OCR dalam talian yang seharusnya terbaik untuk melihat sejauh mana nasib mereka.

OCR Dalam Talian Percuma [Tidak Ada Lagi]

Syukurlah, tidak diperlukan pendaftaran untuk menggunakan OCR Dalam Talian Percuma. Dan saya kagum dua kali apabila melihat tuntutan mereka untuk menjaga pemformatan dan susun atur dokumen saya.

Laman web ini mendakwa dapat menyokong PDF, GIF, BMP, JPEG, TIFF, dan PNG sebagai input. Keluaran boleh berupa DOC, dokumen teks PDF, RTF, dan TXT. Malangnya, saya tidak dapat mengetahui apakah mereka mempunyai had ukuran fail.

Dokumen Asas ke PDF

Ditukar dengan sempurna. Tidak banyak lagi yang boleh dikatakan! Kami pergi ke sangat permulaan yang bagus.

Dokumen Asas kepada DOC

Kata-kata sebenarnya nampaknya berubah dengan sempurna, selain dari 'ount' dari 'Mount Rushmore' entah bagaimana akan AWOL. Pemformatannya adalah cerita yang berbeza. Banyak koma diganti dengan garis bawah, dan ruang rawak dimasukkan pada titik di seluruh dokumen. Apabila anda kemudian melihat bagaimana perisian premium bernasib baik dalam ujian ini, ini bukan usaha yang buruk sama sekali .

Dokumen Kompleks ke PDF

Dokumen Kompleks ke DOC

Kali ini, penukaran hanya memerlukan 10 saat, dengan teks ditukar semula dengan ketepatan sekitar 95%. Terdapat beberapa masalah jarak pelik, dan perisian menghadapi masalah menukar fon di kanan atas dokumen, dan kehilangan beberapa watak di sana-sini.

Keputusan

i2OCR

i2OCR membuat beberapa tuntutan yang mengagumkan. Alat ini mengenali lebih dari 60 bahasa, dapat menangani tata letak multi-kolom (dengan menghapus pemformatan), tidak memiliki had ukuran fail, dapat mengubah fail yang diunggah dan dari URL. Anda juga tidak perlu mendaftar untuk menggunakan alat ini.

Perkhidmatan ini berfungsi dengan hanya mengekstrak teks dari gambar anda, kemudian mengeluarkan teks yang tidak diformat. Anda dapat dengan cepat memperbaiki segala kesalahan dalam paparan bersebelahan, sebelum menyalin teks ke program lain, atau memuat turun sebagai DOC, PDF, atau HTML.

Catatan: semasa saya cuba memuat naik dokumen PDF saya, dokumen ini ditolak oleh i2OCR, jadi saya perlu menukarnya menjadi JPEG (dengan mengambil tangkapan skrin, kemudian memuat naik fail).

Dokumen Asas hingga Teks Biasa

Dokumen Kompleks hingga Teks Biasa

Sebilangan besar teks ditukar tanpa terlalu banyak kesalahan, selain tajuk dan resipi di bahagian kanan atas, yang tidak dapat dibaca untuk alat ini. Cara lajur ditukar menjadi teks biasa jauh dari ideal. Sekiranya anda ingin menjadikan penukaran ini dapat dilaksanakan, banyak masa diperlukan untuk menyusun semula baris menjadi ayat yang koheren.

Keputusan

OCR dalam talian

OCR dalam talian kini menyokong 46 bahasa yang berbeza, dan dapat menukar PDF, JPG, BMP, TIFF, dan GIF ke dalam format Word, Excel, atau Plain Text. Laman web ini mendakwa 'dokumen yang ditukar sama seperti yang asli - jadual, lajur dan grafik'.

Versi yang boleh anda gunakan tanpa mendaftar membolehkan anda menukar sehingga 15 gambar per jam (had 5mb). Sekiranya anda mendaftar untuk akaun, anda boleh membeli lebih banyak halaman di atas had ini, dan juga dapat menukar dokumen berbilang halaman dan arkib ZIP.

Dokumen Asas kepada DOC

Dokumen asas ditukar dengan sempurna selain daripada angka Rom Saya tidak dijemput. Seperti yang dijanjikan oleh laman web, formatnya sama seperti yang terdapat dalam buku. Kudos ke alat ini.

Dokumen Kompleks ke DOC

Setelah kecewa dengan alat OCR sebelumnya dalam menukar dokumen yang rumit, saya sangat terkesan dengan OCR Dalam Talian. Susun aturnya hampir sempurna, seperti yang anda lihat di atas. Sekali lagi, resipi itu tidak diambil dengan baik, tetapi kesalahan kecil lain tidak dapat diabaikan.

Keputusan

Hasil yang sangat hebat dari OCR Dalam Talian. Satu-satunya kelemahan yang saya lihat ialah tidak ada cara untuk memuat turun dokumen yang ditukar sebagai PDF kerana format output yang disebutkan termasuk DOCX, XLSX, dan TXT sahaja.

ABBYY FineReader Online (Percubaan 10 Halaman)

Seperti yang telah disebutkan sebelumnya, ABBYY adalah salah satu peneraju pasaran dalam perisian OCR, berharga sekitar $ 150 untuk program penuh yang boleh dimuat turun. Mereka menawarkan Percubaan percuma 10 halaman walaupun untuk alat dalam talian mereka (pendaftaran diperlukan). Untuk langganan $ 5, alat dalam talian mereka akan membolehkan anda menukar 200 halaman setiap bulan.

Fail yang diterima boleh mencapai 100mb, dalam format berikut: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP, dan PNG. ABBYY juga mengenali hampir 200 bahasa. Keluaran sangat mengagumkan, dengan pilihan antara DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2, dan EPUB.

Anda juga boleh mencuba beberapa ciri BETA semasa percubaan anda. Yang pertama adalah pilihan untuk menterjemahkan dokumen anda ke bahasa lain. Yang lain adalah mengeksport dokumen yang ditukar ke akaun penyimpanan awan anda, sama ada Dropbox, Google Drive, Evernote, Microsoft OneDrive, atau Box.

Dokumen Asas kepada DOCX

Dokumen Kompleks ke DOCX

Setelah ditukarkan, terdapat sedikit kesalahan dalam teks dalam dokumen (selain dari OCR yang bergelut dengan fon resipi itu lagi!), Tetapi formatnya masih banyak yang diinginkan.

Ketiga-tiga lajur itu merangkumi dua halaman, dengan lajur tengah hanya terpapar di halaman kedua. Sekiranya anda mahu sebenarnya buat apa sahaja dengan dokumen yang ditukar ini, anda akan menarik rambut anda.

Dokumen Asas ke PDF

Dokumen Kompleks ke PDF

Keputusan

Hasil Akhir

Sekiranya, seperti kebanyakan orang, anda hanya ingin mengimbas beberapa artikel majalah, dan beberapa bil isi rumah, anda tidak perlu mengedit dokumen ini. Oleh itu, menukar terus ke PDF akan sesuai untuk anda, kerana anda masih dapat mencari dokumen tersebut. Untuk ini, OCR Percuma Dalam Talian pasti merupakan alat percuma terbaik yang kami uji. Kononnya, jika anda sanggup membayar $ 5 sebulan untuk kesempurnaan hampir, FineReader ABBYY Dalam Talian sedikit lebih tepat.

Ketika menukar dokumen menjadi DOC, kami tidak berjaya mencari penyelesaian yang sempurna, tetapi sejauh ini hasil terbaik datang dari OCR dalam talian . Penukaran tidak sempurna, tetapi integriti pemformatan sebahagian besarnya tetap utuh, dan kesalahan tidak dapat diabaikan. Apabila kami membandingkan hasil ini dengan tawaran 'premium' dari ABBYY, anda tidak boleh tidak terkesan secara besar-besaran.

Kami tidak memasukkan keupayaan OCR Google Drive dalam siaran ini; sedikit untuk kesegaran Google, tetapi lebih daripada fakta bahawa kami ingin menguji beberapa perkhidmatan OCR dalam talian percuma di luar sana.

Mengenai anda: Alat OCR dalam talian yang mana yang akan anda cadangkan kepada pembaca kami? Dan yang mana yang telah anda cuba yang tidak akan anda gunakan lagi?

Berkongsi Berkongsi Tweet E-mel Panduan Pemula untuk Animasi Ucapan

Animasi pertuturan boleh menjadi cabaran. Sekiranya anda sudah bersedia untuk mula menambahkan dialog ke projek anda, kami akan menguraikan proses untuk anda.

cara menangkap seseorang yang mengintip di dalam telefon anda
Baca Seterusnya Topik-topik yang berkaitan
  • Internet
  • Produktiviti
  • Penukaran Fail
  • OCR
Mengenai Pengarang Rob Nightingale(272 Artikel Diterbitkan)

Rob Nightingale mempunyai ijazah dalam bidang Falsafah dari University of York, UK. Dia telah bekerja sebagai pengurus dan perunding media sosial selama lebih dari lima tahun, sambil memberi bengkel di beberapa negara. Selama dua tahun kebelakangan ini, Rob juga menjadi penulis teknologi, dan merupakan Pengurus Media Sosial MakeUseOf, dan Editor Newsletter. Anda biasanya akan menjumpainya menjelajah dunia, belajar menyunting video, dan bereksperimen dengan fotografi.

Lagi Dari Rob Nightingale

Langgan buletin kami

Sertailah buletin kami untuk mendapatkan petua, ulasan, ebook percuma, dan tawaran eksklusif!

Klik di sini untuk melanggan