5 δωρεάν υπηρεσίες OCR online δοκιμασμένες και αναθεωρημένες
Έχετε ένα έγγραφο PDF ή μια εικόνα που θέλετε να μετατρέψετε σε κείμενο; Πρόσφατα, κάποιος μου έστειλε ένα έγγραφο στο ταχυδρομείο, το οποίο έπρεπε να επεξεργαστώ και να στείλω πίσω με διορθώσεις. Το άτομο δεν μπόρεσε να εντοπίσει ένα ψηφιακό αντίγραφο, γι 'αυτό ήμασταν επιφορτισμένοι με τη λήψη όλου αυτού του κειμένου σε ψηφιακή μορφή.
Δεν υπήρχε κανένας τρόπος να ξοδεύω ώρες να πληκτρολογώ τα πάντα πίσω, έτσι κατέληξα να κάνω μια ωραία εικόνα υψηλής ποιότητας του εγγράφου και έπειτα έκαψα το δρόμο μου μέσα από μια δέσμη των online υπηρεσιών OCR για να δω ποιος θα μου έδινε το καλύτερο Αποτελέσματα.
Σε αυτό το άρθρο, θα περάσω από μερικά από τα αγαπημένα μου sites για OCR που είναι δωρεάν. Αξίζει να σημειωθεί ότι οι περισσότεροι από αυτούς τους ιστότοπους παρέχουν μια βασική δωρεάν υπηρεσία και έπειτα έχουν πληρωμένες επιλογές αν θέλετε επιπλέον λειτουργίες όπως μεγαλύτερες εικόνες, έγγραφα PDF πολλαπλών σελίδων, διαφορετικές γλώσσες εισόδου κ.λπ..
Είναι επίσης καλό να γνωρίζετε εκ των προτέρων ότι οι περισσότερες από αυτές τις υπηρεσίες δεν θα είναι σε θέση να ταιριάζουν με τη μορφοποίηση του πρωτότυπου εγγράφου σας. Αυτά είναι κυρίως για την εξαγωγή κειμένου και αυτό είναι. Αν χρειάζεστε τα πάντα για να είστε σε συγκεκριμένη διάταξη ή μορφή, θα πρέπει να το κάνετε αυτόματα μόλις λάβετε όλο το κείμενο από το OCR.
Επιπλέον, τα καλύτερα αποτελέσματα για τη λήψη του κειμένου θα προέρχονται από έγγραφα με ανάλυση 200 έως 400 DPI. Εάν έχετε χαμηλή εικόνα DPI, τα αποτελέσματα δεν θα είναι τόσο καλά.
Τέλος, υπήρχαν πολλές τοποθεσίες που δοκιμάσαμε και απλά δεν λειτουργούσαν. Αν έχετε δωρεάν Google OCR στο διαδίκτυο, θα δείτε μια δέσμη ιστότοπων, αλλά αρκετοί από τους ιστότοπους στα κορυφαία 10 αποτελέσματα δεν ολοκλήρωσαν τη μετατροπή. Μερικοί θα χάσουν χρόνο, άλλοι θα έδιναν λάθη και κάποιοι έμειναν κολλημένοι στη σελίδα "μετατροπής", οπότε δεν μπήκα στον κόπο να αναφέρω αυτούς τους ιστότοπους.
Για κάθε τοποθεσία, εξέτασα δύο έγγραφα για να δούμε πόσο καλά θα ήταν η παραγωγή. Για τις δοκιμές μου, απλά χρησιμοποίησα το iPhone 5S μου για να τραβήξω μια εικόνα και των δύο εγγράφων και στη συνέχεια τα ανέβασα απευθείας στους ιστότοπους για μετατροπή.
Σε περίπτωση που θέλετε να δείτε ποιες εικόνες έμοιαζαν με αυτές που χρησιμοποίησα για τη δοκιμή μου, τις έχω συνδέσει εδώ: Test1 και Test2. Σημειώστε ότι αυτές δεν είναι οι εκδόσεις πλήρους ανάλυσης των εικόνων που λαμβάνονται από το τηλέφωνο. Χρησιμοποιούσα την εικόνα πλήρους ανάλυσης κατά τη μεταφόρτωση στους ιστότοπους.
OnlineOCR
OnlineOCR.net είναι ένα καθαρό και απλό site που έδωσε πολύ καλά αποτελέσματα στη δοκιμή μου. Το κύριο πράγμα που μου αρέσει είναι ότι δεν έχει τόνο διαφημίσεων σε όλη τη χώρα, πράγμα που συμβαίνει συνήθως με αυτά τα είδη των εξειδικευμένων τοποθεσιών εξυπηρέτησης.
Για να ξεκινήσετε, επιλέξτε το αρχείο σας και περιμένετε μέχρι να ολοκληρωθεί η μεταφόρτωση. Το μέγιστο μέγεθος μεταφόρτωσης για αυτόν τον ιστότοπο είναι 100 MB. Αν εγγραφείτε για έναν δωρεάν λογαριασμό, θα έχετε μερικές επιπλέον λειτουργίες όπως το μεγαλύτερο μέγεθος μεταφόρτωσης, PDF σε πολλές σελίδες, διαφορετικές γλώσσες εισόδου, περισσότερες μετατροπές ανά ώρα, κ.λπ..
Στη συνέχεια, επιλέξτε τη γλώσσα εισαγωγής και στη συνέχεια επιλέξτε τη μορφή εξόδου. Μπορείτε να επιλέξετε ανάμεσα σε Word, Excel ή Απλό κείμενο. Κάντε κλικ στο Μετατρέπω και θα δείτε το κείμενο που εμφανίζεται στο κάτω μέρος ενός πλαισίου μαζί με ένα σύνδεσμο λήψης.
Εάν το μόνο που θέλετε είναι το κείμενο, απλά αντιγράψτε και επικολλήστε το από το κουτί. Ωστόσο, προτείνω να κατεβάσετε το έγγραφο του Word επειδή κάνει μια εκπληκτικά καλή δουλειά να κρατήσει τη διάταξη του πρωτότυπου εγγράφου.
Για παράδειγμα, όταν άνοιξα το έγγραφο του Word για τη δεύτερη δοκιμή μου, με εξέπληξε ότι το έγγραφο περιελάμβανε ένα τραπέζι με τρεις στήλες, όπως και στην εικόνα.
Από όλες τις τοποθεσίες, αυτό ήταν το καλύτερο από μακριά. Είναι εντελώς αξίζει να εγγραφείτε για αν χρειάζεται να κάνετε πολλές μετατροπές.
Για πληρότητα, πρόκειται επίσης να συνδεθώ με τα αρχεία εξόδου που δημιουργούνται από κάθε υπηρεσία, ώστε να μπορείτε να δείτε τα αποτελέσματα για τον εαυτό σας. Εδώ είναι τα αποτελέσματα από το OnlineOCR: Test1 Doc και Test2 Doc.
Σημειώστε ότι κατά το άνοιγμα αυτών των εγγράφων του Word στον υπολογιστή σας, θα λάβετε ένα μήνυμα στο Word το οποίο δηλώνει ότι προέρχεται από το Internet και ότι η επεξεργασία έχει απενεργοποιηθεί. Αυτό είναι απολύτως εντάξει επειδή το Word δεν έχει εμπιστοσύνη στα έγγραφα από το Internet και δεν χρειάζεται να ενεργοποιήσετε την επεξεργασία εάν θέλετε απλώς να δείτε το έγγραφο.
i2OCR
Μια άλλη τοποθεσία που έδωσε αρκετά καλά αποτελέσματα ήταν i2OCR. Η διαδικασία είναι πολύ παρόμοια: επιλέξτε τη γλώσσα, το αρχείο και στη συνέχεια πατήστε Εξαγωγή κειμένου.
Θα πρέπει να περιμένετε ένα ή δύο λεπτά εδώ επειδή ο ιστότοπος αυτός διαρκεί περισσότερο. Επίσης, στο Βήμα 2, βεβαιωθείτε ότι η εικόνα σας εμφανίζεται δεξιά στην προεπισκόπηση, αλλιώς θα πάρετε μια δέσμη τρελών ως έξοδο. Για κάποιο λόγο, οι εικόνες από το iPhone μου εμφανίζονταν σε κατάσταση πορτραίτου στον υπολογιστή μου, αλλά το τοπίο όταν ανεβαίνω σε αυτόν τον ιστότοπο.
Έπρεπε να ανοίξω χειροκίνητα την εικόνα σε μια εφαρμογή επεξεργασίας φωτογραφιών, να την περιστρέψω 90 μοίρες, στη συνέχεια να την περιστρέψω σε πορτραίτο και να την αποθηκεύσω ξανά. Μόλις ολοκληρωθεί, μετακινηθείτε προς τα κάτω και θα σας δείξει μια προεπισκόπηση του κειμένου μαζί με ένα κουμπί λήψης.
Αυτός ο ιστότοπος ήταν αρκετά καλός με την έξοδο για την πρώτη δοκιμή, αλλά δεν το έκανε τόσο καλά με τη δεύτερη δοκιμή που είχε τη διάταξη της στήλης. Εδώ είναι τα αποτελέσματα από το i2OCR: Test1 Doc και Test2 Doc.
FreeOCR
Το Free-OCR.com θα μεταφέρει τις εικόνες σας και θα τις μετατρέπει σε απλό κείμενο. Δεν έχει δυνατότητα εξαγωγής σε μορφή Word. Επιλέξτε το αρχείο σας, επιλέξτε μια γλώσσα και στη συνέχεια κάντε κλικ στο κουμπί Αρχή.
Ο ιστότοπος είναι γρήγορος και θα έχετε την απόδοση αρκετά γρήγορα. Απλά κάντε κλικ στο σύνδεσμο για να κατεβάσετε το αρχείο κειμένου στον υπολογιστή σας.
Όπως και με το NewOCR που αναφέρεται παρακάτω, ο ιστότοπος αυτός αξιοποιεί όλα τα Τ στο έγγραφο. Δεν έχω ιδέα γιατί θα το έκαναν αυτό, αλλά για κάποιο περίεργο λόγο το site και το NewOCR το έκαναν αυτό. Δεν είναι μεγάλη υπόθεση να το αλλάξετε, αλλά είναι μια κουραστική διαδικασία που πραγματικά δεν πρέπει να κάνετε.
Εδώ είναι τα αποτελέσματα από το FreeOCR: Test1 Doc και Test2 Doc.
ABBYY FineReader Online
Για να χρησιμοποιήσετε το FineReader Online, πρέπει να εγγραφείτε για λογαριασμό, ο οποίος σας δίνει δωρεάν δοκιμή 15 ημερών σε OCR έως και 10 σελίδες δωρεάν. Αν χρειάζεστε μόνο ένα μόνο OCR για μερικές σελίδες, τότε μπορείτε να χρησιμοποιήσετε αυτήν την υπηρεσία. Βεβαιωθείτε ότι κάνατε κλικ στο σύνδεσμο επαλήθευσης στο μήνυμα ηλεκτρονικού ταχυδρομείου επιβεβαίωσης μετά την εγγραφή σας.
Κάντε κλικ στο Αναγνωρίζω στην κορυφή και στη συνέχεια κάντε κλικ στο κουμπί Ανεβάστε για να επιλέξετε το αρχείο σας. Επιλέξτε τη γλώσσα, τη μορφή εξόδου και, στη συνέχεια, κάντε κλικ Αναγνωρίζω στον πάτο. Αυτός ο ιστότοπος έχει μια καθαρή διασύνδεση και όχι και διαφημίσεις.
Στις δοκιμές μου, αυτός ο ιστότοπος ήταν σε θέση να αρπάξει το κείμενο από το πρώτο έγγραφο δοκιμής, αλλά ήταν απολύτως τεράστιο όταν άνοιξα το Word doc, οπότε κατέληξα να το κάνω ξανά και επιλέγοντας Απλό κείμενο ως μορφή εξόδου.
Για το δεύτερο τεστ με τις στήλες, το έγγραφο του Word ήταν άδειο και δεν μπορούσα καν να βρω το κείμενο. Δεν είστε σίγουροι τι συνέβη εκεί, αλλά δεν φαίνεται να είναι σε θέση να χειριστεί τίποτα εκτός από απλές παραγράφους. Εδώ είναι τα αποτελέσματα από το FineReader: Test1 Doc και Test2 Doc.
NewOCR
Η επόμενη τοποθεσία, NewOCR.com, ήταν εντάξει, αλλά όχι τόσο καλή όσο η πρώτη τοποθεσία. Πρώτον, έχει διαφημίσεις, αλλά ευτυχώς όχι ένας τόνος. Αρχικά επιλέγετε το αρχείο και στη συνέχεια κάντε κλικ στο Προεπισκόπηση κουμπί.
Στη συνέχεια, μπορείτε να περιστρέψετε την εικόνα και να προσαρμόσετε την περιοχή όπου θέλετε να σαρώσετε κείμενο. Είναι λίγο πολύ όπως το πώς λειτουργεί η διαδικασία σάρωσης σε έναν υπολογιστή με συνδεδεμένο σαρωτή.
Εάν το έγγραφο έχει πολλές στήλες, μπορείτε να το ελέγξετε Ανάλυση διάταξης σελίδας και θα προσπαθήσει να χωρίσει το κείμενο σε στήλες. Κάντε κλικ στο κουμπί OCR, περιμένετε μερικά δευτερόλεπτα για να ολοκληρωθεί και στη συνέχεια κάντε κύλιση προς τα κάτω στο κάτω μέρος όταν ανανεωθεί η σελίδα.
Στην πρώτη δοκιμή, πήρε όλο το κείμενο σωστά, αλλά για κάποιο λόγο κεφαλαιοποίησε κάθε Τ στο έγγραφο! Δεν υπάρχει ιδέα γιατί θα το έκανε αυτό, αλλά το έκανε. Στη δεύτερη δοκιμή με ενεργοποιημένη την ανάλυση σελίδας, πήρε το μεγαλύτερο μέρος του κειμένου, αλλά η διάταξη ήταν τελείως εκτός λειτουργίας.
Εδώ είναι τα αποτελέσματα από το NewOCR: Test1 Doc και Test2 Doc.
συμπέρασμα
Όπως μπορείτε να δείτε, δωρεάν δεν σας δίνει πραγματικά πολύ καλά αποτελέσματα τις περισσότερες φορές, δυστυχώς. Ο πρώτος ιστότοπος που αναφέρθηκε είναι ο καλύτερος, διότι όχι μόνο έκανε μεγάλη δουλειά για να αναγνωρίσει όλο το κείμενο, αλλά κατάφερε επίσης να διατηρήσει τη μορφή του πρωτότυπου εγγράφου.
Αν χρειάζεστε μόνο κείμενο, οι περισσότεροι από τους παραπάνω ιστότοπους θα πρέπει να μπορούν να το κάνουν για εσάς. Αν έχετε οποιεσδήποτε ερωτήσεις, μην διστάσετε να σχολιάσετε. Απολαμβάνω!