Zer da karaktereen hautemate optikoa (OCR)?

Karaktereen hautemate optikoko (OCR) dokumentuak inprimatutako, idatzitako edo eskuz idatzitako bertsio digitala sortzen duen softwarea da, ordenagailuak eskuz idatzi edo idatzi beharrik gabe irakur ditzake. OCR normalean dokumentu eskaneatuetan erabiltzen da PDF formatuan, baina testuko bertsio irakurgarri bat ere sor dezake irudi-fitxategi batean.

Zer da OCR?

OCR, testu-aitorpen gisa ere deitzen dena, software-teknologia da, inprimatutako edo idatzitako dokumentuetatik datozen zenbakiak, hizkiak eta puntuazio (esamoldak ere deitzen zaizkionak) formatu elektronikoan errazago eta ordenagailu eta beste software programek irakur dezaten. Zenbait OCR programek dokumentu bat eskaneatu edo kamera digital batekin argazkiak ateratzen dituzte eta beste batzuek eskaera horietan eskaneatu edo OCR gabe argazkiak atera ditzakete dokumentu hori. OCR-k erabiltzaileei PDF dokumentuetan bilaketak egitea ahalbidetzen du, testua editatu eta berriro formateatu dokumentuak.

Zer da OCR erabiltzen?

Azkarrago, egunero eskaneatzea behar du, OCR agian ez da aurrez aurre. Eskaneatze ugari egiten badituzu, PDFak bilatzeko beharrezkoa den zehatza bilatu ahal izatea nahiko denbora pixka bat gorde eta OCR funtzionalitatea zure eskanerren programa garrantzitsuagoa bihurtzen du. Hona hemen beste gauza batzuk: OCR laguntzen:

Zergatik erabili OCRa?

Zergatik ez bakarrik argazki bat hartu, ezta? Izan ere, ezingo duzu ezer editatu edo bilatu testu bat irudia delako. Dokumentua eskaneatzen eta OCR softwarea martxan jartzen baduzu, fitxategia editatu eta bilatu ahal izango duzu.

OCRren historia

Testu-aitorpenen erabilera oso lehenetsia 1914. urtea zen bitartean, OCR-ren teknologien garapen eta erabilerari buruzko hedapen zabala 1950eko hamarkadan hasi zen, bereziki letra-tipo errazak erraz sortzeko, testu digitalki irakurgarri bihurtzeko errazago. David Shepard-ek eta OCR-7Bek ohikoak diren lehen letra tipoak lehenetsi zituzten. Oraindik ere OCR-7B erabiltzen da finantza-industrian, kreditu-txartelen eta zordunketa-txartelen erabilitako letra tipoa lortzeko. 1960ko hamarkadan, hainbat herrialdetan posta-zerbitzuak OCR teknologiarekin hasi ziren mailaketarako bizkortzeko, Estatu Batuak, Erresuma Batua, Kanada eta Alemania barne. OCR mundu mailan posta zerbitzuen posta elektronikoa antolatzeko erabilitako oinarrizko teknologia da oraindik. 2000. urtean OCR teknologiaren mugak eta gaitasunak ezagutzera eman ziren bot-ak eta zaborrak geldiarazteko erabilitako CAPTCHA programak garatzeko.

Hamarkadetan, OCRk zehatzago eta sofistikatuagoak izan dira aurrerapen teknologikoko arloetan, esate baterako, adimen artifiziala , makina ikasketak eta ordenagailuaren ikuspegia. Gaur egun, OCR softwarea eredu-aintzatespena, funtzioaren detekzioa eta testuzko meatzaritza erabiltzen ditu dokumentuak azkarrago eta zehatzagoak bihurtzeko.