Vytěžování dat s využitím DOCU-X-OCR

Optické rozpoznávání znaků nebo OCR je proces čtení nebo detekce textů z obrázků, souborů PDF, skenovaných obrázků, textových souborů a podobně. Tato technologie je významným pokrokem v oblasti optické vědy a automatizace. Používání technologie OCR přináší významné zvýšení efektivity práce při zadávání informací do informačních systémů.

V podnikové praxi se nejčastěji se setkáváme s využitím OCR při správě a zpracování elektronických dokumentů nebo DMS. Významnou výhodou tohoto využití je možnost hromadného prohledávaní dokumentů, případně jejich automatizovaného kategorizování na základě jejich obsahu. A to bez ohledu na to, jestli se jedná o fotku, skenovaný obrázek, PDF soubor, tabulku, textový dokument, prezentaci či výkres. Jakmile soubor obsahuje jakýkoliv text, který je čitelný, OCR aplikace jej převede do formátu, který lze následně automatizovaně zpracovávat.

VLASTNOSTI

DOSTUPNÉ INFORMAČNÍ ZDROJE

Ukázka zpracování došlé faktury

Produktový list DOCU-X-OCR