Miten

Asiakirjojen skannaaminen muunnettaviksi tekstitiedoiksi (OCR)

Tekstintunnistuksen parantaminen
Mahdollisia tekstintunnistusongelmia

Voit skannata ja muuntaa asiakirjoja tekstitiedoiksi ja muokata niitä tekstinkäsittelysovelluksella. Tekniikkaa, jonka avulla tietokone 'lukee' tekstiä kuvatiedostoista kutsutaan tekstintunnistukseksi (OCR). OCR edellyttää, että tulkittava teksti on graafisessa muodossa, mikä tavallisesti tarkoittaa skannauskuvaa.

Tuo skannattu kuva tekstintunnistusohjelmistoon.

Tekstintunnistuksen parantaminen

Muuta kynnysarvoa käyttämällä Threshold (Kynnys) -liukusäädintä ja tarkkailen muutoksen vaikutusta Preview (Esikatselu) -ikkunassa. Kynnysarvon säätäminen voi parantaa tekstintunnistusta.

Huomautus:
Threshold (Kynnys) -asetus on käytettävissä ainoastaan, kun Image Type (Kuvatyyppi) -asetus on Black&White (Mustavalkoinen).


[Ylös]

Mahdolliset tekstintunnistusongelmat

Alkuperäisasiakirjan tekstin laatu vaikuttaa suuresti tekstintunnistustulokseen.

Seuraavat originaalityypit saattavat olla tunnistuksen kannalta vaikeita ja niitä on syytä mahdollisuuksien mukaan välttää:

Muista, että tekstintunnistusohjelma ei tunnista käsin kirjoitettuja merkkejä.


[Ylös]


Edellinen

Seuraava