Zamknij

OCR

Na czym polega technologia OCR?

Technologia OCR (Optical Character Recognition) polega na rozpoznawaniu przez odpowiednie oprogramowanie tekstu dostępnego w formie obrazu. Innymi słowy pozwala na przekształcenie do pliku tekstu napisów widocznych na zdjęciach czy też na skanach dokumentów.

Szczegółowy opis działania, charakterystyka. Opis szczegółowy (dla zaawansowanych).

Każdy dokument - co do zasady - może istnieć w dwóch formach:

  1. w formie obrazu graficznego (czyli zdjęcia lub skanu) jako plik w formacie bmp, jpg, tiff czy innych pokrewnych. Taki dokument jest czytelny dla człowieka ale dla komputera nie różni sie zupełnie od jakiegokolwiek innego zdjęcia. Systemy komputerowe nie potrafią więc wyszukać na takim zdjęciu określonego słowa.
  2. w formie - czasami myląco (acz nie mylnie) - określanej jako edytowalna. Chodzi tu o formaty typu txt, doc, docx czy inne pokrewne. Taki tekst jest czytelny zarówno dla człowieka jak i dla komputera. Człowiek może taki tekst wyedytować (czyli zmienić) znacznie łatwiej niż tekst umieszczony na zdjęciu. Co jednak równie ważne - taki rozpoznany tekst pozwala odpowiedniemu oprogramowaniu np. na poszukiwanie odpowiedniego słowa.

Rozpoznawanie tekstu może dotyczyć pisma drukowanego (klasyczny OCR), pisma ręcznego (ICR) a także szerzej - rozpoznawania różnych innych informacji pojawiających się na dokumencie (lub obiekcie). Może to być rozpoznawanie znaczników (tzw. OMR), rozpoznawanie kodu kreskowego (również dwuwymiarowego) ale za pomocą czytnika kodów kreskowych - ale właśnie za pomocą specjalizowanego oprogramowania, które na zdjęciu (czy w strumieniu wideo) wyszuka taki kod i go zamieni na ciąg zrozumiałych znaków.

W każdym z tych przypadków niezbędne jest oprogramowanie w którym zapisana jest wiedza na temat kształtu znaków i symboli jakie mają być rozpoznawane. Oprogramowanie takie posiada też wiedzę o strukturze rozpoznawanego tekstu (np. w jakim języku napisano tekst, jakie znaki są zawarte w konkretnym miejscu formularza itd.). Dzięki jednoczesnemu użyciu obu tych obszarów wiedzy można osiągnąć jakość rozpoznawania absolutnie nieosiągalną jeszcze 5 lat temu.

W związku z powyższym można wydzielić dwie rodziny systemów OCR:

  1. systemy skupione na rozpoznawaniu tekstu, przy czym konkretny układ tego tekstu nie  jest znany: może to być np. rozpoznawanie treści pism reklamacyjnych składanych do danego przedsiębiorstwa. Wiemy co do zasady, że pisma są sporządzone w konkretnym języku, ale każde z nich jest zupełnie inne. Rozpoznajemy te dokumenty po to by móc później zastosować tzw. wyszukiwanie pełnotekstowe - czyli przeszukiwać całą treść dokumentu
  2. systemu skupione na rozpoznawaniu tekstu z dokumentów które mają konkretny ustabilizowany układ - czyli z tzw. formularzy. Formularze takie mogą być mieć sztywną strukturę (np. PIT-36) ale mogą też być bardziej elastyczne. Mamy tu na myśli np. faktury kosztowe jakie otrzymuje dana firma. Jakkolwiek wiadomo jakie informacje pojawiają się na fakturze - to konkretny układ graficzny faktury bywa bardzo różny

Co do zasady systemy drugiej kategorii (do rozpoznawania formularzy) jako, że dysponują większą wiedzą na temat rozpoznawanego dokumentu (niż tylko wiedza o języku) osiągają znacznie niższy poziom błędów niż systemy pierwszego typu.

Zalety technologii:

  1. redukcja kosztów oraz jednoczesna redukcja błędów związanych z ręcznym wprowadzaniem danych
  2. znaczne obniżenie czasu wprowadzania danych i eliminacja opóźnień z tym związanych
  3. redukcja kosztów sprzętowych i pomieszczeń przez użycie jego wysoko produktywnego systemu wprowadzania danych
  4. szybki dostęp do wszelkich informacji

Jakie branże korzystają z tej technologii i w jakim zakresie?

  1. produkcja (zamówienia, karty technologiczne, faktury kosztowe, dokumentacja technologiczna)
  2. logistyka (praktycznie cała dokumentacja magazynowa i transportowa)
  3. usługi (umowy, zamówienia, reklamacje, faktury kosztowe, dokumentacja procesów)
  4. finanse (umowy, zlecenia, zarządzanie produktami finansowymi)

Przykładowe zastosowania:

  1. zamówienia (np. akwizytor podczas rozmów z klientem wypisuje ręcznie standardowy formularz zamówienia)
  2. umowy standardowe (np. umowy przystąpienia do funduszu emerytalnego) wnioski (np. o wydanie karty kredytowej, udzielenie kredytu, przystąpienie do organizacji)
  3. raporty (np. raport kierowcy z ilością przejechanych kilometrów danego dnia, nazwami odwiedzonych klientów)
  4. raporty z pracy maszyn (operator maszyny rejestruje kiedy i jakie zlecenia wykonywał)
  5. ankiety (np. podczas badania opinii publicznej, wyborów, itd.)
  6. formularzach rekrutacyjnych, egzaminacyjnych (np. wyższych uczelni)
  7. książka podawcza
  8. zarządzanie procesami w firmie - przepływ dokumentów (tzw. Document Management Systems)

Na czym polega technologia OCR?

Technologia OCR (Optical Character Recognition) polega na rozpoznawaniu przez odpowiednie oprogramowanie tekstu dostępnego w formie obrazu. Innymi słowy pozwala na przekształcenie do pliku tekstu napisów widocznych na zdjęciach czy też na skanach dokumentów.

Szczegółowy opis działania, charakterystyka. Opis szczegółowy (dla zaawansowanych).

Każdy dokument - co do zasady - może istnieć w dwóch formach:

  1. w formie obrazu graficznego (czyli zdjęcia lub skanu) jako plik w formacie bmp, jpg, tiff czy innych pokrewnych. Taki dokument jest czytelny dla człowieka ale dla komputera nie różni sie zupełnie od jakiegokolwiek innego zdjęcia. Systemy komputerowe nie potrafią więc wyszukać na takim zdjęciu określonego słowa.
  2. w formie - czasami myląco (acz nie mylnie) - określanej jako edytowalna. Chodzi tu o formaty typu txt, doc, docx czy inne pokrewne. Taki tekst jest czytelny zarówno dla człowieka jak i dla komputera. Człowiek może taki tekst wyedytować (czyli zmienić) znacznie łatwiej niż tekst umieszczony na zdjęciu. Co jednak równie ważne - taki rozpoznany tekst pozwala odpowiedniemu oprogramowaniu np. na poszukiwanie odpowiedniego słowa.

Rozpoznawanie tekstu może dotyczyć pisma drukowanego (klasyczny OCR), pisma ręcznego (ICR) a także szerzej - rozpoznawania różnych innych informacji pojawiających się na dokumencie (lub obiekcie). Może to być rozpoznawanie znaczników (tzw. OMR), rozpoznawanie kodu kreskowego (również dwuwymiarowego) ale za pomocą czytnika kodów kreskowych - ale właśnie za pomocą specjalizowanego oprogramowania, które na zdjęciu (czy w strumieniu wideo) wyszuka taki kod i go zamieni na ciąg zrozumiałych znaków.

W każdym z tych przypadków niezbędne jest oprogramowanie w którym zapisana jest wiedza na temat kształtu znaków i symboli jakie mają być rozpoznawane. Oprogramowanie takie posiada też wiedzę o strukturze rozpoznawanego tekstu (np. w jakim języku napisano tekst, jakie znaki są zawarte w konkretnym miejscu formularza itd.). Dzięki jednoczesnemu użyciu obu tych obszarów wiedzy można osiągnąć jakość rozpoznawania absolutnie nieosiągalną jeszcze 5 lat temu.

W związku z powyższym można wydzielić dwie rodziny systemów OCR:

  1. systemy skupione na rozpoznawaniu tekstu, przy czym konkretny układ tego tekstu nie  jest znany: może to być np. rozpoznawanie treści pism reklamacyjnych składanych do danego przedsiębiorstwa. Wiemy co do zasady, że pisma są sporządzone w konkretnym języku, ale każde z nich jest zupełnie inne. Rozpoznajemy te dokumenty po to by móc później zastosować tzw. wyszukiwanie pełnotekstowe - czyli przeszukiwać całą treść dokumentu
  2. systemu skupione na rozpoznawaniu tekstu z dokumentów które mają konkretny ustabilizowany układ - czyli z tzw. formularzy. Formularze takie mogą być mieć sztywną strukturę (np. PIT-36) ale mogą też być bardziej elastyczne. Mamy tu na myśli np. faktury kosztowe jakie otrzymuje dana firma. Jakkolwiek wiadomo jakie informacje pojawiają się na fakturze - to konkretny układ graficzny faktury bywa bardzo różny

Co do zasady systemy drugiej kategorii (do rozpoznawania formularzy) jako, że dysponują większą wiedzą na temat rozpoznawanego dokumentu (niż tylko wiedza o języku) osiągają znacznie niższy poziom błędów niż systemy pierwszego typu.

Zalety technologii:

  1. redukcja kosztów oraz jednoczesna redukcja błędów związanych z ręcznym wprowadzaniem danych
  2. znaczne obniżenie czasu wprowadzania danych i eliminacja opóźnień z tym związanych
  3. redukcja kosztów sprzętowych i pomieszczeń przez użycie jego wysoko produktywnego systemu wprowadzania danych
  4. szybki dostęp do wszelkich informacji

Jakie branże korzystają z tej technologii i w jakim zakresie?

  1. produkcja (zamówienia, karty technologiczne, faktury kosztowe, dokumentacja technologiczna)
  2. logistyka (praktycznie cała dokumentacja magazynowa i transportowa)
  3. usługi (umowy, zamówienia, reklamacje, faktury kosztowe, dokumentacja procesów)
  4. finanse (umowy, zlecenia, zarządzanie produktami finansowymi)

Przykładowe zastosowania:

  1. zamówienia (np. akwizytor podczas rozmów z klientem wypisuje ręcznie standardowy formularz zamówienia)
  2. umowy standardowe (np. umowy przystąpienia do funduszu emerytalnego) wnioski (np. o wydanie karty kredytowej, udzielenie kredytu, przystąpienie do organizacji)
  3. raporty (np. raport kierowcy z ilością przejechanych kilometrów danego dnia, nazwami odwiedzonych klientów)
  4. raporty z pracy maszyn (operator maszyny rejestruje kiedy i jakie zlecenia wykonywał)
  5. ankiety (np. podczas badania opinii publicznej, wyborów, itd.)
  6. formularzach rekrutacyjnych, egzaminacyjnych (np. wyższych uczelni)
  7. książka podawcza
  8. zarządzanie procesami w firmie - przepływ dokumentów (tzw. Document Management Systems)

Na czym polega technologia OCR?

Technologia OCR (Optical Character Recognition) polega na rozpoznawaniu przez odpowiednie oprogramowanie tekstu dostępnego w formie obrazu. Innymi słowy pozwala na przekształcenie do pliku tekstu napisów widocznych na zdjęciach czy też na skanach dokumentów.

Szczegółowy opis działania, charakterystyka. Opis szczegółowy (dla zaawansowanych).

Każdy dokument - co do zasady - może istnieć w dwóch formach:

  1. w formie obrazu graficznego (czyli zdjęcia lub skanu) jako plik w formacie bmp, jpg, tiff czy innych pokrewnych. Taki dokument jest czytelny dla człowieka ale dla komputera nie różni sie zupełnie od jakiegokolwiek innego zdjęcia. Systemy komputerowe nie potrafią więc wyszukać na takim zdjęciu określonego słowa.
  2. w formie - czasami myląco (acz nie mylnie) - określanej jako edytowalna. Chodzi tu o formaty typu txt, doc, docx czy inne pokrewne. Taki tekst jest czytelny zarówno dla człowieka jak i dla komputera. Człowiek może taki tekst wyedytować (czyli zmienić) znacznie łatwiej niż tekst umieszczony na zdjęciu. Co jednak równie ważne - taki rozpoznany tekst pozwala odpowiedniemu oprogramowaniu np. na poszukiwanie odpowiedniego słowa.

Rozpoznawanie tekstu może dotyczyć pisma drukowanego (klasyczny OCR), pisma ręcznego (ICR) a także szerzej - rozpoznawania różnych innych informacji pojawiających się na dokumencie (lub obiekcie). Może to być rozpoznawanie znaczników (tzw. OMR), rozpoznawanie kodu kreskowego (również dwuwymiarowego) ale za pomocą czytnika kodów kreskowych - ale właśnie za pomocą specjalizowanego oprogramowania, które na zdjęciu (czy w strumieniu wideo) wyszuka taki kod i go zamieni na ciąg zrozumiałych znaków.

W każdym z tych przypadków niezbędne jest oprogramowanie w którym zapisana jest wiedza na temat kształtu znaków i symboli jakie mają być rozpoznawane. Oprogramowanie takie posiada też wiedzę o strukturze rozpoznawanego tekstu (np. w jakim języku napisano tekst, jakie znaki są zawarte w konkretnym miejscu formularza itd.). Dzięki jednoczesnemu użyciu obu tych obszarów wiedzy można osiągnąć jakość rozpoznawania absolutnie nieosiągalną jeszcze 5 lat temu.

W związku z powyższym można wydzielić dwie rodziny systemów OCR:

  1. systemy skupione na rozpoznawaniu tekstu, przy czym konkretny układ tego tekstu nie  jest znany: może to być np. rozpoznawanie treści pism reklamacyjnych składanych do danego przedsiębiorstwa. Wiemy co do zasady, że pisma są sporządzone w konkretnym języku, ale każde z nich jest zupełnie inne. Rozpoznajemy te dokumenty po to by móc później zastosować tzw. wyszukiwanie pełnotekstowe - czyli przeszukiwać całą treść dokumentu
  2. systemu skupione na rozpoznawaniu tekstu z dokumentów które mają konkretny ustabilizowany układ - czyli z tzw. formularzy. Formularze takie mogą być mieć sztywną strukturę (np. PIT-36) ale mogą też być bardziej elastyczne. Mamy tu na myśli np. faktury kosztowe jakie otrzymuje dana firma. Jakkolwiek wiadomo jakie informacje pojawiają się na fakturze - to konkretny układ graficzny faktury bywa bardzo różny

Co do zasady systemy drugiej kategorii (do rozpoznawania formularzy) jako, że dysponują większą wiedzą na temat rozpoznawanego dokumentu (niż tylko wiedza o języku) osiągają znacznie niższy poziom błędów niż systemy pierwszego typu.

Zalety technologii:

  1. redukcja kosztów oraz jednoczesna redukcja błędów związanych z ręcznym wprowadzaniem danych
  2. znaczne obniżenie czasu wprowadzania danych i eliminacja opóźnień z tym związanych
  3. redukcja kosztów sprzętowych i pomieszczeń przez użycie jego wysoko produktywnego systemu wprowadzania danych
  4. szybki dostęp do wszelkich informacji

Jakie branże korzystają z tej technologii i w jakim zakresie?

  1. produkcja (zamówienia, karty technologiczne, faktury kosztowe, dokumentacja technologiczna)
  2. logistyka (praktycznie cała dokumentacja magazynowa i transportowa)
  3. usługi (umowy, zamówienia, reklamacje, faktury kosztowe, dokumentacja procesów)
  4. finanse (umowy, zlecenia, zarządzanie produktami finansowymi)

Przykładowe zastosowania:

  1. zamówienia (np. akwizytor podczas rozmów z klientem wypisuje ręcznie standardowy formularz zamówienia)
  2. umowy standardowe (np. umowy przystąpienia do funduszu emerytalnego) wnioski (np. o wydanie karty kredytowej, udzielenie kredytu, przystąpienie do organizacji)
  3. raporty (np. raport kierowcy z ilością przejechanych kilometrów danego dnia, nazwami odwiedzonych klientów)
  4. raporty z pracy maszyn (operator maszyny rejestruje kiedy i jakie zlecenia wykonywał)
  5. ankiety (np. podczas badania opinii publicznej, wyborów, itd.)
  6. formularzach rekrutacyjnych, egzaminacyjnych (np. wyższych uczelni)
  7. książka podawcza
  8. zarządzanie procesami w firmie - przepływ dokumentów (tzw. Document Management Systems)

Powiązane rozwiązania z naszej oferty

APET – Automatyczna poprawa egzaminów testowych

System umożliwiający automatyczną poprawę egzaminów testowych,  wszędzie tam gdzie taki sposób sprawdzania wiedzy jest stosowany. Rozwiązanie idealnie nadające się dla uczelni wyższych, szkół, firm szkoleniowych czy instytucji przeprowadzających / sprawdzających wiedzę przy pomocy testów. Wszędzie tam gdzie testy jednokrotnego lub wielokrotnego wyboru poprawiane są ręcznie APET wyeliminuje możliwość pomyłki oraz znacząco przyspieszy pracę.
Czytaj więcej...

Automatyczna ocena wykładowców i warunków nauczania

W świetle niedawno wprowadzonego przez Ministra Nauki i Szkolnictwa Wyższego rozporządzenia dotyczącego konieczności przeprowadzania wśród swoich studentów ankiet oceniających pracę dydaktyczną wykładowców, a także ankiet oceniających poziom nauczania, w chwili obecnej każda Uczelnia Wyższa zobligowana jest do przeprowadzania ankiet oceniających przynajmniej dwa razy w roku akademickim. Jak się okazuje wiarygodność danych zbieranych w formie elektronicznej jest dużo
Czytaj więcej...

OCR dla administracji

Rozproszona struktura dokumentów, jakie pojawiają się w urzędach, sądach i innych instytucjach publicznych, powoduje że program ABBYY FineReader jest niezastąpionym narzędziem w pracy z dokumentami.
Czytaj więcej...

Rozliczanie produkcji, optymalizacja produkcji, rozliczanie zleceń produkcyjnych

Istnieje wiele parametrów rozliczania procesów produkcyjnych, zaś najważniejsze z nich to: ilość wyprodukowanych towarów w jednostce czasu, koszt jednostkowy, liczba defektów, czas taktu oraz czas cyklu. Synaptic.MES, dzięki pełnej ewidencji produkcji, posiada możliwość nie tylko obliczenia tych czynników, ale również porównania z przyjętymi standardami oraz wyliczenia wartości dla każdej maszyny, operatora czy pracownika fizycznego. Wszystko to daje to najlepszy obraz sł
Czytaj więcej...

OCR dla Small Office / Home Office (SOHO)

Kiedy kilka osób ma zapanować nad procesami jednej firmy, czas w jakim należy wykonać określone czynności ma dużo większe znaczenie, niż w przypadku korporacji.
Czytaj więcej...

Zaufali nam

Kontakt

Godziny otwarcia biura:
pon - pt 9.00 do 16.30

Wsparcie techniczne:
pon - pt 9.00 do 16.00

autoid@autoid.pl
+48 12 260 16 50
ikona kontaktu
Masz pytania?
Skontaktujemy się z Tobą!
Chcesz wiedzieć więcej? - wypełnij formularz, a my skontaktujemy się tak szybko jak to możliwe!
Wyrażam zgodę na przetwarzanie danych osobowych w celu realizacji odpowiedzi na zadane pytanie. Wyświetl pełną treść zgody.
Kontakt
X
Chcesz wiedzieć więcej? - wypełnij formularz, a my skontaktujemy się tak szybko jak to możliwe!
Wyrażam zgodę na przetwarzanie danych osobowych w celu realizacji odpowiedzi na zadane pytanie. Wyświetl pełną treść zgody.
Zarządzaj plikami cookies