Opis rozwiązania:
Zestaw deweloperski ABBYY FineReader Engine umożliwia twórcom oprogramowania tworzenie aplikacji, które wyodrębniają informacje tekstowe z dokumentów papierowych lub obrazów.
Rozwiązanie zapewnia aplikacjom doskonałe rozpoznawanie tekstu, konwersję PDF i przechwytywanie danych, umożliwiając konwersję skanów do dokumentów PDF, Word lub Excel z możliwością przeszukiwania oraz dostęp do danych na zdjęciach lub zrzutach ekranu.
Dostępne dla systemów Windows, Linux, Mac OS i wbudowanych platform. Przy instalacji lokalnej lub chmurowej.
FUNKCJONALNOŚCI:
Kompleksowy zestaw technologii rozpoznawania
W celu rozpoznawania tekstu program ABBYY FineReader Engine oferuje kompleksowy zestaw technologii rozpoznawania. Dostarczane technologie obejmują rozpoznawanie tekstów drukowanych maszynowo (OCR), tekstów drukowanych ręcznie (ICR), rozpoznawanie znaków optycznych (OMR) i rozpoznawanie kodów kreskowych (OBR). Jako lider na rynku, firma ABBYY oferuje największą liczbę języków OCR, które można łączyć indywidualnie.
Wydajne narzędzia do przetwarzania plików PDF
SDK umożliwia konwersję skanów, zdjęć cyfrowych, Tiff, JPEG, BMP i innych formatów obrazu, do wielu rodzajów przeszukiwanych formatów PDF i PDF/A. Ponadto umożliwia import plików PDF i PDF /A oraz ich przetwarzanie na różne sposoby.
Do obu typów przetwarzania plików PDF – konwersji dokumentów do formatu PDF oraz przetwarzania plików PDF i PDF/A – program ABBYY FineReader Engine oferuje szeroki zakres opcji i narzędzi, a także umożliwia przetwarzanie i tworzenie dokumentów elektronicznych zgodnie ze standardami PDF/A-3 oraz standardami ZUGFeRD dla faktur elektronicznych.
Specjalna technologia kompresji MRC (Mixed Raster Content) służy do minimalizowania rozmiaru plików PDF i PDF / A. Skompresowane pliki są znacznie mniejsze przy zachowaniu jakości wizualnej oryginału. Technologia kompresji MRC PDF jest najlepsza, gdy dokumenty kolorowe są skanowane i przetwarzane. Technologia MRC oferuje lepszy wygląd dokumentu i do 8-10x mniejszy rozmiar pliku niż kompresja JPEG.
Wykorzystanie sztucznej inteligencji i nauki maszynowej zapewnia precyzyjne odwzorowanie dokumentów i większą dokładność.
Za pomocą algorytmów opartych na sztucznej inteligencji, nauce maszynowej oraz technologii adaptacyjnego rozpoznawania dokumentów firmy ABBYY, program ABBY FineReader Engine analizuje układ dokumentu i ocenia indywidualną hipotezę.
Na etapie analizy dokumentu, dokument jest dzielony na poszczególne strony – układ każdej strony jest systematycznie sprawdzany pod kątem rozmieszczenia tekstu, obrazów, kodów kreskowych i elementów tabeli. Jednocześnie badany jest dokument jako całość i wykrywana jest jego logiczna struktura. W jaki sposób system FineReader Engine wykrywa strukturę logiczną dokumentu.
Wykorzystanie wielordzeniowych procesorów
Elastyczna i skalowalna architektura programu ABBYY FineReader Engine umożliwia wykorzystanie wielordzeniowych procesorów i przetwarzanie obrazów równolegle na wielu wątkach. W ten sposób można znacznie zwiększyć prędkość przetwarzania.
Domyślnie program ABBYY FineReader Engine automatycznie wykrywa, czy korzystać z przetwarzania wieloprocesorowego. Zależy to od kilku czynników, takich jak liczba dostępnych fizycznych lub logicznych rdzeni procesora w systemie obliczeniowym, liczba rdzeni procesora zdefiniowanych w licencji oraz liczba stron zawartych w dokumencie. W razie potrzeby programista może z łatwością zmienić ustawienia wieloprocesorowe i dostosować liczbę procesów, które powinny zostać uruchomione.
Obsługa chmury i środowisk wirtualnych
Program ABBYY FineReader Engine obsługuje nowy rodzaj licencji – licencję gotową do pracy w chmurze. Umożliwia on przedsiębiorstwom poszerzenie spektrum aplikacji i usług oferowanych przez nowoczesne platformy chmury obliczeniowej, takie jak Amazon AWS i Microsoft Azure. Obsługiwane są również środowiska wirtualne, np. VMware Workstation i ESXi, Docker Containers i Oracle VM VirtualBox.
MOŻLIWOŚCI:
Wstępne przetwarzanie obrazu: zaawansowane funkcje wstępnego przetwarzania obrazu
Po pobraniu obrazów program ABBYY FineReader Engine wykonuje szereg funkcji przetwarzania obrazu w celu poprawy jakości obrazów dokumentów w procesie rozpoznawania. Technologia ta wykorzystuje zestaw funkcji wstępnego przetwarzania i zwiększa jakość obrazów. W ten sposób nawet obrazy o niskiej jakości lub dokumenty sfotografowane za pomocą smartfonów mogą być efektywnie przetwarzane i zapewniać wysoką rozpoznawalność.
Analiza zróżnicowanych perspektyw 3d
Zniekształcenia 3D powodują wiele problemów z rozpoznanym tekstem: mogą wystąpić błędy w OCR, podział strony nie udaje się i zmienia rozmiar czcionki (od góry do dołu). Po korekcie oryginalnego obrazu proces OCR zapewnia doskonałe wyniki:
https://www.abbyy.com/en-us/ocr-sdk/key-features/image-processing/
Korekta obrazu zabronione
Jeśli aparat nie jest ustawiony prawidłowo podczas ekspozycji, obraz może być lekko rozmazany. Nie jest to widoczne na ekranie aparatu, ale może powodować problemy z rozpoznaniem OCR. Po transformacji obrazu źródłowego obraz binarny staje się lepiej czytelny.
Korekcja szumu ISO
Ten rodzaj szumu wygląda tak, jakby obraz wypełniony był dużą liczbą pikseli o różnych kolorach. Może to prowadzić do niewłaściwej binaryzacji, a niektóre postacie mogą zostać utracone. Stosując specjalny filtr, silnik ABBYY FineReader wygładza tło obrazu i zapobiega utracie tekstu.
Profile rozpoznawania dla szybkiego wdrożenia
Program ABBYY FineReader Engine udostępnia zestaw predefiniowanych profili przetwarzania, które zostały zaprojektowane dla scenariuszy częstego użytkowania. Dzięki wykorzystaniu tych profili programiści oszczędzają pracę i mogą wdrażać funkcje przetwarzania OCR bez zaawansowanej znajomości parametrów OCR.
Gotowa do użycia technologia rozpoznawania wizytówek
Wizytówki to określone dokumenty, często fotografowane lub skanowane jako kilka obrazów na jednej stronie. Gotowa do użycia technologia rozpoznawania wizytówek jest zintegrowana z silnikiem FineReader i może być bezpośrednio używana do rozpoznawania wizytówek. API zapewnia pełen zestaw funkcji do przetwarzania wizytówek: od specjalnych funkcji przetwarzania wstępnego do API zapewniającego dostęp do wyodrębnionych danych.
Klasyfikacja dokumentów z wykorzystaniem nauczania maszynowego i NLP
Program ABBYY FineReader Engine udostępnia interfejs API do klasyfikacji dokumentów, który umożliwia tworzenie aplikacji automatycznie klasyfikujących dokumenty i sortujących je do predefiniowanych klas. Zaawansowana klasyfikacja dokumentów wykorzystuje nowoczesne technologie, takie jak nauka maszynowa i przetwarzanie języka naturalnego. Technologie te są w stanie wykryć nawet subtelne różnice pomiędzy poszczególnymi kategoriami dokumentów i umożliwiają stworzenie elastycznych i skalowalnych procesów klasyfikacji.
Komponenty interfejsu użytkownika
Silnik ABBYY FineReader Engine oferuje pięć komponentów wizualnych opartych na ActiveX, które umożliwiają tworzenie graficznego interfejsu użytkownika do przeglądania i wstępnego przetwarzania obrazów oraz edycji i weryfikacji rozpoznanego tekstu, a także monitorowania procesu. Elementy wizualne zostały zaprojektowane zgodnie z wieloletnim doświadczeniem firmy ABBYY w tworzeniu aplikacji dla użytkowników końcowych.
Przeglądarka obrazów
Przeglądarka obrazów wyświetla pełny obraz strony dokumentu i umożliwia użytkownikowi przeglądanie i edycję obrazu. Na przykład:
- Obracanie, przycinanie i dzielenie obrazów
- Rysowanie obszarów, rozpoznawania lub wybieranie typów bloków – tekst, obraz, tabela, kod kreskowy
- Przyciski paska narzędzi mogą być wyświetlane lub ukrywane za pomocą kodu, możliwe są przyciski niestandardowe
Powiększenie
ZoomViewer zapewnia łatwy sposób szczegółowego oglądania obrazu, dostosowywania położenia obszaru lub porównywania niepewnie rozpoznawanych znaków z powiększonym obrazem.
Szczegółowa dokumentacja i wsparcie SDK
Szczegółowa dokumentacja z wieloma wyjaśnieniami i próbkami kodów ułatwia integrację funkcji rozpoznawania tekstu i przechwytywania danych z aplikacjami.
Przeglądarka dokumentów
Przeglądarka dokumentów zapewnia przegląd obrazów dokumentów i ich statusu przetwarzania. Oferuje również narzędzia do zapisywania uznanego dokumentu lub otwierania go w wybranej aplikacji. Dostępne są dwa tryby wyświetlania: widok szczegółowy i widok miniatur.
Edytor tekstu
Edytor tekstu udostępnia opcje wyróżniania niepewnych znaków i podstawowych narzędzi do formatowania tekstu. Programiści mogą kontrolować wyświetlanie obszaru tekstowego, dostępne przyciski i akcje użytkownika.
Weryfikator tekstu
Walidator tekstowy to łatwe w użyciu narzędzie przypominające kreatora do sprawdzania rozpoznanych znaków oznaczonych jako “niepewne”. Zawiera zintegrowaną funkcję sprawdzania pisowni i zapewnia widok “zoom” zatwierdzonego tekstu. Programiści mogą kontrolować zachowanie tego składnika biblioteki rozpoznawania.
Komponenty wizualne silnika ABBYY FineReader udostępniają kilka języków interfejsu. Można także zlokalizować komponenty wizualne w dowolnym języku.