iText veröffentlicht iText pdfOCR, ein vielseitiges Open-Source-Produkt

iText veröffentlicht iText pdfOCR, ein vielseitiges Open-Source-Produkt

Ein vielseitiges Open-Source-Produkt, das Texte in eingescannten Dokumenten erkennt und diese in editierbare PDFs umwandelt.

BildiText Group NV, ein weltweit angesehenes Unternehmen, welches die Entwicklung von PDF-Bibliotheken und -Lösungen vorantreibt, hat heute den Start von iText pdfOCR (https://itextpdf.com/en/products/itext-7/pdfocr) angekündigt. Dies ist das neueste Produkt im preisgekrönten Software-Portfolio des Unternehmens.

Als Teil des bekannten “iText 7”-PDF-SDK bietet iText pdfOCR optische Zeichenerkennung (OCR), um gedruckten Text in eingescannten Dokumenten und Bildern in vollständig durchsuchbare und mit dem PDF/A-3u-Standard kompatible Formate (PDF Version 1.7) umzuwandeln. So wird der Zugriff auf diese Texte einfacher und schneller. Ohne maschinenlesbaren Text können gedruckte oder gescannte Dokumente weder durchsucht, katalogisiert noch analysiert werden. Weitere Schritte nach dem Einlesen könnten die Extrahierung von Daten mit iText pdf2Data, die sichere Schwärzung von Inhalten mit iText pdfSweep oder die Erstellung von mehrsprachigen Dokumenten mit iText pdfCalligraph sein. Die Weiterverwendung der extrahierten Daten mit dem benutzerfreundlichen Dokumentengenerator iText DITO® ist oft der krönende Abschluss der Textverarbeitung.

Das Add-On iText pdfOCR basiert auf der Technologie der Tesseract-OCR-Engine. Tesseract unterstützt mehr als 100 Sprachen und wurde ursprünglich 1985 von Hewlett-Packard entwickelt. 2005 wurde es mit einer Apache-Open-Source-Lizenz veröffentlicht. Seit 2006 wird die Entwicklung von Google gefördert.

“Seit COVID-19 Unternehmen dazu zwingt, ihre digitalen Transformations-Projekte zu beschleunigen, müssen diese Unternehmen neue Möglichkeiten finden, auf ihre Daten zuzugreifen und diese zu verwalten, egal ob es sich dabei um bestehende oder neue Daten handelt. Als führendes Unternehmen im Bereich “Digitaler Dokumente” freut es uns, dass wir an der Spitze dieser neuen Epoche stehen. Deshalb bin ich sehr froh, das neueste Produkt in unserer modernen PDF-Bibliothek vorzustellen: Die OCR-Fähigkeiten von iText pdfOCR eröffnen viele Chancen und Möglichkeiten für Anwender und Unternehmen, die ihr Datenpotenzial maximieren möchten.” Yeonsu Kim, Geschäftsführer bei iText Group NV.

“Da wir unsere Open-Source-Vergangenheit nicht vergessen möchten, basiert iText pdfOCR auf der Tesseract-OCR-Engine, die ebenfalls in Open-Source vorliegt. Damit möchten wir betonen, dass wir nach wie vor ein Open-Source-Unternehmen sind. Diesen Wert schätzen unsere Millionen von Anwendern und Kunden gleichermaßen.”

“Dieses neue Produkt in unserer PDF-Bibliothek hilft Entwicklern dabei, Daten zu nutzen, die bislang in nicht zugänglichen Dokumenten verborgen lagen. Mit unserem neuesten Produkt können diese Unternehmen ihren digitalen Workflow erweitern, indem sie auf Daten aus eingescannten Dokumenten zugreifen und sie für ihre Zwecke oder die ihrer Endbenutzer verwenden.” Tony Van den Zegel, VP im Bereich Produkte und Marketing bei iText Group NV und Geschäftsführer bei iText Software Belgium.

iText pdfOCR hat viele Anwendungsbereiche, wie z. B. die Archivierung historischer Dokumente, die Übersetzung von juristischen Texten, die automatische Eingabe von Daten bei allen Arten von Bewerbungen oder Forderungen auf Basis von Papierdokumenten sowie die Sortierung von gedruckten oder gescannten Dokumenten, die bislang nicht editierbar waren.

Am 9. Juli 2020 können Sie an unseren Live-Vorführungen teilnehmen. Weitere Informationen finden Sie hier. https://itextpdf.com/en/events/live-webinar-introducing-itext-pdfocr-enabling-text-recognition-scanned-documents-pdfs-and
(pressat)

Verantwortlicher für diese Pressemitteilung:

Pressat
Herr Alison Lancaster
Studio 216, 2nd Floor, Hope Mill Pressat, B
M4 7JB Manchester
Deutschland

fon ..: 03300431216
web ..: https://pressat.co.uk/
email : wire@pressat.co.uk

Pressat Newswire is a UK based.

Pressekontakt:

Pressat
Herr Alison Lancaster
Hope Mill Studio 216
M4 7JB Manchester

fon ..: 03300431216
email : wire@pressat.co.uk