Ein nicht unerheblicher Teil von wichtigen Produkt- und Teileinformationen stehen nicht in maschinenlesbarer digitaler Form zur Aufbereitung zur Verfügung. Diese in PDF oder in Papierform vorliegenden Informationen werden heute oftmals noch manuelle bearbeitet. Mit dem IFCC.DataScanner ist es möglich, diese Informationen - ob in Tabellen- oder Textform - so aufzbereiten, dass sie in einzelne Stammdatensätze transformierbar sind. Gerade die Transformation von komplex aufgebauten Produkttabellen bringt jedem Unternehmen, das mit solchen Formaten zu arbeiten hat, einen hohen Mehrwert.
Durch diese Anwendung ist es gelungen, sämtliche externen Datenquellen zu verarbeiten. Somit kann nun die gesamte "Informations-Supply-Chain" aus einer Hand bedient werden. Alle Daten können durch die integrierte IFCC-Anwendungsfamilie aufbereitet werden. Die Datenausleitung kann wiederum je nach Anforderung sehr unterschiedlich sein.
Funktionalitäten
- Automatische Texterkennung durch integrierte OCR-Funktionalität
- Generierung verschiedener Materialstammsätze aus einem einzelnen Datenblatt. Hierbei können die einzelnen Materialstammsätze anhand einzelner Merkmale differenziert werden
- Teilautomatische Klassifizierung der generierten Materialstammsätze
- Semiautomatische Extraktion von Merkmalen aus Fließtexten
- Integration mit dem IFCC.DataOptimizer- sämtliche Materialstammdaten die von IFCC.DataScan erfasst bzw. generiert werden können im IFCC.DataOptimizer weiterverarbeitet werden.
Technische Besonderheit
- State-of-the-Art OCR-Texterkennung durch Kooperation mit Abbyy, dem Marktführer im Bereich OCR und Nutzung der Abbyy FineReader Engine
- Merhplatz-Anwendung aufgrund von Client-Server-Technologie
- Programmierung auf C# (C Shar), der modernsten Programmiersprache für Desktopanwendungen
- Leistungsfähige Microsoft SQL Server 2008 R2 Datenbabnk
Import/Export
- Einlesen von grafischen Dateien in den Formaten: BMP, PDF, GIF, JPG, TIFF, u.v.m.
- Einlesen von mehrseitigen PDF- und TIFF-Dateien
- Export der bearbeiteten Materialstammdaten nach XLS, TXT, CSV, OLEDB, BMEcat u.v.m.
Aktuelle Entwicklung
- Tabellenerkennung zur Differenzierung von Materialstammsätzen anhand angegebener Merkmale