top of page

IoT | MES | SCADA | InDriver | Industry40 | Automation | SmartFactory | DataIntegration

Automating PDF Document Processing

Współczesne firmy przetwarzają tysiące dokumentów — faktur, raportów produkcyjnych, zapisów batch record, raportów laboratoryjnych i wielu innych. Pliki PDF zawierają kluczowe dane, które trzeba analizować, archiwizować i wizualizować. 

Ręczne przetwarzanie to jednak strata czasu, większe ryzyko błędów i ograniczona skalowalność.

 

💡 InDriver rozwiązuje ten problem.

 

Dzięki silnikowi skryptów opartemu na JavaScript i wbudowanym API (PDFApi, FileAPI) możesz:

✅ Automatycznie wykrywać nowe pliki dzięki FileWatcher
✅ Odczytywać dane z tekstu, tabel, nagłówków i pól
✅ Konwertować informacje do formatu JSON
✅ Archiwizować dane bezpośrednio w bazie SQL
✅ Tworzyć dashboardy i analizy w narzędziach takich jak Grafana, Metabase, Looker czy Power BI

🔍 Prosty przykład: analiza PDF za pomocą RegExp

PdfBatch.png

Załóżmy, że otrzymujesz dokumenty typu batch record z danymi w formacie:

Batch ID: ABC-1234  

Produced: 2024-12-15  

Operator: John Doe  

Temperature: 72.5 °C

Kilka linijek kodu wystarczy, by je odczytać:

InDriver.import("PdfApi");

PdfApi.setCodec("ISO 8859-2");

let content = PdfApi.pageText(0); // Load the first page 


let data = {
  batchId: content.match(/Batch ID:\s*(\S+)/)?.[1],
  date: content.match(/Produced:\s*([\d\-]+)/)?.[1],
  operator: content.match(/Operator:\s*(.+)/)?.[1],
  tempC: parseFloat(content.match(/Temperature:\s*([\d.]+)/)?.[1])
};
// JSON

 

InDriver.sqlExecute( "azureserver", "insert into public.batch_records (source, ts, data) \ values ('Machine1','" + new Date().toISOString() + "',$$" + data.stringify()+ "$$);" );

Co tu się dzieje:

  • Plik PDF jest odczytywany przez PDFApi

  • Dane są wyciągane za pomocą wyrażeń regularnych (RegExp)

  • Wynik trafia do bazy SQL

Całość może działać automatycznie — wystarczy, że nowy plik pojawi się w folderze monitorowanym przez FileWatcher.

📊 Takie podejście sprawdza się m.in. dla:

  • Raportów produkcyjnych

  • Rekordów serii (batch records)

  • Faktur zakupowych

  • Raportów jakości

  • Dokumentów wysyłkowych

i wielu innych dokumentów PDF, z których chcesz szybko wyciągać dane.

🚀 Niezależnie od tego, czy przetwarzasz 10, czy 10 000 dokumentów dziennie — InDriver daje Ci pełną kontrolę, szybkość i elastyczność.

InAnalytics.io

Innowacyjna analityka danych

AND SYSTEMS Kraków | Polska

Zarejestruj się, aby otrzymywać najświeższe informacje

Dziękujemy za subskrypcję.

© AND SYSTEMY 2025

bottom of page