Paperless-ngx zur zentralen Dokumenten-Verwaltung

Paperless-ngx zur zentralen Dokumenten-Verwaltung

Digitale Dokumente fallen an verschiedenen Quellen an: Manche kommen als E-Mail-Anhang, andere generieren wir selbst (Scan, PDF-Export, …). Paperless-ng(x) ist ein kostenloses Dokumentenmanagementsystem (DMS), mit dem Dokumente im papierlosen Büro aus vielen Quellen gesammelt, klassifiziert und organisiert werden können.

In diesem Beitrag erkläre ich dir die Grundlagen des Dokumentenmanagement-Systems paperless-ngx und werde dir ein paar Anregungen für deinen eigenen Workflow liefern.

Übersicht: Was ist ein Dokumenten-Management-System (DMS)?

Dokumentenmanagementsysteme bieten in der Regel folgenden Funktionsumfang an:

  • Hoch- und Herunterladen von Dokumenten
  • Texterkennung (OCR)
  • Volltext-Suche
  • Klassifizierung (Tags, Dokumentenklassen, …)
  • Zentrale Speicherung der Dokumente und Bereitstellung von Schnittstellen
  • Datenbankbasiertes Handling der Dokumente (keine Veränderung der Original-Dokumente)
  • Archivierungsfunktion (PDF/A)
 
Besonders die Texterkennung (Optical Character Recognition, OCR) ist eines der Features, die Dokumentenmanagement-Systeme so nützlich machen: Ist beispielsweise ein Scan ohne erkannten Text nur über den Dateinamen auffindbar, so kann im Gegensatz dazu ein PDF mit hinterlegter Texterkennung im Volltext durchsucht werden.
Möchte man also wissen, in welchem seiner Scans das Wort “Rechnung” vorgekommen ist, wird nun nicht mehr nur der Dateiname, sondern auch der gesamte erkannte Inhalt durchsucht.

Paperless-ngx ist kostenlos und Open Source

Paperless-ngx ist kostenlos und wurde unter Open Source entwickelt. Das bedeutet, dass der Quellcode frei zugänglich ist und sich Entwickler auf der ganzen Welt an der Weiterentwicklung beteiligen können.

Für Interessierte ist hier der Link zu dem GitHub-Repository von paperless-ngx: https://github.com/paperless-ngx

Bis vor Kurzem gab es noch den “Vorgänger”, paperless-ng (also ohne das x), was ebenfalls kostenlos und Open Source ist. Jedoch hat der Programmierer (eine Einzelperson) die Entwicklung eingestellt, sodass eine Gruppe anderer Programmierer gemeinsam eine Weiterentwicklung ins Leben gerufen haben: Paperless-ngx.

Jetzt verfügbar: Videokurs für paperless-ngx

Du bist Selbstständig oder führst ein kleines Unternehmen? Dann könnte der Videokurs "Paperless-ngx Masterclass" genau das Richtige für dich sein. Hier lernst du nicht nur, wie du paperless-ngx auf deinem Synology-NAS installierst, sondern auch, wie du dir ein perfektes Ökosystem schaffst, um möglichst effizient und strukturiert arbeiten zu können. Klicke hier, wenn du mehr wissen möchtest.

Features: Paperless-ngx im papierlosen Büro

Webinterface

Paperless-ngx funktioniert so:

Auf einem zentralen Rechner, beispielsweise einem Synology NAS, läuft paperless-ngx im Hintergrund und ist über ein Webinterface erreichbar. Das sieht beispielsweise so aus:

paperless-ngx dark mode 
paperless-ngx im Dark Mode
paperless-ngx light mode 
paperless-ngx im Light Mode

Die Einstellungen zur Darstellungsform sind sehr vielfältig, sodass sich beispielsweise eigene Farben definieren lassen und benutzerdefinierte Filter zum Schnellzugriff hinzufügen lassen.

Ordnerstruktur trotz Dokumentenmanagement möglich!

Einer der großen Vorteile an paperless-ngx ist der, dass es das klassische, auf Ordnern basierende System mit dem modernen und überlegenen datenbankbasierenden System verbindet:

Intern nutzt paperless-ngx eine Datenbank, es können jedoch Dokumente auch über einen speziellen Eingangs-Ordner (“consume”) hinzugefügt werden. Wer gerne seine gespeicherten Dokumente weiterhin in Form von Ordnerstrukturen auf sehen möchte, der kann paperless-ngx so konfigurieren, dass es die Dokumente in der gewünschten Struktur in einem Ordner speichert.

In der Praxis könnte es beispielsweise so aussehen:

  • Inbox: Das ist beispielsweise unser “consume”-Ordner. Jedes Dokument, das hier landet, wird in das DMS überführt und dann aus der Inbox entfernt.
  • Dokumente: Das könnte unser “output”-Ordner sein. Wenn paperless-ngx entsprechend konfiguriert ist, lassen sich hier nahezu beliebig komplexe Ordnerstrukturen anlegen. Achtung: Dieser Ordner darf nicht verändert werden. Ideal ist hier z.B. ein unidirektionaler Sync zu einem Ordner, in dem man arbeiten möchte (und in dem auch mal etwas versehentlich gelöscht oder verschoben werden könnte). Wie man das genau einrichtet, zeige ich in diesem Beitrag.

Automatische Klassifizierung

Ein weiteres sehr mächtiges Feature von paperless-ngx ist die Möglichkeit der automatischen Klassifizierung.

Zunächst einmal eine kurze Erklärung, was ich mit Klassifizierung genau meine:
Alles, was an Zusatzinformationen an ein Dokument angehängt werden kann, um es genauer zu beschreiben und besser auffindbar zu machen.

Beispiele:

  • Tags: Tags kann man sich wie kleine Preisschilder oder Etiketten vorstellen. Sie können beispielsweise genutzt werden, um Dokumente thematisch zuzuordnen (taggen).
  • Dokumentenklassen: Sie geben an, was für eine Art von Dokument es ist. Also eine Rechnung, ein Lieferschein oder ein e-Book.
  • Korrespondenten: Hier lässt sich für Dokumente ein oder mehrere Korrespondenten festlegen. Also z.B. von wem eine Rechnung gekommen ist.
 
All diese Zusatzinformationen lassen sich auch automatisch hinzufügen. Hierfür kann man Regeln definieren und paperless-ngx übernimmt die Zuordnung von selbst.
 
Beispiel:

  • “Füge Dokumente, in denen das Wort Rechnung und vorkommt, automatisch der Dokumentklasse Rechnung hinzu.

E-Mail-Anhänge automatisch importieren

Ein extrem praktisches Feature von paperless-ngx ist der E-Mail-Fetcher:

Hier lässt sich für den eigenen E-Mail-Account ein Zugriff konfigurieren und paperless-ngx fügt automatisch bestimmte Anhänge zum System hinzu. So lässt sich folgendes Szenario realisieren:

Beispiel:

  • Alle E-Mails, in deren Nachricht oder Betreff das Wort Rechnung vorkommt, werden verarbeitet
  • Nur Anhänge in Form von PDFs werden beachtet
  • Zusätzlich muss auch im PDF das Wort Rechnung vorkommen (Inhalt).

Beispiel-Workflow mit paperless-ngx

Setzen wir nun die Features zu einem Workflow für ein papierloses Büro zuhause zusammen:

  • Scans: Ein Netzwerkscanner scannt automatisch in das “Consume”-Verzeichnis von paperless-ngx. So muss zum Scannen nicht einmal mehr ein Computer bedient werden.
  • E-Mails: E-Mails werden automatisch von paperless-ngx nach gewünschten Dokumenten durchsucht und diese werden automatisch hinzugefügt.
  • Andere Dokumente: Alles, was nicht per Scan oder E-Mail hinzugefügt wurde, kann manuell entweder über das Webinterface oder über den “consume”-Ordner in paperless-ngx importiert werden. Hier sind weitere Automatisierungen denkbar.
Zurück zum Blog