Zu Inhalt springen
Digital & direkt nach dem Kauf erhältlich
Digital & direkt nach dem Kauf erhältlich
10 € Rabatt auf Kurse bei Newsletteranmeldung
10 € Rabatt auf Kurse bei Newsletteranmeldung
30 Tage Geld-zurück-Garantie (Kurse)
30 Tage Geld-zurück-Garantie (Kurse)

Paperless-ngx mit n8n und lokaler KI automatisch verschlagworten (ohne paperless-ai)

Paperless-ngx mit n8n und lokaler KI automatisch verschlagworten (ohne paperless-ai)

Du hast paperless-ngx im Einsatz und möchtest, dass deine Dokumente automatisch einen sinnvollen Titel, passende Tags und den richtigen Dokumententyp bekommen? Bisher war paperless-ai die naheliegende Antwort. Aber: Was passiert, wenn die Entwicklung dort eines Tages eingeschlafen wird? Genau das ist bei vielen Open-Source-Projekten schon passiert, auch beim Vorgänger paperless-ng.

In diesem Beitrag zeige ich dir eine Alternative, die dir die volle Kontrolle gibt: einen n8n-Flow, der Dokumente per lokal laufender KI klassifiziert. Du musst nicht auf einen Maintainer warten, du kannst Tags und Logik jederzeit selbst anpassen, und das Ganze läuft komplett bei dir: ohne Cloud, ohne Abos, ohne Datenabgabe.

Den fertigen Flow gibt es weiter unten zum direkten Download. Legen wir los!

Was der Flow eigentlich macht

Vereinfacht gesagt: Sobald in paperless-ngx ein neues Dokument durch die OCR gelaufen ist, ruft paperless einen n8n-Webhook auf. Der Flow holt sich dann den Volltext, deine vorhandenen Tags und Dokumententypen ab, schickt das gebündelt an ein lokal laufendes Sprachmodell (in meinem Beispiel gpt-oss:20b über Ollama) und schreibt das Ergebnis – Titel, Tags und Dokumententyp – per API zurück ins Dokument.

Das Schöne: Es passiert alles bei dir auf dem Server. Kein Token wird an OpenAI oder sonst jemanden geschickt.

Voraussetzungen

Bevor du loslegst, solltest du folgendes vorbereitet haben:

  • n8n läuft bei dir (selfhosted oder Cloud)
  • paperless-ngx ist erreichbar (in meinem Flow unter dem internen Hostname webserver:8000)
  • Ollama ist installiert und das Modell gpt-oss:20b ist geladen (alternativ funktioniert auch ein kleineres Modell – dazu später mehr)
  • Du kannst in paperless-ngx einen Webhook-Workflow einrichten, der bei neuen Dokumenten n8n triggert

Wenn dir bei einem dieser Punkte erstmal ein Fragezeichen aufgeht: Keine Sorge, dafür gibt es weiter unten den Hinweis auf den Kurs. Du kannst aber auch erstmal weiterlesen und dir einen Überblick verschaffen.

Den Flow herunterladen

Hier ist die JSON-Datei zum direkten Import in n8n, ohne E-Mail, ohne Anmeldung:

👉 paperless-ki-flow.json herunterladen

In n8n: Neuen Workflow anlegen → oben rechts auf das Drei-Punkte-Menü → „Import from File" → JSON auswählen. Fertig.

Setup: Was du nach dem Import anpassen musst

Aber Vorsicht: Direkt funktionieren wird der Flow noch nicht, ein paar Stellen musst du auf deine Umgebung anpassen. Ich gehe sie der Reihe nach durch.

1. API-Keys ersetzen (an 4 Stellen!)

Aus Demo-Gründen habe ich den paperless-API-Token im Flow hartcodiert hinterlegt. Das musst du an den folgenden vier HTTP-Request-Nodes ersetzen:

  • Get Document
  • List Tags
  • List Document Types
  • Patch Document

Suche dort jeweils den Header Authorization und ersetze Token <API-Key> durch deinen tatsächlichen Token. Noch besser: Lege in n8n richtige Credentials für paperless an und referenziere die, das ist die saubere Variante und du musst den Token nicht mehr im Klartext im Flow stehen haben.

Den Token bekommst du in paperless-ngx unter „Mein Profil" → „API Auth Token".

2. Hostname anpassen (falls nötig)

Bei mir läuft paperless intern unter webserver:8000 (Docker-internes Netzwerk). Bei dir wird der Hostname wahrscheinlich anders heißen, z.B. paperless.fritz.box, 192.168.178.50:8000 oder ähnlich. Passe das in den vier HTTP-Request-Nodes entsprechend an.

3. Ollama-Credentials neu verbinden

Im Node Message a model ist mein Ollama-Account hinterlegt. Den siehst du natürlich nicht, du musst hier deine eigenen Ollama-Credentials anlegen und verbinden. Achte darauf, dass das gewählte Modell auch tatsächlich auf deiner Ollama-Instanz geladen ist (ollama pull gpt-oss:20b).

4. Webhook in paperless-ngx einrichten

In paperless-ngx legst du unter „Workflows" einen neuen Workflow an, der bei „Document added" oder „Document consumed" einen Webhook auf deine n8n-Instanz schickt. Die URL findest du im n8n-Webhook-Node oben im Flow.

Wichtig dabei: paperless schickt im Body eine doc_url mit – die parst der Extract ID-Node, um die Dokumenten-ID herauszuziehen.

5. System Prompt an deine Tags anpassen

Und jetzt kommt der spannende Teil, die eigentliche „Intelligenz" des Flows. Im Node Message a model findest du einen ausführlichen System Prompt mit Beispielen für Tags und Dokumententypen. Aktuell stehen dort meine Beispieldaten (coursemine GmbH, Musterstr. 1 München, etc.).

Den passt du an deine eigene Welt an. Beispiel:

## Vermietung
Wenn das Dokument einen Bezug zu mindestens einem unserer 
Vermietungsobjekte hat oder unsere Vermietung allgemein betrifft.
Objekte sind ausschließlich:
- Hauptstraße 12, Musterstadt
- Lindenweg 4, Beispielhausen

Wichtig ist die Regel, die ich dort explizit hinterlege: „Nur Tags setzen, wenn diese passen. Keine Tags, wenn keines passt." Ohne diese Vorgabe neigen lokale Modelle dazu, jedes Dokument mit allem zu vertaggen, was im Prompt steht. Das willst du nicht.

Welches Modell soll ich nehmen?

Ich habe im Beispiel gpt-oss:20b verwendet, weil das Modell hier richtig gute Ergebnisse liefert. Aber: 20B-Modelle brauchen ordentlich Hardware. Wenn du keine GPU mit genug VRAM hast, kannst du problemlos auf kleinere Modelle wechseln. Folgende habe ich getestet:

  • gpt-oss:20b – beste Qualität, aber GPU-hungrig
  • qwen2.5:7b – guter Kompromiss aus Qualität und Geschwindigkeit
  • llama3.1:8b – funktioniert auch, etwas weniger zuverlässig bei JSON-Output

Probier einfach durch, was bei dir gut läuft. Den Modellnamen änderst du im Message a model-Node oben.

Warum überhaupt dieser Aufwand statt paperless-ai?

Ich will paperless-ai gar nicht schlechtreden. Das Projekt ist klasse und für viele die richtige Wahl. Aber für mich hat der n8n-Ansatz drei entscheidende Vorteile:

1. Du behältst die Kontrolle. Wenn du morgen einen vierten Tag oder einen neuen Dokumententyp einführen willst, ergänzt du drei Zeilen im System Prompt – fertig. Du musst nicht warten, ob das Feature irgendwann mal ins Tool eingebaut wird.

2. Du verstehst, was passiert. Jeder Schritt im Flow ist sichtbar. Du siehst, welche Daten an die KI gehen, was zurückkommt und wie es in paperless geschrieben wird. Das macht Debugging einfach – und lehrreich.

3. Du bist unabhängig vom Maintainer. Open-Source-Projekte schlafen ein. Deine eigene n8n-Logik nicht. Du kannst sie weiterpflegen, solange n8n und paperless-ngx existieren.

Der Preis dafür: einmaliger Setup-Aufwand. Aber der zahlt sich langfristig aus.

Was du als Nächstes machen kannst

Wenn der Flow bei dir läuft, bist du eigentlich schon fertig. Aber natürlich kannst du das Ganze noch erweitern:

  • Korrespondenten erkennen: Mit einem zusätzlichen API-Call und einer Erweiterung im Prompt
  • Custom Fields füllen: paperless-ngx unterstützt benutzerdefinierte Felder, die per API geschrieben werden können
  • Fallback-Logik: Wenn die KI mal kein valides JSON zurückgibt, das Dokument einfach unverändert lassen
  • Mehrere Modelle vergleichen: Z.B. ein kleines Modell für Standardfälle, ein größeres für komplexe Dokumente

Du willst Schritt für Schritt durch das Setup geführt werden?

Wenn dir das alles etwas zu viel ist (Ollama-Installation, n8n-Konfiguration, paperless-Webhook, System Prompt schreiben) habe ich genau das Richtige für dich:

In meinem Videokurs „Eigenen KI-Server / LLM selbst hosten und betreiben" zeige ich dir Schritt für Schritt, wie du dir deinen eigenen lokalen KI-Server aufsetzt und mit n8n und paperless-ngx verknüpfst. Inklusive Troubleshooting, Modell-Auswahl und Erweiterungen.

👉 Hier geht's zum KI-Kurs

Und falls du erstmal nur reinschnuppern möchtest: Auf meinem YouTube-Kanal findest du regelmäßig kostenlose Videos rund um paperless-ngx, n8n und Co.

Viel Erfolg beim Nachbauen – und falls du Fragen hast, schau gerne in unserem Community-Forum vorbei!

10 € Rabatt auf deinen nächsten Kurs

Melde dich für unseren Newsletter an und erhalte sofort einen 10 €-Gutschein für alle Online-Kurse. Dazu regelmäßig Tipps rund um Digitalisierung und paperless-ngx.