Was ist Paperless-ngx?

Paperless-ngx ist ein Open-Source-Dokumentenmanagementsystem (DMS), das Ihnen hilft, den Papierkram in Ihrem Büro zu digitalisieren und zu organisieren. Der Name ist Programm: Das Ziel ist ein papierloses Büro, in dem alle Dokumente – Rechnungen, Verträge, Belege, Briefe – digital erfasst, durchsuchbar gemacht und intelligent kategorisiert werden.

Die Software ist der Nachfolger des ursprünglichen „Paperless"-Projekts und wird von einer aktiven Open-Source-Community weiterentwickelt. Das „ngx" steht für „next generation" – und tatsächlich bietet Paperless-ngx Funktionen, die sich mit kommerziellen DMS-Lösungen messen können, die ein Vielfaches kosten.

Wir bei fokus it solutions setzen Paperless-ngx bei mehreren Kunden ein – vom Einzelunternehmer bis zum mittelständischen Betrieb. Die Software hat sich als zuverlässig, leistungsfähig und erstaunlich benutzerfreundlich erwiesen. In diesem Guide erklären wir Ihnen alles, was Sie über Paperless-ngx wissen müssen.

Das papierlose Büro: Warum jetzt der richtige Zeitpunkt ist

Der Traum vom papierlosen Büro ist fast so alt wie der Computer selbst. Doch erst in den letzten Jahren sind die technischen Voraussetzungen so gut geworden, dass es tatsächlich praktikabel ist. OCR-Technologie erkennt Texte mit über 99 % Genauigkeit, Speicherplatz ist günstig, und Software wie Paperless-ngx macht die Organisation einfach.

Die typische Situation in deutschen Büros

Kennen Sie das? Aktenordner reihen sich im Regal aneinander, die Ablage türmt sich auf dem Schreibtisch, und wenn Sie eine bestimmte Rechnung von vor sechs Monaten suchen, blättern Sie minutenlang durch Ordner. Steuerberater warten auf Belege, die „irgendwo" abgelegt wurden. Und bei einer Betriebsprüfung wird es richtig stressig.

Das papierlose Büro löst all diese Probleme. Jedes Dokument wird gescannt oder als PDF importiert, per OCR durchsuchbar gemacht und automatisch kategorisiert. Wenn Sie eine Rechnung von „Müller GmbH" vom März 2024 suchen, tippen Sie die Suchbegriffe ein und finden das Dokument in Sekunden – nicht in Minuten oder Stunden.

Die Vorteile im Überblick

  • Zeitersparnis: Dokumente finden statt suchen. Die durchschnittliche Suchzeit sinkt von mehreren Minuten auf wenige Sekunden.
  • Platzersparnis: Kein Aktenlager, keine Regale voller Ordner. Tausende Dokumente passen auf eine SSD.
  • Zugriff von überall: Im Homeoffice, unterwegs oder beim Steuerberater – Ihre Dokumente sind immer erreichbar.
  • Sicherheit: Digitale Backups schützen vor Verlust durch Brand, Wasserschaden oder Diebstahl.
  • Zusammenarbeit: Mehrere Personen können gleichzeitig auf das Archiv zugreifen.
  • Nachhaltigkeit: Weniger Papier bedeutet weniger Ressourcenverbrauch.

OCR: Wie Paperless-ngx Ihre Dokumente liest

OCR steht für „Optical Character Recognition" – optische Zeichenerkennung. Diese Technologie verwandelt Bilder von Text (z.B. ein gescanntes PDF oder ein Foto eines Dokuments) in durchsuchbaren, kopierbaren Text.

Paperless-ngx nutzt die OCR-Engine Tesseract, die von Google entwickelt wurde und als die beste Open-Source-OCR-Lösung gilt. Tesseract unterstützt über 100 Sprachen, darunter natürlich Deutsch und Englisch.

Wie der OCR-Prozess funktioniert

  1. Import: Sie scannen ein Dokument ein oder laden ein PDF hoch. Paperless-ngx überwacht einen Import-Ordner und verarbeitet neue Dateien automatisch.
  2. Vorverarbeitung: Das Bild wird optimiert – Kontrast angepasst, Verzerrungen korrigiert, Rauschen entfernt.
  3. Texterkennung: Tesseract analysiert das Bild und erkennt Buchstaben, Wörter und Sätze.
  4. PDF/A-Erstellung: Das Ergebnis wird als PDF/A gespeichert – ein Langzeitarchivierungsformat, bei dem der erkannte Text als unsichtbare Ebene über dem Originalbild liegt.
  5. Indexierung: Der erkannte Text wird in die Suchindex-Datenbank aufgenommen und ist sofort durchsuchbar.

Das bedeutet: Sie werfen ein gescanntes Dokument in den Import-Ordner und wenige Minuten später ist es vollständig durchsuchbar, kategorisiert und archiviert. Ohne manuellen Aufwand.

Features von Paperless-ngx im Detail

Tags (Schlagwörter)

Tags sind das primäre Organisationswerkzeug in Paperless-ngx. Sie können beliebig viele Tags erstellen – zum Beispiel „Rechnung", „Vertrag", „Steuer 2024", „Buchhaltung", „Versicherung" – und jedem Dokument mehrere Tags zuweisen. Tags lassen sich farblich kennzeichnen, sodass Sie auf einen Blick sehen, um welche Art von Dokument es sich handelt.

Das Besondere: Paperless-ngx lernt aus Ihren manuellen Zuweisungen. Nach einigen Dokumenten erkennt die Software automatisch, welche Tags zu einem neuen Dokument passen, und schlägt diese vor oder weist sie direkt zu.

Korrespondenten

Korrespondenten sind die Absender oder Empfänger Ihrer Dokumente – z.B. „Stadtwerke Stuttgart", „Allianz Versicherung" oder „Finanzamt Böblingen". Auch Korrespondenten werden automatisch erkannt, wenn Paperless-ngx genug Beispiele gesehen hat. So können Sie schnell alle Dokumente eines bestimmten Absenders filtern.

Dokumententypen

Neben Tags und Korrespondenten können Sie Dokumententypen definieren: „Rechnung", „Vertrag", „Kündigung", „Mahnung", „Angebot" etc. Das gibt Ihrem Archiv eine zusätzliche Strukturebene und ermöglicht präzise Filter.

ASN (Archive Serial Number)

Die ASN ist eine fortlaufende Nummer, die jedem Dokument zugewiesen wird. Sie ist besonders nützlich, wenn Sie physische Originale aufbewahren müssen (z.B. aus rechtlichen Gründen): Sie schreiben die ASN auf das Originaldokument und können es jederzeit dem digitalen Pendant zuordnen. So haben Sie eine Brücke zwischen digitalem Archiv und physischem Aktenordner.

Volltextsuche

Die Volltextsuche ist das Herzstück von Paperless-ngx. Jedes Wort in jedem Dokument ist durchsuchbar – auch in gescannten PDFs dank OCR. Die Suche ist blitzschnell und unterstützt komplexe Abfragen. Sie können nach Stichwörtern, Datumsbereich, Tags, Korrespondenten und Dokumententypen filtern – oder alles kombinieren.

Automatische Klassifizierung

Paperless-ngx nutzt Machine Learning, um Dokumente automatisch zu klassifizieren. Die Software lernt aus Ihren manuellen Zuweisungen und wird mit der Zeit immer besser. Nach einigen hundert Dokumenten erkennt Paperless-ngx zuverlässig, ob es sich um eine Rechnung, einen Vertrag oder ein anderes Dokument handelt – und wer der Absender ist.

E-Mail-Integration

Paperless-ngx kann E-Mail-Postfächer überwachen und Anhänge automatisch importieren. Das ist perfekt für Rechnungen und Belege, die per E-Mail kommen: Sie leiten die Mail einfach an Ihre Paperless-Adresse weiter und das Dokument wird automatisch verarbeitet.

Digital vs. physisches Archiv: Der Vergleich

KriteriumPhysisches ArchivPaperless-ngx
SuchzeitMinuten bis StundenSekunden
PlatzbedarfRegale, Aktenschränke, ggf. LagerraumServer (ca. 1 GB pro 10.000 Seiten)
ZugriffNur vor OrtVon überall (Browser)
Sicherheit vor VerlustBrandgefahr, Wasserschaden, DiebstahlAutomatische Backups, verschlüsselt
Gleichzeitiger ZugriffNicht möglich (Dokument ist physisch)Unbegrenzt viele Nutzer gleichzeitig
KostenOrdner, Regale, Miete für Lagerraum59 €/Monat (Managed Hosting)
UmweltPapier, Toner, TransportNur Strom für den Server
Aus der Praxis: Ein Steuerberater-Kunde hat sein komplettes Belegarchiv (ca. 15.000 Dokumente) in Paperless-ngx digitalisiert. Die Vorbereitung der Jahresabschlüsse dauert jetzt Stunden statt Tage. „Ich weiß gar nicht, wie ich vorher ohne gearbeitet habe", sagt er.

DSGVO und Datenschutz bei Paperless-ngx

Dokumente enthalten oft sensible Daten: Namen, Adressen, Kontonummern, Gesundheitsinformationen. Der Datenschutz bei der Digitalisierung ist daher besonders wichtig.

Paperless-ngx bietet hier entscheidende Vorteile gegenüber Cloud-basierten DMS-Lösungen von US-Anbietern:

  • Volle Datenkontrolle: Als Open-Source-Software läuft Paperless-ngx auf Ihrem eigenen Server. Kein Drittanbieter hat Zugriff auf Ihre Dokumente.
  • Server in Deutschland: Bei unserem Managed Hosting stehen die Server in deutschen Rechenzentren. Ihre Daten verlassen nie das Land.
  • AV-Vertrag: Wir stellen Ihnen einen Auftragsverarbeitungsvertrag nach Art. 28 DSGVO zur Verfügung.
  • Zugriffskontrolle: Paperless-ngx unterstützt Benutzer und Berechtigungen. Sie können genau steuern, wer welche Dokumente sehen darf.
  • Verschlüsselung: Die Verbindung zu Ihrem Server ist SSL-verschlüsselt, die Backups werden ebenfalls verschlüsselt gespeichert.
  • Löschung: Sie können Dokumente jederzeit vollständig löschen – sowohl die Datei als auch den OCR-Index und alle Metadaten.

GoBD-Konformität

Für die steuerrechtliche Aufbewahrung von Belegen gelten in Deutschland die GoBD (Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form). Paperless-ngx kann GoBD-konform betrieben werden, wenn Sie einige Grundregeln beachten: Dokumente dürfen nach dem Import nicht verändert werden, die Originaldateien müssen aufbewahrt werden und es muss eine revisionssichere Archivierung gewährleistet sein.

Paperless-ngx speichert sowohl das Original als auch die OCR-verarbeitete Version jedes Dokuments. In Kombination mit unseren täglichen Backups und der ASN-Nachvollziehbarkeit schaffen Sie eine solide Grundlage für die GoBD-konforme Archivierung. Wir empfehlen dennoch, die konkrete Umsetzung mit Ihrem Steuerberater abzustimmen.

Warum Managed Hosting für Paperless-ngx?

Paperless-ngx ist technisch anspruchsvoller als eine einfache Web-Anwendung. Die Software basiert auf Django (Python), nutzt PostgreSQL als Datenbank, Redis als Message Broker, und Tesseract als OCR-Engine. Dazu kommt ein Hintergrund-Worker (Celery), der die Dokumentenverarbeitung übernimmt.

Diese Architektur bietet viel Leistung, erfordert aber auch Know-how bei Installation, Konfiguration und Wartung. Konkret müssen Sie sich bei einer Eigeninstallation um folgendes kümmern:

  • Docker oder native Installation auf einem Linux-Server
  • PostgreSQL-Datenbank einrichten und optimieren
  • Redis konfigurieren
  • Tesseract mit deutschen Sprachpaketen installieren
  • Reverse Proxy (Apache/Nginx) mit SSL einrichten
  • Backup-Strategie für Dateien und Datenbank implementieren
  • Updates einspielen (regelmäßig neue Versionen)
  • Monitoring einrichten

Bei unserem Managed Hosting entfällt all das. Wir richten Paperless-ngx für Sie ein, halten die Software aktuell und kümmern uns um Backups, Sicherheit und Performance. Sie öffnen einfach den Browser und arbeiten mit Ihren Dokumenten.

Kosten: Paperless-ngx Hosting bei fokus hosting

Paperless-ngx Managed Hosting – 59 €/Monat

  • 250 GB SSD-Speicher – Platz für ca. 100.000+ Dokumente
  • Eigene .de-Domain inklusive (z.B. docs.ihrname.de)
  • SSL-Zertifikat – automatisch via Let's Encrypt
  • Tägliche Backups – verschlüsselt, 30 Tage Aufbewahrung
  • OCR in Deutsch und Englisch – weitere Sprachen auf Anfrage
  • Automatische Updates – immer die neueste Version
  • Persönlicher Support – per E-Mail und Telefon
  • AV-Vertrag – DSGVO-konform
  • Server-Standort: Deutschland

Zum Vergleich: Kommerzielle DMS-Lösungen kosten oft mehrere hundert Euro pro Monat und Nutzer. Paperless-ngx bietet vergleichbare Funktionen für einen Bruchteil des Preises – und Sie behalten die volle Kontrolle über Ihre Daten.

Häufig gestellte Fragen zu Paperless-ngx

Was ist Paperless-ngx?

Paperless-ngx ist ein Open-Source-Dokumentenmanagementsystem, das Ihre physischen und digitalen Dokumente digitalisiert, per OCR durchsuchbar macht und intelligent organisiert. Es ist kostenlos verfügbar und wird von einer aktiven Community weiterentwickelt.

Was kostet Paperless-ngx Hosting?

Managed Paperless-ngx Hosting bei fokus hosting kostet 59 €/Monat. Inklusive 250 GB Speicher, eigener .de-Domain, täglichen Backups und persönlichem Support. Es gibt keine versteckten Kosten und keine Limitierung der Nutzerzahl.

Ist Paperless-ngx DSGVO-konform?

Ja, Paperless-ngx ist Open Source und speichert alle Daten lokal auf Ihrem Server. Mit unserem Hosting in Deutschland und einem AV-Vertrag ist die Lösung vollständig DSGVO-konform. Das ist besonders wichtig, wenn Sie sensible Dokumente wie Verträge, Rechnungen oder Personalunterlagen verwalten.

Kann Paperless-ngx meine Dokumente automatisch erkennen?

Ja, Paperless-ngx nutzt OCR (Texterkennung) und Machine Learning, um Dokumente automatisch zu klassifizieren. Nach einer Lernphase erkennt die Software automatisch Korrespondenten, Dokumententypen und passende Tags. Die Genauigkeit verbessert sich mit jedem Dokument, das Sie verarbeiten.

Wie scanne ich Dokumente für Paperless-ngx?

Sie können jeden Scanner verwenden, der PDFs erstellen kann. Ideal sind Dokumentenscanner mit automatischem Einzug (ADF) wie der Fujitsu ScanSnap oder Brother ADS-Serie. Der Scanner speichert die PDFs in einen Ordner, den Paperless-ngx automatisch überwacht. Alternativ können Sie Dokumente auch mit dem Smartphone fotografieren oder digitale PDFs (z.B. Rechnungen per E-Mail) direkt importieren.