Dateiverarbeitung in Python- CSV-, JSON- und Textdateien fortgeschritten nutzen
Dateiverarbeitung in Python: CSV-, JSON- und Textdateien fortgeschritten nutzen
Ein praxisorientierter Leitfaden zur strukturierten Verarbeitung, Umwandlung und Automatisierung von Datei-Inhalten mit Python
Inhaltsverzeichnis
Kapitel 1: Einführung in die Dateiverarbeitung
- Warum Dateiformate wichtig sind
- Text, CSV und JSON im Vergleich
- Der Python-Weg: Klar, strukturiert, automatisierbar
- Grundregeln für saubere Dateiverarbeitung
Kapitel 2: Fortgeschrittenes Arbeiten mit Textdateien
- Zeilenweise Lesen und Schreiben
- Kodierungen (UTF-8, ISO-8859-1) erkennen und nutzen
- Arbeiten mit Kontextmanagern (with open() as …)
- Mini-Projekt: Logdatei filtern und bereinigen
Kapitel 3: Komplexe Textverarbeitung und Formatierung
- Suchen und Ersetzen mit regulären Ausdrücken
- Zeichenweise Verarbeitung großer Dateien
- Umgang mit Absätzen, Sonderzeichen und Strukturmustern
- Mini-Projekt: E-Mail-Extraktion aus Textarchiv
Kapitel 4: CSV-Dateien professionell lesen und schreiben
- csv.reader und csv.writer verstehen
- Mit DictReader und DictWriter arbeiten
- Spalten sortieren, gruppieren, filtern
- Mini-Projekt: Kundendaten zusammenfassen und exportieren
Kapitel 5: Große CSV-Dateien effizient verarbeiten
- Chunkweise Verarbeitung mit pandas
- Lazy-Loading und Speicheroptimierung
- Spaltenumwandlungen und Datentypprüfung
- Mini-Projekt: Umsatzdaten auswerten und bereinigen
Kapitel 6: JSON-Dateien lesen, schreiben und transformieren
- Arbeiten mit json.load(), json.dump()
- JSON-Dateien in Python-Objekte umwandeln
- Schachtelungen, Listen und Dictionaries
- Mini-Projekt: Einstellungen aus JSON-Datei einlesen und anwenden
Kapitel 7: JSON strukturieren, filtern und mergen
- Zugriff auf tief verschachtelte Daten
- Daten extrahieren, filtern, zusammenführen
- JSON-Dateien in andere Formate umwandeln
- Mini-Projekt: API-Daten als JSON speichern und bereinigen
Kapitel 8: Kombination von Dateiformaten
- Text + CSV: Analyse aus Log- und Exportdateien
- JSON → CSV: Umwandlung von Daten für Tabellenkalkulation
- CSV → JSON: Strukturiertes Speichern von Tabellen
- Mini-Projekt: Benutzerfeedback strukturieren und analysieren
Kapitel 9: Fehlerbehandlung und Robustheit
- Typische Fehler: FileNotFoundError, JSONDecodeError, UnicodeError
- Try-Except-Blöcke für Dateiverarbeitung
- Logging von Import-/Exportfehlern
- Mini-Projekt: Validierter Dateiimport mit Protokollierung
Kapitel 10: Automatisierung von Dateioperationen
- Verzeichnisse automatisch durchsuchen mit os und glob
- Dateioperationen: Kopieren, Umbenennen, Archivieren
- Zeitgesteuerte Verarbeitung (z. B. mit schedule)
- Mini-Projekt: Wöchentlicher CSV-Export aus Rohdaten
Anhang A: Übersicht nützlicher Standard- und Drittanbieter-Module
- csv, json, os, glob, re, pandas, pathlib
- Installationshinweise und Kurzanleitungen
Anhang B: Vergleich von Dateiformaten und Einsatzgebieten
- Tabelle mit Vor- und Nachteilen von CSV, JSON, TXT
- Wann welches Format sinnvoll ist
Anhang C: Übungsaufgaben mit Lösungen
- Datei analysieren, umwandeln, bereinigen
- Datensätze vergleichen und mergen
- Fehlerhafte Formate abfangen
- Lösungen mit Kommentaren und Schritt-für-Schritt-Erklärung