Datenformate in Python verarbeiten- XML, YAML und eigene Formate
Datenformate in Python verarbeiten: XML, YAML und eigene Formate
Ein praxisorientierter Leitfaden zum Einlesen, Verarbeiten und Erstellen strukturierter Datenformate in Python
Inhaltsverzeichnis
Kapitel 1: Überblick über strukturierte Datenformate
- Warum strukturierte Daten?
- Vergleich: JSON, XML, YAML, INI, CSV, eigene Formate
- Wann welches Format verwenden?
- Python-Module im Überblick
Kapitel 2: Grundlagen der Arbeit mit XML
- Struktur von XML-Dateien (Tags, Attribute, Hierarchien)
- Einlesen mit xml.etree.ElementTree
- Elemente suchen, ändern und schreiben
- Mini-Projekt: XML-Konfigurationsdatei lesen und bearbeiten
Kapitel 3: Erweiterte XML-Verarbeitung
- Verwendung von minidom und lxml
- XPath-Ausdrücke verstehen
- Validierung mit XML-Schema (XSD)
- Mini-Projekt: Validiertes XML-Exportmodul für Daten
Kapitel 4: YAML-Dateien in Python nutzen
- Was ist YAML und wann ist es besser als JSON?
- PyYAML verwenden: yaml.safe_load(), yaml.dump()
- Strukturierte Konfigurationsdaten lesen und schreiben
- Mini-Projekt: Mehrsprachige Konfiguration in YAML verwalten
Kapitel 5: Eigene Datenformate lesen und schreiben
- Eigene Trennzeichenformate (|, ;, etc.)
- Reguläre Ausdrücke zum Parsen verwenden
- Parser und Serialisierer erstellen
- Mini-Projekt: Eigenes einfaches Datenformat entwickeln
Kapitel 6: Konvertierung zwischen Formaten
- XML ↔ YAML, YAML ↔ JSON, JSON ↔ CSV
- Struktur angleichen, Felder umwandeln
- Umgang mit verschachtelten Strukturen
- Mini-Projekt: Konverter-Tool für Konfigurationsdaten
Kapitel 7: Validierung und Fehlerbehandlung
- Strukturprüfung und Exception-Handling
- Fehlertolerantes Einlesen von externen Dateien
- Testdaten erzeugen und automatisch validieren
- Mini-Projekt: Eingabedatei mit Schema prüfen und loggen
Kapitel 8: Arbeiten mit großen Dateien und Streams
- Speichersparendes Parsen großer XML/YAML-Dateien
- Streaming mit xml.sax und Generatoren
- Mini-Projekt: Streaming-Parser für Logdateien im XML-Format
Kapitel 9: Integration in reale Anwendungen
- Konfigurationsmanagement in CLI- und Webanwendungen
- API-Kommunikation mit YAML/XML
- Versionierung von Datenstrukturen
- Mini-Projekt: Web-App mit YAML-basierten Einstellungen
Kapitel 10: Best Practices und Standards
- Dokumentation und Formatbeschreibung
- Datenaustausch zwischen Systemen
- Tipps für robustes Dateihandling und Portabilität
- Mini-Projekt: Datenimportmodul mit Format-Fallback
Anhang A: Module und Tools im Überblick
- xml.etree, lxml, PyYAML, configparser, re, csv, io
- Installationshinweise und Links
Anhang B: Beispiel-Datenformate und Templates
- XML-Beispieldatei
- YAML-Beispielkonfiguration
- Eigene Formate mit Parser
Anhang C: Übungsaufgaben mit Lösungen
- XML-Datei parsen und Daten extrahieren
- YAML-Datei lesen und in Python-Datenstruktur umwandeln
- Eigene Datei analysieren und rekonstruieren
- Lösungen mit Schritt-für-Schritt-Kommentaren