Datenanalyse mit pandas- Python für Datenfreunde auf dem nächsten Level
Datenanalyse mit pandas: Python für Datenfreunde auf dem nächsten Level
Ein praxisnaher Leitfaden zur professionellen Analyse, Transformation und Visualisierung von Daten mit pandas
Inhaltsverzeichnis
Kapitel 1: Warum pandas?
- Der Vorteil von DataFrames gegenüber Listen und Dictionaries
- pandas im Datenanalyse-Workflow
- Struktur und Philosophie von pandas
- Überblick über Funktionen und Module
Kapitel 2: Datenquellen einlesen und speichern
- CSV, Excel, JSON, SQL – Daten importieren
- read_csv(), read_excel(), read_json(), read_sql()
- Daten exportieren mit to_csv() und Co.
- Mini-Projekt: Umsatzdaten aus Excel importieren und bereinigen
Kapitel 3: Den DataFrame verstehen
- Aufbau und Struktur: Zeilen, Spalten, Indizes
- Daten anzeigen, filtern, sortieren
- Zugriff mit .loc[], .iloc[], .at[]
- Mini-Projekt: Kundenliste alphabetisch sortieren und analysieren
Kapitel 4: Daten vorbereiten und transformieren
- Datentypen konvertieren, fehlende Werte behandeln
- Neue Spalten berechnen, alte umbenennen
- Duplikate finden und entfernen
- Mini-Projekt: Mitarbeiterdaten aufbereiten und standardisieren
Kapitel 5: Gruppieren und Aggregieren mit groupby()
- Daten nach Kategorien zusammenfassen
- Aggregationen: sum(), mean(), count(), agg()
- Mini-Projekt: Monatsauswertungen aus Verkaufsliste erstellen
Kapitel 6: Zeitreihen analysieren
- datetime-Objekte in pandas
- Indexierung nach Datum
- Resampling, Rolling Windows, Gleitmittelwerte
- Mini-Projekt: Temperaturverlauf analysieren
Kapitel 7: Daten zusammenführen und kombinieren
- merge(), join(), concat() im Vergleich
- Schlüsselspalten und verschiedene Join-Typen
- Mini-Projekt: Produkt- und Lieferantendaten kombinieren
Kapitel 8: Daten visualisieren mit pandas und matplotlib
- Schnellübersicht mit .plot()
- Liniendiagramm, Balken, Histogramm, Boxplot
- Diagramme anpassen (Farben, Titel, Achsen)
- Mini-Projekt: Trendanalyse im Kundenverhalten
Kapitel 9: Große Datenmengen effizient verarbeiten
- Speicherverbrauch prüfen und optimieren
- Arbeiten mit Datasets in Chunks
- Kategorien und Typoptimierung
- Mini-Projekt: Millionen Zeilen aus Logdatei auswerten
Kapitel 10: Best Practices in der Datenanalyse mit pandas
- Saubere Spaltennamen und strukturierter Code
- Verwendung von Pipelines und Funktionen
- Dokumentation und Wiederverwendbarkeit
- Tipps zur Fehlervermeidung
Anhang A: Schnellreferenz pandas-Funktionen
- Häufig genutzte Methoden mit Beschreibung und Beispiel
- head(), describe(), groupby(), apply(), pivot_table() usw.
Anhang B: Typische Fehler und wie man sie vermeidet
- KeyError, SettingWithCopyWarning, falsche Achsen
- Tipps zur Fehlersuche in DataFrames
Anhang C: Übungsaufgaben mit Lösungen
- Daten bereinigen und analysieren
- Aggregationen und Visualisierung
- Mini-Projekte mit realitätsnahen Beispieldaten
- Lösungen mit Schritt-für-Schritt-Erklärung