Dieses Projekt demonstriert grundlegende Datenanalysefähigkeiten mit den Python-Bibliotheken Pandas und NumPy. Der Code liest eine CSV-Datei mit 500.000 Zeilen, wählt numerische Spalten aus und führt grundlegende statistische Operationen wie die Berechnung von Mittelwert, Standardabweichung, Summe, Maximum und Minimum durch. Zusätzlich werden die Daten mit Matplotlib und Seaborn visualisiert.
- Einlesen von CSV-Dateien mit Pandas.
- Auswahl numerischer Spalten und Konvertierung in NumPy-Arrays.
- Berechnung statistischer Kennzahlen:
- Mittelwert
- Standardabweichung
- Summe
- Maximum
- Minimum
- Visualisierung der Daten:
- Balkendiagramm für die Mittelwerte der numerischen Spalten.
- Heatmap zur Darstellung der Korrelation zwischen den numerischen Spalten.
- Pandas: Für die Datenmanipulation und -analyse.
- NumPy: Für numerische Berechnungen.
- Matplotlib und Seaborn: Für die Visualisierung der Daten.
- Klonen Sie das Repository:
git clone https://github.com/ihr-benutzername/datenanalyse-projekt.git