ZielgruppeInteressierte auf einem gehobenen Python-Einstiegs-Niveau mit solider Vorerfahrung im Programmieren
Voraussetzungen
Technik- Installation der kostenlosen App Webex Meetings
- Python und VS-Code auf Ihrem Rechner
- R und R-Studio auf Ihrem Rechner
- MS-Windows-Excel (Mac Excel ist nicht ausreichend)
- MS-SQL-Server und SQL-Server Management System
- Headset (Mikrofon und Kopfhörer)
- Administratorenrechte und eine stabile Internetverbindung auf dem Computer
Ziele
- Verständnis grundlegender Datenkonzepte, -strukturen und -kategorien
- Fähigkeit zur Datenmanipulation: Import, Bereinigung, Organisation und Aggregation von Daten
- Unterscheidung und Anwendung verschiedener Datenanalysemethoden, einschließlich explorativer Datenanalyse
- Erstellung und Interpretation von datenbasierten Visualisierungen mit verschiedenen Diagrammtypen
- Kenntnisse über Datenschutzgesetze und verantwortungsvollen Umgang mit Daten in Analyseprozessen
- Anwendung von Datenanalyse- und Bereinigungstechniken in praxisnahen Projekten, wie z.B. der Vorhersage von Studienleistungen oder der Visualisierung von Alumni-Daten
Inhalte
- Daten-Grundlagen: Definition von Daten und Datentypen (Boolean, numerisch, String), grundlegende Datenstrukturen (Tabellen, Zeilen, Spalten, Listen) und Datenkategorien (qualitativ, quantitativ, strukturiert, unstrukturiert, Metadaten, Big Data)
- Datenmanipulation: Datenimport, -speicherung und -export (ETL-Prozesse); Datenbereinigung (Umgang mit NULL-Werten, Duplikaten, inkonsistenten Formatierungen); Datenorganisation (Sortieren, Filtern, Transponieren) und Aggregation (Gruppieren, Pivotieren)
- Datenanalyse: Unterscheidung von Analysemethoden (deskriptive, diagnostische, prädiktive und präskriptive Analyse); Datenaggregation und Interpretationsmetriken (Summe, Durchschnitt, Median, Standardabweichung); explorative Datenanalyse (Mustererkennung, Ausreißer)
- Datenvisualisierung und Kommunikation: Erstellen von Diagrammen und Tabellen (Boxplots, Streudiagramme, Histogramme, Sankey-Diagramme); Dateninterpretation und -kommunikation (Unterschiede zwischen Analyse und Visualisierung)
- verantwortungsvolle Analysepraktiken: Datenschutzgesetze (GDPR, FERPA, HIPAA); ethischer Umgang mit PII, Datensicherheit und Anonymität; Verzerrungen in der Datenerhebung und -interpretation (Bestätigungsverzerrung, kognitive Verzerrung)
- praktische Anwendung: Analyse von Kursabbruchquoten, Überprüfung von Datenschutzprozessen, Visualisierung von Alumni-Daten, Vorhersage von Studienleistungen, Datenbereinigung und Validierung von Bestandsdaten
Methoden
Vortrag, F&A, Demonstrationen, Übungen
HinweiseDer Kurs findet
hybrid statt. Sie können also entweder online teilnehmen oder unseren Kursraum in Präsenz besuchen. In beiden Fällen wird Cisco Webex Meetings verwendet.
Es wird mit den zum Kurszeitpunkt aktuellen Versionen von Python und Visual-Studio Code auf PC/Mac gearbeitet. Wichtig: Achten Sie bei der Installation von Python unbedingt darauf, den Haken bei „Add Python … to PATH“ zu aktivieren.
Das Bootcamp wird entsprechend der Nachfrage terminiert. Lassen Sie sich über "Anmeldung" als Interessent*in aufnehmen.