Python ist eine Programmiersprache mit einem knappen und gut verständlichen Programmierstil, welcher sich sehr gut für die Auswertung von Daten (Data Science), unter anderem mit Hilfe von Machine Learning, eignet.
ZielgruppeInteressierte auf Einstiegs-Niveau mit Vorerfahrung im Programmieren
Voraussetzungen
Sie benötigen
- einen Computer mit den installierten Programmen Python und Visual-Studio Code (Berücksichtigen Sie bitte, dass wir Sie aus zeitlichen Gründen nicht bei der Installation von Software unterstützen können.)
- Headset (Mikrofon und Kopfhörer)
- stabile Internetverbindung
- Admin-Rechte auf Ihrem Rechner, um im Kursverlauf weitere Software installieren zu können
Wir empfehlen die Nutzung
- einer Kamera
- eines zweiten Monitors oder eines Tablets, der Vorteil: Sie können auf dem Monitor/Tablet dem Dozenten folgen und zeitgleich auf Ihrem Rechner die Inhalte nachvollziehen
- Installation der kostenlosen App Webex Meetings
- Programmiert wird in English. Alle wichtigen Unterlagen sind in der Regel englischsprachig. Sie müssen Englisch zwar nicht aktiv sprechen können, sollten aber ein grundlegendes Verständnis der englischen Sprache mitbringen.
ZieleIn unserem intensiven Fortgeschrittenen-Kurs lernen Sie unmittelbar ausgehend von Ihren Python-Basis-Kenntnissen wesentliche Data-Science-Konzepte kennen. Unter anderem werden Sie erste Programmiererfahrungen im Feld des Machine-Learning sammeln. Nach dem Kurs können Sie einfache Data-Science Projekte realisieren sowie gut begründet Ihre nächsten Lernschritte im Feld DataScience planen und umsetzen.
InhalteNumpy
- Zweck und Bedeutung von Numpy Arrays
- Fertigung eines Numpy-Arrays mit Hilfe eines zufälligen biostatistischen Datensatzes
- unter Nutzung der gebräuchlichsten Verteilungen wie (Standard-)Normalverteilung,
- ChiQuadrat-Verteilung, Gleichverteilung etc.
- Einfacher Umgang mit Numpy Arrays: Ermittlung der Dimensionalität, Anzahl und Art
- der Variablen, Anzahl der Elemente
- Konzept und Berechnung beschreibender statistischer Kennzahlen bspw. Modulo,
- Median, Mittelwert, Interquartilsabstand
- Konzept und Berechnung des mittleren quadratischen Fehlers
- Debugging: Step Into, Step Out, Step Over
Pandas
- Zweck und Relevanz von Pandas Dataframes im Unterschied zu Numpy Arrays
- Import und Export von .csv-Dateien
- Transformation von Dataframes, Umgang mit Fehlern
- Filtern und Sortieren von Daten
- Berechnung deskriptiver Kennzahlen
Matplotlib
- Matplotlib Objekt Hierarchie
- Statefull vs. Stateless
- Fertigung von Scatterplots, Säulendiagrammen, Histogrammen, Boxplots und
- Heatmaps
Machine Learning
- Einführung in das Machine Learning: Begriffe, historische Entwicklung, Ausblick.
- Konzepte und Realisierungen folgender Machine-Learning-Modelle
- 1. Decision Tree
- 2. Neural Network inkl. Backpropagation
- 3. Lineare Regression
- 4. Falls Zeit: Logistische Regression
- Vorstellung von Mojo: Mojo ist eine Python-nahe Sprache spezialisiert auf KI-Anwendungen
Datenorganisation mit Hilfe einer relationalen Datenbank (sqlite) - Primär- und Fremdschlüssel
- Referentielle Integrität
- 1.-3. Normalform
MethodenVortrag, F&A, Demonstrationen, Übungen
HinweiseEs wird mit den zum Kurszeitpunkt aktuellen Versionen von Python und Visual-Studio Code auf PC/Mac gearbeitet.
Kurssprache ist Deutsch. Programmiert wird in Englisch, alle Unterlagen sind englischsprachig.
Wichtig:
Achten Sie bei der Installation von Python unbedingt darauf, den Haken bei „Add Python … to PATH“ zu aktivieren.
Das Seminar wird online stattfinden. Zu diesem Zweck wird Cisco Webex Meetings verwendet. Der erste Tag findet hybrid statt. Sie können am ersten Tag also entweder online teilnehmen oder unseren Kursraum in Präsenz besuchen.
Sie haben Interesse an einem Information Technology Specialist (ITS) OD 202 Data Analytics-Zertifikat und möchten sich auf den Test vorbereiten? Buchen Sie unser eintägiges
Bootcamp Python Data Analytics. Die Teilnahme am Bootcamp berechtigt Sie zur Prüfung, die wir Ihnen in Kooperation mit der Ausbildungsverbund Fachinformatik Berlin als anerkanntes Testzentrum für Microsoftzertifikate anbieten.
Der Ausbildungsverbund Fachinformatik Berlin ist eine Initiative der Charité, der Freien Universität Berlin, des Max-Planck-Instituts für Bildungsforschung sowie dem Zuse-Institut. Weitere Informationen zur Microsoft-Prüfung finden Sie unter
Bootcamp Python Data Analytics.