WEITERBILDUNGSZENTRUM - ANMELDEPORTAL


Python Fortgeschrittenen-Kurs: Daten importieren und aufbereiten


24-H.FID14 


Dozent/in
Peter Kocmann
Veranstaltungsumfang
3 appointment, 11/04/2024 - 11/06/2024, Mo - Mi, 09:00 AM - 04:15 PM (24 UE)
Alle Termin(e) im Detail anzeigen / im Kalender speichern
Entgelt885,00 €
Rabattierte Entgelte
FU Beschäftigte*r:663,75 €
Beschäftigte*r eines Kooperationspartners des Weiterbildungszentrums:752,25 €
Art
Hybrid
Ort
(detaillierte Angaben erhalten Sie mit der Kurszusage)

In diesem dreitägigen Kurs lernen Sie, Daten aus verschiedenen Quellen zusammenzuführen und maschinenlesbar aufzubereiten. Der Kurs kombiniert traditionelle Programmiertechniken mit der Nutzung von Chatbots (ChatGPT).

Im Unterschied zu traditionellen Programmierkursen integriert dieser Kurs KI-Methoden. Sie lernen praxisorientiert sowohl die Grundlagen der Programmierung kennen als auch, wie Sie effizient mit Code-Snippets arbeiten und die Möglichkeiten von Chatbots am Beispiel von ChatGPT lösungsorientiert nutzen.

Der Kurs zielt darauf ab, Ihnen zu zeigen, wie Sie Daten aus verschiedenen Quellen datenschutzkonform zusammenführen und aufbereiten können, um diese für eine spätere Datenauswertung vorzubereiten. Sie konzentrieren sich dabei auf den Einsatz von Python, MS-Excel-PowerQuery (Windows) und einfache Regular Expressions. Zusätzlich wird die Integration von ChatGPT als optionales Tool vorgestellt.

Zielgruppe
Interessierte, die viel mit Daten aus unterschiedlichen Quellen arbeiten und bereits über erste Erfahrungen in Python verfügen

Kursinhalte und Lernziele

Grundlagen der Datenverarbeitung und -aufbereitung
Der Kurs beginnt mit einer Auffrischung der grundlegenden Python-Kenntnisse in Bezug auf die Datenverarbeitung. Anschließend lesen und schreiben Sie Dateien in den folgenden Formaten:

  • Text- und Datenformate: .csv, .tsv, .json, .txt, .md, .html, .xlsx, .db, .sqlite
  • Statistik- und wissenschaftliche Formate: .sav, .dta, .RData, .Rds, .mat, .bson, .yaml
  • Dokument- und Bildformate: .docx, .pdf, .png, .tiff, .jpeg
  • Audioformate: .wav, .mp3, .flac, .ogg

Mit Hilfe von Datenbereinigungstechniken behandeln Sie fehlende Werte und Duplikate. Ergänzend wird die Nutzung von Regular Expressions zur Textverarbeitung vermittelt.

Datenzusammenführung und -transformation
Ein wesentlicher Bestandteil des Kurses ist das datenschutzkonforme Zusammenführen von Daten aus unterschiedlichen Quellen. Sie lernen neben dem Einlesen der Daten unterschiedliche Wege kennen, diese Daten zu kombinieren. Als Tools nutzen wir neben Python auch MS-Excel PowerQuery (Windows) und SQLite. Techniken wie Sortieren, Filtern, Verbinden, Pivotieren und Entpivotieren von Daten vermitteln Ihnen das Wissen, komplexe Tabellenstrukturen in auswertbare Strukturen zu überführen. Zusätzlich lernen Sie, wie Sie Daten transformieren können, indem Sie Tabellen aneinander anhängen, Schnittmengen bilden, Vereinigungen und Differenzen erstellen sowie Daten aggregieren und normalisieren.

Praktische Anwendung
Sie vertiefen Ihr Wissen in der fortgeschrittenen Datenaufbereitung mit Python (z.B. Pandas) und erstellen komplexe Datenabfragen mit SQL. Darüber hinaus integrieren wir die Nutzung der ChatGPT-API, um die Datenaufbereitung und -verarbeitung zu unterstützen, sodass Sie in der Lage sind, erweiterte Datenverarbeitungsaufgaben effizient zu bewältigen. Diese praktischen Anwendungen bereiten Sie darauf vor, die erlernten Methoden und Techniken in realen Projekten anzuwenden.

Beispiele für mögliche Projekte sind:
  • Erstellung und Pflege von Stundenplänen: Zusammenführung von Einzeldaten zu übersichtlichen Stundenplänen.
  • Einlesen von Excel-Dateien: Automatische Auswertung von Excel-Dateien, deren Struktur für das menschliche Auge verständlich, aber maschinell schwer verarbeitbar ist.
  • Datenkombination: Mergen von Tabellen, Anhängen von Tabellen und Entfernen von Duplikaten aus verschiedenen Quellen.
  • Prüfungsunterlagen verwalten: Vorbereitung und Verwaltung von Prüfungsunterlagen.
  • Datenschutzkonforme Bearbeitung von Bewerbungen: Aufbereitung und Verwaltung von Bewerbungen für Studiengänge unter Berücksichtigung des Datenschutzes.
  • Bilddatenverarbeitung: Einlesen von Informationen aus Bildern, einschließlich Inhalte, Keywords und Metadaten.
  • Audio- und Videodatenverarbeitung: Einlesen und Aufbereitung des gesprochenen Wortes aus Video-Dateien, Zusammenfassung und Übersetzung der Inhalte.

Diese Projekte sind Beispiele und nicht alle werden notwendigerweise im Kurs bearbeitet. Für jeden Projektvorschlag stehen jedoch fertige Lösungen im Kursprojektordner zur Verfügung, die Sie verwenden, anpassen und weiterentwickeln können. Der Schwerpunkt der Projekte liegt darauf, bestehende Code-Snippets zu verstehen, an die eigenen Bedürfnisse anzupassen und die zum Kurszeitpunkt aktuellen KI-Möglichkeiten geschickt zu nutzen.

Voraussetzungen
  • Python Basis Kenntnisse etwa im Umfang unseres Python Basis-Kurses
  • Installation der kostenlosen App Webex Meetings
  • ein lokal installiertes GIMP (Bildbearbeitung)
  • einen (kostenfreien) Account bei GitHub oder alternativ Python und VS-Code auf Ihrem Rechner
  • ein zum Kurszeitpunkt aktuelles MS-Windows-Excel (Mac Excel ist nicht ausreichend)
  • ab Kursbeginn ein Headset (Mikrofon und Kopfhörer)
  • Administratorenrechte auf Ihrem Computer
  • ein funktionierendes WLAN auf Ihrem Computer
  • eine stabile Internetverbindung im Homeoffice
  • einfache englische Basis-Kenntnisse zum Lesen von Hilfetexten
  • optional: Einen kostenpflichtigen ChatGPT-Account

Methoden
Vortrag, F&A, Demonstrationen, Übungen

Hinweise
Es wird mit den zum Kurszeitpunkt aktuellen Versionen von Python und Visual-Studio Code auf PC/Mac gearbeitet. Wichtig: Achten Sie bei der Installation von Python unbedingt darauf, den Haken bei „Add Python … to PATH“ zu aktivieren.

Kurssprache ist Deutsch. Programmiert wird in Englisch, alle Unterlagen sind englischsprachig.

Das Seminar findet hybrid statt. Sie können also entweder online teilnehmen oder unseren Kursraum in Präsenz besuchen. In beiden Fällen wird Cisco Webex Meetings verwendet.



Veranstaltungsorganisation: Franziska Schwarzer




Belegung: 
Plätze frei
(Plätze frei)
  1. Weitere Veranstaltungen von Peter Kocmann

    1. Python Fortgeschrittenen-Kurs: Daten analysieren24-H.FID12

      11/18/2024 - 11/20/2024 (3 times) 09:00 AM - 04:15 PM
      Berlin
      Plätze frei
      (Plätze frei)