Viele Beschäftigte in Verwaltung oder Bibliothek erstellen regelmäßig Berichte mit quantitativen Daten – oft ohne formalen Statistik-Hintergrund. Wie erkenne ich Trends? Wie gehe ich mit Lücken um? Und wie kann ich Daten grafisch ansprechend präsentieren? Typische Anwendungsfälle: Entwicklung der Studierendenzahlen über Jahre, Auslastung von Räumen, Budgetverläufe oder Bestandsentwicklungen in Bibliotheken.
Dieser Workshop vermittelt einen praxisnahen Einstieg in statistische Auswertungen mit der freien Programmiersprache R und der Arbeitsumgebung RStudio. Die lokal verwendeten Tools R und RStudio sind kostenlos und datenschutzkonform, ideal für reproduzierbare Datenanalysen mit sensiblen Verwaltungsdaten.
Für den Workshop wird sowohl eine lokale Installation als auch ein Cloud-basiertes Backup-System über Posit Cloud vorbereitet, um bei technischen Problemen nahtlos weiterarbeiten zu können. Die Posit Cloud sollte auch nach Kursende ausschließlich mit Übungsdaten genutzt werden, während Sie datensensible Auswertungen immer lokal durchführen sollten. Mit dem intuitiv nutzbaren Erweiterungspaket tidyverse lernen die Teilnehmenden, Daten aufzubereiten, auszuwerten und grafisch verständlich darzustellen – ganz ohne Vorkenntnisse in Statistik oder Programmierung.
Besonderes Augenmerk liegt auf der Interpretation von Zeitreihen, dem Umgang mit fehlenden Werten und der Erstellung automatisierbarer Berichte mit R Markdown, einem Werkzeug zur Kombination von Text, Code und Visualisierung in einem Dokument.
Zielgruppe Beschäftigte aus wissenschaftsunterstützenden Bereichen, Verwaltung, Bibliothek, IT, Controlling, Qualitätsentwicklung, Wissenschaftsmanagement und Forschung, die regelmäßig mit Zahlen arbeiten und ihre Statistikkompetenz erweitern möchten – ohne formale Vorkenntnisse in Statistik
Voraussetzungen- Grundkenntnisse im Umgang mit Excel/CSV-Daten, etwa aus unserem Kurs Basiswissen: MS Excel – Crashkurs, oder vergleichbare Vorkenntnisse
- Primärsystem (Pflicht): R + R-Studio (lokal installiert)
- Backup-System (Pflicht - nur für Übungsdaten): Posit Cloud Account (kostenlos), Hinweis: ausschließlich für technische Ausweichszenarien
- API-Zugang (Pflicht - beide für Redundanz): Academic Cloud (Chat AI, API-Zugang) + Google-Account (Gemini, Gemini API)
- Optional:
- Claude.ai
- Open AI (GPT)
- Hugging Face Account (KI API-Zugang)
Ziele
Nach dem Workshop sind die Teilnehmenden in der Lage,
- das Programmpaket R + RStudio für grundlegende Datenanalysen produktiv zu nutzen,
- Zahlenbestände zu bereinigen, gruppieren und berechnen (z.B. Mittelwerte, Trends),
- aussagekräftige Diagramme zu erstellen und zielgruppengerecht zu gestalten,
- fehlende Werte systematisch zu behandeln, etwa in Zeitreihen oder Evaluationen,
- automatisierte Auswertungsberichte mit R Markdown zu erstellen und zu exportieren.
Inhalte
- Einstieg in RStudio: Fenster, Projekte, Pakete (tidyverse)
- Daten einlesen mit readr und readxl: CSV und Excel sauber importieren
- Daten transformieren mit dplyr: filtern (z.B. nur bestimmte Fachbereiche), gruppieren (nach Jahren/Monaten), berechnen (Summen, Mittelwerte), sortieren
- Grafiken erstellen mit ggplot2: Balken, Linien, Achsen, Beschriftungen
- Fehlende Werte behandeln: Strategien für Zeitreihen und statistische Analysen
- Berichte automatisieren mit R Markdown: Code und Text kombinieren, PDF-Export
Methoden
Einführung und Live-Demonstration, praktische Übungen mit Beispieldatensätzen (z.B. Studierendenzahlen, Ausleihstatistiken), moderierter Austausch zu realen Anwendungsszenarien Hinweise