Dies ist eine alte Version des Dokuments!


LU10a: Aggregatfunktionen Einführung

Datensätze:

  • Einbrüche (Kanton Zürich) – Schema: zh_einbrueche, Tabelle: einbrueche
  • Space Missions – Schema: spacemission, Tabelle: missions
  • YouTube Top 100 (2025) – Schema: youtube_top_100_songs_2025, Tabelle: youtube_top_100_songs_2025

Setup (Download & Import) Laden Sie die vorbereiteten Datensätze herunter und importieren Sie sie: • ZIP mit allen drei SQL-Dumps Schemas im Editor sichtbar machen: spacemission, zh_einbrueche, youtube_top_100_songs_2025.

Screencast, der zeigt wie die SQL-Files in Webstorm ausgeführt werden. Drei Datenbanken mit Tabellen und Datensätzen werden in MySQL erstellt.

Schema wählen (wichtig): Entweder im Editor-Dropdown das Schema wählen oder mit USE explizit setzen:

-- Beispiele:
USE spacemission;
-- USE zh_einbrueche;
-- USE youtube_top_100_songs_2025;

Aggregatfunktionen fassen viele Zeilen zu Kennzahlen zusammen (z. B. Anzahl, Summe, Durchschnitt, Minimum/Maximum). Sie sind die Grundlage für Berichte, Dashboards, BI-Auswertungen1) und Web-Backends2).

Funktion Zweck NULL-Verhalten
COUNT(*) Anzahl Zeilen zählt alle Zeilen
COUNT(spalte) Anzahl nicht NULL ignoriert NULL
SUM(spalte) Summe ignoriert NULL
AVG(spalte) Durchschnitt ignoriert NULL
MIN(spalte) Kleinster Wert ignoriert NULL
MAX(spalte) Grösster Wert ignoriert NULL

Syntax (allgemein)

SELECT AGGREGATFUNKTION(ausdruck) AS alias FROM schema.tabelle;

2.1 COUNT – Wie viele Datensätze sind es?

Frage: Wie viele Missionen befinden sich im Datensatz?

SELECT COUNT(*) AS anzahl_missionen
FROM missions;

Was passiert? COUNT(*) zählt alle Zeilen.

2.2 SUM – Summe bilden

Frage: Wie viele Views haben alle 100 YouTube-Songs zusammen?

SELECT SUM(view_count) AS views_total
FROM youtube_top_100_songs_2025;

Was passiert? SUM(view_count) addiert alle Views über die Tabelle. Ergebnis: 2025 haben die 100 meistgeklickten YouTube-Songs insgesamt über 10 Milliarden Views erzielt.

2.3 AVG – Durchschnitt berechnen

Frage: Wie lang ist ein Song im Durchschnitt?

SELECT AVG(duration) AS avg_duration
FROM youtube_top_100_songs_2025;

Was passiert? AVG(duration) berechnet den Mittelwert; NULLs werden ignoriert. Ergebnis: 2025 haben die 100 meistgeklickten YouTube-Songs eine durchschnittliche Song-Dauer von 3 min 24s.

2.4 MIN / MAX – Kleinster / Grösster Wert

Fragen: Längster Song? Kürzester Song?

-- Längster Song
SELECT MAX(duration) AS max_duration
FROM youtube_top_100_songs_2025;
 
-- Kürzester Song
SELECT MIN(duration) AS min_duration
FROM youtube_top_100_songs_2025;

Was passiert? MAX(…) gibt den grössten, MIN(…) den kleinsten Wert zurück.

Ergebnis: Der längste Song in der Tabelle ist „Kendrick Lamar - Not Like Us“ mit einer Dauer von 5 min 54s und der kürzeste Song „Claudia Valentina - Candy (Official Video)“ mit 2 Minuten. </WRAP>


1)
Business Intelligence: systematische, kennzahlenbasierte Datenanalyse zur Entscheidungsunterstützung; typische Artefakte sind Reports, Dashboards, Zeitreihen und Rankings.
2)
Serverseitige Logik/Services einer Web-App; liest Datenquellen, validiert, rechnet und stellt Ergebnisse über APIs (Schnittstellen) bereit.
  • modul/m290_guko/learningunits/lu10/theorie/a_einfuehrung.1762704571.txt.gz
  • Zuletzt geändert: 2025/11/09 17:09
  • von gkoch