Computational Thinking und Vibecoding: Ein Zeitrafferprojekt aus 59.000 Bildern

13. Mai 2026: „Erstelle mir ein Skript, das…“ – Mit generativer KI rückt die Entwicklung komplexer Softwarelösungen auch für Menschen ohne tiefgreifende Programmierkenntnisse in greifbare Nähe. Doch wie sieht das in der Praxis aus, wenn es nicht nur um eine kleine Übungsaufgabe, sondern um ein reales Projekt mit echten Daten geht?

Am Kreismedienzentrum Esslingen (KMZ) haben wir genau das an einem konkreten Praxisbeispiel erprobt: Für das Kompostwerk Kirchheim u.T. sollte aus tausenden Baustellenfotos ein flüssiges Zeitraffervideo entstehen. Die Lösung lieferte eine KI-gestützte Python-Pipeline, also ein in Python programmierter, automatisierter Ablauf mehrerer Verarbeitungsschritte, bei dem Daten nacheinander verarbeitet und dabei an mindestens einer Stelle von einer KI analysiert oder verändert werden. Dieses Projekt zeigt eindrücklich, warum Computational Thinking und präzises Prompting wichtige Schlüsselkompetenzen der Zukunft sind.

Die Herausforderung: Ein Zeitraffervideo aus Aufnahmen einer Baustellenkamera

Fernüberwachungskameras, in unserem Fall eine Baustellenkamera (wie die hier verwendete Reolink 4K), produzieren Unmengen an Daten. Doch für einen ästhetischen Zeitraffer sind viele Bilder unbrauchbar: Nachtaufnahmen mit Infrarot-Rauschen, die blaue Stunde oder Bilder, auf denen die Kamera noch nicht scharf gestellt hat. Manuell aus hunderten Ordnern die „guten“ Bilder herauszusuchen, würde Tage dauern. Es brauchte eine automatische Lösung: ein Programm in der Programmiersprache Python, das alle Ordner durchsucht, passende Bilder auswählt, ungeeignete aussortiert und daraus am Ende ein sparsames Video erstellt. Statt den Code Zeile für Zeile selbst zu schreiben, übernahm die Bezahlversion eines Large Language Models (LLM) die Programmierung.

Ein eher vager Start-Prompt

< „Im /data Verzeichnis sind Bilder von einer Zeitrafferaufnahme. Erstelle ein Script, das die Ordner durchsucht, die Bilder analysiert und von jedem Tag die unscharfen Bilder bevor es hell wird aussortiert… installiere alle notwendigen Programme die für das Verarbeiten gebraucht werden, verwende die GPU anstatt der CPU, in dem PC ist eine RTX 4090 [*Statt den Hauptprozessor (CPU) soll die Grafikkarte (GPU) für die Berechnungen genutzt werden – konkret eine NVIDIA GeForce RTX 4090.]

Ein solcher Prompt funktioniert als grober Startschuss, führt aber in der Praxis schnell zu Fehlern und Rückfragen. Was genau bedeutet „bevor es hell wird“? Welche Auflösung wird gewünscht? Ein LLM ist nur so gut wie die Anweisung, die es erhält. Anstatt sich auf Syntax zu konzentrieren, braucht es die Fähigkeit, logisch und systematisierend zu denken.

Der optimierte „Profi-Prompt“ (für Nachahmer)

Um zu einem verlässlichen, regelbasierten System zu kommen, muss man denken wie eine Programmiererin – nur eben in menschlicher Sprache. Ein deutlich effektiverer Prompt zerlegt das Problem in logische Teilschritte:

> „Erstelle ein Python-Skript zur automatisierten Zeitraffer-Erstellung aus Bildordnern in `/data`.

> 1. Analysiere den Übergang von Nacht (Infrarot) zu Tag automatisch (über die Farbsättigung) und filtere Nachtaufnahmen sowie unscharfe Frames aus.

> 2. Generiere vier MP4-Dateien: 4K Full Length, 4K 3-Minuten, 1080p Full, 1080p 3-Minuten [Verschiedene Dauer- und Qualitätsangaben].

> 3. Nutze zwingend FFmpeg [Programm zur Videoverarbeitung, z. B. zum Umwandeln und Erstellen von Videos] mit dem Hardware-Encoder hevc_nvenc [Hardware-basierter Videokompressor für das H.265/HEVC-Format auf NVIDIA-Grafikkarten], um die verbaute NVIDIA GeForce RTX 4090 [sehr leistungsstarke Grafikkarte zur schnellen parallelen Datenverarbeitung] zu verwenden.

> 4. Platziere das bereitgestellte Logo oben links über dem bestehenden Kamera-Wasserzeichen (100% Deckkraft, weißer Hintergrund).

> 5. Caching: Speichere die Analyse-Ergebnisse in einer JSON-Datei, um Neustarts zu beschleunigen [Dies sorgt dafür, dass die zeitaufwendige Bildanalyse nicht jedes Mal neu gemacht werden muss, sondern wiederverwendet wird, um den Prozess deutlich zu beschleunigen.].“

Das Ergebnis: KI-Logik in Zahlen

Mit klar definierten Metriken (wie der Sättigungs-Standardabweichung zur Tag/Nacht-Erkennung) und einem effizienten Binary-Search-Algorithmus (schneller Suchalgorithmus) erledigt das Skript nun in wenigen Minuten, wofür ein Mensch Tage bräuchte.

Das Projekt in Zahlen:

  • Verarbeitete Tage: 77
  • Gesamtanzahl Einzelbilder: 59.269
  • Aussortiert (Nacht/Unscharf): 17.276
  • Verwendet für das finale Video: 41.993

Zusätzlich sorgt die präzise Hardware-Anweisung im Prompt dafür, dass das Berechnen der 4K-Videos dank der Grafikkarte NVIDIA RTX 4090 mit über 70 Bildern pro Sekunde extrem schnell abläuft.

Fazit

Das Projekt „Kompostkamera“ zeigt anschaulich, was moderne Medienpädagogik vermitteln muss: Nicht jeder muss Python-Syntax auswendig lernen. Aber Schülerinnen und Schüler müssen befähigt werden, Probleme so zu strukturieren, dass Computer sie lösen können. Wer lernt, komplexe Aufgaben in Teilprobleme zu zerlegen und klare, logische Anweisungen zu formulieren, wechselt von der Rolle des reinen Konsumenten zum aktiven Gestalter digitaler Werkzeuge.