Wie bildgenerierende KI die universitäre Lehre bereichern kann 

In diesem Beitrag möchte ich Ihnen zeigen, wie KI-Bildgeneratoren in der universitären Lehre eingesetzt werden können, um visuelle Elemente für Lernmaterialien zu erstellen. Hierbei beschreibe ich, in welchem Rahmen ich den KI-Bildgenerator Midjourney eingesetzt habe, welche Herausforderungen damit verbunden waren und welche Tipps ich für einen erfolgreichen Einsatz habe.

Bei der Vermittlung von Wissen spielen visuelle Elemente eine entscheidende Rolle. Sie helfen dabei, Lernmaterialien anschaulicher zu gestalten, komplexe Inhalte zu veranschaulichen, Lernprozesse zu unterstützen und die Aufmerksamkeit der Studierenden zu gewinnen. Allerdings verfügt nicht jede Hochschule oder dozierende Person über die notwendigen Ressourcen oder Fähigkeiten, um ästhetische visuelle Inhalte zu erstellen. An dieser Stelle können generative KI-Bildgeneratoren unterstützend eingesetzt werden. KI-Bildgeneratoren, wie Midjourney, Dall-E, und Leonardo AI, erzeugen auf der Grundlage der eigenen Texteingaben Bilder, Logos oder andere Visualisierungen. 

Anschauliche Lernmaterialien mit begrenzten Ressourcen 

Im Rahmen des SKILL-Projekts erhielten wir die Möglichkeit, unsere Lernmaterialien für die Einführung in quantitative Forschungsdesigns und Datenanalyse zu überarbeiten und auf ein Flipped-Classroom Konzept anzupassen. Vor diesem Hintergrund entstand die Idee, ein Online-Lehrbuch zu erstellen, welches den Studierenden das Wissen in Form von Texten, Erklärvideos sowie Beispielen möglichst anschaulich vermittelt. Dabei sollte das Lehrbuch visuell ansprechend sein, um Studierende zu motivieren, sich mit dem eher sperrigen Lernstoff auseinanderzusetzen. 

Bei der Umsetzung dieses Ziels stand ich vor ein paar Herausforderungen:

  • Keine eigenen Design-Ressourcen: Für die Erstellung von professionellen Visualisierungen und Illustrationen erfordert nicht nur Zeit, sondern auch spezifisches Know-how, welches ich nicht besitze. 
  • Einheitliches Design: Das Online-Lehrbuch sollte einen möglichst konsistenten Stil aufweisen.
  • Schnell und effizient: Die verfügbare Arbeitszeit war überschaubar, und die Mittel für die Beauftragung professioneller Illustrationen waren nicht vorhanden.

Genau hier bot sich die Möglichkeit, Midjourney einzusetzen, um mit Hilfe von KI Bilder innerhalb von Sekunden zu generieren. Allerdings sollten hierbei einige Punkte beachtet werden.

Warum Midjourney?

Zum Zeitpunkt des Projekts waren die meisten KI-Bildgeneratoren relativ neu auf dem Markt und standen teilweise noch am Anfang. Die Wahl fiel auf Midjourney, da die Software zum damaligen Zeitpunkt der eindeutige technologische Vorreiter war und die besten Ergebnisse bei gleichzeitig einfacher Bedienung und Zugänglichkeit bot.

Grundsätzlich würde ich empfehlen, die Wahl des KI-Bildgenerators von folgenden Überlegungen abhängig zu machen:

  • Einfache Bedienung: Ich würde je nach eigenen Fähigkeiten auf die Zugänglichkeit und die Art und Weise der Bedienung der Software achten.
  • Preis-Leistungs-Verhältnis: Es lohnt sich, einen prüfenden Blick auf die Kosten und Abo-Modelle der verschiedenen Anbieter zu werfen.  
  • Große Community: Eine aktive Community rund um den KI-Bildgenerator bietet Inspiration und Unterstützung. Hier finden sich unzählige Beispiele und Anleitungen, die den Einstieg erleichtern.
  • Transparenz: Grundsätzlich würde ich bei KI-Modellen für die Nutzung von Open-Source Modellen plädieren . Falls dies aus Gründen der Bedienbarkeit oder Qualitätsansprüchen nicht möglich ist, lohnt sich ein prüfender Blick auf die Transparenzmaßnahmen des Anbieters.

Das ist eine relativ ausufernde Diskussion. Im Endeffekt erhofft man sich von Open Source eine stärkere Unabhängigkeit, Zugänglichkeit und Kontrolle über den Code der Modelle.

Wie bin ich vorgegangen?

Midjourney ist ein hilfreiches Tool, welches aber bei Weitem nicht alle Schritte der Illustration von Lernmaterialien automatisch vornimmt. Ähnlich wie andere generative KI-Modelle arbeitet Midjourney besonders gut, wenn Sie in der Lage sind, eine präzise Beschreibung des gewünschten Bildes als Prompt formulieren zu können. Entsprechend wichtig ist es, sich vor der eigentlichen Generierung der Visualisierungen ein paar Gedanken über das Designkonzept zu machen. 

In meinem Fall habe ich mit der Sichtung bereits existierender Online-Lernmaterialien begonnen. Parallel dazu fand im Projektteam ein offener Austausch über die Zielgruppe sowie Assoziationen mit dem Lehrstoff des Online-Lehrbuchs statt. Das Resultat dieses ersten offenen Brainstormings stellt eine Handvoll mittels Midjourney generierter Beispielbilder dar.

Anhand dieser ersten Entwürfe haben wir im Projektteam ein Designkonzept für das Lehrbuch entwickelt, indem wir Elemente, Farben und Motive ausgewählt haben und diese in eine Prompt-Vorlage einfließen ließen . Die Erstellung dieser Vorlage ist das Ergebnis eines iterativen Prozesses gewesen, welcher Rücksprachen im Team, Inspiration in der Midjourney-Community sowie Ausprobieren umfasst. Die Midjourney-Community wird über die Kommunikationssoftware Discord betreut und verfügt nicht nur über Hilfestellungen, Community-Challenges, Diskussionen und Promptvorschläge sondern auch Updates durch die Entwickler*innen (Einladungslink zur Discord-Community). 

Ich möchte an dieser Stelle den Tipp geben, ausreichend Zeit sowohl in die Entwicklung einer Idee für das Design als auch in eine gute Formulierung des Vorlagen-Prompts zu investieren, da die Qualität der generierten Bilder stark von der Formulierung der Prompts abhängt und dafür zunächst eine Vorstellung darüber entwickelt werden muss was eigentlich das Ergebnis sein soll .

Als allgemeineren Tipp für das Prompting kann ich empfehlen, möglichst präzise das gewünschte Ergebnis zu beschreiben. Hierbei lohnt es sich gezielt Stile, Farben und Details zu nennen und mit den weiteren Parametern von Midjourney, welche unter anderem das Bildformat einstellen, zu arbeiten.

Einfaches Beispiel für ein Prompt

a comic cat asking "any further questions?", bright colors, wideformat, 
--ar 16:9

[Nennung des Stils | das Objekt | Text | gewünschte Farben | Format | Seitenverhältnis]

Das Bild zeigt eine Illustration einer Katze im Stil eines Comics mit einer Sprechblase, welche die Frage "any fur ther questions?" enthält. Die Katze hat rote und weiße Farben und steht vor einem dynamischen Hintergrund mit weißen, schwarzen und roten Strichen.
a comic cat asking "any further questions?", bright colors, wideformat, 
--ar 16:9

Aufbau des Prompts: Nennung des Stils, das Objekt, Text, gewünschte Farben, Format, Seitenverhältnis

Das Bild zeigt eine Illustration einer Katze im Stil eines Comics mit einer Sprechblase, welche die Frage "any fur ther questions?" enthält. Die Katze hat rote und weiße Farben und steht vor einem dynamischen Hintergrund mit weißen, schwarzen und roten Strichen.
a comic cat asking "any further questions?", 
bright colors, wideformat, --ar 16:9
[Nennung des Stils | das Objekt | Text |
gewünschte Farben | Format | Seitenverhältnis]
Das Bild zeigt eine Illustration einer Katze im Stil eines Comics mit einer Sprechblase, welche die Frage "any fur ther questions?" enthält. Die Katze hat rote und weiße Farben und steht vor einem dynamischen Hintergrund mit weißen, schwarzen und roten Strichen.

Hinzu kommt, dass sich das Weiterarbeiten an den ersten generierten Entwürfen lohnt, indem Midjourney gewünschte Veränderungen an dem ersten Entwurf mitgeteilt werden. Auf diese Art und Weise kann sich schrittweise an das gewünschte Endresultat angenähert werden.

Innerhalb dieses Annäherungsprozesses an das gewünschte Bild, würde ich dringend empfehlen, auf mögliche sogenannte Biases als auch Fehler in der visuellen Darstellung zu achten. Midjourney weist, ebenso wie andere generative KI-Werkzeuge, mehrere sogenannter Biases auf, welche im Endeffekt die Reflektion von gesellschaftlichen Missständen, wie unter anderem Sexismus, Rassismus, Ableismus, in den generierten Bildern darstellen. Die meisten Plattformen versuchen zwar mehr oder weniger erfolgreich diesen unerwünschten Darstellungen entgegenzuwirken, trotzdem halte ich es für unbedingt notwendig, einen eigenen kritischen und prüfenden Blick auf die selbst generierten Inhalte zu werfen. 

Beispielsweise habe ich häufiger festgestellt, dass Midjourney eine Tendenz aufweist bei Eingaben, wie „Eine Person arbeitet an einer wissenschaftlichen Studie“, eher männliche, europäisch aussehende Personen zu generieren. Vor dem Hintergrund, dass wir uns als Projektteam einig waren, dass unser Online-Lehrbuch auch die Diversität unserer Studierenden abbilden soll, war an dieser Stelle das gezielte Eingreifen und umformulieren des Prompts notwendig, um das gewünschte Ergebnis zu erhalten. 

Ein weiteres Problem bei der Generierung von Bildern mit Midjourney stellt die Fehlerhaftigkeit mancher Bilder dar. Beispielsweise hatte die Midjourney-Version, welche ich zur Illustration des Online-Lehrbuchs verwendet habe, Probleme bei der korrekten Darstellung von Händen. Dadurch sind immer wieder teilweise lustige oder sehr skurrile Bilder entstanden, die ich entsprechend anpassen oder aussortieren musste. Meines Wissens nach wurde diese Fehlerquelle mittlerweile in neueren Versionen behoben, allerdings muss bei generativen Inhalten immer von einer gewissen Fehleranfälligkeit ausgegangen werden.

Grundsätzlich ist es wichtig bei der Generierung von Bildern die Community-Guidelines im Hinterkopf zu behalten, welche sich etwas verkürzt folgendermaßen zusammenfassen lassen:

  1. Sei freundlich und respektvoll.
  2. Erstelle keine schockierenden oder pornografischen Inhalte.
  3. Reflektiere die Art und Weise, wie generierte Bilder geteilt oder veröffentlicht werden.
  4. Anwendungen von Drittanbietern sowie Automatisierung sind nicht erlaubt.

Des Weiteren stellt Midjourney in den Terms of Service klar, dass die nutzende Person Eigentümer aller generierten Inhalte ist und für jegliche hochgeladenen Inhalte selbst verantwortlich ist. Darüber hinaus ist zu beachten, dass durch das Hochladen von Inhalten diese allen Nutzenden von Midjourney zur Verfügung gestellt werden.

Fazit und Empfehlungen

Midjourney hat sich in unserem Projekt als ein wertvolles Werkzeug erwiesen, das es ermöglicht, in relativ kurzer Zeit und mit vertretbarem Aufwand visuelle Inhalte zu erstellen. Allerdings benötigt Midjourney, ebenso wie fast jedes digitale Werkzeug, eine gewisse Einarbeitungszeit. Ebenfalls ist auch bei KI-generierten Bildern ein kritischer und prüfender Blick notwendig. Nichtsdestotrotz kann ich für alle, die in der universitären Lehre tätig sind und auf der Suche nach einer effizienten Lösung für die Erstellung von Visualisierungen für Lernmaterialien eine Empfehlung aussprechen.

Weiterführende Links und Quellen

Nature-Artikel von Anaya

 über Biases in AI-Bildgeneratoren

Midjourney-Dokumentation

 mit Guides sowie Tipps und Tricks

Nach oben scrollen