Kennen Sie schon DALL·E?

 
Montag, 01.02.2021

Alle Jahre wieder werfen wir zu Beginn des Jahres einen Blick auf neue Techniken in der Bilderwelt, auf Deep Learning und Künstliche Intelligenz in unserer Branche. Vor zwei Jahren etwa berichteten wir über den „Hyperrealistic Face Generator“, der nach Vorlage von ein paar hundert Porträts künstliche Menschen „fotografieren“ kann. Und erinnern Sie sich noch an thispersondoesnotexist oder auch an die von einem Künstlerkollektiv erschaffenen Fake Faces – Stockfotos von Gesichtern, die allesamt künstlich generiert worden sind?

Künstliche Intelligenz (KI) kreiert mittlerweile schon neue Biersorten oder schafft Kunstwerke, die beim Auktionshaus Christie’s versteigert werden. Oder nehmen wir Hyper Bowl, das Studio aus München mit revolutionärer Technik made in Hollywood: Unter dem Motto „The way we killed the green screen“ wird der traditionelle Hintergrund durch eine gigantische LED ersetzt, die virtuelle Welten zeigt und das Set beleuchtet. Und auf universitärer Ebene wird weiterhin fleißig daran geforscht, Bilder aus längeren Texten zu generieren – zum Beispiel Rezepte.

Apropos Bilder aus Texten generieren – auch DALL·E wurde für diesen Zweck erschaffen. DALL·E? Klingt in seiner Schreibweise verdächtig nach WALL·E, dem kleinen Pixar-Disney-Roboter. Und tatsächlich: DALL·E = WALL·E + Dalí, Meister des Surrealismus. Ganz so surreal mutet die Neuerung in unserer digitalisierten Welt nicht mehr an: ein neuronales Netzwerk, das aus Textbausteinen Bilder generiert. Spannend an dem sogenannten Transformer Language Model ist, dass es sowohl mit Bildern als auch mit Text trainiert wird.

Entsprungen ist das GPT-3-basierte neuronale Netzwerk aus der KI-Schmiede OpenAI. Tiefer gehende Details über die Funktionsweise wurden noch nicht veröffentlicht, aber dieser Blogeintrag veranschaulicht in einer knappen halben Stunde Lesezeit, wie das Netzwerk auf Hunderte von Beispielabfragen reagiert hat. Besonders hervorzuheben ist, dass DALL·E dabei auch mit anthropomorphisierten Gegenständen, Tieren oder Nahrung in ungewöhnlichen Situationen zurechtkommt. Eine illustrierte Karotte im pinken Tutu, die mit einem Hund Gassi geht? Here we go:

Exkremente, Tutu und Hundeleine sitzen an der richtigen Stelle, auch die Karotte ist klar erkennbar.
Exkremente, Tutu und Hundeleine sitzen an der richtigen Stelle, auch die Karotte ist klar erkennbar.

Nicht nur zur Bilderstellung kann DALL·E eingesetzt werden, sondern auch zur Veränderung von vorhandenem Bildmaterial, zum Rendern von Text oder zur Transformation einer Fotografie in eine Zeichnung.

DALL·E ist auch in der Lage, Illustrationen in verschiedenen Stilrichtungen aus Fotos zu erstellen.
DALL·E ist auch in der Lage, Illustrationen in verschiedenen Stilrichtungen aus Fotos zu erstellen. Die Qualität lässt dabei bisher noch viele Wünsche offen.

OpenAI gibt zu, dass der Grad an Zuverlässigkeit noch starken Schwankungen unterliegt. Einfache Wünsche wie „Foto blau eingefärbt“ oder „Foto gespiegelt“ sind in der Regel zuverlässiger als komplizierte Aufgabenstellungen. Da können dann schon mal lustige Verwechslungen zustande kommen, wenn DALL·E das Wort „kaputt“ mit „verflucht“ übersetzt und die kaputte Teekanne dann entsprechend dargestellt wird …

Dafür kann DALL·E beispielsweise verschiedene Telefonarten generieren, die zum gewünschten Jahrzehnt passen. Der Grund: Das Netzwerk wurde auch mit historischem Wissen gefüttert.

Historisch passend, wenngleich nicht immer perfekt: DALL·E wurde mit Design-Wissen aus verschiedenen Jahrhunderten und Jahrzehnten gefüttert.
Historisch passend, wenngleich nicht immer perfekt: DALL·E wurde mit Design-Wissen aus verschiedenen Jahrhunderten und Jahrzehnten gefüttert.

Mit den ethischen Fragen zum künstlich intelligenten Netzwerk will sich OpenAI eigenen Angaben zufolge noch beschäftigen. Wir halten die Augen auf. Und wenn auch Sie spannende Technologien finden, die den Bildermarkt der Zukunft revolutionieren könnten: Immer her damit! Ansonsten gilt wie gehabt: Wir bleiben am Ball und halten Sie auf dem Laufenden.


Veröffentlicht am Montag, 01.02.2021 08:02
Kategorien: Agentur des Monats Künstliche Intellienz Computer generated images

Wenn Sie möchten, einmal pro Monat als Magazin per Email.


Weitere News:

  • Das Kreuz mit den Total Buy-Outs

    Montag, 01.02.2021 | Thema des Monats

    Viel wurde in den vergangenen Jahren über das neue Urheberrecht diskutiert. Ein Paragraf kam in den Diskussionen dabei bisher zu kurz: der § 40a. Wir sprachen mit BFF-Justiziarin Dorothe Lanc über die Gesetzesnovelle, exklusive Nutzungsrechte und eine gute Vorsorge für das Jahr 2027.

    Weiterlesen...

  • Neues Jahr - Neue Adresse

    Mittwoch, 06.01.2021 |

    Vorwerkstraße 4: Die Bildbeschaffer GmbH firmiert seit dem 01.01.2021 mit neuer Adresse. Warum wir aber nicht umziehen mussten, lesen Sie hier.

    Weiterlesen...

  • Planen Sie mit uns!

    Mittwoch, 06.01.2021 |

    Das Jahr 2021 wird spannend. Einiges ändert sich. Planen Sie mit uns! Wo wir Sie gern unterstützen möchten, lesen Sie hier.

    Weiterlesen...