DALL-E 2 AI von OpenAI ist für einige Künstler eine schlechte Nachricht
DALL-E 2 von OpenAI war ein Schock für diejenigen, die dachten, dass künstliche Intelligenz niemals (oder zumindest nicht bald) anfangen würde, in den Bereich der Kreativität vorzudringen. Aber DALL-E 2 ist hier, um die Künstler zu beschäftigen?
Wie funktioniert DALL-E 2?
Der DALL-E 2 ist so beeindruckend, dass er sich fast wie Magie anfühlt, aber die allgemeinen Details, wie er solch atemberaubende, lebensechte Bilder erzeugt, sind nicht allzu schwer zu verstehen.
DALL-E 2 besteht aus zwei Hauptkomponenten. Der erste ist GPT-3 , der wohl bisher fortschrittlichste maschinelle Lernalgorithmus für natürliche Sprache. DALL-E 2 verwendet auch ein anderes OpenAI-Modell namens CLIP (Contrastive Language-Image Pre-training).
GPT-3 und CLIP ermöglichen es einem Computer, komplexe natürliche Sprache zu verstehen und zu erzeugen. Durch das Trainieren eines neuronalen DALL-E-Netzwerks mit Milliarden von Bildern und ihren Beschreibungen in natürlicher Sprache aus dem (größtenteils) Internet lernt es Beziehungen zwischen Konzepten.
In gewisser Weise ist DALL-E das Gegenteil der gängigen Praxis des maschinellen Lernens, bei der Sie ein Bild bereitstellen und die KI versucht zu beschreiben, was sie sieht.
Denken Sie an die berüchtigte „ Not a Hot Dog “-App aus der Silicon Valley TV-Show . Der Unterschied besteht hier darin, dass Sie, anstatt die KI zu fragen, ob das Bild ein Hot Dog ist oder nicht, einen Hot Dog beschreiben und sie ein völlig originelles Hot Dog-Bild erstellt, basierend auf allem, was sie über sie gelernt hat.
Der zweite wichtige Teil von DALL-E ist, wie es Bilder erzeugt. Es verwendet eine Technik, die als „Diffusion“ bekannt ist. Insbesondere das Verständnis der menschlichen Sprachbeschreibung eines erstellten Bildes wird mithilfe eines OpenAI-Modells namens GLIDE in ein Bild umgewandelt . GLIDE nimmt ein Bild auf, das aus zufällig erzeugtem Rauschen besteht, und entfernt dieses Rauschen dann schrittweise, bis es mit dem Bild übereinstimmt, wie es in natürlicher Sprache beschrieben wird. Es ist ein bisschen wie ein Bildhauer, der mit einem Stück Marmor beginnt und es wegschlägt, bis nur noch die Statue übrig bleibt.
Für eine viel technischere und detailliertere Beschreibung von DALL-E 2 unter der Haube empfehlen wir von ganzem Herzen die DALL-E 2-Erklärung im AssemblyAI-Deep-Learning-Blog.
Warum DALL-E 2 so revolutionär ist
DALL-E 2 ist bei weitem nicht die erste Software für maschinelles Lernen, die Bilder erzeugen kann. Es gab viele frühere Systeme, und DALL-E 2 baut auf den Erfahrungen aus diesen anderen Projekten auf. Warum fühlt sich diese Zeit also wie ein Wendepunkt an?
Ein wichtiger Grund ist, dass die Bilder, die DALL-E und DALL-E 2 machen, ästhetisch ansprechend sind. Andere KI-Bildgebungssysteme produzieren oft Bilder, die Menschen als verstörend oder wie etwas aus einem Traum beschreiben. Es ist ein bisschen wie das Uncanny Valley, aber für schöne Künste. Der DALL-E 2 erzeugt Bilder, die eindeutig ein künstlerisches Auge oder einen Sinn für Ästhetik hinter sich haben.
Daher sind die Bilder, die der DALL-E 2 erstellt, mit Bildern vergleichbar, die von talentierten Künstlern oder Fotografen gemacht wurden, die ihr ganzes Leben lang ihren ästhetischen Sinn entwickelt haben. Es ist nicht schwer vorstellbar, dass jemand wie er die Bilder betrachtet, die der DALL-E 2 in Sekundenschnelle produzieren kann, und das Gefühl hat, dass sie gleich irrelevant werden.
Das System kann nicht nur schöne, hochauflösende Bilder in Sekundenschnelle aus Hinweisen in natürlicher Sprache erstellen, sondern diese Bilder auch anpassen und bearbeiten oder mehrere Variationen eines vorhandenen Bildes bereitstellen – sogar eines vom Benutzer bereitgestellten. Bedeutet dies, dass Künstler ihre Staffeleien und Zeichentafeln einpacken und stattdessen „ codieren lernen “ sollten?
DALL-E 2 bedeutet, dass Künstler sich ändern und nicht verschwinden werden
OpenAI war sehr darauf bedacht, seine Technologie einfach der Welt zu präsentieren. Dies ist vernünftig, da es eindeutig viel Raum für Missbrauch gibt. Nachdem sie jedoch gezeigt haben, dass dies möglich ist, wird es keine Zeit mehr geben, bis kommerzielle oder unabhängige KI-Forscher das, was DALL-E tut, replizieren und es für alle verfügbar machen. Auch die Big Player des maschinellen Lernens warten mit ihren leistungsstarken KI-Künstlern wie Google Imagen auf ihre Zeit .
Da die Büchse der Pandora nicht geschlossen werden kann, müssen wir akzeptieren, dass sich die Welt der bildenden Kunst unwiderruflich verändern wird, aber das bedeutet nicht, dass die Künstler verschwunden sind.
Man kann es so betrachten, dass diese Art von Technologie es ermöglicht, Kunst in den Händen von jedermann zu erschaffen. Der Schwerpunkt verlagert sich jetzt von der technischen Fähigkeit, Bilder zu erstellen, hin zur Fähigkeit, Ihre Vision genau zu beschreiben und zu wiederholen, bis das, was Sie auf dem Bildschirm sehen, mit dem übereinstimmt, was Sie sich vorgestellt haben. Mit anderen Worten, mehr Menschen werden sich jetzt visuell ausdrücken können, ebenso wie mehr Menschen dank der Existenz von Taschenrechnern jetzt genaue Berechnungen durchführen können.
Bestimmte Arten von Künstlern haben möglicherweise keine tragfähigen Geschäftsmodelle mehr. Wenn Sie Provisionen gegen eine Gebühr verdienen , werden Sie es schwer haben, mit einem Programm zu konkurrieren, das Hunderte von Bildern pro Stunde basierend auf der Beschreibung eines Kunden erstellen und fast sofort Änderungen an diesen Bildern vornehmen kann. Stattdessen können Sie diese Tools verwenden, um Ihre eigene Vision zu verwirklichen und diese einzigartigen Bilder dann basierend auf Ihren Gefühlen zu verkaufen.
Der Kunde hat immer recht
Es ist auch wichtig, sich daran zu erinnern, dass diese Bilder letztendlich für den menschlichen Konsum erstellt werden. Wir Menschen haben unsere eigenen Werte, die über Bequemlichkeit und technische Exzellenz hinausgehen. In einer Welt, in der erzeugte Kunst reichlich vorhanden und daher relativ billig und verfügbar ist, wird es immer ein Publikum geben, das bereit ist, von Menschen geschaffene Kunst zu schätzen (und zu kaufen), einfach weil sie relativ selten sein kann.
Mit anderen Worten, Software wie DALL-E 2 könnte das Ende für Künstler bedeuten, die ihren Lebensunterhalt mit Kunst am Fließband verdienen, aber es ist unwahrscheinlich, dass sie die Aussichten für Künstler dämpft, die etwas zu sagen haben und eine einzigartige visuelle Identität haben durch die man sprechen kann.
Schreibe einen Kommentar