Künstliche Intelligenz scheint eine Vielzahl in Berufen obsolet zu machen. Gleichzeitig scheinen sich aber auch neue Berufsbilder herauszukristallisieren. Dazu gehört beispielsweise der Prompt Engineer. In den folgenden Zeilen wollen wir klären, was ein Prompt Engineer macht und warum er möglicherweise doch kein Beruf der, beziehungsweise mit Zukunft ist.
Es ist beeindrucken, wie natürlich wir uns mit ChatGPT in Textform unterhalten können. Mehr noch: es erschreckt uns, weil uns plötzlich bewusst wird, wie weit die Entwicklung einer universellen künstlichen Intelligenz bereits fortgeschritten ist. Denn diese greift immer konkreter spezifische Berufsbilder an. Die Entwicklung führt irgendwann unweigerlich zur Frage, welchen Sinn das menschliche Leben noch hat, wenn seine Leistungen in jeglicher Hinsicht von einer Maschine in den Schatten gestellt werden können. Eine erste Ahnung, Unsicherheit und ein unbehagliches Gefühl kommen in uns hoch, wenn uns klar wird, dass künstliche Intelligenz auch unser eigenes Leben spürbar beeinflussen wird. Und das schneller, als uns das jeder Science-Fiction-Film weiß machen wollte.
Hochdynamische Entwicklung
Die Entwicklung im Bereich der künstlichen Intelligenz ist hochdynamisch. Und auch die Auswirkungen, die sich daraus für unser Leben ergeben, müssen jedem Tag neu bewertet werden. Ein Blick auf die aktuelle Entwicklung und Nutzung von ChatGPT und der Bilder-generierenden KI Midjourney lässt jedoch erahnen, auf was sich der Mensch mittelfristig einstellen muss.
Der Prompt-Engineer
Auf dem Hintergrund dieser Entwicklungen scheint sich mit dem sogenannten Prompt Engineer ein neues Berufsfeld zu etablieren. Abgeleitet wird der Name von der Befehlszeile, im Fachjargon “Prompt” genannt, über die die KI Auträge entgegennehmen kann. Denn es scheint so, dass die Qualität der Ausgabe massiv von der Formulierung des Auftrages abhängt.
So reicht es beispielsweise nicht aus, wenn ich ChatGPT darum bitte, einen Text über die Zukunft des Prompt Engineers zu verfassen. Vielmehr ist eine sehr spezifische Beschreibung der Aufgaben erforderlich. Bei ChatGPT kann dies auch iterativ erfolgen. Kann also das Ergebnis im ersten Versuch nicht überzeugen, so kann ohne große Aufwände gezielt nachkorrigiert werden. Dies entspricht der menschlichen Herangehensweise bei solchen Aufgaben.
Midjourney: Prompt statt Pinsel
Aber nicht alle KI-System, die sich großer Beliebtheit erfreuen, lassen sich so natürlich bedienen. Möchte man beispielsweise über Midjourney spezifische Bilder generieren, so ist ein vorheriges Einarbeiten erforderlich. Wer das System bereits verwendet hat, der weiß, dass es nicht immer ganz einfach ist, eine konkrete Szenerie im gewünschten Stil berechnen zu lassen. Bislang spielen hier tatsächlich Erfahrungswerte eine wichtige Rolle. Bestimmte Befehle funktionieren in einigen Kontexten besser als andere. Die Veränderung eines einzelnen Wortes kann zu einem völlig anderen Ergebnis führen.
Das folgende Beispiel zeigt unterschiedliche Variationen des Bildes, welches wir für diesen Artikel erstellt haben. Dazu haben wir für Midjourney folgenden Auftrag formuliert:
employer attending her new job, overloaded, funny, evening
Mit dem beschriebenen Auftrag haben wir Midjourney mitgeteilt, was mir gerne sehen würden. Gleichzeitig lassen wir dem System in vielen Aspekten aber großen “kreativen” Freiraum. Wenn wir uns nun ein fotorealistisches Bild wünschen, so teilen wir Midjourney dies mit der Ergänzung von “hyper realistic” mit.
employer attending her new job, overloaded, funny, evening, hyper realistic
Wenn uns die Tonalität insgesamt zu depressiv anmutet, können wir mit “laughing” für etwas mehr positive Stimmung sorgen. Allerdings sorgt dieses eine Wort für ein gänzlich verändertes Setting. Sogar der Bildausschnitt wird von Midjourney nun anders gewählt.
employer attending her new job, laughing, overloaded, funny, evening, colorful, hyper realistic

Das Wissen über die Formulierungen im Prompt entscheiden darüber, wie schnell ein passenden, gewünschtes Bild generiert werden kann. Genau diese Fähigkeit, das Wissen und auch der Erfahrungsschatz soll Bestandteil des Jobprofils des Prompt Engineers sein.
ChatGPT als Prompt Engineer
Im direkten Vergleich stellen wir fest, dass ChatGPT deutlich besser darin ist, menschliche Sprache zu verstehen und korrekt zu interpretieren. Midjourney-Nutzer hingegen müssen sich auf das System syntaktisch einstellen und Zeit zum Experimentieren einplanen. Das brachte ein paar Anwender auf den Gedanken, die Prompt-Eingaben von ChatGPT formulieren zu lassen. Das System würde damit erstmals die Aufgaben eines Prompt Engineers übernehmen.
Die Informationen von ChatGPT reichen zurück bis in den September 2021. Es liegen damit keine Informationen zu aktuellen Entwicklungen von Midjourney vor. In einem gewissen Rahmen ist es jedoch möglich, ChatGPT mit der Bedienungsanleitung von Midjourney zu “primen”, also mit Informationen über die Eingabezeile auszustatten, mit denen es dann arbeiten kann.
Im Netz kursieren unterschiedliche Priming-Ansätze. Mit unterschiedlich guten Resultaten. Auch wenn die Vorgehensweise aktuell nicht immer praxistauglich erscheint, so wird aber klar, dass künftig auch der Job eines Prompt Engineers von einer KI übernommen werden kann. Im hier beschriebenen Fall wird das aber auch nur dann erforderlich sein, wenn Midjourney beim Verständnis menschlicher Sprache nicht weiter zulegt. Wenn alle Systeme iterativ über gewöhnliche menschliche Sprache bedient werden können, ja dann wird wohl auch keinen Prompt Engineer mehr benötigt werden – der als Schnittstelle zwischen Mensch und Maschine lediglich die Kommunikationsdefizite kompensiert.
Digitale Generalisten auf dem Vormarsch
Auch wenn der Künstler nicht mehr selbst den Pinsel schwingen muss, um ein Bild seiner Vorstellung zu kreieren, so ist er dennoch im Vorteil, wenn es um die Beschreibung konkreter Aufträge geht. Denn schließlich müssen die Ideen in beschreibende Sätze gebracht werden. Dazu gehören dann auch zu verwendende Techniken, Stile und Materialien. Ähnliches gilt für Fotografen. Haben diese ein konkretes Motiv vor dem inneren Auge, so können diese dann neben dem Motiv auch genau beschreiben, welche Belichtungszeit, welche Linse oder Filmmaterial genutzt werden sollen.
Damit treten theoretische Ansätze für die Planung in den Vordergrund. Die konkrete Durchführung, die praktische Erfahrung und das Handling spielen dann kaum noch eine Rolle. Es wird also immer unwichtiger, wie ich den Pinsel halte. Hauptsache ich weiß, wie das Endergebnis aussehen soll.
Was noch kommt: Audio und Video
Besonders deutlich wird diese Entwicklung, wenn wir uns die noch kommenden Möglichkeiten zur Erstellung von Audio- und Videomaterial betrachten. Mit ChatGPT könnten ganze Drehbücher inklusive Regieanweisungen erstellt werden. Auf deren Basis könnten dann ganze Filme samt Soundtrack generiert werden. Ein Regisseur oder Produzent müsste dann nur noch in der Lage sein zu formulieren, was er hören und sehen will. Terminologien und Fachbegriffe müssten sie beherrschen, die Umsetzung nicht.
Deutliche Dezentralisierung
Letztlich führt diese anzunehmende Entwicklung zu einer Liberalisierung des Marktes. Plötzlich ist es tatsächlich nur noch die Vorstellungskraft einer einzelnen Person, die darüber entscheidet, ob ein Film entsteht, der ein Millionenpublikum begeistern kann. Finanzielle und personelle Ressourcen spielen kaum noch eine Rolle. Der Wettbewerb steigt. Und das ist gut, denn mit ihm steigt auch die inhaltliche Qualität.
Ähnliche Entwicklungen haben wir zu den Anfangszeiten der Videoplattform Youtube gesehen. Plötzlich konnte jeder seinen eigenen “TV-Kanal” gründen und auf Sendung gehen. Das war die Geburtsstunde unzähliger Influenzer, aber auch künstlerischer Karrieren, die es ohne ein dezentralisiernedes Medium nie gegeben hätte.
Es liegt auf der Hand, dass der Ablösung existierender Marktstrukturen Arbeitsplätze zum Opfer fallen. Es werden aber definitiv viele neue entstehen. Besetzt von digitalen Generalisten mit einer konkreten Vision. Wenn es dann so weit ist, wird man sich nicht mehr daran erinnern, was ein Prompt Engineer gewesen sein soll.










