Invoke Archetypes

aiart
The geometric illuminati, the father of power, tarot black and gold, black paper, fine point ink, stipple shading, volumetric lighting, glitchcore:: infrared black and white photography :: ominous seraphim-like angel, glowing gold void eyes, creation runes, illustrated by Kentaro Miura, monochromatic manga cover, symmetrical, bold black and white geometric details :: spacecore fantasypunk synthwave, symmetrical red crimson and black ink, full art geometric skeletal goddess of Death :: The geometric lich queen unreal engine, gauche monochromatic illustration by Kentaro Miura and Alphonse Mucha and Jungi Ito and Chris Foss :: 8k, unreal engine epic, ocult character symbolism — ar 9:21 — chaos 20 — stylize 3000 — q 2 — no long neck, two face, extra face –s 750

Ich habe mir ein extrem schwieriges fucking manual für Midjourney/Discord angetan und versucht, das ins Deutsche zu übersetzen. Schwierig deshalb, weil man nicht automatisch den Sinn versteht, selbst wenn man das Wort kennt. Ich spreche fließend Englisch, aber ich weiß zum Beispiel immer noch nicht, welches deutsche Wort man hier für „invoke“ benutzen sollte. Es soll Leute geben, die ChatGPT siezen. Parallel zu meinen eigenen Gehirnwindungen habe ich Google und ChatGPT übersetzen lassen, was aber auch nicht wirklich half.

Was ist die „Invoke“-Methode?(1) Was sind „Archetypen“ und wie kann ich sie verändern oder aufrufen?

Wenn es dir schwer fällt, eine bestimmte Aktion, Pose oder Szene [mit KI] zu erstellen, erwäge die „Invoke“-Methode. Das bedeutet: Beschreibe nicht die Details, sondern rufe stattdessen die Details mit „Stereotypen“, „Archetypen“ und „Klischees“ auf [die Midjourney bereits gelernt hat – vermutlich beschreibt „Vorlagen“ oder „Schemata“ ungefähr das, was gemeint ist].

Beispiele:
❌ a puppy with an envelope in its mouth walking down the street toward a mailbox
✅ a puppy delivering mail
❌ a middle-aged woman wearing glasses sitting behind a desk covered in books and one apple
✅ a schoolteacher sits at her desk

Wie und warum funktioniert die „Invoke“-Methode?

Um die Korrelationen zwischen Token [Eingaben, vgl. unten] und Regeln für die Pixelplatzierung zu lernen, hat Midjourney (unter anderem) die Beziehung zwischen Text [im Prompt] und Bildern [die erzeugt wurden] untersucht. Wenn wir Text schreiben, neigen wir dazu, assoziativ zu denken, anstatt ganz einfach zu beschreiben, da für uns Detailtreue und Prägnanz („in der Kürze liegt die Würze“) gleich wichtig sind. Wir möchten nicht, dass unsere „sehbehinderten“ Benutzer zehn lange Sekunden lang Text lesen müssen. Daher werden wir höchstwahrscheinlich nicht schreiben: A man in leather chaps, a suede vest, checkered shirt, boots, and a hat, holding a lasso, leaning against a cedar fence, surrounded by a herd of cows. Sondern eher: At a cattle ranch, a cowboy leans against a cedar fence. Das ist viel assoziativer und dauert nur einen Bruchteil der Zeit. Als Midjourney gelernt hat, Bilder zu erstellen, hat es sich vermutlich von der [ebenfalls antrainierten] Tradition der Aufrufmethode in Text [Prompt] inspirieren lassen.

Archetypen

And here are some more examples.
don’t say this ➡️ say this instead
a man with a sword ➡️ a swordsman (or guardian, or warrior, or…)
a female with a sword ➡️ a female swordsman
…with a bow and arrow ➡️ a male/female ranger
wearing glasses and carrying an apple ➡️ a schoolteacher
riding a bicycle ➡️ a cyclist
on a horse ➡️ a rider
carrying a magic wand ➡️ a magician
wearing a business suit ➡️ a businessman
having a glass of wine and talking to other people ➡️ mingling
sitting at a table with a pile of poker chips holding cards ➡️ playing poker
around a table with a pink cake and balloons ➡️ birthday party
a human with any non-human characteristic ➡️ humanoid
a cat with any non-cat characteristic ➡️ felinoid

Wenn wir einen /imagine-Job auf Midjourneys Servern ausführen, wird uns pro Job nur ein begrenztes Stück Arbeitsspeicher (RAM) zur Verfügung gestellt. Daher kann Midjourney nicht viele „Token“ [Eingaben](2) gleichzeitig verarbeiten. Stattdessen werden die Token irrlevant, miteinander verschmolzen oder weggelassen. [Ähnlich wie bei Schachcomputern, die nicht alle möglichen Züge durchrechnen). Dadurch ist die Aufrufmethode technisch effizienter. Einfach ausgedrückt benötigt „Cowboy“ weniger Speicherplatz als „Ein Mann in Lederchaps, einer Wildlederweste, kariertem Hemd, Stiefeln und einem Hut, der einen Lasso hält“. Damit kann Midjourney besser umgehen.

token
Faustregel: Ein Token entspricht in der Regel etwa ~4 Zeichen Text eines englischen Textes. Das entspricht in etwa ¾ eines Wortes (also 100 Tokens ~= 75 Wörter).

Der Nachteil der „Invoke“-Methode besteht darin, dass du beim ersten Versuch keine bestimmten Details angeben kannst. Dein Cowboy wird möglicherweise nicht mit dem gewünschten karierten Hemd dargestellt. Aber hier kommen andere Funktionen von Midjourney ins Spiel, insbesondere „Remix“. Sobald du deinen Cowboy erzeugt hast, kannst du einen Remix-Workflow verwenden, um Details hinzuzufügen, zu entfernen oder zu ändern. Es dauert etwas länger, aber es gibt dir eine viel bessere Kontrolle, da es die aktuellen Einschränkungen von Midjourney berücksichtigt.

aiart
a surreal cat with an ocular third eye, fantasy art –v 5 –s 750

„Push“-Wörter

Um einen „Archetypen“ zu modifizieren, kann man so genannte „Push-Wörter“ („unlock words“) zum Prompt hinzufügen.

Um einen Menschen mit einer nicht-menschlichen Eigenschaft „aufzupeppen“, könnte man formulieren:
a humanoid with blue skin
Ein wesentlich besseres Ergebnis ergäbe aber:
a humanoid with blue skin, fantasy art
Das „Push-Wort“ ist fantasy.

Beispiele:
fantasy
surreal
magical
concept art
make-believe
fabled
mythical
fictional
supernatural
fantastical
imaginary
unrealistic
fanciful
legendary
hallucinatory
mythological
illusional
dreamed
pretend
unreal
anachronistic

Schwierige Aufgaben mit der „Involve-Methode gelöst:

🔹 Du möchtest eine Katze mit drei Augen? „Archetypische“ Augen kommen nur paarweise. „Archetypische“ Katzen haben zwei Augen. Also kann man versuchen, den einen Archetypen („Katze“) mit einem anderen aufzumischen. Versuche a surreal cat with an ocular third eye, fantasy art –v 5. Das „Push“-Wort ist fantasy art Benutze rerolls, :vroll: vrolls, and remix, um dich deiner Idee anzunähern.

🔹 Du möchstest einen gläsernen Anker erstellen? Der „Archetyp“ Anker ist nicht aus Glas. Also muss man einen gläsernen Archetypen hinzufügen. Versuche: a glass sculpture in the shape of a ship’s anchor.

aiart
a glass sculpture in the shape of a ship’s anchor –chaos 100 –s 750

Mehr Beispiele für die „Invoke“-Methode
⁠📗 Hovering (Remix)
⁠📗 Create Selfies
⁠📗 Dynamic Poses
⁠📗 Control Poses
⁠📗 Controlled Blending (Hybrids)
⁠📗 Multiple Subjects
_____________________________________________
(1) Einige deutsche Synonyme für das englische Wort „invoke“ sind: anrufen, heraufbeschwören, hervorrufen, aufrufen, verwenden, appellieren, beschwören, benutzen, in Anspruch nehmen, nutzen
(2) Tokenizer von OpenAI zeigt, wie Prompts von ChatGPT beziehungsweise GPT-3, aber auch von anderen KI-Tools separiert werden. Ein bis zwei kurze englische Sätze entsprechen etwa 30 Token; zwei deutsche Sätze gleichen Inhalts können zuweilen doppelt so viele Token umfassen.
OpenAI selbst gibt für GPT-3 und damit auch ChatGPT ein Limit von 4.097 Token an. Text, der über diese Grenze hinausgeht, wird von der Künstlichen Intelligenz ignoriert.

image_pdfimage_print

Kommentare

3 Kommentare zu “Invoke Archetypes”

  1. Die Anmerkung am August 3rd, 2023 12:30 pm

    to invoke

    herbeizaubern

    aka

    Das prompt so „aufrufen“, mit diesen Parametern „aufrufen“, initialisieren, ausführen.

  2. admin am August 3rd, 2023 12:53 pm

    „Die Methode, um etwas aufzurufen“, ist mir zu sperrig.

  3. frank am August 4th, 2023 9:15 am

    Die Methode zum Invozieren …

Schreibe einen Kommentar