Trace: midjourney1

Product design met generatieve AI

Product design met generatieve AI

Mijn werkbank zoals een AI die bedacht heeft

Introductie

Generatieve AI-modellen die tekst naar afbeeldingen omzetten, vormen een snel opkomend gebied binnen de kunstmatige intelligentie. (AI = Artificiële intelligentie ook wel Synthetische Intelligentie genoemd) Deze technologie maakt gebruik van geavanceerde neurale netwerkarchitecturen om visuele content te genereren op basis van tekstuele beschrijvingen. Dit wordt soms ook wel “prompt engineering” genoemd, verwijzend naar het proces van het nauwkeurig en strategisch formuleren van prompts om gewenste uitvoer van het model te krijgen.

Wat is MidJourney?

MidJourney is een generatieve AI-tool :een cloud dienst, je draait het dus niet op je eigen PC, die in staat is om visuele ontwerpen te creëren op basis van tekst inputbeschrijvingen. Stel je voor: je hebt een idee voor een nieuw type oscilloscoop, maar je mist de grafische vaardigheden om het te tekenen. Met MidJourney voer je gewoon je specificaties en wensen in, en voilà, een visueel concept wordt gegenereerd.

Hoe werkt het?

Deze systemen zijn getraind op enorme datasets van afbeeldingen en de bijbehorende beschrijvingen. Door dit te doen, leren ze de relatie tussen tekstuele beschrijvingen en de visuele kenmerken die ermee geassocieerd worden. Wanneer je zo'n systeem een nieuwe beschrijving geeft, zoals “een rode bal op een groen veld”, zal het proberen een afbeelding te genereren die overeenkomt met die beschrijving op basis van wat het tijdens de training heeft geleerd.

Verfijnen met Prompt Engineering

Prompt engineering speelt een cruciale rol in het verfijnen van de uitvoer. Door de instructies of de tekstuele prompt aan te passen, kun je variaties en specifieke details in de gegenereerde afbeelding beïnvloeden.

Bij Midjourney kun je getallen en gewichten gebruiken om bepaalde kenmerken of aspecten van de gegenereerde output te benadrukken. Deze getallen kunnen dienen als “wegingen” om de mate van invloed van een bepaalde instructie in de prompt te reguleren.

Laten we een voorbeeld bekijken voor een audio eindversterker met buizen:

Prompt: "Ontwerp een audio eindversterker met buizen. Stijl: retro [0.8], modern [0.2]. Kleurenschema: goud [0.7], zwart [0.3]. Extra kenmerken: glanzend oppervlak [0.6], zichtbare buizen [1.0]."

Uitleg:

  • “Stijl: retro [0.8], modern [0.2]”: Dit suggereert dat het ontwerp voornamelijk retro moet zijn met een kleine moderne touch. De wegingen (0.8 voor retro en 0.2 voor modern) geven aan hoe dominant elk stijlelement moet zijn in het uiteindelijke ontwerp.
  • “Kleurenschema: goud [0.7], zwart [0.3]”: Het model wordt geleid om voornamelijk gouden kleuren te gebruiken met wat zwarte accenten.
  • “Extra kenmerken: glanzend oppervlak [0.6], zichtbare buizen [1.0]”: Hier wordt de glans van het oppervlak benadrukt, maar de zichtbare buizen zijn het meest dominante kenmerk vanwege de maximale weging van 1.0.

Het gebruik van dergelijke getallen en wegingen kan helpen om meer specifieke en afgestemde resultaten uit het model te krijgen, maar het vereist ook meer finesse en experimenten om de optimale prompt te vinden die de gewenste output oplevert.

Deze spectrum analyser ziet er gewoon super vet uit, dat had ik zelf nooit kunnen tekenen.

Eigen visuals als basis

Het gebruik van voorbeeldafbeeldingen als basis helpt de AI ook om de stijl, kleur en andere kenmerken van de gewenste output beter te begrijpen. Dit wordt soms “style transfer” genoemd, waarbij de AI de stijl van de gegeven afbeelding probeert toe te passen op de nieuwe content die het genereert.

In het voorbeeld met de persoon in de foto (ik had een foto van mezelf gebruikt) heeft Midjourney een combinatie gemaakt van mijn foto en een fantasie buizenversterker. (Mijn gezicht is niet meer herkenbaar, de zwarte T-shirt en leeftijd en kapsel zijn aardig goed gebleven)

Zo ziet een mogelijk webinterface er uit, je krijgt meerdere varianten en dan kun daarin steeds verder verfijnen in stijl en details.

Voordelen van MidJourney

  • Snelheid: In plaats van dagen te besteden aan het handmatig schetsen en herzien van ontwerpen, kan MidJourney in enkele minuten meerdere concepten genereren.
  • Diversiteit/Verscheidenheid: MidJourney kan een breed scala aan ontwerpstijlen en variaties bieden, Je kunt een breed scala aan visuals verkennen door simpelweg de tekstuele beschrijving te veranderen.
  • Toegankelijkheid: Geen behoefte aan geavanceerde grafische vaardigheden. Met een duidelijke beschrijving kan elke technicus of hobbyist gebruik maken van deze tool.
  • Lage kosten: Paar euro in de maand voor urenlang speelplezier en nieuwe concepten, altijd beschikbaar ook buiten kantooruren, is een koopje.

Uitdagingen

  • Authenticiteit: Hoewel de AI fantastische ontwerpen kan genereren, kunnen ze soms generiek of repetitief aanvoelen.
  • Fine-tuning: Voor complexe producten kan de AI soms nuances missen die een menselijke ontwerper wel zou opmerken.
  • Afhankelijkheid van de Prompt: De kwaliteit en nauwkeurigheid van de uitvoer hangen sterk af van de precisie van de gegeven prompt.
  • Onvoorspelbaarheid: De uitvoer is niet altijd perfect en kan soms onvoorspelbare resultaten opleveren. (dit kan ook een voordeel zijn natuurlijk!)

Kosten

MidJourney begint bij 10 euro per maand voor een abonnement.

MidJourney in Actie bij WisClub

Bij WisClub hebben we MidJourney gebruikt om concepten te visualiseren voor diverse technische producten, zoals een radio, oscilloscoop, meetapparatuur en dashboards. Het resultaat? Inspirerende en diverse visuele ontwerpen die als uitgangspunt dienen voor verdere productontwikkeling of nieuwe gedachten.

Conclusie

MidJourney biedt een nieuwe en snelle brug tussen idee en visualisatie, waardoor technische professionals en liefhebbers hun ideeën sneller dan ooit in beeld kunnen brengen. In mijn mening een waardevolle tool in de ontwerpfase van elk technisch project.

Nota bene: Alle afbeeldingen in deze posting zijn met MidJourney gemaakt!