Hvordan generere bilder med kunstig intelligens

I en verden der kunstig intelligens (KI eller AI) fortsetter å overraske og engasjere, har bildegenereringsteknologi som DALL•E og MidJourney raskt blitt en del av vår digitale hverdag. Sistnevnte har nok blitt min favoritt, selv om DALL•E ofte er litt mer tilgjengelig. Uansett, disse innovative verktøyene tilbyr muligheter til å skape bilder som tidligere bare kunne forestilles. I dette innlegget vil jeg gjerne dele min personlige tilnærming til hvordan jeg genererer bilder med disse verktøyene, og hvordan jeg går frem for å skape bilder til mitt bruk.

Å skape et bilde med KI-basert teknologi er mer enn bare å mate et system med tilfeldige ord eller fraser. Det krever gjerne en gjennomtenkt tilnærming for å formidle nøyaktig hva du ønsker at verktøyet skal generere.

Jeg pleier å dele prompten (kommandoen) opp i fem nøkkelkomponenter for å oppnå det beste resultatet:

  1. Bildestil

  2. Subjekt

  3. Omgivelser

  4. Lyssetting

  5. Komposisjon

Bildestil

Dette er fundamentet i bildet. Det setter tonen for hvordan resten av elementene vil samhandle. Spesifiserer du "photorealism", søker du etter et bilde som ligner så tett som mulig på virkeligheten. Ønsker du derimot "street art painting", indikerer du en helt annen estetikk, ofte mer abstrakt og kunstnerisk.

Subjekt

Subjektet i bildet er hovedfokus. For eksempel, når jeg beskriver "norwegian woman, 30 years old, black shirt", gir det AI-en en klar forståelse av hvem eller hva som skal være i sentrum av bildet.

Omgivelser

Omgivelsene forteller AI-en hvor scenen utspiller seg. "Looking at screen in office" plasserer subjektet i en bestemt kontekst som tilfører dybde og relevans til bildet.

Lyssetting

Lys kan skape magi i bildet, og blir gjerne avgjørende for stemningen i bildet. Selv om dette ofte kan være implisitt i bildestilen eller omgivelsene, kan spesifikasjon av lyssetting som "soft afternoon light" eller "harsh shadows" veilede genereringen mot en spesifikk atmosfære. En av mine favoritter, er “cinematic lighting”. Prøv det selv, bildet blir dritkult! :)

Komposisjon

Dette handler om hvordan elementene i bildet er arrangert. Begreper som "balanced composition" antyder en harmonisk fordeling av visuelle elementer, noe som er essensielt for bildets generelle estetikk.

For å illustrere nærmere, la oss se på to ulike prompter jeg har brukt i MidJourney.

“stock image, norwegian woman, 30 years old, black shirt, looking at screen in office, 4k, photorealism, balanced composition”

Denne prompten søker å skape et høyoppløselig og fotorealistisk bilde av en norsk kvinne i en kontorsetting. Spesifiseringen av "4k" og "balanced composition" indikerer ønsket om høy bildekvalitet og en velbalansert bildekomposisjon.

"street art painting, norwegian woman, 30 years old, black shirt, looking at screen in office, concrete wall"

Her endrer vi bildestilen til "street art painting", noe som gir rom for mer kreativitet og kunstnerisk frihet. Ved å tilføye "concrete wall", gir vi KI-en beskjed om å inkludere et urban element som bakgrunn, noe som ytterligere definerer estetikken vi er ute etter.

Gjennom å dele opp prompten på denne måten, gir vi en mer detaljert forståelse av våre ønsker, noe som resulterer i bilder som ikke bare er visuelt tiltalende, men som også treffer nærmere det vi hadde i tankene. Samtidig er fremgangsmåten relativt enkel.

Send meg gjerne dine beste råd for prompting, mulighetene er mange!

Forrige
Forrige

Imponerende videoer generert av kunstig intelligens

Neste
Neste

LinkedIn slutter med lookalikes