Kuidas saada AI-lt täpselt sellist pilti, nagu vaja? Pildipromptimise tehnikad.
AI-pildiloome võib olla kas täielik õnnemäng või täpne ja professionaalne tööriist. Kõik sõltub sellest, kuidas sa juhiseid annad. Kui tead, mida tahad ning oskad seda ka AI-le selgitada, saad kvaliteetse tulemuse. Kasuta PLAD, FMOS või Nano Bananase tehnikat, et kirjeldada pilti struktureeritult. Eesti keeles promptimine toimib, aga inglise keel annab minu hinnangul suurema täpsuse ja stiilivaliku. Esimene tulemus pole kunagi viimane, sest AI pildiloome on alati protsess.
Palusid ChatGPT-lt illustratsiooni töökultuuri teemalisele blogipostitusele, aga said midagi, mis näeb välja nagu 90ndate ulmefilmis. Või vajasid lihtsat infograafikat, aga tulemus oli nii keeruline, et isegi ei saa aru, mida see kujutab.
Tegelikult suudab tehisintellekt luua täitsa tip-top pilte, kuid teda hästi juhendada. Pildiloomeks on olemas kindlad tehnikad, mida AI vestlusrobotid "loevad" palju paremini kui meie juhuslikud kirjeldused. Järgnevalt jagangi sulle kolm selget tehnikat, mis muudavad pildiloomise tehisntellektiga professionaalsemaks.
Alusta visioonist, sest juhuslik kirjeldus = juhuslik pilt
Koolitusel teen pildiloomet õpetades sageli väikese “inimkatse”. Palun osalejatel silmad kinni panna. Räägin seejärel kõigile ühe ja sama loo. Nad peavad seda lugu lihtsalt vaimusilmas ette kujutama. Kui silmad taas avatakse, palun kirjeldada, mida nad ette kujutasid.Selgub alati sama tõde. Kõik oleksid nagu erinevat lugu kuulnud.
Seega enne pildi loomist küsi endalt, millist sõnumit see pilt peaks edasi andma, millist tegevust väljendama ja millist meeleolu looma. Ilma selge suunata teeb AI oma oletuse ning see ei ole alati see, mida sina mõtlesid. Näiteks kui soovid edasi anda mõtet “rahulik koostöö”, siis sõnasta see nii: “calm collaboration atmosphere, soft light, natural tones”.
Kas promptida eesti või inglise keeles?
Pilte võib AI-le kirjeldada nii eesti kui inglise keeles, kuid inglise keel annab reeglina täpsema ja visuaalselt kvaliteetsema tulemuse. Põhjus on lihtne. Enamik pildi generaatoreid on treenitud ingliskeelsete kirjelduste peal. See tähendab siis, et ingliskeelsetest juhistest saab AI paremini aru ning tulemus vastab täpsemalt soovitud stiilile, valgusele ja kompositsioonile.
Kolm pildiloome tehnikat
Kasuta PLAD tehnikat kui tahad lihtsalt paremat visuaali
(P) Perspektiiv
Kas vaatame stseeni ülevalt (droonivaade), otse eest (portree) või küljelt (profiil)?(L) Valgus (Light)
Kas valgus on loomulik, kuldse tunni pehme valgus või hoopis dramaatiline varjudega kontrast?(A) Asend (Angle)
Millise nurga alt on vaade? Madalast, kõrgest, silmade kõrguselt?(D) Suund (Direction)
Kas subjekt vaatab kaamerasse, eemale või liigub teatud suunas?
Näide:
„Side view (P) of a woman sitting by a window at eye-level angle(A), golden hour sunlight (L) casting long shadows. She is looking out the window(D), creating a relaxed mood.“
„Create a photo. Side view of a professional working at a clean desk in a modern, Nordic-style office. Sunlight from a large window casts soft shadows on the wall. Calm, focused atmosphere. Minimalist interior with muted green and beige tones, symbolising trust and stability. Estonian flag colors are subtly reflected in decor.“
Kui sa mõistad hästi fotograafia telgitaguseid kasuta FMOS raamistikku
FMOS mudel sobib minu arust hästi fotograafiahuvilistele.
(F) Kadreering (Framing)
Kas vaade on lähivõte, keskplaan või lainurk? Äkki hoopis makro või portree?(M) Väljendusviis (Medium)
Kas soovid fotot, illustratsiooni, 3D-kujutist, infograafikut, õlimaali, joonist?(O) Objekt
Mis või kes on pildi keskmes (inimene, meeskond, töösituatsioon)?(S) Stiil (Style)
Milline kunstistiil? (minimalism, vintage, flat design, skandinaavia stiil. kaasaegne)
Proovi järgi:
Close-up overhead view (F), professional photography (M), modern desk workspace with laptop and plants (O), Scandinavian minimalist aesthetic with neutral tones (S)"
Medium shot of a person using a self-service portal on a laptop at home in the evening. Warm lighting, soft bokeh in background. Mood: simple, calm, trustworthy. The screen shows a blurred interface.
Kui vajad täpsust ja järjepidevust, proovi Nano Bananas lähenemist
Minu hinnangul on antud ajahetkel Nano Bananas (Google Gemini platvormil) on oma uue mudeli jaoks kokku pannud kõige detailsema juhise ja pakub kõige sisukamat pildiloome loogikat. Prompt jaguneb kuueks osaks:
Subjekt - kes või mis on pildi keskmes
Tegevus - mida subjekt teeb
Keskkond - kus see toimub
Kunstistiil - milline visuaalne lähenemine
Valgustus - kuidas valgus langeb
Detailid - täiendavad elemendid ja nüansid
Näide:
Single person silhouette (subjekt) climbing abstract stairs (tegevus) against gradient sky background (keskkond) minimalist vector art style (kunstistiil) soft backlit glow (valgustus) geometric shapes, clean lines, blue to orange gradient (detailid).
A group of professionals engaged in leadership training activities, one presenting in front of a screen while others listen and take notes, in a modern seminar room with large windows and soft furnishings, clean vector illustration style with Scandinavian aesthetic, natural soft daylight from the side, muted green and beige color palette, subtle Estonian cultural details in decor, clear visual hierarchy.
Nano Bananas on hetkel kõige võimsam AI-vestlusroboti pildigeneraator, mis võimaldab luua, redigeerida ja kombineerida pilte väga hea järjepidevusega. Kui traditsioonilised AI tööriistad võivad luua igal katsel täiesti erineva väljanägemisega isikuid või ruumne, siis Nano Bananas suudab säilitada näojooni ja pildi korduval korrigeerimisel üle tuua vana pildi tunnuseid.
Mõned vead, mida vältida
Segad eri tehnikaid. Pigem vali üks ja hoia selge struktuur.
Kirjutad liiga pika prompti. Mõnikord on vaja kirjeldada, aga üle 70-100 sõna ajab AI veidi segadusse.
Üritad vastandlikke asju luua või kirjeldada. Näiteks “minimalistlik ja samal ajal väga detailne” ei tööta hästi. Proovi uuesti.
Kasutad ebamääraseid sõnu nagu “äge”, “huvitav”. Paraku ei pruugi need AI-le väga midagi öelda.
Jätad stiili lisamata ning ilma selleta saad juhusliku tulemuse.
Eesti politsei on välja toonud, et AI-ga genereeritud dokumendifotod võivad tunduda kiire ja mugav lahendus, aga tegelikkuses võivad need sulle kasutamise järgselt peavalu valmistada. Jah, esimene automaatne fotokontroll laseb pildi ehk läbi, aga kui piirivalve või turvakontroll hakkab sinu päris nägu biomeetriliselt võrdlema AI-ga genereeritud passifotoga, siis ei pruugi need kokku sobida. Ja siis on sul lennujaamas või piiril tõsine probleem.
Kasuta AI-d julgelt oma LinkedIn'i postitustele, koolitusmaterjali illustratsioonidele või ettevõtte blogisse, aga dokumendifotode ja ametlike materjalide puhul jää ikka päris fotograafi või fotoboksi juurde. Ega ma ilmaasjata ütle, et tehisintellekti kasutamisel tasub kriitiline meel alati endaga kaasa hoida.
Kokkuvõte
Struktureeritud juhiste või raamistike kasutamine tagab, et AI tööriist mõistab, mida sa väljundina soovid luua. Esimene tulemus ei pruugi olla ideaalne. AI-ga pildi tegemine on iteratiivne protsess ehk siis sa genereerid, vaatad üle, täpsustad, ja mõnikord ka kordad. Kui nüüd natukene eestlaslikku huumorit lisada ja vaadata enne-AI aega tagasi, siis hea kujundajaga kulgeb koostöö samamoodi. Tavaliselt on kolmas või neljas versioon juba see, mida vajad 🙂