Op zoek naar een handig lijstje met AI tools voor de creatief?
Ben je bijvoorbeeld tekstschrijver, designer, illustrator, animator of videomaker en op zoek naar welke AI programma’s interessant zijn?
In deze blog onderzoeken we als animatiestudio welke AI tools ons kunnen helpen betere teksten, illustraties en animaties te maken.
N.B. deze blog wordt elke paar weken/maanden ververst, kijk dus over een tijdje weer.
De grote spelers van AI
Allereerst een overzicht van het krachtenveld in AI:
- OpenAI en Microsoft: chatten met ChatGPT, beelden genereren in Dall-E en straks bewegend beeld in Sora.
- Google: chatten met Gemini (geen beeldopties meer na klachten)
- Meta (Facebook): chatten met Llama. Ook MetaAI (nog niet beschikbaar)
- Er zijn nog flink wat andere chat AI’s, bijvoorbeeld Claude (van Anthropic) en Grok (van Elon Musk, X) en de Europese Mistral.
- Wil je ze allemaal een keer proberen, dan kun je terecht bij Poe.
Met al dat aanbod: wat is wijsheid om te gebruiken?
Voor ons is de basis nu ChatGPT, omdat:
- het goed en prettig werkt.
- het de enige plek is waar je kunt chatten, beelden kunt genereren en straks als het goed is ook bewegend beeld.
- het wordt omarmt door kleine en grote partijen: Microsoft gebruikt het in z’n zoekmachine en Apple in z’n telefoons.
Met AI van tekst naar verhaal, copy, blog en redactie
We zitten middenin een tekst naar ‘iets’ revolutie. De eerste was tekst naar tekst.
Met ChatGPT van OpenAI kun je een zinnetje invoeren – ook wel prompt genoemd – en kun je bijvoorbeeld vragen om een out-of-the-box verhaal:
Is dit nu een krachtig idee voor een verhaal? Niet echt natuurlijk. Maar dat ligt ook aan de prompt, die kan veel beter en specifieker.
En daarbij: je kunt ChatGPT steeds nieuwe ideeën laten genereren totdat er iets voorbij komt dat je misschien wel leuk vindt.
Kortom, het kan een goede sparringspartner zijn voor:
- Blogonderwerpen bedenken
- Vertalen van teksten (kan ook met DeepL)
- Samenvatten
- Dialogen schrijven
- Synoniemen zoeken
- Andere tone-of-voices
- Tekstredactie
Moet je ChatGPT zomaar 1 op 1 overnemen?
Nee, zeker niet. Het heeft namelijk een paar nadelen:
- Je weet niet zeker of ChatGPT juiste informatie verstrekt. Je moet dus zelf nog steeds kijken of het logisch is wat er staat. Of het klopt. Bijvoorbeeld een vertaling naar een taal die je zelf niet beheerst is tricky. Want er zijn veel specifieke uitzonderingen en opties binnen talen, die je wel door een kundig iemand wilt laten afwegen.
- Er komen steeds meer Output Detectors die scannen of iets door ChatGPT of door een mens geschreven is, zoals deze GPT Output Detector. Het is dus bijvoorbeeld een risico om je hele website door ChatGPT te laten schrijven, omdat Google die detectoren natuurlijk ook gebruikt.
- Door ChatGPD 1 op 1 over te nemen beroof je jezelf van een leerzame ervaring. Het maken van iets, het schrijven van een tekst, blog of copy is een bijzonder proces waarmee je de informatie in je hoofd aanscherpt.
Wij zien ChatGPT dus als extra input, als extra invalshoek, als extra bron.
En het is ook gewoon leuk. Je kunt er genoeg lol aan beleven:
Met AI van tekst naar design, illustratie, schilderij en foto
Een nog interessantere stap is natuurlijk van tekst naar beeld.
Dall-E
Met DALL-E van OpenAI is er veel mogelijk. Ondertussen is dit onderdeel geworden van een betaald abonnement van ChatGPT.
De visuals worden steeds mooier:
Zeker als je je prompt heel uitgebreid schrijft:
Je kunt ditzelfde natuurlijk doen met fotografie, bijvoorbeeld om productfotografie voor te bereiden of stockfoto’s mee te maken. Je kunt op Shutterstock eens kijken voor prompts.
Wat opvalt is dat mensen steeds realistischer worden, zoals de hilarische website thispersondoesnotexist al jaren duidelijk maakt. Meerdere mensen op een foto geeft nog wel fouten en specifieke houdingen ook. Bekijk de hand onder het gezicht van de vrouw maar eens.
Je kunt ook specifieke HEX of RGB-kleuren doorgeven. Dit werkt nog niet helemaal lekker, maar geeft wel perspectief voor volgende versies:
Je kunt ook vragen om andere verhoudingen. Helaas krijg je dan niet hetzelfde beeld, dus dat moet je meteen goed invoeren.
Geïntresseerd hoe dit allemaal werkt? Bekijk deze video van Vox.
Nadelen van DALL-E (vanuit ChatGPT):
- Kleurcodes worden nog niet helemaal goed opgepakt. Je kunt niet lekker in je huisstijl werken.
- Je kunt beperkt iets veranderen aan je beeld. Je kunt op het image klikken en dan aangeven welke zone je iets wilt veranderen, maar de output is (nog) niet goed.
- Je moet hopen dat door de input die je geeft en door oneindig op variaties door te gaan, je het beeld krijgt dat je wilt. Tip: via Hugging Face kun je bestaand beeld invoeren en dan krijg je daar een beschrijving (prompt) van die je weer kunt invoeren in ChatGPT/DALL-E. Tip 2: je kunt ook een prompt kopen via Promptbase.
- Fotografie met meerdere mensen en houdingen werkt nog niet zo lekker. Toch beter om bij echte mensen te blijven. Voor gratis stockfoto’s kun je beter terecht bij deze websites:
Pexels
Unsplash
Climate Visuals
Wikimedia
CC Search
KREA
Het grootste nadeel van ChatGPT is dat je lang aan het wachten bent op een resultaat en weinig controle hebt. Het voelt niet echt intuitief.
Een tool die dit een beetje oplost is KREA. Het programma past je afbeelding aan terwijl je een tekst schrijft. Aan de rechterkant kun je ook kiezen voor foto, conceptueel of juist CGI of cartoon.
Wat verder erg leuk is, is dat je elementen kunt toevoegen aan het linkerbeeld, waardoor je het rechterbeeld (het plaatje dat je aan het ontwikkelen bent) een beetje kunt sturen:
Natuurlijk heeft ook KREA nadelen:
- Het werkt goed met een enkel persoon, maar bij meerdere karakters krijg je vervormingen of blijft het programma vasthouden aan een enkel karakter.
- Als je je prompt wat moeilijker maakt, krijg je weinig resultaat.
- Het sturen van beelden kan ook frustrerend zijn, je hebt iets in gedachten maar krijgt het er niet goed uit.
- Je krijgt best wel veel standaardbeelden, het lijkt allemaal een beetje op elkaar op een gegeven moment. Een beetje hetzelfde wat de app Lensa had: leuk als gimmick, maar niet voor creatieven die voor langere termijn wat zoeken.
Met AI van tekst naar voice-overs en stemmen
Waar AI voice-overs vroeger nogal blikkerig en uncanny voelden, worden ze steeds beter en echter.
Er zijn al Nederlandse radiostations die nieuws laten voorlezen door AI. Op Q-Music is een sidekick als grapje vervangen voor AI. Luisteraars hadden het niet echt door.
Elevenlabs
Met Elevenlabs kun je allerlei kanten op met stemmen en voice-overs:
- Tekst naar speech omzetten. Je hebt keuze uit allerlei vooringestelde voice-overs. Elevenlabs heeft ook deals gesloten met familie van filmsterren zoals James Dean en Judy Garland.
- Je eigen voice creëren. Je kunt als creator of voice-over zelf je stem inladen en je eigen AI stem maken. Nooit meer een dag met een slechte stem of een verkoudheidje! Ook kun je stemmen gebruiken die anderen al gemaakt hebben.
- Je kunt ook van tekst naar sound effects.
Je hebt daarmee de mogelijkheid om audioboeken in te laten spreken door verschillende stemmen, hoorspelen te creëren met sound effects en natuurlijk ook stemmen te vervangen of te vertalen.
Wat (nog) niet of minder goed werkt:
- Wij maken meestal animaties met een Nederlandse voice-over. Helaas krijg je best veel stemmen waar je toch een Amerikaans/Engels randje voelt. Of soms krijg je gewoon een Belgische stem!
- De mogelijkheden om een stem aan te sturen zijn beperkt. Je kunt het niet hebben over het tempo, over bepaalde zinsdelen waar je een pauze wilt, specifieke intonaties voor woorden, enzovoorts.
- Bestanden lijk je alleen te kunnen downloaden met mp3 en mp4. Liever werken we met grotere bronfiles.
- Wij maken animatiefilms met voice-over, sound design en muziek. Als je die als totaal upload, wordt het sound design en muziek aangetast. Het werkt dus logischerwijs het beste met 1 duidelijk audiospoor dat je wilt vertalen.
Met AI van tekst naar muziek
Een zinnetje typen en je gewenste muziekcompositie krijgen? Ja hoor.
Mubert
Je kunt je gewenste stemming omschrijven in AI generator Mubert. Je krijgt vervolgens een kant-en-klare track.
SoundRAW
Een andere AI muziek tool is SoundRaw. Omdat dit betaald is, heb je meer opties. Waaronder een optie om de opbouw van de muziek aan te sturen qua energie:
Alle opties hebben dezelfde nadelen:
- Je moet hopen dat je krijgt wat je wilt. Je kunt de uitkomst niet echt goed sturen.
- Je kunt weinig tot geen veranderingen maken in de tracks zelf. Geen veranderingen aan instrumentatie, net even een ander melodietje, een crash op precies de goede plek.
Wij gebruiken zelf de Youtube Audiobibliotheek voor het onderzoeken van de juiste muziekstijl. Je kunt hier snel muziek zoeken op stemming, de tracks downloaden en testen.
En vervolgens maken we samen met een componist een custom made track. Die dus wel aan te passen en te fine-tunen is.
Want als er feedback komt, wil je niet moeten zeggen ‘Sorry, maar die aanpassing kan onze AI software niet’.
Met AI van tekst naar animatie en film
Gaan we een nieuw tijdperk in voor productie van films en animatie? Er is in ieder geval veel beweging.
SORA
Met SORA (van OpenAI – bedrijf achter ChatGPT) kun je momenteel nog niet werken.
Maar.. sommige bedrijven mogen er blijkbaar al wel mee experimenteren. Toys’R’Us genereerde er een reclamevideo mee, waarbij ongeveer 80-85% is gemaakt met Sora.
Er is natuurlijk veel op aan te merken, omdat het jongetje bijvoorbeeld niet overal hetzelfde is en je gezichtsvervormingen ziet. En omdat het een van de eerste commerciele toepassingen van AI video is, was er natuurlijk ook veel controverse.
RunwayML
Ook RunwayML biedt de mogelijkheid om beelden tot leven te toveren, bijvoorbeeld deze animatiefilm:
Wat qua techniek opvalt, is dat het veel slow-motion video en morphing effecten zijn, wat overigens soms ook leuk onderdeel van het verhaal zelf is:
Stel je voor wat je kunt (als museum) met een archief van oude zwart-wit foto’s:
Op RunWayML kun je ook lip syncing video’s maken (Gen-3 abonnement nodig).
Je schrijft een tekst, kiest je stem en gezicht en de video rolt er zo uit.
KREA
Ook de eerder genoemde tool KREA geeft de optie om video’s te maken.
Je voert een aantal beelden in en krijgt al snel beelden die in elkaar overvloeien, ook weer veel morphing effecten en slow-motion:
Algemene conclusies:
- Het is leuk om mee te spelen, maar het resultaat is niet super en het kost stiekem best veel tijd.
- De programma’s gebruiken veelal slow-motion en morph effecten wat erg beperkt voelt. Als je een paar video’s hebt gemaakt, voelt het allemaal veel van hetzelfde.
- Aanpassingen zijn eigenlijk niet te maken, tenzij je dus genereert en daarna zelf goed kan editen en animeren.
Met AI van tekst naar talking head video’s (avatars)
Een digitaal ‘mens’ als presentator? Als verteller in een talking head uitleganimatie? Als pratende game karakters die je de nieuwste game uitleggen?
Synthesia
Synthesia combineert AI voice-overs en AI-avatars.
Je schrijft een tekst voor je avatar (of laat dat doen), kiest een gezicht en vervolgens zie je die ‘persoon’ jouw tekst uitspreken.
Het bekendste voorbeeld van Synthesia is deze opvallende video waarin David Beckham in meerdere talen en stemmen heeft:
D-iD
D-iD biedt ook AI Avatars aan. Ze noemen het ook wel ‘digital agents’.
Net als Synthesia lijkt dit vooral een goede tool als je met een bedrijf over meerdere landen werkt en goedkope talking head video’s en presentaties wilt maken.
Uit onze gratis testen blijkt:
- Je kunt veel talen kiezen. Maar wat meteen duidelijk wordt: het Nederlands is erg Amerikaans. Waarschijnlijk is dit dan ook voor andere talen zo.
- Je kunt veel verschillende gezichten kiezen. Eventueel interessant als je wilt inzetten op diversiteit en inclusie.
- Je kunt ook ‘fantasie’ mensen maken. Denk aan een avatar in een ruimtepak, iemand met een blauw hoofd of een cartoonfiguur.
- Je kunt ook je eigen avatar maken: je digitale tweelingbroer of zus. Dat is wel een beetje spooky.
AI gebruiken of weigeren als creatieveling
Misschien vraag je je na het lezen van deze blog af: wat moet ik met AI?
- Ben je tegen gebruik van AI? Bijvoorbeeld vanwege auteursrecht (er lopen veel rechtszaken), het verliezen van een bepaald soort ambacht en eventueel verlies van banen.
- Ben je voor het gebruik van AI? Bijvoorbeeld omdat je het een tool vindt die je creatiever maakt, net als allerlei andere technologie waardoor we creaties kunnen maken en dat altijd alles al een remix van ideeen is geweest.
Voorlopig zitten wij ergens tussen die twee uitersten. We proberen bij te houden welke kant het op gaat, hoe programma’s werken en wat ermee gemaakt wordt. We raden je aan om hetzelfde te doen, zodat je beter je mening kunt vormen.
Kijk deze interessante video eens over de ontwikkeling van techniek en menselijke creativiteit:
Schrijf je in voor onze nieuwsbrief voor meer tips en informatie over animatie, film, AI en communicatie
Animatie laten maken zonder of met AI 🙂
We helpen je graag.
Ted Griffioen | Tekstschrijver