Così come l'avvento della fotografia venne salutato con disprezzo perché si temeva che la produzione di immagini realizzate attraverso il meccanismo fotografico avrebbe segnato l'abbandono di quella pittorica, allo stesso modo l’ascesa dell’Intelligenza Artificiale Generativa per la creazione di immagini ha suscitato le medesime diatribe.
Come tutti sappiamo, il tempo ha dato torto ai detrattori della fotografia: tutt'altro che una scorciatoia per pittori falliti, si tratta di una vera e propria forma d'arte. Pertanto, viene da chiedersi se il polverone che aleggia sull'avvento delle immagini generate dall'AI sia ancora una volta l'espressione del timore del nuovo, o una battaglia contro una vera e propria deriva dei contenuti.
Approfondiamo qui quali sono i vantaggi, ma anche i potenziali rischi, legati alla generazione di immagini tramite intelligenza artificiale. In più, sarà presentata una panoramica dei migliori tools attualmente disponibili per realizzare contenuti visivi sfruttando tecnologie come le reti neurali generative.
Cosa sono e come funzionano le Generative Adversarial Nets (GAN)?
Le
GAN rappresentano delle reti, introdotte per la prima volta nel 2014, che hanno completamente sovvertito le modalità di generazione di contenuti visivi tramite intelligenza artificiale. L'acronimo sta per
Generative Adversarial Nets e si riferisce al fatto che le immagini vengono generate dalla “competizione” tra un generatore ed un discriminatore.
Si tratta di due
reti neurali convoluzionali, coinvolte in un gioco a somma zero. Il network generatore parte dai dati appresi e genera un'immagine falsa ma quanto più possibile somigliante alla realtà. Il discriminatore invece agisce in maniera contraria: ricevuti gli input dal generatore, vi assegna un valore compreso tra 0 e 1, vero o falso, confrontando questi input con i modelli appresi. Si tratta quindi di un classificatore binomiale.
Esistono
diverse tipologie di GAN, come ad esempio le GAN condizionali, quelle bidirezionali, le info GAN, le Generative Facial Prior GAN (o GFP-GAN) ed altre. La differenza sta nelle modalità con cui vengono generate nello specifico.
Potenziali applicazioni delle GAN
Ogni tipologia di GAN appena menzionata, porta con sé diverse applicazioni, reali o potenziali.
Le GAN vengono infatti utilizzate per:
- invecchiare i volti nelle fotografie o modificare queste ultime;
- generare cartoni animati;
- produrre ex novo delle foto che siano quanto più realistiche possibile;
- tradurre un contenuto in un altro (ad esempio, trasformare un testo in immagine);
- migliorare la qualità di immagini a bassa risoluzione e/o danneggiate creazione di immagini e/o fotografie di natura artistica;
- produrre oggetti 3D creare;
- presentazioni o infografiche.
Oltre i punti appena elencati, l’intelligenza artificiale generativa per la creazione di contenuti visivi trova applicazione anche in
campo medico, seppur si trovi ancora in fase sperimentale. Per quanto riguarda quest'ultimo ambito, questa nuova tecnologia permetterebbe di generare, ai fini dello studio, delle immagini radiologiche estremamente verosimili, che bypasserebbero il problema della privacy e dell'anonimato, o quello della mancanza di dati relativo alle malattie rare.
Ancora, potrebbe risolvere i difetti delle immagini causati dal movimento o dalla presenza di corpi estranei. Da non trascurare, in quest'ultimo caso, la possibilità che si creerebbe di sottoporre il paziente ad una bassa dose di radiazioni, per poi migliorare l'immagine come se fosse stata acquisita con un'alta dose di radiazioni.
Le GAN aiuterebbero anche nel processo di
segmentazione delle immagini radiologiche, effettuato solitamente a mano, rendendo possibile un risparmio di tempo e risorse. Sono state poi utilizzate in un esperimento di brain decoding, oltre ad avere un ulteriore utilissimo possibile sviluppo. Questo tipo di immagini potrebbe infatti permettere, simulando delle radiografie successive, di anticipare l'andamento della malattia, generando in questo modo un processo terapeutico ancor più
personalizzato.
Purtroppo però, come sempre accade con le nuove tecnologie, ci sono alcuni problemi da risolvere prima che le GAN possano effettivamente essere inserite nella pratica clinica. Per alcune di queste
applicazioni mediche, infatti, sarebbe necessaria una mole di dati estremamente ampia per l'addestramento. Questa è una delle tante problematiche a cui bisogna ovviare per far sì che l’IA generativa approdi ufficialmente in questo campo, portando con sé tutti i vantaggi descritti.
Vantaggi e potenziali rischi delle GAN
Partiamo con un approfondimento relativo ai potenziali rischi individuati nell’impiego dell’intelligenza artificiale per creare immagini. Come dicevamo all'inizio, questa nuova tecnologia, nonostante le notevoli potenzialità, ha generato un'enorme quantità di critiche e proteste. Sulla scia dei deepfake, infatti, alle GAN è legato il problema della potenziale generazione di fake.
Questi potrebbero palesarsi in diversi ambiti, attraverso un finto annuncio o un finto curriculum ad esempio, o anche attraverso le fake news, ben note al mondo del web. Ma ciò che ha generato il maggior numero di problemi e rimostranze, sfociando in un vero e proprio trend sui social, è il problema dell'individuazione della figura dell'autore e dell'attribuzione del diritto d'autore, unito a quello della svalutazione della figura dell'artista. Con le GAN il concetto stesso di autore perde quei confini che sembravano così chiaramente delineati.
Chi è l'autore in questo caso? L'AI o chi la utilizza? La questione ha generato poi anche degli effetti collaterali. Grandi polemiche ha suscitato, ad esempio, la vincita di una competizione artistica con l'utilizzo di un'opera realizzata attraverso l'intelligenza artificiale. È stata infatti criticata la scelta di far competere un lavoro dell'AI con altri realizzati attraverso l'ingegno umano. Ma la più grande delle polemiche riguarda la stessa identità dell'artista figurativo e degli utili che sarebbero stati sottratti ad alcuni di loro.
Ricordiamo l’accaduto ai Sony World Photography Awards, quando il vincitore Eldagsen ha deciso di rifiutare il premio ricevuto poiché la fotografia vincitrice era stata realizzata con uno dei più sofisticati ed avanzati strumenti di intelligenza artificiale: Stable Diffusion. La scelta del fotografo tedesco, premiato per la fotografia "The Electrician", è stata motivata dal fatto che egli ritiene che l’intelligenza artificiale non è fotografia, ma sono due cose ben diverse.
In tantissimi hanno espresso le loro rimostranze, in particolar modo attraverso i social. Innanzitutto, l'AI fa in pochissimo tempo ciò che gli artisti hanno imparato a fare in anni di esperienza.
Questo, come si è anticipato, svaluterebbe totalmente la figura dell’artista stesso, rendendo praticamente inutili i talenti e le abilità acquisite. C'è poi un problema tecnico, ovvero quello degli utili, dei diritti e della proprietà dei dataset di partenza utilizzati per generare le GAN.
Molti, infatti, lamentano il fatto che dei loro disegni o dipinti siano stati dati in pasto all'AI. Addirittura, qualcuno sottolinea che in alcune opere così generate si veda ancora la firma dell'artista di partenza. Questa operazione è stata fatta senza chiedere l'autorizzazione a nessuno e, soprattutto, senza rendere a nessuno un compenso.
Vantaggi di creare immagini con l'intelligenza artificiale
Dopo aver passato in rassegna quelli che sono stati individuati come dei potenziali rischi legati all’uso dell’intelligenza artificiale per la creazione di immagini, possiamo elencare gli effettivi vantaggi. In primis, utilizzare le GAN - soprattutto in un contesto aziendale - conduce ad un’efficienza del tempo. Se, fino a poco fa, la generazione di un’immagine per un contenuto web richiedeva l’impiego di tempo e risorse, ad oggi i tools di IA generativa riducono notevolmente le tempistiche necessarie per ottenere il medesimo risultato.
Sicuramente, l’accessibilità è un ulteriore vantaggio associato alle GAN. In effetti, questi strumenti di IA generativa non devono necessariamente essere utilizzati da esperti e professionisti del settore. Questo agevola, ad esempio, chi ha intenzione di intraprendere la strada del personal branding. Al tempo stesso, tali strumenti sono vantaggiosi perché consentono di customizzare il più possibile le immagini generate. In realtà, permettono anche un'approfondita sperimentazione di diversi stili, facendo in modo che ogni brand e/o realtà aziendale possa comunicare perfettamente dei valori o dei principi o veicolare messaggi specifici per aumentare l’engagement o per tessere dei legami con i propri customers.
Creare immagini con l'intelligenza artificiale: quali sono i migliori tool?
Per poter creare delle immagini con l’intelligenza artificiale c’è bisogno di conoscere i migliori strumenti disponibili al momento. Ognuno di questi, presenta delle specificità che possono soddisfare delle esigenze piuttosto che altre. Ecco alcuni dei migliori strumenti per creare immagini con l’intelligenza artificiale, sia gratuiti che a pagamento:
- DALL·E 2: si tratta di un algoritmo appartenente ad OpenaAi, casa madre di CHAT GPT, che può generare delle immagini in base agli input proposti dall’utente sotto forma di indicazioni testuali
- MID JOURNEY: è uno dei più popolari bot di Discord. Anche questo, genera delle immagini partendo da descrizioni testuali, ma presenta delle funzionalità legate all’ecosistema Discord
- STABLE DIFFUSION: lanciato nel 2022, è un ulteriore strumento di analisi generativa in grado di realizzare immagini sempre sulla base di istruzioni testuali.
Oltre a strumenti come questi, è possibile anche approfittare degli ultimi aggiornamenti proposti da tools di progettazione grafica come il noto
Canva. Chiaramente, la qualità dell’immagine generata dall’AI sarà direttamente proporzionale alla
qualità del prompt, ovvero della descrizione fornita.
In conclusione, sebbene le GAN presentino dei rischi evidenti - come quello di incappare in fake news o di non riconoscere il diritto di proprietà di un’opera ad un artista - sono comunque dei potenti ed innovativi strumenti che possono
incentivare la creazione artistica e offrire nuovi e costanti spunti creativi ai designers, marketers e qualsiasi utente del Web interessato ad esplorare il campo della creazione di immagini grazie alle reti GAN.
Ai posteri l'ardua sentenza.