Negli ultimi giorni sono uscite alcune news importanti riguardanti l’AI, ed in particolare i modelli generativi.
I modelli generativi basati su AI sono utilizzati soprattutto per immagini, oltre che per video e testi, e stanno diventando sempre più realistici.
Summary
Modelli generativi AI più potenti: le ultime news
Un’importante notizia a riguardo è quella di Stability AI, che ha annunciato il rilascio di Stable Diffusion 3.5, modello di generazione di immagini AI open source.
Si tratta di una versione aperta che include molteplici varianti altamente personalizzabili in base alle loro dimensioni, eseguibili su hardware consumer e gratuite per uso sia commerciale che non commerciale, secondo la licenza permissiva Stability AI Community License.
Si possono scaricare Stable Diffusion 3.5 Large e Stable Diffusion 3.5 Large Turbo da Hugging Face, compreso il codice su GitHub. Stable Diffusion 3.5 Medium invece verrà rilasciato il 29 ottobre.
Stable Diffusion 3.5
Stable Diffusion 3.5 è il modello generativo AI più potente finora creato da Stability AI.
A giugno avevano rilasciato Stable Diffusion 3 Medium, la prima release aperta della serie Stable Diffusion 3, che però non aveva pienamente soddisfatto le aspettative della community.
Così, dopo aver ascoltato il feedback della community stessa, Stability AI ha sviluppato una nuova versione per portare in avanti la loro missione di trasformare i media visivi.
Stable Diffusion 3.5 vuole fornire ai creator strumenti ampiamente accessibili, all’avanguardia e gratuiti per la maggior parte dei casi d’uso, ed offre una varietà di modelli sviluppati per soddisfare le esigenze di ricercatori scientifici, hobbisti, startup e aziende.
Questa versione è uno dei modelli generativi di immagini basati su AI più personalizzabili ed accessibili sul mercato, con tuttavia al contempo prestazioni di alto livello in termini di pronta aderenza e qualità dell’immagine.
News AI e aggiornamenti nel campo dei modelli generativi: la gestione autonoma del mouse e della tastiera
Ma c’è anche dell’altro.
Anthropic ha annunciato il lancio di una nuova versione beta del suo modello basato su AI, Claude, che consentirà agli sviluppatori che lavorano con l’API di assumere addirittura il controllo del cursore del mouse, per cliccare su pulsanti e campi ed inserire testo in modo autonomo.
Questo aggiornamento consente di fatto agli sviluppatori di indicare a Claude di usare i computer come fanno le persone, ovvero guardando uno schermo, muovendo un cursore, cliccando sui pulsanti e digitando del testo. Secondo Anthropic, Claude 3.5 Sonnet è il primo modello AI ad offrire l’uso del computer nella beta pubblica, anche se in questa fase è ancora sperimentale tanto da risultare a volte macchinoso e soggetto ad errori.
Stanno già sperimentando questa nuova funzionalità Asana, Canva, Cognition, DoorDash, Replit e The Browser Company.
L’aggiornamento di Claude 3.5 Sonnet è disponibile per tutti gli utenti.
Notizie negative
Non vi sono però solamente notizie positive riguardo lo sviluppo dei modelli generativi AI.
Ad esempio Penguin Random House (PRH) ha introdotto una nuova dichiarazione nelle pagine del copyright, sia dei libri nuovi che di quelli ristampati, in cui si afferma che nessuna parte dei suoi libri può essere utilizzata o riprodotta in alcun modo allo scopo di addestrare tecnologie o sistemi di intelligenza artificiale.
PRH è il più grande editore commerciale al mondo, e quindi potrebbe fare scuola da questo punto di vista.
La dichiarazione cita una direttiva del Parlamento Europeo, e mira a vietare l’uso dei suoi testi alle aziende di intelligenza artificiale per lo sviluppo di chatbot ed altri strumenti digitali.
D’altronde negli USA sono già emersi diversi casi di violazione del copyright in tal senso, tanto che molti libri sono già stati utilizzati senza autorizzazione per addestrare strumenti di intelligenza artificiale.
PRH è il primo tra i Big Five degli editori commerciali anglofoni a modificare le proprie informazioni sul copyright per tali scopi.
Accelerazioni e frenate
Come accade praticamente sempre, un nuovo settore in rapida espansione produce forti accelerate e grandi frenate.
Il problema in questi casi è che le accelerate potrebbero portarlo molto in avanti, tanto che le frenate potrebbe solo rallentare l’accelerazione senza riuscire a fermarla.
Tuttavia non è tutto oro ciò che luccica, ed in tutte le evoluzioni c’è sempre anche una componente di distruzione.
In questo caso il rischio è quello di distruggere il modello di business di alcuni tra coloro che producono informazione, e di farlo ricorrendo di fatto al furto della proprietà intellettuale.
Non è nemmeno detto che i legislatori siano in grado di star dietro a queste rapide evoluzioni, pertanto potrebbe occorrere un po’ di tempo prima che tutte le questioni più delicate vengano prese in esame, e magari risolte.
Ciò che è chiaro però è che non si tratta solamente di una moda, o di un fuoco di paglia, ma di uno di quei grandi balzi in avanti che ha portato la società umana a dominare incontrastata questo mondo.