HomeBlockchainReddit data DAO e tutto ciò che c'è da sapere sull'addestramento del...

Reddit data DAO e tutto ciò che c’è da sapere sull’addestramento del modello di Gen AI

Il Cryptonomist ha intervistato Anna Kazlauskas, CEO e Co-fondatrice di Vana’s, che Reddit Data DAO, che nella prima settimana ha visto 140k utenti iscriversi con account Reddit verificati. Anna ora sta lavorando con gli sviluppatori per costruire Data DAO per altre piattaforme, come LinkedIn e ChatGPT. 

Oltre ai DAO, hanno altri sbocchi per gli utenti per raggruppare i loro dati in dataset che possono poi essere utilizzati per l’addestramento di modelli GenAI, come la creazione di ritratti o avatar.

Oltre a ciò che Vana sta facendo, con Anna abbiamo parlato della crescita dello spazio AI decentralizzato, poiché le piattaforme aiutano le persone a utilizzare e monetizzare i loro dati per nuove applicazioni. 

Summary

Puoi fornire una panoramica di Vana e della sua missione nello spazio AI decentralizzato?

Vana è una piattaforma AI di proprietà degli utenti alimentata da dati di proprietà degli utenti. La nostra missione è che gli utenti possiedano i loro dati e il valore che essi creano attraverso modelli AI. C’è un crescente bisogno di più dati di addestramento per migliorare le prestazioni dei modelli AI, poiché in definitiva i modelli AI sono validi solo quanto i loro dati. 

Ad esempio, LLaMA 3 è addestrato su circa 15 trilioni di parole, che è approssimativamente la quantità di dati disponibili su internet pubblico. Le aziende stanno ora cercando di acquisire più dati, a volte pagando centinaia di milioni di dollari per ottenerli. Le principali piattaforme tecnologiche stanno accumulando preziosi dati degli utenti e costruendo nuove tecnologie senza considerare i permessi degli utenti, il che sta frenando l’innovazione. 

Da Vana, stiamo liberando i dati da questi giardini recintati mettendoli sotto il controllo degli utenti. Permettiamo agli utenti di contribuire direttamente ai modelli di AI, scegliere come vengono utilizzati i loro dati e come viene utilizzata l’AI. Crediamo di poter effettivamente superare i modelli leader se possiamo accedere ai dati migliori, superando le prestazioni di modelli come GPT-6 accedendo ai dati disponibili solo direttamente dagli utenti. Vana è architettata come una blockchain di livello 1 progettata da zero per dati privati e di proprietà degli utenti. 

Il Reddit Data DAO ha visto 140k utenti iscriversi nella sua prima settimana. Cosa pensi abbia guidato questa rapida adozione e quali lezioni hai imparato da questo lancio?

Il Reddit Data DAO è stato un incredibile successo dal punto di vista dell’adozione, con oltre 140k utenti che si sono iscritti nella prima settimana. Questo livello di adozione è insolito per i DAOs–è ora il più grande data DAO nella storia. 

Una delle cose che ha guidato l’adozione rapida è che gran parte della storia era già stata delineata, poiché gli utenti stanno diventando sempre più consapevoli del valore dei loro dati attraverso la copertura mediatica delle vendite di dati. Renderti conto che Reddit sta vendendo i tuoi dati per $200M o che Apple sta acquistando dati per $50M ti rende molto più consapevole del loro valore. 

C’è anche un forte appetito per i prodotti di proprietà degli utenti costruiti in web3 che vanno oltre i familiari prodotti DeFi verso una nuova frontiera della proprietà. Stiamo vedendo questa tendenza in progetti come Farcaster, reti DePIN e data DAOs costruiti su Vana, che rappresentano una nuova ondata di prodotti di proprietà degli utenti.

Una lezione importante è stata la necessità di requisiti di prova di contributo. Oltre un milione di persone hanno cercato di unirsi al Reddit Data DAO, ma molti non soddisfacevano i criteri di avere un account Reddit che esistesse da un certo tempo e avesse una quantità minima di dati. Questo evidenzia l’importanza di avere meccanismi per garantire contributi di qualità.

Hai menzionato piani per creare Data DAOs per piattaforme come LinkedIn e Chat GPT. Quali sfide e opportunità uniche vedi nell’espanderti su queste piattaforme?

Vana è una rete peer to peer per dati di proprietà degli utenti, e i costruttori hanno creato vari data DAO come il Reddit Data DAO, LinkedIn Data DAO e ChatGPT Data DAO. 

Queste diverse fonti di dati sono incredibilmente preziose per l’addestramento dei modelli di AI, ma attualmente sono bloccate in giardini recintati. Ognuna di queste piattaforme può essere difficile da cui estrarre dati, ma è sempre possibile a causa della regolamentazione dei dati.

Come Vana consente agli utenti di monetizzare i loro dati e quali sono alcuni esempi di come gli utenti hanno beneficiato di questo?

Il nostro obiettivo è aiutare gli utenti a monetizzare e proteggere i loro dati simultaneamente. Ad esempio, con il Reddit Data DAO, stanno ora addestrando un modello di proprietà degli utenti (principalmente focalizzato sul shitposting in questa fase, ma è un inizio). Gli utenti vengono pagati ogni volta che il modello viene utilizzato, creando un incentivo economico per la proprietà congiunta del modello. 

E i dati dell’utente rimangono completamente privati – piuttosto che vendere i dati, i dati vengono semplicemente “affittati” dove i dati sottostanti non lasciano mai l’ambiente sicuro. 

Con la crescente preoccupazione per la privacy dei dati, come garantisce Vana che i dati degli utenti siano sicuri e utilizzati eticamente all’interno dei Data DAOs?

La privacy dei dati è passata dall’essere solo una questione ideologica o di preferenza a una questione economica. Se qualcuno ha i tuoi dati, può potenzialmente creare una versione AI di te che è economicamente preziosa, generando entrate e potenzialmente competendo con te. Ecco perché la privacy è così importante e centrale per Vana. 

Abbiamo inventato un concetto chiamato “dati non-custodial”, che è simile a un portafoglio non-custodial ma per i tuoi dati personali. Mantiene i tuoi dati sotto il tuo pieno controllo, autorizzati dalla tua chiave privata. Questo permette ai tuoi dati di essere portabili tra le applicazioni e aggiunge uno strato finanziario nativo sopra, permettendo la costruzione di cose come i dati DAOs.

Come i dataset creati attraverso i Data DAO di Vana migliorano l’addestramento dei modelli di AI generativa e quali vantaggi offrono rispetto ai dataset tradizionali?

Tipicamente, i modelli di AI vengono addestrati con dati estratti da internet pubblico – dati disponibili senza dover effettuare il login da nessuna parte. Ma se ci pensi dal punto di vista di insegnare a un bambino sul mondo, non vorresti che vagasse casualmente su internet pubblico. Vorresti dargli informazioni di alta qualità che potrebbero non essere disponibili pubblicamente – cose come scrittura di alta qualità, processi di pensiero o messaggi. L’AI è principalmente addestrata su dati pubblici, ma ha davvero bisogno di dati privati per spingere le frontiere. Questo è ciò che i data DAOs abilitano: utenti che contribuiscono con i loro dati privati per creare AI di proprietà degli utenti. 

Crediamo che l’IA debba essere creata più come software open source, da una comunità. Il nostro obiettivo è dare ai ricercatori accesso ai migliori dataset che sono attualmente tenuti prigionieri all’interno di giardini recintati per spingere i confini delle prestazioni dell’IA.

Quali tendenze prevedi nello spazio dell’IA decentralizzata nei prossimi 5-10 anni e come si sta posizionando Vana per guidare in questo panorama in evoluzione?

Lo spazio AI decentralizzato ha davvero accelerato nell’ultimo anno. Ad esempio, all’EthCC di quest’anno, c’era un evento AI decentralizzato quasi ogni giorno, rispetto a nessuno l’anno scorso. Le persone stanno capendo come applicare le tecnologie sovrane che hanno funzionato bene per la finanza allo spazio AI. A Vana, crediamo che la base fondamentale di tutto questo sia i dati. Per costruire AI di proprietà degli utenti e AI sovrana, hai bisogno di dati di proprietà degli utenti, quindi il nostro obiettivo è su quel pezzo di dati.

Nei prossimi 5-10 anni, sono entusiasta di alcuni traguardi: 1) Un modello di fondazione di proprietà degli utenti collettivamente posseduto da 100 milioni di persone. 2) Più agenti AI autonomi che possono guadagnare autonomamente, e garantire che quegli agenti siano veramente di proprietà degli utenti che hanno contribuito al loro addestramento. 

Man mano che l’IA assume un ruolo economico sempre più importante, è fondamentale garantire che il potere sia ampiamente distribuito sia da una prospettiva tecnica che sociale. 

Puoi condividere di più sulla tua collaborazione con gli sviluppatori per costruire Data DAOs? Quali sono alcuni dei progetti innovativi attualmente in cantiere?

Vana è una rete senza permessi, quindi chiunque può costruire un data DAO. È una blockchain layer one progettata da zero per dati privati e di proprietà dell’utente. Ci sono oltre 100 data DAO distribuiti sulla testnet Satori oggi. Molti dei costruttori sono partecipanti iniziali nell’ecosistema Bittensor che comprendono profondamente l’intersezione tra crypto e AI. Alcuni progetti notevoli includono il Twitter Data DAO, LinkedIn Data DAO e GitHub Data DAO. Stiamo anche collaborando con progetti nello spazio ZK e nello spazio degli strumenti DAO per rendere i data DAO ancora più facili da creare e gestire.

Quali considerazioni etiche sono più urgenti nello sviluppo dell’AI decentralizzata, e come affronta Vana queste questioni?

Penso che una delle domande più grandi nell’IA oggi sia chi dovrebbe possedere i modelli e decidere quali dati vi entrano. Man mano che iniziamo a fare sempre più affidamento sull’IA per le informazioni, diventano la nostra fonte di verità. Chiunque decida cosa entra nell’IA sta essenzialmente decidendo la verità. È spaventoso avere un’unica entità che controlla questo. La nostra visione in Vana è che la comunità, non una singola azienda, dovrebbe prendere queste decisioni.

Un’altra domanda che sorge nell’AI decentralizzata è: se l’AI è completamente decentralizzata, cosa succede se l’AI diventa ribelle e non c’è un pulsante di spegnimento? Il modo in cui affrontiamo questo problema a Vana è che i modelli di AI sono in definitiva di proprietà degli utenti che vi hanno contribuito, quindi rimangono sempre sotto il loro pieno controllo. 

Quali consigli daresti agli aspiranti imprenditori che desiderano entrare nello spazio dell’IA decentralizzata, basandoti sulle tue esperienze con Vana e Data DAOs?

È un ottimo momento per iniziare a costruire nello spazio dell’IA decentralizzata. Ci sono molte opportunità per applicare alcuni dei primitivi economici crypto che hanno funzionato bene per DeFi alla nuova categoria emergente di dati e IA decentralizzati. Consiglierei anche di dedicare del tempo ad approfondire lo spazio dell’IA open source non crypto per conoscere alcuni degli approcci che le persone stanno adottando al di fuori di un contesto crypto. Mi immergerei direttamente in alcuni dei progetti esistenti per vedere quali tipi di primitivi sono disponibili per costruire, incluso provare a iniziare un data DAO su Vana. 

Amelia Tomasicchiohttps://cryptonomist.ch
Esperta di digital marketing, Amelia inizia a lavorare nel settore fintech nel 2014 dopo aver scritto la sua tesi di laurea sulla tecnologia Bitcoin. Precedentemente è stata un'autrice di diversi magazine crypto all'estero e CMO di Eidoo. Oggi è co-founder di Cryptonomist, e di Econique.art. E' stata nominata una delle 30 under 30 secondo Forbes. Amelia è stata anche insegnante di marketing presso Digital Coach e ha pubblicato un libro "NFT: la guida completa'" edito Mondadori. Inoltre è co-founder del progetto NFT chiamato The NFT Magazine, oltre ad aiutare artisti e aziende ad entrare nel settore. Come advisor, Amelia è anche coinvolta in progetti sul metaverso come The Nemesis e OVER.
RELATED ARTICLES

Stay updated on all the news about cryptocurrencies and the entire world of blockchain.

Featured video

LATEST