Il settore dell’intelligenza artificiale ha un problema che pochi ammettono apertamente: non è la potenza di calcolo a mancare, ma i dati. E quei dati costano. OpenAI spende tra 60 e 100 milioni di dollari all’anno solo per accedere ai contenuti di piattaforme come Reddit e Twitter tramite API. Per le startup senza budget miliardari, quel cancello è sbarrato. È in questo vuoto che si è inserita Perceptron, una piattaforma di infrastruttura dati decentralizzata che trasforma la larghezza di banda inattiva degli utenti comuni in materia prima per i modelli AI.
Summary
Punti chiave
- Perceptron raccoglie dati web pubblicamente accessibili sfruttando la banda inutilizzata di dispositivi consumer, aggirando legalmente i costosi paywall delle API aziendali.
- La rete conta circa 800.000 nodi attivi in oltre 150 paesi, alimentati da utenti che installano un’estensione browser o un’app Android.
- I dati raccolti vengono verificati da modelli AI centralizzati prima di essere consegnati ai clienti enterprise.
- Perceptron ha lanciato un AI Data Fund da 10 milioni di dollari per supportare sviluppatori AI indipendenti con infrastruttura e fino a 5 TB di dati gratuiti.
- I contributori della rete guadagnano punti convertibili in token crypto nativi, creando un incentivo economico condiviso.
Il collo di bottiglia che frena l’AI indipendente
La narrazione dominante sull’AI parla di chip, modelli fondativi e capacità computazionale. Ma c’è un vincolo strutturale che resta sistematicamente sottovalutato: la qualità e l’accessibilità dei dati di training. Senza dataset aggiornati e diversificati, anche il modello più sofisticato diventa inutile.
Come ha spiegato a crypto.news Peter Anthony, Co-Founder e CEO di Perceptron: “Se costruisci il miglior modello del mondo, è praticamente inutile se non ha accesso a dati di qualità. Puoi essere il ragazzo più intelligente della classe, ma se non riesci ad accedere ai libri, non hai molte informazioni da presentare.”
Il problema si è aggravato negli ultimi anni. La maggior parte dei contenuti open-web è già stata raccolta ed elaborata. Il resto è protetto da API commerciali che le grandi piattaforme hanno progressivamente trasformato in business a sé stanti. Per chi non può permettersi quei contratti multimilionari, il mercato dei dati di training è di fatto un oligopolio.
Anthony descrive questa asimmetria come un’opportunità di mercato: “C’è molta data nascosta in posti non ancora accessibili. Stiamo raccogliendo e posizionando Perceptron per fornire dati alle aziende AI a costi ridotti.”
Come funziona la raccolta dati decentralizzata di Perceptron
Il meccanismo alla base della piattaforma è più semplice di quanto sembri. Ogni utente che installa un’estensione Chrome o un’app Android diventa un nodo della rete. Quando il dispositivo è inattivo, la piattaforma utilizza quella connessione per navigare pagine web pubblicamente accessibili, raccogliendo frammenti di dati da diverse prospettive geografiche.
La dimensione attuale è già significativa: circa 800.000 nodi distribuiti in più di 150 paesi. Non si tratta di accesso ai file personali degli utenti o ai loro dati privati. Come ha precisato Anthony, il valore sta nella geolocalizzazione: uno stesso sito web può restituire contenuti diversi a un utente in Malawi rispetto a uno a Dubai. Aggregare queste “vantage point” crea dataset geograficamente diversificati che le API centralizzate non riescono a replicare con la stessa granularità.
Una volta raccolti, i pacchetti di dati grezzi vengono inviati a server centralizzati dove modelli AI specializzati li analizzano e verificano prima di consegnarli ai clienti. Per rafforzare ulteriormente questo processo, la startup ha acquisito una società specializzata in software di verifica di transazioni e pagamenti, adattandola all’automazione della validazione dei dataset.
L’aspetto legale: aggirare le API senza violarle
Il nodo più delicato della proposta è quello normativo. Perceptron sostiene di operare entro i confini della legalità perché raccoglie esclusivamente dati già pubblicamente accessibili tramite qualsiasi browser standard. Instradare la raccolta attraverso nodi individuali permette di aggirare legalmente i paywall commerciali, senza interfacciarsi con le API enterprise che le piattaforme cercano di monetizzare.
Questo approccio è già operativo: la rete fornisce dataset di immagini a piattaforme generative text-to-video, tra cui Everlyn AI, e ha avviato attività di sentiment analysis tracciando il discorso pubblico su Twitter, YouTube e nei mercati degli asset digitali. Questi ultimi servizi vengono utilizzati da exchange e società crypto per costruire strumenti di analisi capaci di anticipare movimenti di prezzo improvvisi.
Il modello di incentivi: token crypto per chi contribuisce
Perché un utente dovrebbe cedere la propria banda inutilizzata? La risposta di Perceptron è economica. Ogni nodo guadagna punti proporzionali alla propria partecipazione, e questi punti sono destinati a convertirsi in token crypto nativi. Il sistema è pensato come un ciclo economico circolare: quando la piattaforma genera ricavi, i token vengono reimmessi nell’ecosistema. È prevista anche una componente di buyback.
La qualità resta però il filtro di selezione. Non tutti i nodi ricevono compensi automatici: gli algoritmi automatizzati valutano i dati raccolti rispetto a benchmark target prima di rilasciare qualsiasi ricompensa. Chi contribuisce dati di bassa qualità non viene premiato allo stesso modo.
Per stimolare ulteriormente la partecipazione attiva, Perceptron ha in programma il lancio di una piattaforma chiamata Data Questing, che permetterà ai contributori di trasformare il proprio impegno diretto nella creazione di dataset unici, non replicabili attraverso processi centralizzati.
Il fondo da 10 milioni di dollari per gli sviluppatori AI
Parallelamente all’infrastruttura tecnica, Perceptron ha lanciato l’AI Data Fund da 10 milioni di dollari, pensato specificamente per sviluppatori AI indipendenti che non possono permettersi l’accesso ai dati ai prezzi di mercato.
I team selezionati ricevono cinque settimane di assistenza dedicata all’infrastruttura dati e fino a 5 TB di dati reali gratuiti per accelerare l’ottimizzazione dei loro modelli in fase iniziale. L’obiettivo dichiarato da Anthony non è puramente filantropico: “Il nostro obiettivo è supportare i progetti mentre crescono e i loro requisiti di dati aumentano. Possiamo diventare uno dei loro fornitori di riferimento: è sia un investimento nell’ecosistema più ampio che un modo per costruire ricavi a lungo termine e stabili.”
In questo senso, il Fondo funziona da strumento di acquisizione clienti mascherato da iniziativa di supporto all’ecosistema. Una strategia che riflette l’ambizione di posizionare i dati AI Perceptron come infrastruttura critica per la prossima generazione di startup AI.
La transizione verso la business intelligence distribuita
La visione a lungo termine va oltre la semplice fornitura di dataset statici. Anthony punta a trasformare la rete in un motore di business intelligence distribuita per clienti enterprise, capace di fornire analisi in tempo reale su fenomeni dinamici come e-commerce, trading e comportamenti degli utenti digitali.
“I dataset tradizionali sono statici, vengono raccolti una volta e diventano rapidamente obsoleti”, ha spiegato Anthony. “Un singolo server che monitora tutti questi utenti non può raccogliere intelligenza significativa a quella scala. Quello di cui abbiamo bisogno è uno spostamento verso la business intelligence distribuita.”
È qui che l’architettura decentralizzata di Perceptron mostra il suo potenziale più interessante. Una rete di 800.000 nodi distribuiti in tutto il mondo non è solo uno strumento di raccolta passiva: è potenzialmente un sensore globale capace di rilevare tendenze di mercato, variazioni di sentiment e segnali deboli in tempo reale. Se la piattaforma riuscirà a compiere questa transizione, il suo modello competitivo cambierà radicalmente rispetto all’attuale posizionamento.
FAQ
Come raccoglie dati Perceptron per il training AI?
Perceptron utilizza la larghezza di banda inattiva di dispositivi consumer comuni — tramite un’estensione browser Chrome o un’app Android — per raccogliere dati web pubblicamente accessibili. I dispositivi degli utenti fungono da nodi della rete, navigando pagine pubbliche da diverse prospettive geografiche senza accedere a file o dati personali.
Come viene garantita la qualità dei dati raccolti?
I pacchetti di dati grezzi raccolti dai nodi vengono trasmessi a server centralizzati, dove modelli AI specializzati li analizzano e verificano rispetto a benchmark di qualità prima di consegnarli ai clienti. La startup ha inoltre acquisito una società specializzata in software di verifica di transazioni per automatizzare ulteriormente questo processo di validazione.
Perché i contributori partecipano alla rete Perceptron?
I contributori guadagnano punti in base alla propria partecipazione e alla qualità dei dati forniti. Questi punti sono destinati a convertirsi in token crypto nativi della piattaforma, creando un incentivo economico diretto per chi mette a disposizione la propria banda inutilizzata.
Cos’è l’AI Data Fund lanciato da Perceptron?
È un fondo da 10 milioni di dollari che supporta sviluppatori AI indipendenti con cinque settimane di assistenza dedicata all’infrastruttura dati e fino a 5 TB di dati reali gratuiti, per accelerare lo sviluppo e l’ottimizzazione di modelli AI in fase iniziale.
Contenuto realizzato con l’assistenza dell’intelligenza artificiale e con revisione editoriale umana.

