Introduzione
L' intelligenza artificiale applicata alla biologia può rivelarsi un aiuto fondamentale per i ricercatori, impegnati a scoprire proteine sconosciute in precedenza, per forma e struttura, e a progettarne persino di nuove da zero. L'implicazione dell'Intelligenza Artificiale nello sviluppo di proteine potrebbe contribuire ad una applicazione concreta nella cura di determinate patologie, accelerando la ricerca contro i tumori, ad esempio, o fornire elementi per lo sviluppo futuro di vaccini più efficienti.
Proteine digitali: cosa sono?
Le proteine digitali, lo dice la parola stessa, sono molecole prodotte da zero dall'intelligenza artificiale che già aveva contribuito alla determinazione della struttura delle proteine.
Deepmind, una succursale di Google e l'istituto EBI (European Bioinformatics Institute) hanno annunciato la realizzazione di una banca dati che contiene la previsione della struttura di 350 mila proteine, un numero sorprendente se i pensa che di queste, in oltre mezzo secolo di ricerca, ne sono la metà.
Perché è importante conoscere la forma delle proteine?
Le proteine sono fondamentali nei processi di funzionamento cellulare. Sono prodotte dall'informazione contenuta nei geni a partire da un set di 20 aminoacidi disposti in catene lineari di lunghezza differente. Ogni singolo aminoacido è caratterizzato da una parte comune che costituisce la catena lineare, e da un componente variabile dalla quale dipende la forma tridimensionale che la proteina assumerà ripiegandosi una volta prodotta all'interno della cellula.
La forma che la proteina assume è di fondamentale importanze per capire quale funzione asumerà nell'organismo, vale a dire positiva o meno per il corpo umano. Può essere infatti l'emoglobina che trasporta l'ossigeno ai tessuti o la proteina di un virus (vedi la Spike per il Covid) che muta in molteplici varianti. Basti pensare che conoscere la forma di una proteina sia cruciale nel contrastare sia quelle tossiche come quelle prodotte da un virus o da una cellula neoplastica per curare il cancro, o che causano malattie degenerative.
Proteine digitali: le tappe della ricerca
Nel 2020 la società britannica del campo dell'intelligenza artificiale "DeepMind" (di proprietà di Google), annunciò "AlphaFold 2", uno strumento di Intelligenza Artificiale che attraverso il "Deep Learning", ossia apprendimento profondo basato su reti neurali artificiali, in grado di prevedere con precisione al 90% di affidabilità la forma delle proteine. Un passo in avanti incredibile in biologia, essendo le proteine fondamentali per la vita degli esseri umani. AlphaFold oggi è in grado di prevedere le forme di tutte le proteine note all'uomo.
Applicazioni future
Come già specificato, le proteine sono implicate in quasi tutti i processi che avvengono in biologia. Sono costituite da centinaia o migliaia di amminoacidi collegati in lunghe "catene", che poi si ripiegano in forme tridimensionali. AlphaFold fornisce ai ricercatori elementi sulla struttura, la forma e il comportamento delle proteine, ProteinMPNN, invece, riuscirà a formulare la sequenza di amminoacidi che si ripiega in quella forma, utilizzando una rete neurale progettata su un numero ampio di esempi di sequenze di aminoacidi che si ripiegano in strutture tridimensionali.
Come usare questi algoritmi nella cura di malattie è ancora nell'immaginario, ma potrebbero svolgere un ruolo chiave nella comprensione di varianti di sequenze di proteine dovute a patologie come difetti congeniti o tumori, oppure per valutare la reazione ad un farmaco di un malato.