StartNews

DeepMind: l’intelligenza artificiale che svela i segreti delle proteine

DeepMind: l’intelligenza artificiale che svela i segreti delle proteine

Le proteine sono dei macromolecole formate da una catena di unità più piccole chiamate amminoacidi. Gli amminoacidi sono solo 20, ma si possono combinare in sequenze diverse per formare milioni di proteine diverse. Ogni proteina ha una funzione specifica nel nostro organismo: per esempio, ci sono proteine che trasportano l’ossigeno nel sangue, proteine che difendono il corpo dalle infezioni, proteine che regolano il metabolismo, proteine che permettono il movimento dei muscoli e così via.

Ma come fa una proteina a svolgere la sua funzione? La risposta sta nella sua forma tridimensionale. Infatti, gli amminoacidi non si dispongono in modo lineare, ma si piegano e si avvolgono nello spazio secondo delle regole chimiche e fisiche. Questo processo si chiama ripiegamento o folding e determina la struttura tridimensionale della proteina. La struttura tridimensionale è fondamentale perché permette alla proteina di interagire con altre molecole e di svolgere la sua attività.

CASTELlaccio ani2

Tuttavia, non è facile conoscere la struttura tridimensionale di una proteina a partire dalla sua sequenza di amminoacidi. Finora, gli scienziati hanno usato dei metodi sperimentali, come la cristallografia a raggi X o la risonanza magnetica nucleare, per determinare la forma delle proteine. Questi metodi sono però complessi, costosi e richiedono molto tempo. Inoltre, non sempre funzionano per tutte le proteine.

Per questo motivo, da anni gli scienziati cercano di sviluppare dei metodi computazionali, basati su algoritmi matematici e modelli statistici, per prevedere la struttura tridimensionale delle proteine a partire dalla loro sequenza. Questo campo di ricerca si chiama predizione della struttura delle proteine e rappresenta una delle sfide più grandi e importanti della biologia.

E qui entra in gioco DeepMind, una società di intelligenza artificiale fondata nel 2010 e acquisita da Google nel 2014. DeepMind è nota per aver creato dei programmi di intelligenza artificiale che hanno battuto i campioni umani in giochi complessi come gli scacchi, il Go e il poker. Ma DeepMind non si occupa solo di giochi: ha anche applicato la sua intelligenza artificiale a problemi scientifici e sociali, come il risparmio energetico, la diagnosi medica e appunto la predizione della struttura delle proteine.

Il programma di DeepMind che si occupa di questo problema si chiama AlphaFold e usa una tecnica chiamata deep learning o apprendimento profondo. Si tratta di un metodo basato su reti neurali artificiali, ovvero dei sistemi informatici ispirati al funzionamento del cervello umano, che sono in grado di apprendere da grandi quantità di dati e di migliorare le proprie prestazioni con l’esperienza.

AlphaFold è stato presentato per la prima volta nel 2018 in occasione della competizione CASP (Critical Assessment of protein Structure Prediction), una sorta di olimpiade mondiale della predizione della struttura delle proteine che si tiene ogni due anni. In questa competizione, i partecipanti devono prevedere la struttura tridimensionale di alcune proteine sconosciute a partire dalla loro sequenza e confrontare le loro previsioni con le misure sperimentali. AlphaFold si è classificato al primo posto, superando di gran lunga gli altri metodi.

Ma la vera rivoluzione è avvenuta nel 2020, quando DeepMind ha presentato la seconda versione di AlphaFold, ancora più potente e accurata. Questa volta, AlphaFold ha raggiunto un livello di precisione paragonabile a quello dei metodi sperimentali, riuscendo a prevedere la struttura tridimensionale di quasi tutte le proteine proposte dalla competizione CASP. Questo risultato è stato definito come una pietra miliare nella storia della biologia e ha suscitato grande entusiasmo nella comunità scientifica.

Ma DeepMind non si è fermata qui: nel luglio 2021 ha annunciato di aver creato una mappa tridimensionale di oltre 350 mila proteine appartenenti a 20 organismi diversi, tra cui animali come il topo e la mosca della frutta, e batteri come l’E. coli. Queste proteine coprono tutto il proteoma umano, ovvero l’insieme di tutte le proteine espresse dalle cellule umane. Inoltre, DeepMind ha reso disponibili gratuitamente queste previsioni alla comunità scientifica, grazie a una collaborazione con l’Istituto europeo di bioinformatica (EMBL-EBI).

Ma perché questa mappa è così importante? Perché ci permette di avere una visione globale e dettagliata delle proteine che costituiscono la vita e di capire meglio come funzionano e come interagiscono tra loro. Questo può avere delle implicazioni enormi per la scienza e la salute, perché ci può aiutare a scoprire nuovi meccanismi biologici, a identificare le cause di molte malattie, a sviluppare nuovi farmaci e vaccini, a progettare nuove proteine artificiali con funzioni utili per l’umanità.

Insomma, grazie all’intelligenza artificiale di DeepMind, si apre una nuova era nella biologia strutturale e nella proteomica, la scienza che studia il proteoma. E questo è solo l’inizio: DeepMind ha infatti annunciato che continuerà ad aggiornare e migliorare il suo database di proteine, fino a coprire tutte le proteine note alla scienza, che sono circa 100 milioni. Un obiettivo ambizioso ma non impossibile per questa intelligenza artificiale che sembra non avere limiti.

Luigi Schiavo per StartNews

CASTELlaccio ani2

Utilizziamo i cookie per essere sicuri che tu possa avere la migliore esperienza sul nostro sito. Se continui ad utilizzare questo sito noi assumiamo che tu ne sia felice. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi