Gene ontology project
Progetto nato nel 1998 dalla collaborazione tra gli archivi elettronici dedicati alla conservazione dei dati genomici di vari organismi, con lo scopo di sviluppare una descrizione coerente dei geni e dei loro prodotti fra i diversi archivi. Inizialmente, al progetto Gene ontology (GO) hanno partecipato gli archivi dedicati a tre importanti organismi modello per la ricerca biologica: il moscerino della frutta Drosophila (Flybase, http://flybase.bio.indiana.edu/), il lievito (Saccharomyces genome database, http://www.yeastgenome.org/) e il topo (Mouse genome database, http://www.informatics.jax. org/). In seguito, al consorzio GO hanno aderito tutti i maggiori centri per la conservazione e la divulgazione di dati genomici. Il progetto ha sviluppato tre vocabolari strutturati e controllati (ontologie), organizzati gerarchicamente in una struttura ad albero, relativi ai processi biologici, ai componenti cellulari e alle funzioni molecolari. Un prodotto genico può essere associato o localizzato in uno o più componenti cellulari, essere attivo in uno o più processi biologici, nel corso dei quali esegue una o più funzioni molecolari. Per es., il prodotto del gene MYC è associato per funzioni molecolari alle locuzioni ‘fattore di trascrizione’ e ‘interazione con proteine’; per processo biologico alle locuzioni ‘regolazione positiva della proliferazione cellulare’ e ‘regolazione della trascrizione dai promotori della RNA polimerasi II’ e, infine, per componente cellulare al termine ‘nucleo’. Inoltre, dato che i vocabolari sono strutturati gerarchicamente, l’annotazione di un gene o di un prodotto genico può essere specificata a differenti livelli, in funzione dell’accuratezza e dell’approfondimento delle conoscenze che di esso sono disponibili. La base di dati del consorzio ospita sia le tre ontologie sia le annotazioni dei geni e dei loro prodotti fatte in accordo alla terminologia GO. In tal modo è possibile compiere ricerche complesse sulle annotazioni usando le ontologie. Utilizzando una interfaccia apposita (amiGO, http://www.geneontology.org/) è possibile sfogliare e interrogare l’archivio. La diffusione dell’uso dei termini GO da parte degli archivi genomici che partecipano al progetto permette una maggiore uniformità del linguaggio di interrogazione facilitando le ricerche trasversali. Data la struttura ad albero dei vocabolari GO, le interrogazioni possono raggiungere differenti livelli; per es., è possibile ricercare tutti i prodotti genici del topo implicati nella trasduzione del segnale, oppure richiedere solo quelli che siano recettori dotati di attività tirosina chinasica.