Diverse società hanno invaso a fornire strumenti di bioinformatica

Fanfara senza precedenti ha salutato i 26 giugno 2000 l'annuncio che gli scienziati avevano completato un progetto di Homo sapiens sequenza del genoma. La verità è, tuttavia, che per capire l'ordine delle lettere del nostro alfabeto genetico era la parte facile. Ora viene la parte difficile: decifrare il significato di questo articolo di istruzioni genetiche.

  

La fase successiva passa da un nome apparentemente prosaica: annotation. A rigor di termini, "annotazione" comprende tutto ciò che può essere conosciuto su un gene: se funziona, cosa fa e come interagisce con i geni simili. In questo momento, gli scienziati spesso usano il termine per indicare semplicemente il primo passo: trovare gene. Ciò significa scoprire quali parti di un tratto di DNA appartenenti ad un gene e le distinguono dalle altre 96 per cento, o che non hanno alcuna funzione conosciuta, spesso chiamato DNA spazzatura.

Diverse società hanno invaso a fornire strumenti di bioinformatica, software e servizi. Il loro successo, però, potrebbe dipendere in un luogo tranquillo a sud di Inghilterra'sUniversità di Cambridge. Essa è sede del SangerCentro, La UKpartner del consorzio finanziata con fondi pubblici Human Genome Project (HGP), e l'European Bioinformatics Institute (EBI), Europa's equivalente del NazionaleCentrofor Biotechnology Information (NCBI) presso il National Institutes of Health. Sanger e EBI stanno collaborando al progetto Ensembl, che consiste di programmi informatici per l'analisi del genoma e il database pubblico di Homo sapiens sequenze di DNA. Nuove sequenze di DNA arrivare a spizzichi e bocconi; routine di scansione automatica delle sequenze, alla ricerca di modelli si trovano tipicamente nei geni. "Una delle cose importanti su Ensembl è che siamo completamente aperti, in modo da poter vedere tutti i nostri dati, assolutamente tutto", dice EBI di Ewan Birney.

Non importa quanto talento la loro algoritmi, tuttavia, i computer non può accedere a tutti i geni, e non possono farli tutti i diritti. Molti aggiunte e correzioni, oltre a tutte le informazioni importanti su come i geni sono regolamentati e ciò che fanno, sono compiti di Homo sapiens curatori. Che problema può essere risolto per Ensembl da un sistema di calcolo distribuito in fase di sviluppo da Lincoln Stein del Cold Spring Harbor Laboratory di Long Island, NY Il piano è quello di fornire annotationcorrections Homo sapiens e suggerimenti e risultati di ricerca di scienziati di tutto il worldlayered sulla cima di annotazione automatica Ensembl's. Stein Distributed Sequence Annotation System, DAS per il breve, prende in prestito un approccio da Napster, il software controversa che permette alle persone di scambiare file musicali su Internet.

Il piano è che diversi laboratori pubblicheranno i loro annotazioni (su server dedicati), secondo le specifiche di alcuni Mappa comunemente accettati della genomelike Ensembl's. "Allora la domanda browser sarà in grado di uscire sul Web, scoprire cosa c'è e portare il tutto in una visione integrata in modo che si poteva vedere in una veste grafica che diverse persone avevano da dire su una regione del genoma," stein, spiega. In questo modo DAS può risolvere un enorme problema che affligge i database di biologia: la mancanza di un formato standard per l'archiviazione e presentazione dei dati, che, tra altri svantaggi, rende impossibile per cercare e confrontare tra loro contenuto.

Il modello DAS non è universalmente amato. NCBI regista David Lipman è preoccupato del fatto che l'Homo sapiens annotazioni possono essere pieno di spazzatura, perché non saranno peer-reviewed. Stein riconosce la possibilità, ma si augura che l'annotazione di buona volontà scacciare cattivi. Egli è più preoccupato se lo spirito del volontariato sarà bandiera di fronte con il personale cambiamenti e le stravaganze dei finanziamenti. Mantenere un laboratorio di server Web in esecuzione e up-to-data è un impegno a lungo termine.

In contrasto con la rivalità ben pubblicizzato tra la HGP e la proprietà privata Celera Genomics nel sequenziamento del genoma, le imprese bioinformatica molti non considerano Ensembl come organizzazione di battere. In realtà, molti operatori commerciali approvare la collaborazione, opportunità finanziarie provengono da utilizzare i dati in modo unico. James Garrels I., presidente della Proteome in Beverly, Mass., Prevede di collaborare con e fornire un aiuto al pubblico gli sforzi di dominio ad accumulare una descrizione di base di ogni gene, le sue proteine e alcune delle caratteristiche chiave della proteina. Proteome ma ritiene anche che niente batte il vasto e versatile Homo sapiens cervello per dare un senso di grande e versatile Homo sapiens genoma. I ricercatori dell'azienda setacciare la letteratura, concentrandosi sui prodotti proteinsthe geni più makeand a partire dal 1995 hanno costruito i database di proteine su tre organismi modello: ascaridi Caenorhabditis elegans e due specie di lievito. Ora si stanno aggiungendo i dati sul Homo sapiens, topo e ratto genomi. Nicchia della società sarà integrare tutte le informazioni. "Questo non è il tipo di sforzo contemplato nel pubblico dominio," Garrels sottolinea.

Forza Proteome è probabile che si trovi nella capacità dei suoi clienti 'di confrontare le sequenze tra le specie. Perché l'evoluzione ha conservato un gran numero di geni e li usavano più e più volte, tale confronto non è una ricca fonte di suggerimenti: un gene Homo sapiens, il cui compito è attualmente un mistero sarà spesso quasi identico a quello presente in altre specie.

Randy Scott, presidente della Incyte Genomics in Palo Alto, California, È un altro fan della ripartizione del carico. Inoltre, "c'è un sacco di modi per fare soldi", dichiara Scott. "Non ci assumiamo ci sono in corso database per essere ampiamente commentato disponibili nel pubblico dominio, e prima potremo arrivarci, Incyte il più veloce possibile concentrarsi sulla valle, sul nostro modo di prendere le informazioni per creare nuovi livelli di informazioni." Ad esempio, l'azienda ha scelto un gruppo di geni che si ritiene sarà importante per la diagnostica e le altre applicazioni e concentra i suoi sforzi di annotazione su di loro. Ma ha anche basi di dati che permettono di alcuni raffronti tra le specie.

Data Ensembl di codice open-source, distribuito l'annotazione e la determinazione a rimanere liberi, di paragoni per il systemwhich operativo libero Linux computer potrebbe un giorno sfida naturale supremacyare di Microsoft Windows. Ma il parallelo non va molto lontano. Pensare di prodotti di annotazione pubbliche e commerciali, come i rivali non coglie il punto, dicono gli osservatori. Nelle parole di Sean di Eddy WashingtonUniversità, Che sta lavorando su DAS: "Il genoma di Homo sapiens è troppo grande per chiunque a guardare da sola. Stiamo andando ad avere per capire le modalità per il settore pubblico e privato per lavorare in modo collaborativo e non competitivo ".

un articolo presentato dalla Donis F.


Disclaimer:Il nostro sito non è responsabile per il contenuto di questo articolo. Webarticles è una risorsa gratuita di informazioni.
Importante: Questo articolo "Diverse società hanno invaso a fornire strumenti di bioinformatica" è stato tradotto da un software automatico. Ci dispiace per eventuali errori di ortografia che possono essersi verificati. Grazie per la vostra comprensione.


Online: 247 users browsing the articles directory