GenBank
Database di sequenze nucleotidiche e delle loro traduzioni amminoacidiche, conservato presso il National Center for Biotechnology Information statunitense. Istituito nel 1982, GenBank ora fa parte della International Nucleotide Sequence Database Collaboration, insieme alla DNA DataBank of Japan e allo European Molecular Biology Laboratory. I tre istituti si scambiano quotidianamente i dati disponibili, che vengono inviati direttamente dai gruppi di ricerca. I dati, dopo gli appositi controlli, vengono pubblicati e sono liberamente accessibili tramite le diverse interfacce informatiche delle tre banche dati. L’annotazione di ogni sequenza è standardizzata e comprende un numero di indicizzazione, la sequenza completa di nucleotidi, l’organismo di appartenenza, i nomi dei ricercatori coinvolti nel sequenziamento, e tutte le informazioni necessarie per la localizzazione della sequenza all’interno del genoma. Nel giugno 2008, il database comprendeva oltre 92 miliardi di basi provenienti da più di 88 milioni di sequenze.