A humán és egér referencia genomokat a Genome Reference Consortium (GRC), egy kevesebb mint 20 tudósból álló csoport tartja fenn és fejleszti, amely számos genomkutató intézetből, többek között az Európai Bioinformatikai Intézetből, a Nemzeti Biotechnológiai Információs Központból, a Sanger Intézetből és a St. Louis-i Washington Egyetem McDonnell Genom Intézetéből áll. A GRC folytatja a referencia genomok javítását azáltal, hogy új, kevesebb hézagot tartalmazó illesztéseket készít, és kijavítja a szekvenciában lévő hibás ábrázolásokat.
Emberi referencia genomSzerkesztés
A Genome Reference Consortium 2013. december 17-én adta ki a GRCh38 emberi referencia genomot. Ez a build körülbelül 250 hiányosságot tartalmazott, míg az első verzió nagyjából 150 000 hiányosságot tartalmazott. A GRCh38 assemblyben több mint 100 hézagot zártak be vagy csökkentettek. A Nanopore szekvenálással 12 hézagot sikerült bezárni a GRCh38 referencia-összeállításban az ultrahosszú leolvasások alkalmazásával.
A humán referencia-genom tizenhárom névtelen önkéntesből származik a New York állambeli Buffalóból. Az adományozókat a The Buffalo News-ban 1997. március 23-án, vasárnap megjelent hirdetéssel toborozták. Az első tíz férfi és tíz női önkéntest meghívták, hogy egyeztessenek időpontot a projekt genetikai tanácsadóival, és adjanak vért, amelyből DNS-t vettek ki. A DNS-minták feldolgozásának módjából adódóan a referencia genom mintegy 80 százaléka nyolc embertől származik, és egy férfi, akit RP11-nek neveztek el, a teljes genom 66 százalékát adja. Az ABO vércsoportrendszer különbözik az emberek között, de az emberi referenciagenom csak egy O allélt tartalmaz, bár a többit annotálták).
A humán referenciagenomnak vannak korlátai annak a ténynek köszönhetően, hogy “egyetlen” különálló szekvenciáról van szó. Emiatt nevezik kifejezetten “referenciának”. A fő célja, hogy a genetikai jellemzők indexeként vagy lokátoraként szolgáljon. Az 1000 Genom projekt egy olyan adatbázist hoz létre, amely az emberi populáció genomjainak eltéréseiről nyújt információt.
A legújabb genom-összeállítások a következők:
Kibocsátás neve | Kibocsátás dátuma | Egyenértékű UCSC verzió |
---|---|---|
GRCh38 | Dec 2013 | hg38 |
GRCh37 | Feb 2009 | hg19 |
NCBI Build 36.1 | Március 2006 | hg18 |
NCBI Build 35 | Május 2004 | hg17 |
NCBI Build 34 | Július 2003 | hg16 |
.