T2T-CHM13, cea mai completă secvență a genomului uman?

6 iulie 2021 | Genomul uman | 0 comentarii

La 20 de ani de când a fost anunțată, în revista Nature, realizarea primei schițe a genomului uman de către Celera Genomics și Internațional Human Genome Sequencing Consortium, o nouă organizație numită Telomere-to-Telomere Consortium (T2TC) anunță printr-un preprint* secvențierea suplimentară a 8% din Genomul Uman, procent rămas nerezolvat în versiunea inițială.

Ultima mare îmbunătățire a secvenței genomului uman a fost realizată de către Genome Reference Consortium (GRC) în 2013, iar de atunci la anumite intervale de timp au fost eliberate mici versiuni îmbunătățite, ultima fiind cea din 2019, care are codul de referință GRCh38.p13.

Noua versiune numită T2T-CHM13 conține 3 miliarde de perechi de baze (3.054.815.472 pb), include asamblarea fără goluri a celor 22 de autozomi și a cromozomul X plus ADN-ul mitocondrial (16.569 pb), a corectat numeroase erori, a introdus aproape 200 milioane de pb noi ce conțin copiile a 2226 gene paraloage, dintre care 115 se presupune că ar codifica pentru proteine și, conform autorilor, reprezintă cel mai important update a secvenței genomului uman de la prima sa secvențiere.

Noua versiune propusă de T2TC include toate regiunile centromerice și brațele scurte ale celor 5 cromozomi acrocentrici, făcându-le accesibile pentru prima oară pentru studii de funcționalitate și varianță. Spre deosebire de GRCh38.p13, această nouă versiune adaugă sau corectează 238 Mpb de secvență din care 180 Mpb reprezintă sateliți centromerici, 68 Mpb duplicații segmentare și 10 Mpb de ADN ribozomal (ADNr).

Un alt aspect interesant al acestui demers este acela ca T2TC a folosit pentru secvențiere linia celulară CHM13, care se caracterizează printr-un nivel scăzut al heterozigoției, ceea ce a permis eliminarea efectului variației heterozigoției, care putea crea confuzie în analiza ulterioară a secvenței genomice. Dezavantajul acestei abordări este acela că din structura secvenței lipsește Cromozomul Y (aprox. 58 Mpb).

În ciuda importanței lor în structura și funcționarea celulară, brațele p ale cromozomilor acrocentrici (chr13, chr14, chr15, chr21 și chr22) au fost omise din schiță inițială a genomului uman datorită dificultăților tehnice, ridicate la acea vreme (2001), de structura acestora, compusă dintr-o regiune de ADNr variabilă ca dimensiune, mărginită distal și proximal de regiuni de ADN satelit (repetitiv) cu dimensiuni înalt polimorfice. Importanța genomică a acestor regiuni include biogeneza ribozomilor, formarea nucleului, instabilitatea cromozomială și boli genetice cunoscute precum ribozomopatiile, translocațiile Robertsoniene sau Sindromul Down.

Comparațiile efectuate între T2T-CHM13, GRCh38 și secvențele genomurilor primatelor au dezvăluit tipare noi ale heterozigoției structurale și diferențe evolutive masive în ceea ce privește conținutul genelor dublate, între oameni și maimuțe. Această comparație și multe alte studii au fost realizate pornind de la versiunea T2T-CHM13, accesibilă pentru analiza și consultare prin intermediul UCSC Assembly Hub browser.

Linia celulară pe baza căreia a fost efectuată noua secvențiere a genomului uman, realizată de T2TC, respectiv CHM13hTERT va fi disponibilă în curând publicului larg, pentru a exista și o referință fizică a secvenței genomice T2T-CHM13, lucru pe care versiunea GRCh38 nu îl poate furniza.

T2T-CHM13v1.1 este cea mai nouă și mai completă versiune a secvenței genomului uman, însă asta nu însemnă că ea nu poate fi perfectibilă, de vreme ce, din componența ei lipsește secvența cromozomul Y, aspect pe care cei de la T2TC îl au în considerare și în proces de realizare folosind, în mod similar, linia celulară HG002.

T2T-CHM13 și GRCh38 reprezintă schițe ale genomului uman realizate în diferite stadii de dezvoltare a tehnologiilor de secvențiere, scopul suprem al cercetătorilor acestui vast domeniu (reuniți sub umbrela unor consorții, datorită complexității eforturilor depuse), reprezintă asamblarea genomului uman diploid, fără artefacte tehnologice și de la un număr cât mai mare de persoane,  pentru a putea cuprinde pe de-a-ntregul complexitatea variației genetice umane.

 

Surse:

 

* Atenție acest articol este un preprint și nu a fost certificat de evaluarea peer review. Deoarece acest proces poate fi lung, autorii folosesc serviciul bioRxiv pentru a-și face manuscrisele disponibile ca „preprints” înainte de a finaliza evaluarea peer review și certificarea consecventă de către o revistă științifică. Acest lucru permite altor oameni de știință să vadă, să discute și să comenteze imediat descoperirile. Prin urmare, cititorii ar trebui să fie conștienți de faptul că articolele de pe bioRxiv nu au fost finalizate de autori, ar putea conține erori și raportează informații care nu au fost încă acceptate sau aprobate în vreun fel de comunitatea științifică.

0 Comentarii

Confirmări/Notificări

  1. Ce trebuie să știi dacă vrei să-ți secvențiezi genomul | Genomica - […] Prima schiță brută a hărții genomului uman a fost realizată în perioada 1999-2000 prin efortul deosebit al instituțiilor ce…
  2. WGS Extract | Genomica - […] genomul supus secvențierii/analizei. Mai multe despre versiunile genomice de referință și aici [Link]. De obicei în rapoartele de rezultate…

Lasă un răspuns