Változás a digitális világban

Biztosan hallottál már genomi szekvenciáról, de tudod, milyen technológia teszi lehetővé? Tudja, mennyibe kerül egy genom szekvenálása? Ebben a cikkben választ adunk ezekre és más kérdésekre, és elemezzük a technológia legfrissebb adatait.

mennyibe

Mindennek a kezdete: a DNS genetikai kódja

Genetikai kódunk és az összes élő szervezet, a legkisebb vírusoktól a legnagyobb dinoszauruszokig, mindössze négy betűből álló ábécén alapul: A, C, G és T (minden nukleotidhoz vagy DNS-bázishoz egy: adenin, guanin, citozin és timin).

Ezzel a kvaterner nyelvvel írják le a DNS-láncokat. Az élőlény összes DNS-láncának összessége a genomja. Az emberi genom 46 DNS-szálból (46 kromoszóma) áll, összesen több mint 3 milliárd levélből. Minden sejtünk a magjában tartalmazza a genom másolatát. Minden cellában ugyanaz a másolat. Ezt a genomot minden egyes sejttípusban máshogy dolgozzák fel, amint azt legutóbbi cikkünkben kifejtettük:

"Mi a genetikai öröklődés a zongora hangjaival magyarázva"

A genomi szekvenciák nyilvános adatbázisokban tekinthetők meg

Az a sorrend, amelyben a négy A, C, G és T betűt egy genomba írják, az az úgynevezett szekvencia. A több ezer genom szekvenciája jelenleg ismert; és ezeket a szekvenciákat hatalmas adatbázisokban tárolják, amelyek közül sok nyilvános és szabadon elérhető. A legfontosabb nyilvános genomikai adatbázisok a következők NCBI (Nemzeti Biotechnológiai Információs Központ, USA), ENA (Európai Nukleotid Archívum, Egyesült Királyság) és DDBJ (Japán, Japán DNS-adatbázisa).

Valamennyi közpénzből finanszírozott szekvenálási projekt köteles szabadon kiosztani a vizsgálata során kapott szekvenciákat ezen adatbázisok bármelyikébe, hogy szabadon megtekinthessék vagy felhasználhassák őket.

Az emberi genom 2001-ben teljesen szekvenálódott. A molekuláris biológia ezt a mérföldkövét egyidejűleg publikálták tudományos folyóiratok is Természet Y Tudomány.

A genetikai szekvenálást lehetővé tevő technológiák

De hogyan olvassa el a DNS szálakat? Bármely szekvenálási projekt első lépése mindig az, hogy a genom DNS-szálait apróbb darabokra szétaprózza, ami megkönnyíti a szekvenálási csapatok számára azok elolvasását. Miután a genom széttöredezett, minden DNS-bázishoz különböző címkéket helyeznek el, amelyek a szekvenáló berendezéseket felismerik, lefordítják A, C, G vagy T formában, és ezt a fordítást elküldik egy szoftverhez, amely a az:

Ezeket a szoftveres kimeneteket kromatogramoknak nevezzük, amelyekben az egyes DNS-bázisokat más szín képviseli (zöld az A, kék a C, a fekete a G és a piros a T). Ez az egyes alapértékek minőségét is jelzi, amelyet függőleges zöld sáv képvisel. A DNS-szekvencia minőségi indexét az egyes bázisok egyedi minőségének összegzésével számítják ki, és ez az alacsony, közepes és jó minőségű szekvenciák megkülönböztetésére szolgál. A DNS-szekvencia későbbi alkalmazásától függően minden minőség használható, vagy csak a legjobb minőségű.

A szekvenálási leolvasásokat elküldik egy adatbázisba, amely, miután elemezték a szekvenálási projekttel kapcsolatos minőségi és egyéb információikat, hozzárendelnek nekik egy azonosító kódot (egyedi az adatbázis minden egyes DNS-szekvenciájához), és a raktárakat. Az adatbázis felhasználóiként egy sorozat letöltésekor egy ehhez hasonló szöveges formátumú fájlt kapunk vissza:

A fájl első két sora> jellel határolva tartalmazza a DNS-szekvencia egyedi információit: numerikus kódját (ebben az esetben 568815593), nevét (ebben az esetben NC_000005.10, amely megfelel az emberi 5. kromoszóma számnak) követi annak pontos elhelyezkedését a kromoszómán belül (: c151690947-151657201, a szekvencia a kezdő és a véghelyzet között van). Megjegyzés: a c betű azt jelzi, hogy a szekvenciát a komplementer DNS-szálban olvasták, ezért a kezdő olvasási pozíciója egy számmal nagyobb, mint a végső olvasási pozíciója.

Forrás: https://www.genome.gov/27562862/breve-historia-del-proyecto-del-genoma-humano/

Különböző szekvenálási technológiák léteznek

Ennek a cikknek nem az a célja, hogy részletes elemzést készítsen az egyes eddig kifejlesztett szekvenciázási technológiákról, hanem egy olyan globális jövőkép bemutatása, amely segít megérteni a költségek lefelé irányuló evolúciójának okát, és ezáltal az alkalmazás demokratizálódását. A különböző technológiák áttekintéséhez ez egy jó útmutató spanyolul.

A múlt század 70-80 évtizedében a DNS-szekvenálást minden molekuláris biológiai laboratóriumban szabványosították; Ez egy DNS-bázisok radioaktív jelölésén alapuló kézi szekvenálás volt. Minden szekvenálási reakcióhoz 150-300 bázis közötti leolvasást értek el, és minden körbe legfeljebb 10 független reakciót lehetett beépíteni. Manuálisnak hívták, mert a leolvasást a felhasználó végezte, a.

A 90-es évek közepén kezdték forgalomba hozni az első automatikus szekvenáló berendezéseket, úgynevezetten, mert már beépítették azokat a szoftvereket, amelyek "elolvasták" a szekvenciát; Ezenkívül a fluoreszcencia-kibocsátásokon alapuló címkék radioaktív címkézésének elhagyása (ennek következtében a foglalkozási kockázatok csökkenésével) továbbra is a mai tömegszekvenálási módszerek alapját képezi.

A szekvenálási technológiák valódi forradalma a DNS-minta betöltő eszközök miniatürizálásának kifejlesztésével kezdődik: először 96 lyukú lemezek jelentek meg (mindegyik mélyedésbe 1 DNS-mintát helyeztek), majd kapacitásukat négyszeresére növelték lemezenként 384 üregig, végül ma olyan lemezeket használnak, ahol több tízezer DNS-mintát helyeznek el egyidejűleg.

Ha a már kommentáltakhoz hozzáadjuk a berendezés felépítésében, a DNS-bázisok jelölési címkéinek felismerésében és az alkalmazott szekvenálási algoritmusokban tett javításokat, mindez a szekvenálási költségek fokozatos csökkenését jelentette.

De mennyibe kerül egy genom szekvenálása?

Grafikonot készítettünk a genom szekvenálásának költségeinek alakulásáról 2001 és 2017 között, felhasználva az Egyesült Államok NHGRI (Nemzeti Emberi Genomkutató Intézet), az emberi genom szekvenálás egyik úttörőjének és jelenleg az egyik nyilvános adatait. világszerte a nyilvános szekvenálási projektek fő adattárai közül. A nyers adatok és a kiszámításához használt módszerek itt olvashatók.

A fenti grafikon a genomonkénti költséget mutatja (ezer dollárban) az eltelt idővel (2001 és 2017 között). A talált óriási különbségek jobb megfigyelése érdekében a genomra jutó költséget logaritmikus skálán ábrázolják. 2001-ben a genom szekvenálása körülbelül 100 millió dollárba került, míg ma csak 1000 dollárba kerül ugyanez. E 17 év során ennek a csökkentésnek különböző fázisait figyelték meg: 2007-ig 10% -os csökkenést figyeltek meg, de 2007-től a szekvenálási költségek nagyon gyorsan csökkentek; Ennek oka az volt, hogy a különféle tömegsorrendezési technológiák fentebb említett fejlesztéseket bevezették, valamint az őket fejlesztő technológiai vállalatok között fennálló és fennálló heves verseny.

Ezeknek az olcsó fejlesztéseknek a jelentősége már számos alkalmazási területre kiterjedt, nevezetesen az úgynevezett személyre szabott orvoslás. Célja az orvosi kezelések, valamint az egészségügyi ajánlások optimalizálása az egyes betegek egyedi genomikus jellemzői alapján.

Nem sokkal később genomiális szekvenciánkat beépítjük kórtörténetünkbe, és ehhez társulnak a valós idejű monitorozási adatok, amelyeket mobilalkalmazásaink révén szerzünk be. Ők a három lába annak, amit az egészség nagy adatainak neveznek.

Bármely technológiai változás a történelem folyamán mindig bizonyos félelmet feltételezett azoktól a társadalmaktól, amelyek látták őket megszületni, de az is bebizonyosodott, hogy a megfelelő és naprakész szabályozáson alapuló technológiák helyes használata jelentős előrelépéseket tett az emberiség számára. A genomikus adataink helyes szabályozása elősegíti az olyan alkalmazások fejlesztését, amelyek kétségtelenül javítják életminőségünket.

A cikk elkészítéséhez felhasznált bibliográfiai hivatkozások:

Mardis E. A DNS-szekvenálási technológia egy évtizedes perspektívája. Természet, 470: 198-203. 2011.

Metzker M. Szekvenálási technológiák - a következő generáció. Természetgenetika, 11: 31–46. 2010.

Tízéves emberi genom: a szekvenciarobbanás. Természet, 464: 670-671. 2010.