Dokumentumok
A mitokondriális DNS-szekvenciák változáspontjainak detektálása
Változási pontok észlelése
DNS-szekvenciákban
Nora Martnez Villanueva
Statisztikai technikák mestere
Vigói Egyetem
Változási pontok detektálása a
Nora Martnez Villanueva
Szállítási engedély
Javier Roca Pardinas és Miguel Mendoca Fonseca
Hogy a projekt a DNS-mítosz szekvenciáiban bekövetkezett változási pontok detektálása volt-
kondriát Dna készített. Nora Martnez Villanueva, a D.N.I. 53179846-
M, Javier Roca Pardinas és Miguel Mendoca Fonseca urak irányításával.
Ez a jelentés képezi a dokumentációt, amelyet engedélyünkkel átadunk
- mondta a hallgató a Végső Mester Projektként.
Javier Roca Pardinas Miguel M. Fonseca
Vigo, 2012. január 16
A DNS-szekvenciákat befolyásoló mutációs folyamatok azonosítása elengedhetetlen-
a genomok fejlődésének jobb megértése érdekében. A mechanizmus
replikáció, amelynek során a láncokat nagy mutációs károsodásnak teszik ki-
Nála a kompozíció egyik elfogultságának egyik fő forrásaként írták le
nukleotidláncok. Ebben a munkában a seq2R, egy R csomag szerepel
szingularitásokat detektál a mitokondriális genomok (mtDNS) összetételében. Mert
Ezért olyan kernel típusú simítási technikákat alkalmaztak, amelyek megbecsülik az indexeket
nukleotidikát és bootstrap módszereket alkalmaztak a
bizalom ezekre a becslésekre. Ezenkívül ez a csomag lehetővé teszi a graphi ábrázolását-
a kapott becslések, és következtetéseket vonnak le a változás pontjairól (vagy
szingularitások) érdekes.
1. Bevezetés 1
2. Statisztikai módszertan 7
2.1. Becslés algoritmus. . . . . . . . . . . . . . . . . . . . . . . . . 8.
2.2. Ablak kiválasztása. . . . . . . . . . . . . . . . . . . . . . . . . . 9.
2.3. Számítási szempontok. . . . . . . . . . . . . . . . . . . . . . . . 10.
2.4. Bizalom intervallumok. . . . . . . . . . . . . . . . . . . . . . . . . . tizenegy
3. Szoftverfejlesztés 13
3.1. Read.genbank () függvény. . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2. Read.all () függvény. . . . . . . . . . . . . . . . . . . . . . . . . . . tizenöt
3.3. Change.binary () függvény. . . . . . . . . . . . . . . . . . . . . . . . 16.
3.4. Change.points () függvény. . . . . . . . . . . . . . . . . . . . . . . . 17.
3.5. Funkció plot.change.points (). . . . . . . . . . . . . . . . . . . . . 19.
3.6. Kritikus () függvény. . . . . . . . . . . . . . . . . . . . . . . . . . . 19.
4. Mitokondriális DNS vizsgálata Homo sapiens-ben 23
Seq2R 33 csomag
A legtöbb eukarióta organizmus sejtjeiben tartalmaz néhányat
a mitokondriumok nevén ismert organellák. Az említett organellák esenek-
a sejtaktivitás szempontjából, mivel ők felelősek a kalóriák átalakításáért
hogy az étrendbe beépítjük a felhasználható energiát (adenozin-trifoszfát, ATP) keresztül
az oxidatív foszforilezési folyamat (Wallace, 1992). Ez a folyamat azonban nem
ez az egyetlen, amelyben a mitokondriumok beavatkoznak. Például ismertek
részt vesz más celluláris metabolitok bioszintézisében és a
programozott sejthalál vagy apoptózis (Orrenius, 2004).
Ezeket az organellákat egy külső mitokondriális membrán alkotja, a tér
intermembrán, belső mitokondriális membrán (invaginációknak nevezzük
címerek) és mitokondriális mátrix. Bár a sejtben lévő DNS legnagyobb része az
A magban a mitokondrium saját genommal rendelkezik, a mitokondriális DNS-sel (mtDNS,
1.1. Ábra) (Bruces et al., 2007).
A mitokondriumok száma sejtenként a szerv típusától függően nagyban változik.-
nizmus vagy szövet, és mindegyikük becslések szerint 2-10 kópia mtDNS-t tartalmaz
(Wiesner és mtsai, 1992).
A mitokondriumok genomja a mitokondriális mátrixban található, és a
tipikusan kör alakú szerkezet, amely két DNS-szálból áll. Ezek ea-
főleg négy nitrogénes bázisból áll: adenin (a), timin (t), guanin
(g) és citozin (c). Mindkét lánc egyesülését a
Ezek az alapok, az adenin és a timin komplementer, míg a guanin komplementer.
citozinnal van. Biokémiai összetételük miatt a két szál különbözik, mivel
hogy az egyik nukleotidszekvenciája gazdag G-ben (nehéz lánc vagy H-szál), a másik lánc pedig gyenge ebben a nitrogén-bázisban (könnyű lánc vagy Lstrand) (Anderson
2 1. fejezet - Bevezetés
és mtsai., 1981). A mitokondriális genom a láncban részt vevő 13 fehérjét kódol
légzőszervi, 2 riboszomális RNS és 22 transzfer RNS, amelyek társultak
mtDNS transzkripciós eljárással (P. F. Chinnery, 2003). Az 1.2
az emberi mtDNS sematikus ábrázolása.
1.1. Ábra: Egy eukarióta sejt (középen) mitokondrium (középső) szerkezete (balra). Mitokondrium mikroszkóp képe (jobbra) (http://bio1151b.nicerweb.com/Locked/media/ch06/mitochondrion.html).
Ennek az egyedülálló genomnak a felfedezése a mitokondriumokban nagyon
fontos, hogy tanulmányokat lehessen végezni az említett organellák eredetéről és evolúciójáról
(Mounolou et al., 1966; Schatz, 1963).
A mutáció az egyik nukleotid változása a másikra. Genetikai variáció
az mtDNS-ben a genomban felhalmozódó mutációk révén keletkezik. A
az mtDNS átlagos mutációs rátája tízszerese a nukleáris DNS-nek.
Ennek oka, hogy (i) az mtDNS-t kiteszik az oxidatív károsodásnak, amelyet a
a mitokondriumokban előforduló reakciók, (ii) a nukleáris DNS jobb
védett és (iii) a DNS károsodás-helyreállító mechanizmusai nem túl hatékonyak
a mitokondriumokban. Mivel az mtDNS az anyán keresztül öröklődik (Dawid és
Blackler, 1972; 3. Hutchison et al., 1974), és a rekombinációs ráta korlátozott és
ritkán generál új genetikai variánsokat (Tsaousis et al., 2005), ezek a mutációk
leginkább a variáció forrása ebben a genomban.
1.2. Ábra: Homo sapiens mitokondriális genom. Ez egy 16 569 kb méretű kettős szálú mDNS molekula, amely a légzőszervi lánc 13 alapvető összetevőjét kódolja: ND1-ND6 gének, amelyek az I komplex 7 alegységét kódolják, a Cyt b a III komplex alegységét, a CO I-III hármat kódol a IV komplex alegységei, az ATP6 és ATP8 gének a V komplex két alegységét kódolják, továbbá 2 riboszomális RNS gént (12S és 16S rRNS) és 22 transzfer RNS gént tartalmaz. A D-hurok egy nem kódoló régió, amely részt vesz a fontos folyamatok szabályozásában. Az OH és az OL az mtDNS nehézláncának és könnyűláncának replikációs kezdete. Rövidítések: ND1-ND6, NADH dehidrogenáz 1-6 alegységek; Cyt b, citokróm b alegység; COI-III, citokróm c-oxidáz alegységek; ATP6 és ATP8, az ATP-szintáz alegységei. 12S és 16S rRNS; A tRNS-géneket a megfelelő aminosav betűjével jelöljük.
Amikor a mutagén mechanizmusok és a szelekciós folyamat egyaránt befolyásolja
a DNS mindkét szálához a nukleotid frekvenciának mindegyikben meg kell lennie
kiegyensúlyozott, a paritás második szabálya (Chargaff, 1950; Lobry, 1995). Mindazonáltal,
a láncok összetételében rejlő torzítás a beli eltérésekként azonosítható
ez a kapcsolat, amely a különbözőből származó aszimmetrikus mutációk létezését vonja maga után-
a mutáció különféle mechanizmusai, például a bázisváltozások a replikáció során,
DNS transzkripció vagy helyreállítás (Frank és Lobry, 1999). Ha ezeknek a mutációknak van-
Ehelyett a replikáció során nagy változásokra számíthat a
4 1. fejezet - Bevezetés
nukleotidösszetétel a replikáció kezdetén (gerinces állatok előtt)-
kettő, úgynevezett OH és OL) és az új szekvenciák végében
MtDNA (Touchon és Rocha, 2008).
A szekvenciák összetétele alapján és a hely megbecsülése érdekében
a két replikációs origó (OH és OL) közül Grigoriev (1998) használta az akut-
GC mulátus: olyan módszer, amely a (G-C)/(G + C) összegéből áll egy ponttól
a szekvencia önkényes kezdete, amíg teljesen át nem megy. Megfigyelhetné ezt
A GC torzítása növekszik, amikor az OH és az OL felé közeledünk. Ez a módszer azonban
mint sok más eddig használt, hiányzik belőle a statisztikai szigor.
Ebben a projektben egy új statisztikai módszertan kerül bemutatásra, amely lehetővé teszi-
a genomi szekvenciák összetételében bekövetkező változások detektálása
regresszió. Ezeknek a kapcsolási pontoknak a meghatározása hasznos a vásárlás során-