dns-szekvenciák

Dokumentumok

A mitokondriális DNS-szekvenciák változáspontjainak detektálása

Változási pontok észlelése

DNS-szekvenciákban

Nora Martnez Villanueva

Statisztikai technikák mestere

Vigói Egyetem

Változási pontok detektálása a

Nora Martnez Villanueva

Szállítási engedély

Javier Roca Pardinas és Miguel Mendoca Fonseca

Hogy a projekt a DNS-mítosz szekvenciáiban bekövetkezett változási pontok detektálása volt-

kondriát Dna készített. Nora Martnez Villanueva, a D.N.I. 53179846-

M, Javier Roca Pardinas és Miguel Mendoca Fonseca urak irányításával.

Ez a jelentés képezi a dokumentációt, amelyet engedélyünkkel átadunk

- mondta a hallgató a Végső Mester Projektként.

Javier Roca Pardinas Miguel M. Fonseca

Vigo, 2012. január 16

A DNS-szekvenciákat befolyásoló mutációs folyamatok azonosítása elengedhetetlen-

a genomok fejlődésének jobb megértése érdekében. A mechanizmus

replikáció, amelynek során a láncokat nagy mutációs károsodásnak teszik ki-

Nála a kompozíció egyik elfogultságának egyik fő forrásaként írták le

nukleotidláncok. Ebben a munkában a seq2R, egy R csomag szerepel

szingularitásokat detektál a mitokondriális genomok (mtDNS) összetételében. Mert

Ezért olyan kernel típusú simítási technikákat alkalmaztak, amelyek megbecsülik az indexeket

nukleotidikát és bootstrap módszereket alkalmaztak a

bizalom ezekre a becslésekre. Ezenkívül ez a csomag lehetővé teszi a graphi ábrázolását-

a kapott becslések, és következtetéseket vonnak le a változás pontjairól (vagy

szingularitások) érdekes.

1. Bevezetés 1

2. Statisztikai módszertan 7

2.1. Becslés algoritmus. . . . . . . . . . . . . . . . . . . . . . . . . 8.

2.2. Ablak kiválasztása. . . . . . . . . . . . . . . . . . . . . . . . . . 9.

2.3. Számítási szempontok. . . . . . . . . . . . . . . . . . . . . . . . 10.

2.4. Bizalom intervallumok. . . . . . . . . . . . . . . . . . . . . . . . . . tizenegy

3. Szoftverfejlesztés 13

3.1. Read.genbank () függvény. . . . . . . . . . . . . . . . . . . . . . . . . 14

3.2. Read.all () függvény. . . . . . . . . . . . . . . . . . . . . . . . . . . tizenöt

3.3. Change.binary () függvény. . . . . . . . . . . . . . . . . . . . . . . . 16.

3.4. Change.points () függvény. . . . . . . . . . . . . . . . . . . . . . . . 17.

3.5. Funkció plot.change.points (). . . . . . . . . . . . . . . . . . . . . 19.

3.6. Kritikus () függvény. . . . . . . . . . . . . . . . . . . . . . . . . . . 19.

4. Mitokondriális DNS vizsgálata Homo sapiens-ben 23

Seq2R 33 csomag

A legtöbb eukarióta organizmus sejtjeiben tartalmaz néhányat

a mitokondriumok nevén ismert organellák. Az említett organellák esenek-

a sejtaktivitás szempontjából, mivel ők felelősek a kalóriák átalakításáért

hogy az étrendbe beépítjük a felhasználható energiát (adenozin-trifoszfát, ATP) keresztül

az oxidatív foszforilezési folyamat (Wallace, 1992). Ez a folyamat azonban nem

ez az egyetlen, amelyben a mitokondriumok beavatkoznak. Például ismertek

részt vesz más celluláris metabolitok bioszintézisében és a

programozott sejthalál vagy apoptózis (Orrenius, 2004).

Ezeket az organellákat egy külső mitokondriális membrán alkotja, a tér

intermembrán, belső mitokondriális membrán (invaginációknak nevezzük

címerek) és mitokondriális mátrix. Bár a sejtben lévő DNS legnagyobb része az

A magban a mitokondrium saját genommal rendelkezik, a mitokondriális DNS-sel (mtDNS,

1.1. Ábra) (Bruces et al., 2007).

A mitokondriumok száma sejtenként a szerv típusától függően nagyban változik.-

nizmus vagy szövet, és mindegyikük becslések szerint 2-10 kópia mtDNS-t tartalmaz

(Wiesner és mtsai, 1992).

A mitokondriumok genomja a mitokondriális mátrixban található, és a

tipikusan kör alakú szerkezet, amely két DNS-szálból áll. Ezek ea-

főleg négy nitrogénes bázisból áll: adenin (a), timin (t), guanin

(g) és citozin (c). Mindkét lánc egyesülését a

Ezek az alapok, az adenin és a timin komplementer, míg a guanin komplementer.

citozinnal van. Biokémiai összetételük miatt a két szál különbözik, mivel

hogy az egyik nukleotidszekvenciája gazdag G-ben (nehéz lánc vagy H-szál), a másik lánc pedig gyenge ebben a nitrogén-bázisban (könnyű lánc vagy Lstrand) (Anderson

2 1. fejezet - Bevezetés

és mtsai., 1981). A mitokondriális genom a láncban részt vevő 13 fehérjét kódol

légzőszervi, 2 riboszomális RNS és 22 transzfer RNS, amelyek társultak

mtDNS transzkripciós eljárással (P. F. Chinnery, 2003). Az 1.2

az emberi mtDNS sematikus ábrázolása.

1.1. Ábra: Egy eukarióta sejt (középen) mitokondrium (középső) szerkezete (balra). Mitokondrium mikroszkóp képe (jobbra) (http://bio1151b.nicerweb.com/Locked/media/ch06/mitochondrion.html).

Ennek az egyedülálló genomnak a felfedezése a mitokondriumokban nagyon

fontos, hogy tanulmányokat lehessen végezni az említett organellák eredetéről és evolúciójáról

(Mounolou et al., 1966; Schatz, 1963).

A mutáció az egyik nukleotid változása a másikra. Genetikai variáció

az mtDNS-ben a genomban felhalmozódó mutációk révén keletkezik. A

az mtDNS átlagos mutációs rátája tízszerese a nukleáris DNS-nek.

Ennek oka, hogy (i) az mtDNS-t kiteszik az oxidatív károsodásnak, amelyet a

a mitokondriumokban előforduló reakciók, (ii) a nukleáris DNS jobb

védett és (iii) a DNS károsodás-helyreállító mechanizmusai nem túl hatékonyak

a mitokondriumokban. Mivel az mtDNS az anyán keresztül öröklődik (Dawid és

Blackler, 1972; 3. Hutchison et al., 1974), és a rekombinációs ráta korlátozott és

ritkán generál új genetikai variánsokat (Tsaousis et al., 2005), ezek a mutációk

leginkább a variáció forrása ebben a genomban.

1.2. Ábra: Homo sapiens mitokondriális genom. Ez egy 16 569 kb méretű kettős szálú mDNS molekula, amely a légzőszervi lánc 13 alapvető összetevőjét kódolja: ND1-ND6 gének, amelyek az I komplex 7 alegységét kódolják, a Cyt b a III komplex alegységét, a CO I-III hármat kódol a IV komplex alegységei, az ATP6 és ATP8 gének a V komplex két alegységét kódolják, továbbá 2 riboszomális RNS gént (12S és 16S rRNS) és 22 transzfer RNS gént tartalmaz. A D-hurok egy nem kódoló régió, amely részt vesz a fontos folyamatok szabályozásában. Az OH és az OL az mtDNS nehézláncának és könnyűláncának replikációs kezdete. Rövidítések: ND1-ND6, NADH dehidrogenáz 1-6 alegységek; Cyt b, citokróm b alegység; COI-III, citokróm c-oxidáz alegységek; ATP6 és ATP8, az ATP-szintáz alegységei. 12S és 16S rRNS; A tRNS-géneket a megfelelő aminosav betűjével jelöljük.

Amikor a mutagén mechanizmusok és a szelekciós folyamat egyaránt befolyásolja

a DNS mindkét szálához a nukleotid frekvenciának mindegyikben meg kell lennie

kiegyensúlyozott, a paritás második szabálya (Chargaff, 1950; Lobry, 1995). Mindazonáltal,

a láncok összetételében rejlő torzítás a beli eltérésekként azonosítható

ez a kapcsolat, amely a különbözőből származó aszimmetrikus mutációk létezését vonja maga után-

a mutáció különféle mechanizmusai, például a bázisváltozások a replikáció során,

DNS transzkripció vagy helyreállítás (Frank és Lobry, 1999). Ha ezeknek a mutációknak van-

Ehelyett a replikáció során nagy változásokra számíthat a

4 1. fejezet - Bevezetés

nukleotidösszetétel a replikáció kezdetén (gerinces állatok előtt)-

kettő, úgynevezett OH és OL) és az új szekvenciák végében

MtDNA (Touchon és Rocha, 2008).

A szekvenciák összetétele alapján és a hely megbecsülése érdekében

a két replikációs origó (OH és OL) közül Grigoriev (1998) használta az akut-

GC mulátus: olyan módszer, amely a (G-C)/(G + C) összegéből áll egy ponttól

a szekvencia önkényes kezdete, amíg teljesen át nem megy. Megfigyelhetné ezt

A GC torzítása növekszik, amikor az OH és az OL felé közeledünk. Ez a módszer azonban

mint sok más eddig használt, hiányzik belőle a statisztikai szigor.

Ebben a projektben egy új statisztikai módszertan kerül bemutatásra, amely lehetővé teszi-

a genomi szekvenciák összetételében bekövetkező változások detektálása

regresszió. Ezeknek a kapcsolási pontoknak a meghatározása hasznos a vásárlás során-