""

Illustrasjon: Frida Marie E. Westby

Hvordan lese DNA?

Veien fra et langt molekyl til en lang rekke bokstaver.

Av MNKOM-studentene
Publisert 15. juli 2022

Artikkelen er skrevet av Frida Marie E. Westby

Du har sikkert sett den før, en modell formet som en dobbelheliks, hvor to og to bokstaver eller farger er knyttet sammen. Disse skal forestille de biokjemiske forbindelsene kalt nukleotider, som er byggesteinene i DNA-et vårt.

Nukleotidene kommer i to basepar, adenin (A) med tymin (T) og cytocin (C) med guanin (G). Vi har fra 50 millioner til 300 millioner slike basepar i et enkelt kromosom, som vi vanligvis har 46 av.

Men hvordan har vi funnet ut av dette? Hvordan går vi fra en lang tråd DNA som er så liten at vi ikke engang kan se den, til å kunne lese en rekke bokstaver på en PC-skjerm? For å forstå hvordan dette er mulig må vi dykke litt dypere inn i oss selv.

Frida Marie E. Westby er masterstudent i computational science ved Universitetet i Oslo. Denne artikkelen er skrevet som en del av formidlingskurset MNKOM. Foto: Bendik Steinsvåg Dalen

Genet, det kjæreste du har

Cellen, så liten at ved siden av et sesamfrø ville vi kunne stilt opp 3000 celler i en rekke. Men på tross av den beskjedne størrelsen har den noe til felles med deg: den har organer (kalt organeller). Som at vi kan kalle vår hjerne det viktigste organet vi har, ville cellen sagt det samme om sin cellekjerne.

Her finner vi DNA-tråder som er nesten to meter lange, og disse fungerer som en oppskriftsbok på nettopp deg. Er det ikke rart at i én enkel celle kan vi finne noe som er to meter langt?

DNA-molekylet er har form som en dobbelheliks. Illustrasjon: Frida Marie E. Westby

Hvor lange blir disse trådene til sammen om vi tar ut alle fra cellene våre og legger de på en rekke? Da får vi faktisk en så lang tråd at den kan nå månen hele 150 tusen ganger. Men hvordan skal vi kunne lese av noe som er to meter langt og er så tynt at vi ikke engang kan se det?

Først må vi dele opp DNA-et. Dette høres kanskje litt rart ut, men siden DNAet er såpass langt må vi kutte det opp for at vi skal kunne lese det. Men selv om vi kutter ut en liten bestemt del, vil det fremdeles være for lite til at vi kan se det. Hva gjør vi så?

En kopimaskin?

Året er 1977, en biokjemiker med navn Fredrick Sanger har publisert en artikkel som beskriver en metode som senere blir kjent som Sanger-sekvensering. Og det er nettopp dette vi trenger, en måte å bestemme rekkefølgen (eller sekvensen) til den lille DNA-biten vår.

Idéen bak Sanger-sekvensering er at vi kan bytte ut den delen av nukleotidet (eller byggesteinen) som gjør at nye nukleotider kan bygges på.

Det nye nukleotidet får en kul egenskap – nemlig at den kan lyse. Men dette gjør at vi kun kan se den siste basen og ikke alle som kommer før. Heldigvis har Sanger-sekvensering en løsning på dette: Vi lager mange kopier i forskjellige lengder.

Den siste basen lar ikke nye baser bygges på og vi får «halvferdige» kopier. Illustrasjon: Frida Marie E. Westby

Du har kanskje hørt om PCR – polymerasekjedereaksjon (Polymerase Chain Reaction) – som er en bioteknologisk metode mange kanskje skapte seg en formening om under koronapandemien. Kort fortalt er PCR en metode som lager mange kopier av en liten bestemt del av DNA-et.

Sanger-sekvensering er ganske likt PCR, men isteden for å lage mange millioner identiske kopier, lager den mange millioner «halvferdige» kopier. Hvordan kan vi bruke dette?

Kappløpet

Vi tar alle kopiene, sender de gjennom en tykk gelé og ser hvor langt de kommer.

Det viser seg nemlig at de kopiene som er lengst, ikke kommer så langt igjennom denne tykke geléen. Mens jo kortere de er, jo lenger frem kommer de.

Ved å la de løpe om kapp kan vi dermed sortere trådene fra kortest til lengst.

Kopiene løper om kapp, de lengste har mest «bagasje» og kommer ikke like langt som de korte med mindre «bagasje». Illustrasjon: Frida Marie E. Westby

Lys i mørket

Nå kan vi bruke en maskin som kan fange opp de forskjellige lysene fra de sorterte trådene.  Hvis den ser fargen blå lyse opp, må det være en C. Kommer det et rødt lys, må dette være en T.

Et gult lys betyr at vi har en G, og et grønt lys forteller oss at vi har en A. Slik fortsetter det til vi har en lang «sekvens» med bokstaver.

Sekvens. Illustrasjon: Frida Marie E. Westby

Vi har nå tatt et dypdykk inn i cellen, kopiert en liten del av vår egen oppskriftsbok, laget flere millioner kopier i forskjellige størrelser, latt disse løpe om kapp, for så å lese av fargene fra første til siste plass.

Nå kan vi endelig jobbe med disse dataene – rekkene med bokstaver – og prøve å forstå hva disse gjør med deg og meg.

Kilder:

Cell size and scale, Learn.Genetics.
Genetics by the numbers, National Institute of General Medical Sciences.
Human genome project
Sanger, Nicklen og Coulson: DNA sequencing with chain-terminating inhibitors. PNAS, 1977