Gründe und Methoden für die Genomsequenzierung

Die Sequenzierung von Genomen ist anspruchsvoll, komplex und erfordert spezielle Technologie. Ein Segment von 500 bis 800 bp kann sequenziert werden. Genome sind jedoch sehr groß, z. B. E. coli mit 4, 2 × 10 6 Bp und 3, 2 × 10 9 Bp beim Menschen.

Für die Sequenzierung werden also kleine Segmente benötigt. Solche Segmente werden durch zufälliges Brechen genomischer DNA in kleine Fragmente hergestellt. Solche Fragmente überlappen normalerweise andere Fragmente an ihren Enden. Fragmente werden in einen Vektor geklont, um eine genomische Bibliothek des Organismus zu erzeugen.

Gründe für die vollständige Sequenzierung eines Genoms:

(i) Sie liefert Informationen zur Grundlage für die Entdeckung von Genen und liefert ein Inventar von Genen.

(ii) Es repräsentiert die möglichen Beziehungen zwischen den Genen.

(iii) Die Sequenzierung von Genomen stellt eine Reihe von Werkzeugen für weitere Experimente bereit.

(iv) Die genetische Information eines Organismus wird aus der Gensequenz zur Verfügung gestellt.

(v) Die vollständige genetische Sequenzierung eines Organismus liefert alle genetischen Informationen, die zur Bildung eines Organismus erforderlich sind.

Für die Genomsequenzierung verwendete Methoden:

(i) gerichtete Sequenzierung von Bakterienkrebs (BAC):

Bakterielle künstliche Chromosomen sind einfach Plasmide, die für die Klonierung sehr langer Segmente (dh 100.000 bis 300.000 bp) DNA konzipiert sind. Diese Vektoren werden verwendet, um genomische Bibliotheken zu erstellen, in denen die Insertgröße 80 bis 100 kb beträgt. DNA-Fragmente von Tausenden Basenpaaren werden in den BAC-Vektor kloniert.

Die genomische Bibliothek wird gescreent, indem übliche Restriktionsklone, sogenannte Contigs, lokalisiert werden. Die Mitglieder des Contig enthalten einige überlappende Bereiche, um die genaue Bestimmung ihres Standorts im Contig zu ermöglichen.

Das ultimative Ziel der physikalischen Kartierungsmethoden besteht darin, für jedes Chromosom des Genoms einen vollständigen Inhalt zu erhalten. Die kartierten Contigs werden durch Brechen großer DNA-Fragmente in kleine Segmente sequenziert. Jeder Klon des Contig wird sequenziert. Die Nukleotidsequenz wird allein durch Klonbasis identifiziert, bis das vollständige Genom sequenziert ist.

(ii) Random-Flinten-Sequenzierung oder Bottom-Up-Ansatz:

Es ist möglich, in einem Organismus ein beliebiges Gen eines anderen Organismus durch Spritzen zu klonen. Für dieses gesamte Genom des ersten Organismus wird mit Restriktionsendonuklease verdaut, um eine zufällige Mischung von Fragmenten herzustellen.

Zufällige (Shotgim) -Bibliotheken genomischer DNA werden in kleinen, dh 2, 0 kb und mittleren, dh 10 kb-Insert-Plasmidvektoren zusammen mit der großen BAC-Bibliothek der genomischen Shotgun-Insertion (80-100 kb) konstruiert. Fragmente werden in den Plasmidvektor inseriert und die rekombinanten Plasmide in die gewünschte Wirtszelle transformiert.

In der Schrotflintensequenzierung werden zufällig ausgewählte Klone sequenziert, bis Klone in der Genombibliothek analysiert werden. Mit anderen Worten können wir sagen, dass in zufälligen Schrotflinten-Sequenzierchromosomen in Abschnitte unterteilt werden und dann der Abschnitt der genomischen DNA in Millionen kleiner Segmente aufgeteilt wird und alle Segmente in einer unverzerrten Weise sequenziert werden.

Bereiche überlappender DNA sind aufeinander abgestimmt, wodurch immer größere Abschnitte der genomischen DNA gebildet wurden. Die DNA-Sequenzierung wird an beiden Enden von Inserts von zufällig ausgewählten Klonen sowohl aus den Plasmidbibliotheken für kleine als auch aus mittleren Inserts durchgeführt, um das Genom mindestens dreimal zu decken.

Kleine DNA-Fragmente werden zufällig in verschiedene Plasmidmoleküle eingefügt. Bei überlappenden Inserts stammen alle vom gleichen genomischen Ort, aber aus verschiedenen Regionen, die entweder nach links oder nach rechts verschoben sind.

Die überlappenden Fragmente werden entweder in Coting oder in eine Sequenz für die betroffene Region ausgerichtet (Shot-Gun-Methode). Prokaryotische Genome haben wenig jeweilige DNA und die Shot Gun-Sequenzierung führt zu guten Ergebnissen. Eukaryoten tragen viele wiederholte Sequenzen.

Dies alles führt zu Verwirrung. Überlappungen von Fragmenten werden jedoch in der Montagephase durch Rechenaufgaben ausgenutzt. Ein Computerprogramm identifiziert die überlappenden Sequenzen und fügt sie zu einer durchgehenden Strecke zusammen. Dieses Verfahren wurde erfolgreich zur Sequenzierung aller von Celera Genomics veröffentlichten mikrobiellen Genomsequenzen angewendet.