ResearchBlogging.orgRestriktionsfragmentlängenpolymorphismus (Restriktion Fragment Length Polymorphism; RFLP) ist an sich schon ein schwieriges Wort, mit dem man vielleicht nicht unbedingt einen Artikel anfangen sollte. Wer trotzdem nicht zu sehr abgeschreckt ist, dem möchte ich versuchen zu erklären, wie man diese intelligente und etablierte Technik in Verbindung mit Hochdurchsatzsequenzierung nutzen kann. Zunächst mal ein Bild wie das früher aussah.

i-39b0112819307c8be48e68f91907a996-RFLP_genotyping-thumb-500x285.gif

Quelle: Englisches Wikipedia

RFLP wird also seit den 1980 als “genetischer Marker” für eine Reihe interessanter Anwendungen benutzt. Das gesamte Genom des interessierenden Organismus wird mit Hilfe eines Restriktionsenzyms verdaut.
Verdauen ist kein Problem, man zerstückelt das Genom in tausende bis zigtausende Schnipsel, wie soll man diese Schnipsel aber nun sichtbar machen? Früher ging das indem man die Fragmente auf einem Gel auftrennte, dann die Moleküle vom Gel auf eine Membran wandern ließ und dort mit Radioaktivität sichtbar machte. Genauer gesagt mit einer Sonde, einem Stück radioaktiv markierter DNA, die komplementär zu einem Teil des interessierenden Genomstücks ist. Das ist natürlich teuer, zeitaufwendig und man muss zumindest ein Stück der interessierenden Sequenz schon kennen.
Um eine große Zahl von DNA Stücken sichtbar zu machen gibt es seit Neustem aber auch andere Methoden: Man hat kurzzeitig auch Micorarrays benutzt, da diese aber, wie ich schon geschrieben habe, mausetot sind, kann man nun auch die Technik benutzen, die sie ablöst:
Hochdurchsatzsequenzierung von sehr kurzen Sequenzen auf der Solexa-Plattform.

i-73a1d00afda9343f885660479812f900-RAD_Seq-thumb-500x1145.gif

Dabei wird nach dem Verdau der genomischen DNA zunächst ein Adapter an die Restriktionsschnittstelle ligiert. Dieser Adapter enthält drei wichtige Sequenzbausteine: Eine Primerbindestelle zur Amplifikation, eine Primerbindestelle zur Sequenzierung und einen Barcode. Durch den Barcode ist es danach möglich verschiedene Proben (von unterschiedlichen Individuen, oder Populationen) zu mischen. So können nicht nur viele Marker pro Individuum/Population betrachte werden, sondern es können sogar die zu vergleichenden Proben gemeinsam sequenziert werden.
Danach folgt das für die Art der Sequenzierung typische Scheren der DNA, es werden sehr kurze Stücke hergestellt.
Damit bei der anschließenden Amplifikation nur Fragmente vermehrt werden bedient man sich eines molekularbiologischen Tricks: die Primerbindestelle des ligierten Primers ist halb mit komplementärer Sequenz gefüllt (grau im Bild), damit muss die Synthese de ersten Strangs von der Seite des ersten Adapters (mit dem Barcode etc.) beginnen.
Damit ist alles bereit zum Sequenzieren, fast beliebig viele Fragmente von fast beliebig vielen Individuen oder Populationen in einem einzigen Experiment.

Das Bild gibts im frei verfügbaren Originalartikel in groß. Auch das zweite Bild im Artikel ist zum Verständnis des weiteren Texts sehr hilfreich.

Was kann mit der neuen Technik erreicht werden? Baird und Kollegen demonstrieren dies Eindrucksvoll am Beispiel von Stichlingen.
Bei diesen gibt es Süßwasserpopulationen, welche die Seitenplatten-Panzerung der ozeanischen Populationen verloren haben. In einem ersten Sequenzierungsexperiment wurde also genomische DNA einer Population aus einem See und zum Vergleich aus der ozeanischen Population verdaut. Eingesetzt wurd dazu ein Restriktionsenzym mit einer 8-Basen Erkennungssequenz, das also theoretisch (hätte es eine zufällige Erkennungssequenz und das Stichlingsgenom eine zufällige Basenverteilung) alle 48=65536 Basen schneiden würde. Die Barcodes wurden dann also spezifisch für die Populationen ligiert und es konnten 1.4 Millionen Schnipsel sequenziert werden. Diese verteilten sich auf etwa 40000 Genomische Marker-Orte.
So konnten an 1890 Orten 1136 Vollpanzerungs-spezifische und 1097 Weichlings-Marker identifiziert werden. Interessanterweise waren fast 60% dieser Unterschiede nicht durch eine Zerstörung der Restriktionsstelle und damit einem Fehlen des Markers zu erkennen, sondern waren Unterschiede im anschließenden Sequenzbereich.
Dann kam ein sogenanntes “Bulk segregant” Experiment zu Einsatz. Eine “Kartierungskreuzung im Pulk”. Diese Kreuzung braucht man, da es sich bei den sequenzierten Polymorphismen zunächst einmal um wahrscheinlich neutrale Marker handelt, an denen sich die Populationen ganz einfach zufällig unterscheiden. Es werden also aus den schon sequenzierten Eltern-Populationen F2 Nachkommen hergestellt.
Diese F2 Nachkommen segregieren bei einem “mendelnden” Merkmal wie der Seitenplatten-Panzerung in ihrem Phänotyp. Diese F2 Individuen wurden nun nach der Ausprägung der Seitenplatte in einem stark gepanzerten und einem schwach gepanzerten Pool sequenziert, und es wurden wieder zu etwa gleichen Teilen 1,5 Millionen Sequenzen generiert.
Selbst ohne Zuhilfenahme des für den Stichling vorhandenen Referenzgenoms konnten so 18 Marker identifiziert werden, die immer zusammen mit dem gepanzerten Phänotyp vererbt wurden. Diese lagen dann auch in drei physikalisch eng aneinander liegenden Gruppen im Genom.
Doch mit der neuen Technik war noch mehr möglich: In einem dritten Versuch wurde das Genom der beiden Elternpopulationen mit einem Enzym verdaut, das eine nur 6 Basen lange Erkennungssequenz hat und damit theoretisch alle 46=4096 Basen schneidet. Dies resultierte in 148390 Markern. “Nur” fünfmal nicht über zehnmal mehr als bei einem Enzym mit 8-Basen Erkennungssequenz, da der Stichling ein GC-reiches Genom hat und das Enzym eine AT-reiche Erkennungsstelle. Durch Berücksichtigung des GC Gehalts ist also eine sehr feine Abstufung der gewünschten Markerdichte möglich.
Etwa 2300 bzw. 4500 typische Marker für weiche oder harte Seitenplatte konnten so in 4 Millionen Sequenzen der Elterngeneration gefunden werden.
Diese wurden nun in 96 F2-Individuen aus der Kartierungskreuzung untersucht, diesmal wurde aber mit spezifischen Barcodes für einzelne Fische sequenziert. Damit konnten die 96 dann erst am Computer in die weiche und harte Gruppe eingeteilt werden.
In nochmals 3.7 Millionen Sequenzen konnten so in 6 Fischen Stellen gefunden werden an denen Rekombination stattgefunden hatte: Sie hatten entweder bei weichem Phänotyp Marker der hart gepanzerten Population bis ganz in die Nähe des vorher grob eingekreisten Eda locus oder hatten umgekehrt den hart gepanzerten Phänotyp und “Weichlings-Marker”bis fast zum dadurch weiter eingegrenzten genetischen Ort.
Und noch einen weiteren Vorteil hatte die individuelle Sequenzierung: Die Fische konnten einfach für ein zweites vorher notiertes phänotypisches Mekmal in andere Gruppen eingeteilt werden. Die Ausprägung des Beckenstachels, die in den Seepopulationen auch schwächer ist konnte so dann zusätzlich sehr genau kartiert werden.
Ein Fehlen der Panzerung, wohl bedingt das Seeleben ist übrigens das Paradebeispiel für die deterministische Kraft der Selektion: Das Merkmal konnte vorher schon in anderen Populationen, die unabhängig ihre Panzerung verloren hatten auf den selben Locus kartiert werden.

Doch auch die neue Technik an sich die “Sequenzierung restiriktionsschnittstellenassozierter DNA Marker”, oder kurz RAD Sequenzierung, ist beeindruckend. Es macht Spaß darüber nachzudenken was in anderen weniger gut untersuchten Organismen damit möglich wäre. Speziell beeindruckend ist dies, hält man sich vor Augen, dass die vorliegende Studie etwa 10 Millionen Sequenzen brauchte. Für diese werden im Moment nicht mehr wie damals 8 Experimente (je etwa 1.2 M Sequenzen) benötigt, sondern lediglich noch 2 (je etwa 5M Sequenzen). Das heißt schon ein halbes Jahr nach Veröffentlichung der Studie wäre die Technik 4 mal günstiger -oder detaillierter- einsetzbar. Auch was die Analyse von Heterozygotie angeht ist bei der Technik sicher noch etwas herauszuholen, in der vorliegenden Studie wurde ein “Alles-oder-Nichts” Ansatz bei der Analyse verwendet und nur Vorhandene/Nicht-vorhandene und in einer Population einheitliche Marker als polymorph zwischen den Populationen beachtet. Mit fundierten statistischen Ansätzen könnte man den eigentlich codominanten Marker (siehe Bild ganz oben) auch wieder wie einen solchen analysieren, dies wird im Moment entwickelt. Außerdem ist genomische DNA ja nicht die einzige Nucleinsäure, die man verdauen kann! Beim Verdau von transkriptomischer cDNA ergäben sich ganz neue Möglichkeiten: Marker wären mit Genexpressionsniveaus korreliert, diese “transkriptomische” Verknüpfung (Linkage) könnte von Unterschieden in cis- oder trans-regulierenden Elementen stammen. So könnte eine Verknüpfung von Expressionsmerkmalen im selben Experiment mit physikalisch oder in einem Regulationsnetzwerk vor den Genen liegenden Markern analysiert werden.

Baird, N., Etter, P., Atwood, T., Currey, M., Shiver, A., Lewis, Z., Selker, E., Cresko, W., & Johnson, E. (2008). Rapid SNP Discovery and Genetic Mapping Using Sequenced RAD Markers PLoS ONE, 3 (10) DOI: 10.1371/journal.pone.0003376