Blog durchsuchen
Profil
Alexander Knoll ist Biologe. Für seine Promotion am Karlsruher Institut für Technologie versucht er, die DNA-Reparatur und -Rekombination in Pflanzen besser zu verstehen.
Emanuel Heitlinger promoviert an den Universitäten Karlsruhe und Edinburgh. Er untersucht mit Hilfe von Hochdurchsatz-DNA-Sequenzierung die Evolution eines Wirt-Parasit-Systems.
Letzte Einträge
- The MolBio Carnival #92 Kommentare· 04.04.11
- Krebszellen sind verkappte Individualisten? Eher nicht.12 Kommentare· 28.02.11
- Da bin ich wieder!8 Kommentare· 16.02.11
- The MolBio Carnival, third edition11 Kommentare· 04.10.10
- Der Molbio Blogkarneval3 Kommentare· 19.09.10
Kommentare
- Wahnie · 15.05.12 · 11:56 Uhr Die Wurst mit Zähnen kriegt keinen Krebs!
- Georg Hier · 27.04.12 · 19:59 Uhr Das Venter-Rezept für Bakterien mit synthetisiertem Genom
- Malta Property Agents · 12.03.12 · 19:47 Uhr Gefahr im URlaub: verschachtelte Statistik (Nested Designs)
- Hutshop · 12.03.12 · 12:59 Uhr Ich bin natürlich versessen!
- Ina · 07.11.11 · 16:53 Uhr Krebszellen sind verkappte Individualisten? Eher nicht.
Blogroll
Alexander Knoll aufDeutsche Wissenschaft
- *Evil under the Sun*
- Ach Du lieber Darwin!
- Begrenzte Wissenschaft
- Bierologie
- bio crash
- Biotechnologie.de
- Bloggen in der Wissenschaft - academics-Blog
- cBlog
- EbM-Anwender - Blog für angewandte Evidenzbasierte Medizin
- Fischblog
- MIND & MOLECULES
- Paperfrust - hier raus lassen!
- Research Blogging - All Topics - German
- SCIENCE-MEETS-SOCIETY
- Selective Sweep
- Skeptic as hell - Die Welt im Blick...
- Varia & Eventualia
- Vom Hai gebissen
- Wissenschafts-Café
- wissenslogs
Englische Wissenschaft
- adaptivecomplexity's blog
- Aetiology
- Bad Science
- Bayblab
- bioephemera
- Biofortified
- Biology in Science Fiction
- Bitesize Bio
- Botany Photo of the Day
- Cancer and Your Genes
- Catalogue of Organisms
- Clinical Genetics Blog (beta v0.1)
- Discovering Biology in a Digital World
- easternblot.net
- EveryONE
- Genetic Future
- Genetic Maize - Navigating the maze of GMOs
- genomeboy.com
- Genomicron
- Genomics, Evolution, and Pseudoscience
- Greg Laden's Blog
- Interrogating Nature
- JCB Biowrites
- Labtutorials in Biology
- Mailund on the Internet
- Mendeley Blog
- Microarray and bioinformatics
- Mobile DNA
- Molecule of the Day
- Morbid Anatomy
- Myrmecos Blog
- Next Generation Sequencing
- No seeds, no fruits, no flowers: no problem.
- nodalpoint.org - A bioinformatics weblog
- Not Exactly Rocket Science
- Omics! Omics!
- Ouroboros
- Parasite of the Day
- Pharyngula
- Pimm - Partial immortalization
- Pyrenaemata
- RealClimate
- Research Blogging - All Topics - English
- RRResearch
- Sandwalk
- Science-Based Medicine
- ScienceRoll
- Sex, genes & evolution
- The Barcode of Life blog
- The Daily Transcript
- The Ensembl Weblog
- The Giant's Shoulders
- The Inoculated Mind
- The Loom
- The Mobilome
- The Seven Stones
- The Tree of Life
- The Y.O.R.F.
- Think Gene
- Tomorrow's Table
- When The Scientist Presents
- Yann Klimentidis' Weblog
Kategorien
« vorheriger Beitrag · nächster Beitrag »
18.10.09 · 19:23 Uhr
Fixiert auf Methodik - Analyse von Sequenzdaten
Kategorie: Naturwissenschaften·Technik
In der Biologie gibt es momentan einen rasanten technischen Fortschritt was die Sequenzierung von DNA angeht. Es werden mit neuen Methoden immer größere Datenmengen erzeugt. Diese neue Methoden sind insofern neu, dass sie nicht auf den chemischen Reaktionen beruhen, die in den frühen 70er Jahren von Frederick Sanger und Kollegen entdeckt wurden. Tatsächlich wurden nämlich genau diese Reaktionen in einer hoch parallelisierten Form zur Sequenzierung des ersten menschlichen Genoms und für die Genome der bekannten Modellorganismen eingesetzt.
Die Weiterentwicklung der ursprünglichen Technik ging im Fall der Sanger-Sequenzierung mit einer Weiterentwicklung der Methoden zur Analyse der Sequenzen einher. Diese Weiterentwicklung fand auf beiden Gebieten - Chemie der Sequenzierungsreaktionen und Algorithmen zur Dantenanalyse - an öffentlich finanzierten Forschungseinrichtungen statt. Der chemische Part wurde dann im Nachhinein kommerzialisiert.
Diese vergleichsweise langsame und stetige Entwicklung resultierte auf Seite der Datenanalyse in einer Sammlung von qualitativ hochwertigen Programmen. Die Sicherung der Qualität wird dabei einerseits durch die tausendfache Benutzung, andererseits durch die Offenheit der Quellcodes der jeweiligen Programme gewährleistet.
Bei der Abschätzung der Qualität der jeweiligen Sequenz hat sich dabei beispielsweise ein Programm von Phil Geen namens Phred etabliert. Es ordnet den einzelnen Basen eine Qualität zu, diese kann dann in weiteren Analysen eingesetzt werden.
Nächster Schritt in der Sequenzanalyse ist häufig das Assembley, das Zusammenpuzzeln einzelner Sequenzstücke. Sowohl bei den neuen Methoden als auch bei der Sanger-Methode handelt es sich nämlich um "Shotgun" -zu deutsch "Schrotschuss" - Methoden: Das Zielmolekül ist um ein Vielfaches länger als die Leseweite der chemischen Reaktionen, es muss aus überlappenden Regionen einzelner Schnipsel zusammengesetzt werden. Hier haben sich Programme wie Phrap oder Cap3 etabliert.
Schon beim ersten Schritt der Qualitätsmessung der Sequenzen gibt es nun Bedarf für neue Methoden. Während die moderne Form der Sanger-Sequenzierung auf Fluoreszenzsignalen basierte werden bei den neuartigen Methoden die Sequenzen aus Abfolgen von Hochauflösenden Bildern bestimmt. Die Hersteller der Sequenziergeräte nehmen etwa halbjährlich kleine Änderungen in der Chemie vor, was jeweils zu einem Weiterentwicklung (mehr Daten zu günstigeren Preisen), aber auch zu einer potentiellen Änderung von Fehlerquellen führt. Eine Lösung hierfür wird es wohl erst in einiger Zeit gebe, wenn eine gewisse Ruhe bei der Weiterentwicklung eingekehrt ist und sich Methoden zur Fehlerabschätzung etablieren können. Solange bleibt es eine Herausforderung in der Weitergehenden Analyse mit der fehlenden bzw ungenauen Information umzugehen.
Auch beim Assembly besteht Bedarf an neuen Methoden, hier vorallem durch die schiere Datenmenge. Zwei der drei neuen Technologien (Abi-Solid und Illumina Solexa) produzieren sehr kurze (<100b Sequenzen), von diesen dafür sehr, sehr, sehr viele. Die Effizienz der etablierten Algorithmen reicht hier häufig nicht aus um auf realistischer Hardware Ergebnisse erzielen zu können.
Ein Problem stellt nun dar, dass die neuen Sequenziermethoden von Anfang an in Unternehmen weiterentwickelt werden. Diese Unternehmen liefern zu ihren Maschienen auch Programme zur weiterführenden Analyse mit. Diese Programme besitzen häufig eine grafische Benutzeroberfläche, sind aber nicht quelloffen und liefern qualitativ fragwürdige Ergebnisse.
Der gewissenhafte Benutzer greift hier auf an öffentlichen Forschungseinrichtungen entwickelte, quelloffene Programme zurück. Diese setzen allerdings ein Arbeiten an der Kommandozeile, häufig in einer Unix/Linux Umgebung voraus.
Um Ergebnisse einzelner Analyseschritte zwischen Programmen und Dateiformaten weiterzuleiten ist das Erlernen einer Script-Sprache wie Perl oder Python erforderlich. Im besten Fall gibt es für bestimmte Dateiformate sogar schon Benutzerschnittstellen in Bio-Perl/Phyton/Java oder in R-Bioconductor.
Für viele Biologen ist dieses Feld noch ungewohnt und so haben sich teilweise auch teure Programme etabliert, die zwar grafische Benutzeroberflächen bieten, aber keinen Zugang zu Quellcodes, fragwürdige Algorithmen und nicht reproduzierbare Ergebnisse mit sich bringen.
Für eine Doktorarbeit hat man in der Biologie etwa 3 Jahre Zeit, dies ist eine völlig ausreichende Zeit, um die ein oder andere Programmiersprache zu erlernen - auch ohne Vorkenntnisse, sogar ohne direkte Anleitung: Auf keinem anderen Gebiet bietet das Netz so detaillierte Informationen. Für die Mühe wird man dann außer dadurch, dass man seine Arbeit ordentlich erledigen kann auch damit belohnt, dass man das Gerät, vor dem man den Großteil seiner Arbeitszeit verbringt besser beherrscht.
Die Biologie hat sich von einer Disziplin mit überschaubaren Datensätzen zu einer mit riesigen Datenmengen entwickelt, und tut dies immer weiter.
Dies soll auch als Erklärung dafür dienen, dass ich in der nächsten Zeit weiter hier über eher technische Dinge schreiben werde.
Autor: Emanuel Heitlinger· 0 Kommentare· Permalink· Trackback-URL
Kommentar schreiben
Top5
- Liebe Piraten, lasst uns endlich vernünftig miteinander reden!Astrodicticum Simplex· 14.05.2012
- Impft Eure Kinder! Die Masern sind zurück!blooDNAcid· 09.05.2012
- Dr. h.c. im Sonderangebot für 39 Euro[sic]· 14.05.2012
- Wer braucht Forschungsreaktoren - Atomforschung abschaffen? Astrodicticum Simplex· 09.05.2012
- Die Erde dreht sich nicht um die Sonne...Astrodicticum Simplex· 12.05.2012
Top5
- Impft Eure Kinder! Die Masern sind zurück!blooDNAcid· 09.05.2012
- Liebe Piraten, lasst uns endlich vernünftig miteinander reden!Astrodicticum Simplex· 14.05.2012
- Gibt es ein "generisches Maskulinum"?Hier wohnen Drachen· 11.05.2012
- Sollten wir auf Fleisch verzichten?evolvimus· 11.05.2012
- Die kalte Sonne von Vahrenholt/Lüning: Le Trend, c'est moi!Primaklima· 16.05.2012
ScienceBlogs.com
- Doubt and other products: The National Toxicology Program's Report on Carcinogens, bad for whose business?by Elizabeth Grossman As it pursues its anti-regulatory agenda the ...The Pump Handle· 22.05.2012 · 16:39 Uhr
- Weekend Recap: My Annular Eclipse Expedition!A little more persistence a little more effort and what ...Starts With A Bang· 22.05.2012 · 00:11 Uhr
- Water, waterThis image has been going around the intertubes recently I ...A Few Things Ill Considered· 21.05.2012 · 22:59 Uhr
- To be or not to be? The Prevention and Public Health Fundby Kim Krisberg We will pay for this by taking ...The Pump Handle· 21.05.2012 · 15:19 Uhr
- An important revelation regarding Heartland Gate (global warming denialism)Peter Gleick has been cleared of faking a key memo ...Greg Laden's Blog· 21.05.2012 · 12:52 Uhr


