Information

14.2: DNA-Struktur und Sequenzierung - Biologie

14.2: DNA-Struktur und Sequenzierung - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Fähigkeiten zum Entwickeln

  • Beschreibe die Struktur der DNA
  • Erklären Sie die Sanger-Methode der DNA-Sequenzierung
  • Besprechen Sie die Ähnlichkeiten und Unterschiede zwischen eukaryotischer und prokaryotischer DNA

Die Bausteine ​​der DNA sind Nukleotide. Die wichtigen Bestandteile des Nukleotids sind eine stickstoffhaltige Base, Desoxyribose (5-Kohlenstoff-Zucker) und eine Phosphatgruppe (Abbildung (PageIndex{1})). Das Nukleotid wird in Abhängigkeit von der stickstoffhaltigen Base benannt. Die stickstoffhaltige Base kann ein Purin wie Adenin (A) und Guanin (G) oder ein Pyrimidin wie Cytosin (C) und Thymin (T) sein.

Die Nukleotide verbinden sich miteinander durch kovalente Bindungen, die als Phosphodiesterbindungen oder Bindungen bekannt sind. Die Purine haben eine Doppelringstruktur mit einem Sechsring, der zu einem Fünfring kondensiert ist. Pyrimidine sind kleiner; sie haben eine einzelne sechsgliedrige Ringstruktur. Die Kohlenstoffatome des Zuckers mit fünf Kohlenstoffatomen sind mit 1', 2', 3', 4' und 5' nummeriert (1' wird als „eine Primzahl“ gelesen). Der Phosphatrest ist an die Hydroxylgruppe des 5'-Kohlenstoffs eines Zuckers eines Nukleotids und die Hydroxylgruppe des 3'-Kohlenstoffs des Zuckers des nächsten Nukleotids gebunden, wodurch eine 5'-3'-Phosphodiesterbindung gebildet wird.

In den 1950er Jahren arbeiteten Francis Crick und James Watson zusammen, um die Struktur der DNA an der University of Cambridge, England, zu bestimmen. Auch andere Wissenschaftler wie Linus Pauling und Maurice Wilkins erforschten dieses Gebiet aktiv. Pauling hatte mittels Röntgenkristallographie die Sekundärstruktur von Proteinen entdeckt. In Wilkins’ Labor verwendete die Forscherin Rosalind Franklin Röntgenbeugungsmethoden, um die Struktur der DNA zu verstehen. Watson und Crick konnten das Puzzle des DNA-Moleküls anhand von Franklins Daten zusammensetzen, weil Crick auch die Röntgenbeugung untersucht hatte (Abbildung (PageIndex{2})). 1962 erhielten James Watson, Francis Crick und Maurice Wilkins den Nobelpreis für Medizin. Leider war Franklin bis dahin gestorben, und Nobelpreise werden nicht posthum verliehen.

Watson und Crick schlugen vor, dass die DNA aus zwei Strängen besteht, die umeinander verdreht sind, um eine rechtsgängige Helix zu bilden. Die Basenpaarung findet zwischen einem Purin und Pyrimidin statt; nämlich A-Paare mit T- und G-Paaren mit C. Adenin und Thymin sind komplementäre Basenpaare, und Cytosin und Guanin sind ebenfalls komplementäre Basenpaare. Die Basenpaare werden durch Wasserstoffbrücken stabilisiert; Adenin und Thymin bilden zwei Wasserstoffbrückenbindungen und Cytosin und Guanin bilden drei Wasserstoffbrückenbindungen. Die beiden Stränge sind von Natur aus antiparallel; das heißt, das 3'-Ende eines Strangs liegt dem 5'-Ende des anderen Strangs gegenüber. Der Zucker und das Phosphat der Nukleotide bilden das Rückgrat der Struktur, während die stickstoffhaltigen Basen im Inneren gestapelt sind. Jedes Basenpaar ist vom anderen Basenpaar durch einen Abstand von 0,34 nm getrennt, und jede Windung der Helix misst 3,4 nm. Daher sind pro Helixwindung zehn Basenpaare vorhanden. Der Durchmesser der DNA-Doppelhelix beträgt 2 nm und ist durchgehend einheitlich. Nur die Paarung zwischen Purin und Pyrimidin kann den einheitlichen Durchmesser erklären. Die Verdrillung der beiden Stränge umeinander führt zur Bildung von gleichförmig beabstandeten großen und kleinen Rillen (Abbildung (PageIndex{3})).

DNA-Sequenzierungstechniken

Bis in die 1990er Jahre war die DNA-Sequenzierung (Lesen der DNA-Sequenz) ein relativ teurer und langwieriger Prozess. Die Verwendung von radioaktiv markierten Nukleotiden verschlimmerte das Problem auch durch Sicherheitsbedenken. Mit der derzeit verfügbaren Technologie und automatisierten Maschinen ist der Prozess billiger, sicherer und kann in wenigen Stunden abgeschlossen werden. Fred Sanger entwickelte die Sequenzierungsmethode, die für das heute weit verbreitete Projekt zur Sequenzierung des menschlichen Genoms verwendet wird (Abbildung (PageIndex{4})).

Link zum Lernen: Besuchen Sie diese Website, um ein Video anzusehen, das die DNA-Sequenz-Lesetechnik erklärt, die aus Sangers Arbeit resultierte.

Das Verfahren ist als Didesoxy-Kettenabbruchverfahren bekannt. Die Sequenzierungsmethode basiert auf der Verwendung von Kettenabbrechern, den Didesoxynukleotiden (ddNTPs). Die Didesoxynukleotide oder ddNTPSs unterscheiden sich von den Desoxynukleotiden durch das Fehlen einer freien 3'-OH-Gruppe am Fünf-Kohlenstoff-Zucker. Wenn ein ddNTP zu einem wachsenden DNA-Strang hinzugefügt wird, wird die Kette nicht weiter verlängert, da die freie 3'-OH-Gruppe, die benötigt wird, um ein weiteres Nukleotid hinzuzufügen, nicht verfügbar ist. Durch Verwendung eines vorbestimmten Verhältnisses von Desoxyribonukleotiden zu Didesoxynukleotiden ist es möglich, DNA-Fragmente unterschiedlicher Größe zu erzeugen.

Die zu sequenzierende DNA-Probe wird denaturiert oder durch Erhitzen auf hohe Temperaturen in zwei Stränge getrennt. Die DNA wird in vier Röhrchen unterteilt, in denen ein Primer, DNA-Polymerase und alle vier Nukleotide (A, T, G und C) hinzugefügt werden. Zusätzlich zu jedem der vier Röhrchen werden jedem Röhrchen jeweils begrenzte Mengen eines der vier Didesoxynukleotide zugesetzt. Die Röhrchen sind entsprechend dem hinzugefügten ddNTP mit A, T, G und C gekennzeichnet. Zu Nachweiszwecken trägt jedes der vier Didesoxynukleotide einen anderen Fluoreszenzmarker. Die Kettenverlängerung wird fortgesetzt, bis ein fluoreszierendes Didesoxynukleotid eingebaut ist, wonach keine weitere Verlängerung stattfindet. Nach Beendigung der Reaktion wird eine Elektrophorese durchgeführt. Sogar ein Längenunterschied einer einzelnen Base kann festgestellt werden. Die Sequenz wird von einem Laserscanner gelesen. Für seine Arbeiten zur DNA-Sequenzierung erhielt Sanger 1980 den Nobelpreis für Chemie.

Link zum Lernen: Die Genomsequenzierung von Sanger hat zu einem Wettlauf um die schnelle und kostengünstige Sequenzierung menschlicher Genome geführt, die oft als 1000-Dollar-in-einem-Tag-Sequenz bezeichnet wird. Erfahren Sie mehr, indem Sie hier die Animation Sequencing at Speed ​​auswählen.

Gelelektrophorese ist eine Technik, die verwendet wird, um DNA-Fragmente unterschiedlicher Größe zu trennen. Normalerweise besteht das Gel aus einer Chemikalie namens Agarose. Agarosepulver wird in einen Puffer gegeben und erhitzt. Nach dem Abkühlen wird die Gellösung in eine Gießschale gegossen. Sobald das Gel verfestigt ist, wird die DNA auf das Gel geladen und elektrischer Strom angelegt. Die DNA hat eine negative Nettoladung und bewegt sich von der negativen Elektrode zur positiven Elektrode. Der elektrische Strom wird so lange angelegt, dass sich die DNA nach Größe trennen lässt; die kleinsten Fragmente sind am weitesten von der Vertiefung (wo die DNA geladen wurde) entfernt, und die Fragmente mit dem schwereren Molekulargewicht befinden sich am nächsten zur Vertiefung. Sobald die DNA getrennt ist, wird das Gel zur Ansicht mit einem DNA-spezifischen Farbstoff gefärbt (Abbildung (PageIndex{5})).

Evolution Connection: Neandertaler Genom - Wie sind wir verwandt?

Der erste Entwurf einer Sequenz des Neandertaler-Genoms wurde kürzlich von Richard E. Green et al. 2010,1 Neandertaler sind die nächsten Vorfahren des heutigen Menschen. Es war bekannt, dass sie in Europa und Westasien gelebt haben, bevor sie vor etwa 30.000 Jahren aus den Fossilienfunden verschwanden. Greens Team untersuchte fast 40.000 Jahre alte fossile Überreste, die aus Fundstätten auf der ganzen Welt ausgewählt wurden. Wegen der Zerbrechlichkeit der Knochen und der starken mikrobiellen Kontamination wurden äußerst ausgeklügelte Mittel zur Probenvorbereitung und DNA-Sequenzierung eingesetzt. In ihrer Studie konnten die Wissenschaftler rund vier Milliarden Basenpaare sequenzieren. Die Neandertaler-Sequenz wurde mit der heutiger Menschen aus der ganzen Welt verglichen. Nach dem Vergleich der Sequenzen fanden die Forscher heraus, dass das Neandertaler-Genom 2 bis 3 Prozent mehr Ähnlichkeit mit Menschen außerhalb Afrikas hatte als mit Menschen in Afrika. Während aktuelle Theorien nahelegen, dass alle heutigen Menschen auf eine kleine Vorfahrenpopulation in Afrika zurückgeführt werden können, können die Daten des Neandertaler-Genoms dieser Ansicht widersprechen. Green und seine Kollegen entdeckten auch DNA-Abschnitte bei Menschen in Europa und Asien, die Neandertaler-Sequenzen ähnlicher sind als anderen zeitgenössischen menschlichen Sequenzen. Eine weitere interessante Beobachtung war, dass Neandertaler mit Menschen aus Papua-Neuguinea genauso eng verwandt sind wie mit Menschen aus China oder Frankreich. Dies ist überraschend, da fossile Neandertalerreste nur in Europa und Westasien gefunden wurden. Höchstwahrscheinlich fand der genetische Austausch zwischen Neandertalern und modernen Menschen statt, als der moderne Mensch aus Afrika auftauchte, bevor sich Europäer, Ostasiaten und Papua-Neuguineer voneinander trennten.

Mehrere Gene scheinen während der Evolution des heutigen Menschen von Neandertalern verändert worden zu sein. Diese Gene sind an der Schädelstruktur, dem Stoffwechsel, der Hautmorphologie und der kognitiven Entwicklung beteiligt. Eines der besonders interessanten Gene ist RUNX2, das sich bei modernen Menschen und Neandertalern unterscheidet. Dieses Gen ist für den prominenten Stirnknochen, den glockenförmigen Brustkorb und die Zahnunterschiede bei Neandertalern verantwortlich. Es wird spekuliert, dass eine evolutionäre Veränderung in RUNX2 bei der Entstehung des modernen Menschen wichtig war und sich auf den Schädel und den Oberkörper auswirkte.

Link zu Learning Watch Svante Pääbos Vortrag über die Genomforschung des Neandertalers auf der Jahreskonferenz TED (Technology, Entertainment, Design) 2011.

DNA-Verpackung in Zellen

Wenn man prokaryontische Zellen mit eukaryontischen Zellen vergleicht, sind Prokaryonten in vielen ihrer Eigenschaften viel einfacher als Eukaryonten (Abbildung (PageIndex{6})). Die meisten Prokaryonten enthalten ein einzelnes, kreisförmiges Chromosom, das sich in einem Bereich des Zytoplasmas befindet, der als Nukleoid bezeichnet wird.

Kunstverbindung

In eukaryontischen Zellen findet die DNA- und RNA-Synthese in einem von der Proteinsynthese getrennten Kompartiment statt. In prokaryontischen Zellen laufen beide Prozesse zusammen ab. Welche Vorteile könnte die Trennung der Prozesse haben? Welche Vorteile könnte es haben, wenn sie zusammen auftreten?

Die Größe des Genoms in einem der am besten untersuchten Prokaryonten, E coli, beträgt 4,6 Millionen Basenpaare (ungefähr 1,1 mm, wenn geschnitten und gestreckt). Wie passt das in eine kleine Bakterienzelle? Die DNA wird durch das sogenannte Supercoiling verdreht. Supercoiling bedeutet, dass die DNA aus ihrem normalen entspannten Zustand entweder unterwunden (weniger als eine Helixwindung pro 10 Basenpaare) oder überwunden (mehr als 1 Windung pro 10 Basenpaare) ist. Von einigen Proteinen ist bekannt, dass sie am Supercoiling beteiligt sind; andere Proteine ​​und Enzyme wie DNA-Gyrase helfen bei der Aufrechterhaltung der Supercoiled-Struktur.

Eukaryoten, deren Chromosomen jeweils aus einem linearen DNA-Molekül bestehen, verwenden eine andere Verpackungsstrategie, um ihre DNA in den Zellkern einzupassen (Abbildung (PageIndex{7})). Auf der grundlegendsten Ebene ist die DNA um Proteine, die als Histone bekannt sind, gewickelt, um Strukturen zu bilden, die Nukleosomen genannt werden. Die Histone sind evolutionär konservierte Proteine, die reich an basischen Aminosäuren sind und ein Oktamer bilden. Die DNA (die wegen der Phosphatgruppen negativ geladen ist) ist eng um den Histonkern gewickelt. Dieses Nukleosom wird mit Hilfe einer Linker-DNA mit dem nächsten verbunden. Dies wird auch als „Perlen auf einer Schnur“-Struktur bezeichnet. Diese wird weiter zu einer 30 nm Faser verdichtet, was dem Durchmesser der Struktur entspricht. Im Metaphasestadium sind die Chromosomen am kompaktesten, haben eine Breite von etwa 700 nm und werden in Verbindung mit Gerüstproteinen gefunden.

In der Interphase haben eukaryotische Chromosomen zwei unterschiedliche Regionen, die durch Färbung unterschieden werden können. Die dicht gepackte Region wird als Heterochromatin bezeichnet, und die weniger dichte Region wird als Euchromatin bezeichnet. Heterochromatin enthält normalerweise Gene, die nicht exprimiert werden, und findet sich in den Regionen des Zentromers und der Telomere. Das Euchromatin enthält normalerweise transkribierte Gene, wobei die DNA um Nukleosomen herum verpackt, aber nicht weiter verdichtet ist.

Zusammenfassung

Das derzeit akzeptierte Modell der Doppelhelix-Struktur der DNA wurde von Watson und Crick vorgeschlagen. Einige der hervorstechenden Merkmale sind, dass die beiden Stränge, aus denen die Doppelhelix besteht, komplementär und antiparallel sind. Desoxyribose-Zucker und -Phosphate bilden das Rückgrat der Struktur, und die stickstoffhaltigen Basen sind im Inneren gestapelt. Der Durchmesser der Doppelhelix, 2 nm, ist durchgehend einheitlich. Ein Purin paart sich immer mit einem Pyrimidin; A paart mit T und G paart mit C. Eine Helixwindung hat zehn Basenpaare. Während der Zellteilung erhält jede Tochterzelle eine Kopie der DNA durch einen Prozess, der als DNA-Replikation bekannt ist. Prokaryoten sind in vielen ihrer Eigenschaften viel einfacher als Eukaryoten. Die meisten Prokaryoten enthalten ein einzelnes, kreisförmiges Chromosom. Im Allgemeinen enthalten eukaryotische Chromosomen ein lineares DNA-Molekül, das in Nukleosomen verpackt ist, und haben zwei unterschiedliche Regionen, die durch Färbung unterschieden werden können, die unterschiedliche Verpackungs- und Verdichtungszustände widerspiegeln.

Kunstverbindungen

[link] In eukaryontischen Zellen findet die DNA- und RNA-Synthese in einem von der Proteinsynthese getrennten Kompartiment statt. Welche Vorteile könnte die Trennung der Prozesse haben? Welche Vorteile könnte es haben, wenn sie zusammen auftreten?

[link] Die Kompartimentierung ermöglicht es einer eukaryontischen Zelle, Prozesse in einzelne Schritte aufzuteilen, sodass sie komplexere Protein- und RNA-Produkte aufbauen kann. Aber auch ein einziges Kompartiment hat einen Vorteil: Die RNA- und Proteinsynthese erfolgt in einer prokaryontischen Zelle viel schneller.

  1. 1

    Richard E. Green et al., „A Draft Sequence of the Neandertal Genome“, Wissenschaft 328 (2010): 710-22.

Glossar

Elektrophorese
Technik zur Trennung von DNA-Fragmenten nach Größe

16.4 Eukaryotische Transkriptionsgenregulation

Am Ende dieses Abschnitts können Sie Folgendes tun:

  • Diskutieren Sie die Rolle von Transkriptionsfaktoren bei der Genregulation
  • Erklären Sie, wie Enhancer und Repressoren die Genexpression regulieren

Wie bei prokaryotischen Zellen erfordert die Transkription von Genen in Eukaryoten die Wirkung einer RNA-Polymerase, um an eine DNA-Sequenz stromaufwärts eines Gens zu binden, um die Transkription zu initiieren. Im Gegensatz zu prokaryontischen Zellen benötigt die eukaryontische RNA-Polymerase jedoch andere Proteine ​​oder Transkriptionsfaktoren, um die Transkriptionsinitiation zu erleichtern. RNA-Polymerase allein kann die Transkription in eukaryontischen Zellen nicht initiieren. Es gibt zwei Arten von Transkriptionsfaktoren, die die eukaryotische Transkription regulieren: Allgemeine (oder basale) Transkriptionsfaktoren binden an die Kernpromotorregion, um die Bindung der RNA-Polymerase zu unterstützen. Spezifische Transkriptionsfaktoren binden an verschiedene Regionen außerhalb der Kernpromotorregion und interagieren mit den Proteinen am Kernpromotor, um die Aktivität der Polymerase zu verstärken oder zu unterdrücken.

Link zum Lernen

Sehen Sie sich den Transkriptionsprozess an – die Herstellung von RNA aus einer DNA-Vorlage.

Der Promoter und die Transkriptionsmaschinerie

Gene sind organisiert, um die Kontrolle der Genexpression zu erleichtern. Die Promotorregion befindet sich unmittelbar stromaufwärts der kodierenden Sequenz. Diese Region kann kurz (nur einige Nukleotide lang) oder ziemlich lang (Hunderte von Nukleotiden lang) sein. Je länger der Promotor, desto mehr Platz für die Bindung von Proteinen. Dies verleiht dem Transkriptionsprozess auch mehr Kontrolle. Die Länge des Promotors ist genspezifisch und kann sich zwischen den Genen dramatisch unterscheiden. Folglich kann sich auch der Grad der Kontrolle der Genexpression zwischen den Genen ziemlich dramatisch unterscheiden. Der Zweck des Promotors besteht darin, Transkriptionsfaktoren zu binden, die die Initiation der Transkription steuern.

Innerhalb der Kernpromotorregion befindet sich 25 bis 35 Basen stromaufwärts der Transkriptionsstartstelle die TATA-Box. Die TATA-Box hat die Konsensussequenz von 5’-TATAAA-3’. Die TATA-Box ist die Bindungsstelle für einen Proteinkomplex namens TFIID, der ein TATA-bindendes Protein enthält. Die Bindung von TFIID rekrutiert andere Transkriptionsfaktoren, einschließlich TFIIB, TFIIE, TFIIF und TFIIH. Einige dieser Transkriptionsfaktoren helfen, die RNA-Polymerase an den Promotor zu binden, und andere helfen, den Transkriptionsinitiationskomplex zu aktivieren.

Neben der TATA-Box finden sich in einigen Promotoren weitere Bindungsstellen. Einige Biologen ziehen es vor, den Bereich des eukaryotischen Promotors auf den Kernpromotor oder die Polymerase-Bindungsstelle zu beschränken, und bezeichnen diese zusätzlichen Stellen als promotornahe Elemente, da sie normalerweise innerhalb weniger hundert Basenpaare stromaufwärts der Transkriptionsstartstelle gefunden werden . Beispiele für diese Elemente sind die CAAT-Box mit der Konsensussequenz 5’-CCAAT-3’ und die GC-Box mit der Konsensussequenz 5’-GGGCGG-3’. Spezifische Transkriptionsfaktoren können an diese promotornahen Elemente binden, um die Gentranskription zu regulieren. Ein gegebenes Gen kann seine eigene Kombination dieser spezifischen Transkriptionsfaktor-Bindungsstellen aufweisen. Es gibt Hunderte von Transkriptionsfaktoren in einer Zelle, von denen jeder spezifisch an ein bestimmtes DNA-Sequenzmotiv bindet. Wenn Transkriptionsfaktoren direkt stromaufwärts des kodierten Gens an den Promotor binden, wird es als cis-wirkendes Element bezeichnet, da es sich auf demselben Chromosom direkt neben dem Gen befindet. Transkriptionsfaktoren reagieren auf Umweltreize, die dazu führen, dass die Proteine ​​ihre Bindungsstellen finden und die Transkription des benötigten Gens initiieren.

Enhancer und Transkription

In einigen eukaryotischen Genen gibt es zusätzliche Regionen, die helfen, die Transkription zu erhöhen oder zu verbessern. Diese Regionen, die als Enhancer bezeichnet werden, befinden sich nicht unbedingt in der Nähe der Gene, die sie verstärken. Sie können stromaufwärts eines Gens, innerhalb der kodierenden Region des Gens, stromabwärts eines Gens oder Tausende von Nukleotiden entfernt liegen.

Enhancer-Regionen sind Bindungssequenzen oder Stellen für spezifische Transkriptionsfaktoren. Wenn ein Proteintranskriptionsfaktor an seine Enhancersequenz bindet, ändert sich die Form des Proteins, wodurch es mit Proteinen an der Promotorstelle interagieren kann. Da die Enhancer-Region jedoch vom Promotor entfernt sein kann, muss sich die DNA biegen, damit die Proteine ​​an den beiden Stellen in Kontakt kommen können. DNA-Bending-Proteine ​​helfen, die DNA zu biegen und bringen die Enhancer- und Promotor-Regionen zusammen (Abbildung 16.9). Diese Formänderung ermöglicht die Wechselwirkung der spezifischen Aktivatorproteine, die an die Enhancer gebunden sind, mit den allgemeinen Transkriptionsfaktoren, die an die Promotorregion und die RNA-Polymerase gebunden sind.

Gene ausschalten: Transkriptionelle Repressoren

Wie prokaryontische Zellen verfügen auch eukaryontische Zellen über Mechanismen, um die Transkription zu verhindern. Transkriptionelle Repressoren können an Promotor- oder Enhancer-Regionen binden und die Transkription blockieren. Wie die Transkriptionsaktivatoren reagieren Repressoren auf externe Stimuli, um die Bindung von aktivierenden Transkriptionsfaktoren zu verhindern.


Materialen und Methoden

DNA-Isolierung

Ac Stamm Neff (ATCC 30010) wurde bei 30°C unter mäßigem Schütteln bis zu einer OD . gezüchtet550 von ungefähr 1,0. Die gesamten Nukleinsäurepräparationen wurden durch differentielle Zentrifugation von Zellextrakten von mitochondrialer DNA-Kontamination befreit [91]. DNA mit hohem Molekulargewicht wurde aus Kernpellets entweder auf Cäsiumchlorid-Hoechst 33258-Farbgradienten gemäß [92] oder unter Verwendung des Qiagen Genomic-tip 20/G Kits (Qiagen, Hilden, Deutschland) extrahiert.

Vorbereitung und Sequenzierung genomischer DNA-Bibliotheken

Alle genomischen DNA-Bibliotheken wurden gemäß dem Illumina-Protokoll erstellt. Genomic DNA Sample Prep Guide - Oligo Only Kit (1003492 A) Beschallung wurde anstelle der empfohlenen Vernebelung als Methode zur DNA-Fragmentierung mit einem Biorupter™ (Diagenode, Lüttich, Belgien) verwendet. Die Bibliotheksvorbereitungsmethodik der Endreparatur, um stumpfe Enden zu erzeugen, das Hinzufügen eines 3'-A-Überhangs für eine effiziente Adapterligation, die Ligation der Adapter und die Größenauswahl des mit dem Adapter ligierten Materials wurde unter Verwendung der im Protokoll angegebenen Enzyme durchgeführt. Adapter und Amplifikationsprimer wurden von Illumina (Illumina, San Diego, CA, USA) bezogen, sowohl Single-Read-Adapter (FC-102-1003) als auch Paired-End-Adapter (Katalognummer PE-102-1003) wurden bei der Bibliothekskonstruktion verwendet. Alle Enzyme zur Generierung einer Bibliothek wurden von New England Biolabs (Ipswitch, MA, USA) bezogen. Eine limitierte 14-Zyklen-Amplifikation von größenselektierten Bibliotheken wurde durchgeführt. Um Adapter-Dimere zu eliminieren, wurden die Bibliotheken weiter auf 2,5% TAE-Agarose-Gelen selektiert. Gereinigte Bibliotheken wurden unter Verwendung eines QubitTM Fluorometers (Invitrogen, Carlsbad, CA, USA) und eines Quant-iTTM doppelsträngigen DNA High-Sensitivity Assay Kit (Invitrogen) quantifiziert. Clustering und Sequenzierung des Materials erfolgte nach Herstellerangaben auf der Illumina GAII Plattform im UCD Conway Institute (UCD, Dublin, Irland).

RNA-Extraktion und RNA.seq-Bibliotheksvorbereitung und -sequenzierung

Für alle getesteten Bedingungen (Tabelle S1.6.1 in Zusatzdatei 1) mit Ausnahme der Infektionsserie wurde RNA aus mindestens 1 × 10 6 Zellen unter Verwendung von TRIzol® (Invitrogen/Life Technologies, Paisley, UK) extrahiert. Für Infektionsmaterial ist das ausführliche Protokoll in [93] veröffentlicht. Strangspezifische RNA.seq-Bibliotheken wurden aus Gesamt-RNA unter Verwendung einer modifizierten Version von [94] erzeugt, die in [93] detailliert beschrieben ist. Kurz gesagt wurde die Gesamt-RNA poly(A) selektiert, fragmentiert, revers transkribiert und Zweitstrang-cDNA durch Zugabe von dUTP markiert. Es wurde die Standardmethodik von Illumina befolgt - Endreparatur, A-Addition, Adapterligation und Auswahl der Bibliotheksgröße - mit Ausnahme der Verwendung von "Home-brew 6-Nukleotid-indizierten" Adaptern nach Craig et al. [95]. Vor der begrenzten Amplifikation der Bibliotheken wurde der dUTP-markierte zweite Strang durch Verdau mit Uracil-DNA-Glycosylase (Bioline, London, UK) entfernt. Die endgültigen Bibliotheken wurden unter Verwendung des High Sensitivity DNA Quant-iT™ Assay-Kits und des Qubit™ Fluorometers (Invitrogen/Life Technologies) quantifiziert. Alle Sequenzierungen wurden im UCD Conway Institute auf einem Illumina GAII gemäß den Anweisungen des Herstellers durchgeführt.

Sequenzierung und Montage

Die Genomassemblierung erfolgte in einem zweistufigen Verfahren. Zunächst wurden die Illumina-Reads mit dem Short-Read-Assembler Velvet [96] zusammengestellt, um eine Reihe von Contigs zu generieren. Diese zusammengesetzten Contigs wurden verwendet, um einen Satz von Pseudo-Reads mit einer Länge von 400 bp zu erzeugen. Diese Pseudo-Reads wurden dann in Verbindung mit den 454 FLX- und Sanger-Sequenzen unter Verwendung von Version 2.3 des GS De Novo Assembler unter Verwendung von Standardparametern zusammengestellt (Tabelle S1.1.1 in Zusatzdatei 1). Die Anordnung enthielt 45,1 Mb Gerüstsequenz, von denen 3,4 Mb (7,5%) Lücken darstellen und 75% des Genoms in weniger als 100 Gerüsten enthalten sind. Für Assemblierungsstatistiken siehe Tabelle S1.2.1 in Additional file 1. Um die Abdeckung des Transkriptoms zu bestimmen, haben wir unsere Genomassembly an einem öffentlich verfügbaren EST-Datensatz von GenBank (unter Verwendung der Entrez-Abfrage acanthamoeba EST) UND 'Acanthamoeba castellanii' [ porgn:txid5755]). Von den 13.784 heruntergeladenen EST-Sequenzen kartieren 12.975 (94%) über 50% ihrer Länge mit einer durchschnittlichen prozentualen Identität von 99,2% und 12.423 (90%) kartieren über 70% ihrer Länge mit einer durchschnittlichen prozentualen Identität von 99,26%.

Vorhersage der Genstruktur

Genfunde wurden an den größten 384 Gerüsten der Ac Zusammenbau mit einem iterativen Ansatz, indem zunächst Genmodelle direkt aus RNA.seq generiert werden, um einen Genfindungsalgorithmus mithilfe einer Genom-Annotationspipeline zu trainieren, gefolgt von einer manuellen Kuration. Zunächst wurden vorhergesagte Transkripte unter Verwendung von RNA.seq-Daten aus einer Vielzahl von Bedingungen (Tabelle S1.4.1 in zusätzlicher Datei 1) in Verbindung mit dem G.Mo.R-Se-Algorithmus (Gene Modeling using RNA.seq) generiert, ein Ansatz, der darauf abzielte beim Erstellen von Genmodellen direkt aus RNA.seq-Daten [97], die mit Standardparametern ausgeführt werden. Dieser Algorithmus erzeugte 20.681 vorhergesagte Transkripte. Wir verwendeten dann diese vorhergesagten Transkripte, um den Genfinder SNAP zu trainieren [98] unter Verwendung der MAKER-Genomannotationspipeline [99, 100]. MAKER wird für die Annotation von prokaryotischen und eukaryotischen Genomprojekten verwendet. Es identifiziert Repeats, richtet ESTs (in diesem Fall die vom G.Mo.R-Se-Algorithmus generierten Transkripte) und Proteine ​​von (nr) zu einem Genom aus, produziert ab-initio Genvorhersagen und synthetisiert diese Daten automatisch zu Genannotationen. Die 17.013 von MAKER generierten Genvorhersagen wurden dann manuell mit dem Apollo Genome Annotation Curation Tool annotiert [101, 102]. Apollo ermöglicht die Deletion von Genmodellen, die Erstellung von Genmodellen aus Annotationen und das Editieren von Genstarts, -stopps und 3'- und 5'-Spleißstellen. Die Modelle wurden manuell mit Anmerkungen versehen, wobei eine Vielzahl von Beweisen untersucht wurde, einschließlich ausgedrückter Sequenzdaten und Übereinstimmungen mit Proteindatenbanken (Abschnitt 1 der zusätzlichen Datei 1). Von insgesamt 113.574 Exons sind 32.836 exakt und 64.724 teilweise durch Transkripte abgedeckt und 7.193 Gene haben mindestens 50% ihrer Gesamtlänge durch Transkriptdaten abgedeckt.

Funktionale Annotationszuweisungen

Funktionale Annotationszuweisungen wurden mit einer Kombination aus automatisierter Annotation wie zuvor beschrieben [103] gefolgt von manueller Annotation durchgeführt. Kurz gesagt wurden Suchen auf Genebene in Protein-, Domänen- und Profildatenbanken durchgeführt, einschließlich JCVI-interner nicht redundanter Proteindatenbanken, Uniref [104], Pfam [105], TIGRfam HMMs [106], Prosite [107] und InterPro [ 108]. Nachdem dem Arbeitsgenset ein aussagekräftiger Name und eine Funktion zugewiesen worden waren, wurde jeder Name manuell kuratiert und dort geändert, wo es für möglich gehalten wurde, einen genaueren Namen zu verwenden. Vorhergesagte Gene wurden mittels Gene Ontology (GO) klassifiziert [109]. GO-Zuweisungen wurden automatisch zugewiesen, basierend auf anderen Zuweisungen von eng verwandten Organismen mit Pfam2GO, einem Tool, das eine automatische Zuordnung von Pfam-Treffern zu GO-Zuweisungen ermöglicht.


Schau das Video: DNA AufbauBiologie Lernvideo Learning Level Up (Dezember 2022).