Information

9: Genome, Gene und regulatorische Netzwerke - Biologie

9: Genome, Gene und regulatorische Netzwerke - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

An dieser Stelle haben wir Gene, DNA und Proteine ​​eingeführt, aber wir haben eine Reihe wichtiger Fragen ungelöst gelassen. Der Schlüssel ist, ruhig zu bleiben und weiter zu analysieren!


Genregulierungsnetzwerke

Eric H. Davidson, in The Regulatory Genome, 2006

Publisher-Zusammenfassung

Dieses Kapitel konzentriert sich auf die evolutionären Implikationen der Struktur und Funktion von Genregulationsnetzwerken. Veränderungen in gegebenen funktionellen Verknüpfungen von Genregulationsnetzwerken treten auf DNA-Ebene durch Veränderung der cis-regulatorischen Sequenz auf, die die Zielstellen des Transkriptionsfaktors definiert. Differenzierungsgene sind einzigartig in der regulatorischen Netzwerkstruktur positioniert und befinden sich an der Peripherie des Netzwerks. Im Gegensatz zu allen Genen, die die interne Struktur des Netzwerks bilden, haben ihre Produkte nicht die Funktion, andere Gene zu kontrollieren. Die Einschränkungen der evolutionären Veränderung der Differenzierungsgenbatteriefunktion unterliegen direkt der Selektion, da sie im Detail die meisten phänotypischen Funktionalitäten erzeugen, mit denen das Tier seiner Umwelt gegenübersteht. Der Körperplan ist in den internen Regionen des Genregulationsnetzwerks kodiert, die während der Entwicklung das Fortschreiten räumlicher Regulationszustände bestimmen, nicht das Geschäft der Differenzierungsgenbatterien. Viele der in den letzten Jahrzehnten erfassten groben regionalen Auswirkungen des Gewinns oder Verlusts von Hox-Gen-Mutationen auf die Morphologie erinnern an evolutionäre Diversifizierung.


Ähnliche Links

Verweise: Eine vergleichende Enzyklopädie der DNA-Elemente im Mausgenom. Yue F, Cheng Y, Breschi A, Vierstra J, Wu W, Ryba T, Sandstrom R, Ma Z, Davis C, Pope BD, Shen Y, Pervouchine DD, Djebali S, Thurman RE, Kaul R, Rynes E, Kirilusha A , Marinov GK, Williams BA, Trout D, Amrhein H, Fisher-Aylor K, Antoshechkin I, DeSalvo G, See LH, Fastuca M, Drenkow J, Zaleski C, Dobin A, Prieto P, Lagarde J, Bussotti G, Tanzer A , Denas O, Li K, Bender MA, Zhang M, Byron R, Groudine MT, McCleary D, Pham L, Ye Z, Kuan S, Edsall L, Wu YC, Rasmussen MD, Bansal MS, Kellis M, Keller CA, Morrissey CS, Mishra T, Jain D, Dogan N, Harris RS, Cayting P, Kawli T, Boyle AP, Euskirchen G, Kundaje A, Lin S, Lin Y, Jansen C, Malladi VS, Cline MS, Erickson DT, Kirkup VM, Learned K, Sloan CA, Rosenbloom KR, Lacerda de Sousa B, Beal K, Pignatelli M, Flicek P, Lian J, Kahveci T, Lee D, Kent WJ, Ramalho Santos M, Herrero J, Notredame C, Johnson A, Vong S , Lee K, Bates D, Neri F, Diegel M, Canfield T, Sabo PJ, Wilken MS, Reh TA, Giste E, Shafer A, Kutyavin T, Haugen E, Dunn D, Reynolds AP, N eph S, Humbert R, Hansen RS, De Bruijn M, Selleri L, Rudensky A, Josefowicz S, Samstein R, Eichler EE, Orkin SH, Levasseur D, Papayannopoulou T, Chang KH, Skoultchi A, Gosh S, Disteche C, Treuting P, Wang Y, Weiss MJ, Blobel GA, Cao X, Zhong S, Wang T, Good PJ, Lowdon RF, Adams LB, Zhou XQ, Pazin MJ, Feingold EA, Wold B, Taylor J, Mortazavi A, Weissman SM, Stamatoyannopoulos JA, Snyder MP, Guigo R, Gingeras TR, Gilbert DM, Hardison RC, Beer MA, Ren B Mouse ENCODE Konsortium. Natur. 2014 Nov. 20515 (7527): 355-64. doi: 10.1038/nature13992. PMID: 25409824.

Konservierung von trans-wirkenden Schaltkreisen während der regulatorischen Evolution von Säugetieren. Stergachis AB, Neph S, Sandstrom R, Haugen E, Reynolds AP, Zhang M, Byron R, Canfield T, Stelhing-Sun S, Lee K, Thurman RE, Vong S, Bates D, Neri F, Diegel M, Giste E, Dunn D, Vierstra J, Hansen RS, Johnson AK, Sabo PJ, Wilken MS, Reh TA, Treuting PM, Kaul R, Groudine M, Bender MA, Borenstein E, Stamatoyannopoulos JA. Natur. 2014 Nov. 20515 (7527): 365-70. doi: 10.1038/nature13972. PMID: 25409825.

Prinzipien der regulatorischen Informationserhaltung zwischen Maus und Mensch. Cheng Y, Ma Z, Kim BH, Wu W, Cayting P, Boyle AP, Sundaram V, Xing X, Dogan N, Li J, Euskirchen G, Lin S, Lin Y, Visel A, Kawli T, Yang X, Patacsil D , Keller CA, Giardine B Mouse ENCODE Consortium, Kundaje A, Wang T, Pennacchio LA, Weng Z, Hardison RC, Snyder MP. Natur. 2014 Nov. 20515 (7527): 371-5. doi: 10.1038/nature13985. PMID: 25409826.

Topologisch assoziierende Domänen sind stabile Einheiten der Replikationszeitsteuerung. Papst BD, Ryba T, Dileep V, Yue F, Wu W, Denas O, Vera DL, Wang Y, Hansen RS, Canfield TK, Thurman RE, Cheng Y, Gülsoy G, Dennis JH, Snyder MP, Stamatoyannopoulos JA, Taylor J , Hardison RC, Kahveci T, Ren B, Gilbert DM. Natur. 2014 Nov. 20515(7527):402-5. doi: 10.1038/nature13986. PMID: 25409831.

Regulatorische DNA-Landschaften der Maus zeigen globale Prinzipien der cis-regulatorischen Evolution. Vierstra J, Rynes E, Sandstrom R, Zhang M, Canfield T, Hansen RS, Stehling-Sun S, Sabo PJ, Byron R, Humbert R, Thurman RE, Johnson AK, Vong S, Lee K, Bates D, Neri F, Diegel M, Giste E, Haugen E, Dunn D, Wilken MS, Josefowicz S, Samstein R, Chang KH, Eichler EE, De Bruijn M, Reh TA, Skoultchi A, Rudensky A, Orkin SH, cPapayannopoulou T, Treuting PM, Selleri L, Kaul R, Groudine M, Bender MA, Stamatoyannopoulos JA. Wissenschaft. 2014 Nov. 21346(6212):1007-12. doi: 10.1126/science.1246426. PMID: 25411453.

Vergleich der Transkriptionslandschaften zwischen menschlichem und Mausgewebe. Lin S, Lin Y, Nery JR, Urich MA, Breschi A, Davis CA, Dobin A, Zaleski C, Beer MA, Chapman WC, Gingeras TR, Ecker JR, Snyder MP. Proc Natl Acad Sci USA. 2014 Dez. 2111(48):17224-9. doi: 10.1073/pnas.1413624111. Epub 2014 20. November. PMID: 25413365.

Finanzierung: National Human Genome Research Institute (NHGRI) der NIH, National Institute of General Medical Sciences (NIGMS), National Cancer Institute (NCI), National Institute of Diabetes and Digestive and Kidney Diseases (NIDDK), Eunice Kennedy Shriver National Institute of Child Health and Human Entwicklung (NICHD), National Heart, Lung, and Blood Institute (NHLBI), National Institute of Environmental Health Sciences (NIEHS), National Institute on Drug Abuse (NIDA), National Institute of Mental Health (NIMH), National Institute of Neurological Disorders and Stroke (NINDS) und dem NIH Common Fund Spanish Plan Nacional Wellcome Trust Howard Hughes Medical Institute National Science Foundation und dem American Recovery and Reinvestment Act.


Ergebnisse

Oxidative und antioxidative Bewertung der drei Hochland-Baumwollakzessionen CRI12, LAT40 und MAR85 unter Salzstressbedingungen

Die drei Hochland-Baumwoll-Genotypen sind morphologisch identisch und weisen keine signifikanten Variationen bei jeglicher Stressbelastung auf, daher wurde in dieser Studie keine Berücksichtigung verschiedener morphologischer Merkmale berücksichtigt. Wir beobachteten jedoch Variationen beim Wurzelwachstum und der Biomasseakkumulation, CRI12 und LAT40 hatten eine relativ höhere Wurzel- und insgesamt höhere Biomasse im Vergleich zu MAR85 (Abb. 1a). Darüber hinaus zeigten MAR85 und CRI12 bei der Durchführung einer Tiefenanalyse der Konzentrationen von oxidativen und antioxidativen Enzymen im Blattgewebe der drei Sorten unter Salzstressbedingungen signifikant höhere Konzentrationen von Prolin und Superoxiddismutase (SOD) im Vergleich zu LAT40 (Abb. 1b), ein Hinweis darauf, dass CRI12 und MAR85 im Vergleich zu LAT40 unter Salzstress weniger beeinflusst wurden. Darüber hinaus ist die Konzentration von Malondialdehyd (MDA) in den Pflanzen ein Hinweis darauf, dass die Pflanzen unter oxidativem Stress leiden, da MDA ein Nebenprodukt der Lipidperoxidation ist [22]. Die erhaltenen Ergebnisse stimmten mit früheren Ergebnissen überein, in denen der Knockdown des Trihelix-Transkriptionsfaktors in Baumwolle die Dürre- und Salzstresstoleranz reduzierte und wiederum die Akkumulation verschiedener Oxidationsmittel und MDA-Spiegel unter Trocken- und Salzstress-Exposition beschleunigte [22].

Morphologische und physiologische Eigenschaften von MAR85, CRI12 und LAT40 nach Salz-Alkali-Stressbehandlung. ein Sämlings-Phänotyp in verschiedenen Entwicklungsstadien in drei Akzessionen von Hochlandbaumwolle. B Der dynamische PRO-, MDA- und SOD-Gehalt nach Salz-Alkali-Stressbehandlung

Sequenzierung und Transkriptidentifikation

Die Transkriptionsanalysen von drei Akzessionen von G. hirsutum unterschieden sich signifikant in ihren morphologischen Eigenschaften sowie ihren entscheidenden Einsichten auf Systemebene in die molekularen Mechanismen, die der Alkali-Salz-Stressantwort zugrunde liegen [23, 24]. In dieser Studie wurden eine Hochland-Baumwollsorte (CRI12, China) und zwei weitere wilde Hochland-Baumwollsorten (LAT40, G. hirsutum Rasse latifolium40 und MAR85, G. hirsutum race mari-garant85) wurden für die Transkriptionsanalyse verwendet, indem eine RNA-Sequenzierung an ihren Geweben durchgeführt wurde, wenn sie Salzstress ausgesetzt waren. Zwei Organe wurden betrachtet, das Blatt und die Wurzel der drei Akzessionen, in vier verschiedenen Behandlungsstadien wurden die Proben mit Rt_0h, Rt_3h, Rt_12h, Rt_48h für die Wurzelproben und Blattproben mit Lf_0h, Lf_3h, Lf_12h und Lf_48h kodiert, alle die Proben wurden dreimal repliziert. Die Leistung der drei Hochland-Baumwollakzessionen wurde in vier verschiedene Gruppen eingeteilt, als normales Wachstumsstadium (CK0), frühes Alkalisalz-Stressreaktionsstadium (SS3), Sämlinge signifikant geschädigtes Stadium (SS12) und Sämling-Wiederherstellungsstadium (SS48). Um die Transkriptomdynamik während der Alkali-Salz-Stressbehandlung zu untersuchen, wurde die Gesamt-RNA aus dem Blatt und der Wurzel von drei Akzessionen von . isoliert G. hirsutum in vier verschiedenen Behandlungsstufen. Insgesamt wurden aus 48 cDNA-Bibliotheken 1.106.485.712 Nummern der Raw-Reads erzeugt, nach der Reinigung wurden 1.097.617.134 (99,19 %) saubere Reads erhalten. Der Prozentsatz der zugeordneten Lesevorgänge unter den sauberen Lesevorgängen in jeder Bibliothek reichte von 83,88 bis 89,61 %, außerdem reichte der Anteil der sauberen Lesevorgänge mit einem Phred-Qualitätswert von 30 % von 94,37 bis 97,05 %. Darüber hinaus wurden die Clean Reads auf das Referenzgenom von ausgerichtet Gossypium hirsutum (ANZEIGE1), in dem 83,06 bis 89,73 % der aus den 48 Proben generierten Reads dem Referenzgenom zugeordnet wurden, was 77,4–82,3 % der eindeutig kartierten Reads des Referenzgenoms ergab. G. hirsutum Genom. Interessanter war, dass die einzigartig kartierten Reads mithilfe von HT-seq (Python-Paket) mit höherer Effizienz und Genauigkeit auf das Referenzgenom abgebildet wurden (Tabelle 1 und https://www.ncbi.nlm.nih.gov/sra/ PRJNA531727).

Transkriptions- und Expressionsanalyse in verschiedenen Geweben der drei Baumwollarten unter Salzstressbedingungen

Insgesamt wurden 64.737 Gene identifiziert, und die Anzahl der exprimierten Gene in verschiedenen Proben variierte von 51.586 bis 57.263, wie durch RNA-Sequenzdatenanalyse nachgewiesen wurde ( 2a ). Um die globalen Unterschiede in der Transkriptomdynamik während unterschiedlicher Behandlungsstadien zu verstehen, wurden die Expressionsverteilungsanalyse, Korrelationsanalyse, Hauptkomponentenanalyse (PCA) und hierarchische Clusterbildung basierend auf FPKM-Werten für alle exprimierten Gene in mindestens einem der 32 . realistisch durchgeführt Gewebeproben (Abb. 2b). Die Blattproben zeigten ein niedrigeres Expressionsniveau als die Wurzel und das gleiche Behandlungsgewebe/Behandlungsstadium von drei Akzessionen von G. hirsutum zeigt die ähnliche Expressionsverteilung. Die Analyse des Korrelationskoeffizienten nach Pearson unter den kombinierten 32 Proben zeigte eine signifikantere Korrelation im gleichen Gewebe-/Behandlungsstadium unter drei Akzessionen von G. hirsutum (Abb. 2c). Wie erwartet, gruppierten sich die Blatttranskriptome von drei kontrastierenden Hochlandbaumwollrassen zusammen und zeigten erhebliche Unterschiede mit den Behandlungspunkten. LAT40 und CRI12 zeigten eine genauere Korrelation und ein ähnlicher Phänotyp im Blatt nach Alkalisalzbehandlung zeigte eine hohe Ähnlichkeit in ihren Transkriptionsprogrammen. Verglichen mit den CK0-Stadien zeigten sich SS3, SS12 und SS48 näher in Wurzel und Blatt von drei Akzessionen von Hochlandbaumwolle (Abb. 2d). Es deutete auf einen signifikanten Unterschied der Transkriptionsprogramme zwischen dem Standard- und dem Alkalisalz-Stresszustand hin. Insgesamt zeigten Gewebe/Behandlungsstadien in diesen Analysen eine höhere Korrelation, von denen erwartet wurde, dass sie ähnlichere Transkriptome und Funktionen/Aktivitäten aufweisen.

Genexpressionsanalyse von drei Akzessionen von G. hirsutum. ein Expressionsverteilung verschiedener Proben B Heatmap des Ergebnisses der Probenkorrelationsanalyse basierend auf der globalen Transkriptomexpression unter Alkali-Salz-Stress C Diagramm der Hauptkomponentenanalyse (PCA) basierend auf der globalen Transkriptomexpression unter Alkalisalz-Stress D Clustering von Proben basierend auf globaler Transkriptom-Expression unter Alkali-Salz-Stress

Differentielle Genexpression nach Alkalisalzbehandlung

Um das unterschiedliche Expressionsmuster der verschiedenen Transkriptionsfaktoren in den drei Hochlandbaumwollakzessionen zu untersuchen, wurden zwei Gewebe profiliert, das Blatt- und Wurzelgewebe unter Salzstressbedingungen. Die Gesamtzahl der differentiell exprimierten Gene (DEGs) variierte von 8663 (MAR85L_CK0 vs. MAR85L_SS12) bis 22.068 (CRI12R_CK0 vs. CRI12R_SS12) außerdem wurden die DEGs aus paarweisen Vergleichen gewonnen (MAR85L: MAR85L_C0 vs MAR85L_CK0 vs. MAR85L_SS48 MAR85R, LAT40L/R und CRI12L/R paarweise Vergleich war ähnlich mit MAR85L) unter Verwendung der DEGseq-Software (Abb. 3a). Eine größere Anzahl von DEGs wurde in Wurzeln beobachtet (insgesamt 41.132 DEGs) als in Blättern (insgesamt 35.724 DEGs), was darauf hindeutet, dass die Wurzeln das Hauptgewebe sein könnten, das von Salzstress betroffen sein könnte und somit eine dynamischere und komplexere Genregulation aufweisen um die Toxizität von Salzen für die Wurzelzellen zu reduzieren. Die erhaltenen Ergebnisse stimmen mit früheren Erkenntnissen über Genexpressionsmuster überein, die dazu neigen, gewebespezifisch zu sein. Magwanga et al. [25] fanden heraus, dass eine hohe Zahl der LEA Gene waren in den Blattgeweben im Vergleich zu Stamm- und Wurzelgeweben unter Trockenstressbedingungen stark hochreguliert. Verglichen mit den Stadien SS3 (21.738 und 30.525, in Blättern bzw. Wurzeln) und SS48 (23.418 bzw. 26.533, in Blättern bzw. Wurzeln) wies das SS12-Stadium (28.521 bzw. 32.560, in Blättern bzw. Wurzeln) die höchste Zahl auf von DEGs in Wurzel und Blatt, was darauf hindeutet, dass das SS12-Stadium stärker für die Reaktion auf Alkalisalz-Stress aktiviert war. Interessanterweise zeigte MAR85 die niedrigste Anzahl der DEGs in allen Stadien im Vergleich zu LAT40 (höchste Anzahl von DEGs) und CRI12. Es zeigte, dass die inkonsistenten Reaktionen auf Alkali-Salz-Stress von drei Zugängen von Hochlandbaumwolle. Darüber hinaus wurden 3509 (SS3 VS. CK0), 8138 (SS12 VS. CK0) und 5955 (SS48 VS. CK0) gemeinsame DEGs in jedem Stadium nach der Alkalisalzbehandlung in den Blättern von drei Hochlandbaumwoll-Akzessionen identifiziert. Dann wurden 8870 (SS3 VS. CK0) (Fig. 3e), 10.428 (SS12 VS. CK0) und 7281 (SS48 VS. CK0) DEGs in den Wurzeln identifiziert (Fig. 3b). Die variable Anzahl unterschiedlich exprimierter Gene deutete darauf hin, dass jede Gewebe-/Alkalisalz-Behandlungsstufe ihre eigenen unabhängigen Entwicklungsprogramme beibehielt. Alternativ kann die transkriptionelle Komplexität lediglich die Kompliziertheit der eingefangenen Samenstadien widerspiegeln, die mehr als einen Zelltyp enthielten.

Analyse verschiedener Expressionsgene (DEGs) von drei Akzessionen von G. hirsutum. ein DEGs-Zahl nach Alkalisalzbehandlung B-g DEGs in verschiedenen Behandlungsstadien in Blatt und Wurzel (L3 h, L12 h, L48 h, R3h, R12h bzw. R48h)

Funktionale Annotation von DEGs-Sets in den drei Akzessionen von Hochlandbaumwolle an verschiedenen Geweben (Blatt und Wurzel)

Insgesamt 22.359 DEGs (11.818 bzw. 15.674 in Blatt und Wurzel) wurden für die funktionelle Anreicherung und die gewichtete Co-Expressions-Netzwerkanalyse (WGCNA) verwendet. Die Clusteranalyse, Folge der 27.492 DEGs, war der Clusteranalyse aller Gene ähnlich. Diese empirische Beobachtung unterstützte diese 22.359 DEGs, die aus dem Blatt- und Wurzelgewebe in den drei verschiedenen Baumwollakzessionen erhalten wurden, und konnten die Variationen in den analysierten Proben genau veranschaulichen. Die gemeinsamen DEGs jedes Gewebes/Stadiums in drei Akzessionen von Hochlandbaumwolle wurden weiter verwendet, um die Anreicherungsanalyse der Gen-Ontologie (GO) und der Kyoto-Enzyklopädie der Gene und Genome (KEGG) durchzuführen. Insgesamt wurden 17.985 Gene annotiert, wobei 7836 und 10.149 Gene unterschiedlich in den Blättern bzw. Wurzeln exprimiert wurden. Von den 7836 annotierten DEGs wurden 105 GO-Terme bei . signifikant angereichert P-Wert ≤0.05, FDR ≤ 0.05 (Zusätzliche Datei 6: Tabelle S2). In Roots wurden mehr DEGs annotiert, jedoch fanden sich nur 96 GO-Terme signifikant angereichert (Zusatzdatei 7: Tabelle S3). Darüber hinaus wurden 54 GO-Begriffe häufig zwischen Blatt- und Wurzelgewebe angereichert, einschließlich Oxidations-Reduktionsprozess (GO: 0055114), Kohlenhydrat-Stoffwechselprozess (GO: 0005975), Oxidoreduktase-Aktivität (GO: 0016491), Protein-Serin/Threonin-Kinase-Aktivität ( GO: 0004713) und Transkriptionsfaktoraktivität (GO: 0003700), von denen bekannt war, dass sie an der abiotischen Stressreaktion beteiligt sind.

Gewebespezifische Anreicherungs-GO-Terme wurden beobachtet, wo die aus dem Blatt erhaltenen DEGs signifikant in Photosynthese (GO: 0015979) und photosynthese-bezogenen GO-Termen (GO: 0019684, GO: 0009765) angereichert waren. Darüber hinaus wurden alle 4163 DEGs (2426 bzw. 2667 DEGs in Blättern und Wurzeln) mithilfe der KEGG-Datenbank angereichert. Die DEGs von Blatt und Wurzel wurden in 30 bzw. 34 KEGG-Termen mit dem Q-Wert von signifikant angereichert ≤0.0001, und Gennummer für jeden analysierten Ausdruckssatz bei 3 (Zusatzdatei 8: Tabelle S4 und Zusatzdatei 9: Tabelle S5). Die Signaltransduktion von Pflanzenhormonen (ko04075) und die Biosynthese von Sekundärmetaboliten (ko01110) waren die am häufigsten nachgewiesenen KEGG-Pfade (Zusatzdatei 2: Abbildung S1 und S2), und es wurde bereits festgestellt, dass die beiden Pfade signifikant an der abiotischen Stressreaktion beteiligt sind [26,27,28,29].Darüber hinaus wurden blattspezifisch angereicherte KEGG-Begriffe entdeckt, die sich auf den Photosyntheseapparat des Pflanzenblattes beziehen, wie Photosynthese (ko00195) und Photosynthese - Antennenproteine ​​(ko00196). Obwohl die Alkali-Salz-Stressreaktion an komplexeren Signalübertragungs- und Oxidations-Reduktionsprozessen beteiligt ist, könnten die nachgewiesenen DEGS eine zentrale Rolle im Blatt- und Wurzelgewebe von Baumwolle unter Salzstressbedingungen spielen. Abgesehen von den DEGs analysierten wir die verschiedenen Pflanzentranskriptionsfaktoren mit mutmaßlicher Funktion bei der Verbesserung der Salzstresstoleranz unter den drei verwendeten Baumwollsorten. Insgesamt wurden 2080 TFs identifiziert, wobei 991 TFs unter den DEGs in den Blattgeweben nachgewiesen wurden, während 1577 TFs aus den DEGs stammten, die aus den Wurzeln des Wurzelgewebes analysiert wurden (Zusatzdatei 10: Tabelle S6). Die für die TFs erhaltenen Ergebnisse korrelierten positiv mit der Verteilung der DEGs, bei denen mehr in den Wurzeln als im Blattgewebe exprimiert wurden, ein Hinweis darauf, dass die Wurzeln das primäre Pflanzengewebe sein könnten, das unter Salz stark betroffen ist Stressbedingungen. In allen identifizierten TFs wurden 53 verschiedene Genfamilien mit den TFs wie ZF-HD, SRS, S1Fa-like, SAP und NF-X1 TFs-Familien für die DEGs für das Wurzelgewebe identifiziert, während die YABBY TF-Familie , wurde für die DEGs nachgewiesen, die für die Blattgewebe gefunden wurden.

Co-Expression Netzwerk- und Modulbau

Um das Genregulationsnetzwerk der Alkali-Salz-Stressantwort in Hochlandbaumwolle zu untersuchen, identifizierten wir koexprimierte Gensets mittels Weighted Gene Co-Expression Network Analysis (WGCNA), die verwendet werden können, um Netzwerke (Module) hochkorrelierter Gene zu finden [30 ]. In der vorliegenden Studie wurden 22.359 DEGs für WGCNA verwendet. Um ein skalenfreies Netzwerk zu gewährleisten, ist die Leistung von β = 12 (skalenfreies R2 = 0,8740) wurde durch Bestimmung der weichen Schwellenleistung (Zusatzdatei 3: Abbildung S3A/B) und Auswertung der skalenfreien Topologieanalyse (Zusatzdatei 3: Abbildung S3C/D) genau ausgewählt. Stellvertretend für die Interaktion zwischen Genen mit ähnlichen Expressionsprofilen wurden mehrere Netzwerke identifiziert, die als Co-Expressionsmodule bezeichnet wurden. Über die Dynamic Tree Cut Methode (Kernparameter: MEDissThres = 0,25) wurden insgesamt 20 Module identifiziert, die von 135 Genen im Mistyrose-Modul bis zu 4793 Genen im Darkmagenta-Modul variierten. Von 20 Modulen waren 17 Gene nicht brauchbar, die im grauen Modul angezeigt, von keinem anderen Modul ausgewählt werden konnten (Zusatzdatei 4: Abb. 4a-b). Tausend Gene wurden zufällig ausgewählt, um Gennetzwerke zu visualisieren. Gene im gleichen Modul zeigten eine höhere topologische Überlappung (Zusatzdatei 4: Abbildung S4), was darauf hindeutet, dass Netzwerke (Module), die von WGCNA konstruiert wurden, biologische nützliche Funktionen haben.

Co-Expression-Netzwerk-Konstruktion von drei Zugängen von Hochland-Baumwolle. ein Clustering-Dendrogramm von 22.359 verschiedenen exprimierten Genen, mit Unähnlichkeit basierend auf topologischer Überlappung. Die Farbreihen ermöglichen einen einfachen visuellen Vergleich der Modulzuordnungen (Astschnitte) nach dem dynamischen Hybrid-Astschnittverfahren. B Gennummer jedes Netzwerks/Moduls

Identifizierung und Visualisierung von gewebe-/stadienspezifischen Modulen in Blatt und Wurzel von Hochlandbaumwolle

Ein zusammenfassendes Profil (Eigengen) für jedes Modul, das von WGCNA erhalten wurde. Zum Beispiel, das Clustering von Heatmap und Eigengen-Balkendiagramm von Modulen, die stark mit den Merkmalen korrelierten, die in (Fig. 5a) gezeigt wurden, repräsentierte die Genexpressionsniveaus jedes Moduls. Um die Korrelation zwischen Modul und Merkmal zu bestimmen, haben wir Eigengene mit Alkalisalzbehandlungsstufen bzw. Hochlandbaumwollrassen über die Pearson-Korrelationskoeffizientenanalyse verknüpft. Interessanterweise ist keines der Module signifikant mit drei Hochland-Baumwollrassen (r ≥ 0,60, p ≤ 0,01) jedoch zeigten 11 Co-Expressionsmodule eine relativ höhere Korrelation (r ≥ 0,60) mit SS3-, SS12-, SS48-Stadien in Blatt und Wurzel von Hochlandbaumwolle (Abb. 5b-c). Es deutete darauf hin, dass die Co-Expressionsnetzwerke in den verschiedenen Stadien signifikant unterschiedlich waren. Im Gegenteil, keines der Co-Expressionsnetzwerke wurde mit drei Akzessionen von Hochlandbaumwolle assoziiert, was darauf hindeutet, dass ein besonderes regulatorisches Netzwerk der Alkali-Salz-Stressreaktion in verschiedenen Hochlandbaumwollrassen vorliegt. Die Stufen SS12 und SS48 wurden mit mehr als einem Modul korreliert. SS12-Stadium wurde mit der braunen 2 korreliert (Gen-Nummer: 1163, r = 0,79), dunkelolivgrün (Gennummer: 416, r = 0,76) und dunkles Meergrün 4 (Gennummer: 237, r = 0,68) Module im Blatt und korreliert mit mittelgroßer Orchidee (Gennummer: 241, r = 0,66) und Blauviolett (Gennummer: 2632, r = 0,71) Module im Stamm bzw. SS48-Stadium wurde mit nebliger Rose in Verbindung gebracht (Gen-Nummer: 135, r = 0,67) und hellschieferblau (Gennummer: 1300, r = 0,87) Module im Blatt, verbunden mit hellem Stahlblau1 (Gen-Nummer: 1218, 0,87) und Orange-Rot 4 (Gen-Nummer: 536, r = 0,85) Module im Stamm bzw. Während nur ein Modul mit dem SS3-Stadium korreliert war (navajo white (Gen-Nummer: 326, r = 0,88) moduleSS3-Stufe in Blattorangerot1 (Gennummer: 1836, r = 0,95) Modul-SS3-Stufe im Root). Interessanterweise waren die hoch und signifikant korrelierten Module alle positiv mit unterschiedlichen Stadien korreliert, was darauf hindeutet, dass unterschiedliche Expressionsgene in unterschiedlichen Geweben/Stadien überwiegend als Reaktion auf Alkalisalz-Stress hochreguliert wurden.

Visualisierung von Genexpressionsniveaus und Eigengenwerten signifikanter Module. ein Clustering-Heatmap und Balkendiagramm repräsentieren die Genexpressionsniveaus jedes Moduls. In den Heatmaps reichen die Farben von Grün bis Rot, was jeweils auf niedrige bis hohe Expressionsniveaus hindeutet. B Heatmap der Korrelationen zwischen Modul und verschiedenen Behandlungsstadien in Blatt und Wurzel. C Heatmap der Korrelation zwischen Modulen und drei Akzessionen von Hochlandbaumwolle in Blatt und Wurzel. Die Farben von Blau über Weiß bis Rot zeigen jeweils niedrige über mittlere bis hohe Korrelationen an. ME, die erste Hauptkomponente der standardisierten Ausdrucksprofile eines bestimmten Moduls

GO-Anreicherungsanalyse

Wir führten eine GO-Anreicherungsanalyse von Genen in gewebe-/stadienspezifischen Modulen durch. Die angereicherten GO-Begriffe sind in (Zusatzdatei 12: Tabelle S8) dargestellt. Die GO-Analyse kategorisiert die Gene in drei mögliche Gruppen, nämlich zelluläre Komponente (CC), molekulare Funktionen (MF) und biologische Prozesse (BP). Die für die DEGs nachgewiesenen molekularen Funktionen waren Signalwandleraktivität (GO:0004871) und Phosphorelay-Reaktionsregulatoraktivität (GO:0000156), die im SS3-Stadium signifikant angereichert waren, Proteintyrosinkinaseaktivität (GO:0004713), Proteinkinaseaktivität (GO :0004672) und Protein-Serin/Threonin-Kinase-Aktivität (GO:0004674) waren die Top 3, die im SS12-Stadium im Blatt hoch angereichert waren, während Nukleinsäurebindung der regulatorischen Region (GO:0001067), DNA-Bindung der regulatorischen Region der Transkription (GO:0044212), regulatorische DNA-Bindung der Region (GO:0000975) waren die Top 3, die im SS48-Stadium signifikant angereichert waren (P < 0,001, FDR < 0,05) im Blatt. In der GO-Anreicherungsanalyse für den biologischen Prozess (BP) wurde in den SS3-Stadien der Blattproteinphosphorylierung (GO:0006468), der Makromolekülmodifikation (GO:0043412) und des Proteinmodifikationsprozesses (GO:0036211) kein signifikanter Stoffwechselweg identifiziert die drei wichtigsten Stoffwechselwege im SS12-Stadium im Blatt, während der Stoffwechselprozess eines einzelnen Organismus (GO:0044710), der Kohlenhydrat-Stoffwechselprozess (GO:0005975) und der Oxidations-Reduktionsprozess (GO:0055114) die drei wichtigsten Stoffwechselwege im SS48-Stadium im Blatt waren . Für die GO-Analyse der molekularen Funktion, der Aktivität des Nukleinsäure-bindenden Transkriptionsfaktors (GO:0001071), der Aktivität des Transkriptionsfaktors, der sequenzspezifischen DNA-Bindung (GO:0003700) und der Oxidoreduktase-Aktivität, die auf gepaarte Spender wirkt, mit Einbau oder Reduktion von molekularem Sauerstoff (GO :0016705) waren die Top 3, die im SS3-Stadium in der Wurzel signifikant angereichert waren im SS12-Stadium in der Wurzel, während die Oxidoreduktase-Aktivität (GO:0016491), die Acyl-CoA-Dehydrogenase-Aktivität (GO:0003995) und die katalytische Aktivität (GO:0003824) im SS48-Stadium in der Wurzel die drei signifikant angereicherten waren. Interessanterweise wurde Oxidoreduktase-Aktivität in verschiedenen Differenzierungsstadien gefunden. In der GO-Anreicherungsanalyse des biologischen Prozesses waren die Regulation des RNA-Biosyntheseprozesses (GO:2001141), die Regulation der Transkription, DNA-Templat (GO:0006355), die Regulation der Nukleinsäure-gestützten Transkription (GO:1903506) die Top 3 signifikant angereichert GO-Begriffe im SS3-Stadium in der Wurzel-Regulation des RNA-Stoffwechselprozesses (GO:0051252), Regulation des RNA-Biosyntheseprozesses GO:2001141 und Regulation der Transkription, DNA-templatiert (GO:0006355) waren die drei wichtigsten Wege im SS12-Stadium in der Wurzel. Ähnlich wie beim SS12-Stadium im Blatt waren der Stoffwechselprozess eines einzelnen Organismus (GO: 0044710), der Einzelorganismus-Prozess (GO: 0044699) und der Oxidations-Reduktionsprozess (GO: 0055114) die drei wichtigsten Wege im SS48-Stadium in der Wurzel. Insgesamt wurde die Signaltransduktion im SS3- und SS12-Stadium durchgeführt und die Transkription wurde im SS48-Stadium im Blatt reguliert. Obwohl es kompliziert ist, den Alkali-Salz-Stress in der Wurzel zu regulieren, wurde die Regulierung der Oxidations-Reduktion in allen Stadien durchgeführt. Die erhaltenen Ergebnisse stimmten mit früheren Ergebnissen überein, in denen ähnliche GO-Begriffe für verschiedene auf Stress reagierende Gene identifiziert wurden, wie z LEA Gene [25], KAMERAD Gene [31] unter anderem.

Identifizierung zentraler und hochgradig verbundener Gene

Um Hub-Gene unter dem Salz-Alkali-Stress zu identifizieren, wurden zwei verschiedene Methoden zum Screening von Genen verwendet. Jedes Gen Möglichkeitsgewicht (P. Gewicht) wurde durch die Netzwerk-Screening-Funktion des WGCNA-Pakets basierend auf Gensignifikanz (GS), modularer Mitgliedschaft (MM) und niedrigeren P. Der Gewichtswert zeigte, dass das Gen eine höhere Korrelation mit Merkmalen (Behandlungsstadien) aufwies. Die Top 30 Hub Gene wurden basierend auf p identifiziert. Gewicht. In der zweiten Methode wurden die Top 150 und Top 300 hochgradig verbundene Gene für höhere Korrelationsmodule verschiedener Stadien für die Analyse basierend auf der topologischen Überlappungsmatrix (TOM) aller differentiellen Expressionsgene ausgewählt. Darüber hinaus wurden die 30 wichtigsten Gene, die zentral und hoch verbunden waren, mit der Software Cytoscape 3.3.0 visualisiert (Zusatzdatei 11: Tabelle S7, Abb. 6a-b). Insgesamt 180 Hub Gene mit höherer Korrelation mit verschiedenen Behandlungsstadien wurden gefunden und 180 Gene mit höherer Konnektivität wurden auch in sechs verschiedenen Stadien ausgewählt, in denen 39 gemeinsame Gene durch zwei verschiedene Methoden identifiziert wurden, die die Kernrolle dieser Gene als Reaktion auf Alkalisalz-Stress anzeigten. Interessanterweise wurden 19 und 18 gemeinsame Gene in SS3L- und SS48L-Stadien erhalten, aber keines der gemeinsamen Gene wurde in anderen Stadien gefunden. Transmembranproteine ​​(Pfam: DUF3082), Gh_D11G2953 und Gh_A11G2587, waren die Gene am stärksten mit anderen Genen und in SS3L-Stadien unter Alkali-Salz-Stress korreliert. Protein der Galactosyltransferase-Familie (Gh_D05G1401 und Gh_A05G1229) und Protein der Lysin-Decarboxylase-Familie (Gh_D05G1724 und Gh_A03G0267) wurde ebenfalls ein Hinweis darauf beobachtet, dass diese Gene im SS3L-Stadium in Bezug auf die Salzstresstoleranz signifikant wichtige Faktoren waren.

Visualisierung von Genverbindungen in verschiedenen Modulen durch Heatmap und Cytoscape 3.3.0. Im oberen Teil des A-F-Bildes, Heatmap-Plots, die die Beziehungen zwischen den 30 wichtigsten Genen darstellen, die durch Netzwerk-Screening identifiziert wurden. Jede Spalte und Zeile der Heatmap entspricht einem einzelnen Gen Helle Farben bedeuten topologische Überlappungen progressiv dunklere Farben entsprechen höheren topologischen Überlappungen. Im unteren Teil des A-F-Bildes Verbindungen von 30 Hub-Genen, die aus den Top 150 hochgradig verbundenen Genen und den Top 300 Verbindungen von hochgradig verbundenen Genen höherer Korrelationsmodule ausgewählt wurden. Die Plots A-F zeigen die Hub Gennetzwerk von L3 h, L12 h, L48 h, R3h, R12h bzw. R48h

Drei verschiedene stärkeverzweigende Enzyme (Gh_A02G1739, Gh_D02G0995 und Gh_Sca006745G03) und zwei Proteine ​​der RING/U-Box-Superfamilie (Gh_D05G0963 und Gh_D07G1649) wurden identifiziert, die in SS48L-Stadien eine wichtige Rolle spielen könnten. Homologe Genpaare wurden zur gleichen Zeit von WGCNA identifiziert, was auf ihre potenzielle Schlüsselrolle bei der Regulation von Alkali-Salz-Stress in Baumwolle hindeutet. Insgesamt wurden 35 TFs gefunden unter Hub Gene zeigten von 26 TFs eine höhere Konnektivität zu verschiedenen DEGs. Darüber hinaus hatten 4 der gemeinsamen Gene von den 35 TFs eine höhere Korrelation mit anderen Genen und Behandlungsstadien unter Alkali-Salz-Stress, waren Mitglieder des Doppel-B-Box-Zinkfingers (DBB, Gh_A10G0877 und Gh_A11G2610) und Kernfaktor YA (NF-YA, Gh_D03G0606 und Gh_Sca006219G01) TF-Familie. Insgesamt 321 Hub Gene wurden identifiziert, darunter 35 Transkriptionsfaktoren.

Validierung der Hub-Gene durch RT-qPCR

Um das Expressionsniveau und die Funktion des Hub Gen wurden 12 Gene ausgewählt und ihre Expressionsanalysen durchgeführt. In jedem der ausgewählten Gene wurden in fünf Proben zufällig per RT-qPCR untersucht. Die Genprimerinformationen von 12 Hub Gene wurde entworfen und Details sind enthalten in (Zusatzdatei 5: Tabelle S1, Zusatzdatei 6: Tabelle S2, Zusatzdatei 7: Tabelle S3, Zusatzdatei 8: Tabelle S4, Zusatzdatei 9: Tabelle S5, Zusatzdatei 10: Tabelle S6 , Zusatzdatei 11: Tabelle S7, Zusatzdatei 12: Tabelle S8). Wir fanden, dass die Genexpressionsdaten der RT-qPCR signifikant hoch korreliert waren (cor = 0,7397, P-Wert = 1,458e-11) mit den Daten von RNA-seq (Abb. 7a). Dieses Ergebnis bewies, dass die RNA-seq-Daten in dieser Forschung zuverlässig waren. Darüber hinaus wurden die Hub-Gene im Vergleich zum Expressionsniveau von Kontrollsämlingen unter Salzstressbedingungen unterschiedlich exprimiert, was darauf hindeutet, dass die von WGCNA identifizierten Hub-Gene eine mutmaßliche Rolle bei der Salz-Alkali-Stressantwort spielen.

Validierung von Hub-Genen durch RT-qPCR

Erhöhte Salzempfindlichkeit in GhSOS3 und GhCBL10 Virus-induzierte Gene Silencing (VIGS) Sämlinge

Um die Funktionen von Hub-Genen weiter zu untersuchen, GhSOS3 und GhCBL10, das VIGS pYL156-GhPDS, pYL156-Ctrl, pYL156-GhSOS3 und pYL156-GhCBL10 Pflanzen wurden unter Salz-Alkali-Stress beobachtet. Albinoblätter wurden in mit pYL156-PDS beimpften Sämlingen nach 7 Tagen Beimpfung beobachtet. Im Vergleich zu infizierten Sämlingen stellten wir fest, dass Kontrollsämlinge nach 20 Tagen Inokulation ein schnelles Wachstum aufwiesen. Darüber hinaus wurden keine Unterschiede zwischen infizierten Sämlingen festgestellt (Abb. 8a). Die Ausdrucksstufen von GhSOS3 und GhCBL10 wurden durch RT-qPCR überprüft. Im Vergleich zu pYL156-Ctrl-Keimlingen wurden Expressionsniveaus von GhSOS3 und GhCBL10 wurden in den entsprechenden Gen-Silencing-Keimlingen nach 20 Tagen Inokulation herunterreguliert ( 8b ). Der Urlaub von pYL156-GhSOS3 und pYL156-GhCBL10 Sämlinge verwelkten und verwelkten im Vergleich zur Kontrolle und den pYL156-Ctrl-Keimlingen nach 20 Tagen Salz-Alkali-Stressbehandlung (Fig. 8c). Außerdem war der PRO- und SOD-Gehalt niedriger in pYL156-GhSOS3 und pYL156-GhCBL10 Sämlinge verglichen mit Kontroll- und pYL156-Ctrl-Keimlingen nach 20 Tagen Salz-Alkali-Stressbehandlung. Im Gegenteil, der MDA-Gehalt war höher in pYL156-GhSOS3 und pYL156-GhCBL10 Sämlinge im Vergleich mit Kontroll- und pYL156-Ctrl-Keimlingen (Fig. 8d). Dieses Ergebnis vorgeschlagen pYL156-GhSOS3 und pYL156-GhCBL10 Die Sensibilität der Sämlinge wurde verbessert.

Phänotypbewertung, Expressionsanalyse und biochemische Assays an VIGS- und Wildtyp-Pflanzen unter Alkali-Salz-Stress. ein Der Phänotyp des normalen (CK), pYL156-Ctrl, pYL156-PDS, pYL156-GhSOS3 und pYL156-GhCBL10 Sämlinge von MAR85. B Der Phänotyp des normalen (CK), pYL156-Ctrl, pYL156-PDS, pYL156-GhSOS3 und pYL156-GhCBL10 Sämlinge von MAR85 nach 20 Tagen nach der Salz-Alkali-Stressbehandlung. C Das Ausdrucksniveau von GhCBL10 und GhSOS3 Gene auf den VIGS, WT und positiv kontrollierten Pflanzen unter normalen Bedingungen (D) PRO-, MDA- und SOD-Gehalt im Normalzustand (CK), pYL156-Strg, GhSOS3 und pYL156-GhCBL10 Sämlinge von MAR85 nach Salz-Alkali-Stressbehandlung


Methoden

Genregulatorische Netzwerke und Motive.

Wir haben die Menge der regulatorischen Interaktionen für E coli aus dem Datensatz in Ref. 2, das die in der RegulonDB-Datenbank 7 verfügbaren Informationen nutzt und aus der Literatur zusammengestellte neue Interaktionen bereitstellt. Es gab 1.409 regulatorische Interaktionen mit 121 Transkriptionsfaktoren und 795 Zielgenen. Wir haben 42 FFMs und 30 SIMs in diesem Netz gefunden. Wir haben die Transkriptionsfaktoren und ihre Zielgene in Hefe dem Datensatz in Lit. entnommen. 3, die aus 906 Interaktionen mit 109 Transkriptionsfaktoren und 402 Zielgenen bestand. Es gibt 131 FFMs und 29 SIMs in diesem Netzwerk. Die große Anzahl von FFMs in Hefe spiegelt die umfangreiche Transkriptionsfaktor-Interregulation im Eukaryonten im Vergleich zum Prokaryonten wider. Einzelheiten hierzu finden Sie in der Ergänzenden Anmerkung online.

Identifizierung von duplizierten Genen.

Der Nachweis von Homologie zwischen entfernten paralogen Proteinen in einem Organismus ist wegen der Sequenzdivergenz eine schwierige Aufgabe. Es ist jedoch bekannt, dass die Struktur eines Proteins stärker konserviert ist als seine Sequenz. Um zuverlässig entfernte Beziehungen zwischen E coli und Hefeproteinen verwendeten wir dreidimensionale Strukturdomänenzuordnungen der Proteine ​​im Netzwerk als Maß für die Homologie. Wenn zwei Proteine ​​dieselbe Domänenarchitektur oder eine Reihe von Domänen aus denselben Proteinfamilien aufwiesen, nahmen wir an, dass sie von demselben gemeinsamen Vorfahren stammen, wie durch die Analyse der Proteinstrukturen 26 und Sequenzen 27 gestützt.

Wir erhielten Domänenarchitekturen aus den Domänenzuordnungen in der SUPERFAMILY-Datenbank 13 (Version 1.61) für die Proteinsequenzen in der Hefe und E coli Genome. Evolutionäre Informationen über Domänen sind dem Klassifikationsschema der SCOP-Datenbank 28 inhärent, und die Hidden-Markov-Modelle der SUPERFAMILY-Datenbank basieren auf diesen Domänen.

Wir betrachteten Domänenarchitekturen, die sich nur durch Lücken oder Wiederholungen von Domänen unterschieden, als homolog, da Wiederholungen manchmal von der strukturellen Zuordnungsmethode übersehen werden. Beim Vergleich mit Sequenzclustern, die von FASTA 29 ganzer Sequenzen gefunden wurden (E-Wert ≤ 0,01 in einer großen Datenbank, Übereinstimmung mit über 80% Sequenz), teilt unsere Methode zum Vergleichen von Domänenarchitekturen niemals Sequenzcluster auf. Mehrere Sequenzcluster hatten jedoch dieselbe Domänenarchitektur. Um die Abdeckung der Methode zu verdeutlichen, hatten 48% aller Hefeproteine ​​im Genom eine Domänenzuordnung, während nur ∼ 5% von FASTA in der oben beschriebenen Weise geclustert werden können.

Wenn nur für ein Protein in einem Transkriptionsfaktor-regulierten Genpaar eine Domänenzuweisung vorlag, konnten wir die Duplikation nur dann verfolgen, wenn das Paar in eine geeignete Netzwerktopologie eingebettet war. Wenn beispielsweise einem Transkriptionsfaktor eine Domänenzuordnung fehlte, aber zwei homologe Gene reguliert wurden, konnten wir die Evolution solcher Interaktionen immer noch verfolgen (Abb. 2b).

Identifizierung von duplizierten Kanten und Simulationsverfahren.

Wir bewerteten die Bedeutung der gemeinsamen Interaktionen zwischen Homologen durch Vergleich mit einem Szenario, in dem die Domänenarchitekturen zufällig über Proteine ​​gemischt wurden. Wir haben dies simuliert, indem wir die Topologie des realen Netzwerks beibehalten und Domänenarchitekturen zufällig zwischen diesen Knoten mit Domänenarchitekturinformationen gemischt haben. Wir haben die Transkriptionsfaktoren getrennt von den Zielgenen gemischt. Wir führten die Simulation 10.000 Mal durch und berechneten jedes Mal die Anzahl der homologen Transkriptionsfaktoren mit gemeinsamen Zielen und der homologen Zielgene mit gemeinsamen Transkriptionsfaktoren. Der Anteil an Homologen mit geteilten Interaktionen war in allen 10.000 Iterationen der Berechnung (Supplementary Methods online) nie so hoch wie im realen Netzwerk.

Informationen zum verwendeten Datensatz und strukturellen Zuordnungen finden Sie unter http://www.mrc-lmb.cam.ac.uk/genomes/madanm/net_evol/.

Notiz: Zusatzinformationen ist auf der Website von Nature Genetics verfügbar.


Materialen und Methoden

Regulatorische Wechselwirkungen

Wir erhielten regulatorische Interaktionen aus RegulonDB 5.6 [1]. Nach Entfernung von RNA-Genen und Pseudogenen sowie des Housekeeping-Sigma-Faktors RpoD hatten wir 159 charakterisierte TFs, 1.354 regulierte Gene und 3.085 regulatorische Interaktionen zwischen ihnen. Einige der TFs sind in diesen Fällen Heterodimere, wir haben nur eine der beiden Untereinheiten analysiert. Wir untersuchten auch TF- und Gen-Annotationen in EcoCyc [47] und bekannte Operons in RegulonDB.

Evolutionsgeschichten von TFs

Wir haben die Evolutionsgeschichte von TFs untersucht, indem wir den Genbaum mit dem Artenbaum verglichen haben. Als ersten Schritt verwendeten wir schnelle Neighbor-Joining-Bäume [48] für COGs, PFams und Ad hoc BLAST-Familien aus dem MicrobesOnline-Baumbrowser [49] und wir verglichen die Genbäume mit dem MicrobesOnline-Artenbaum. (Die wichtigsten Teile des Artenbaums sind in Abbildung 2 dargestellt, und der Aufbau des Artenbaums wird unten beschrieben.)

Anhand eines Genbaums und eines Artenbaums identifizierten wir horizontale Transferereignisse unter Verwendung einer Kombination der Genphylogenese und des Musters der Genpräsenz und Genabwesenheit. Wenn eine stark unterstützte Klade im Genbaum in unterschiedlichen Genomen vorhanden war, so dass drei oder mehr Deletionsereignisse erforderlich wären, um die Verteilung der Unterfamilie auf dem Artenbaum zu erklären, dann haben wir ein HGT-Ereignis zugeordnet. Deletionen in den stark reduzierten Genomen der Insekten-Endosymbiontengruppe (Buchnera, Wigglesworthia, und Blochmannia) wurden nicht als Beweis für HGT angesehen. Da HGT bei Bakterien häufig vorkommt, ist die Schwelle von drei oder mehr Deletionsereignissen konservativ. Insbesondere bei höheren Schwellenwerten ist eine große Anzahl von Deletionen von Vorfahrenbakterien erforderlich, um die gegenwärtige Verteilung der Gene zu erklären, die unverhältnismäßig große Genome der Vorfahrenbakterien voraussetzt [50, 51].

Wenn der Genbaum Paraloge aufwies und die Phylogenie zweier Untergruppen mit dem Artenbaum übereinstimmte, ordneten wir ein Genduplikationsereignis zu. Historien, die keines dieser Kriterien erfüllten, wurden als heimisch betrachtet, selbst wenn es geringfügige Abweichungen zwischen dem Artenbaum und dem Genbaum gab. Wenn ein Gen sowohl für HGT als auch für Duplikation Beweise aufwies, haben wir das jüngste Ereignis verwendet, um den Ursprung des Gens zu klassifizieren (z. Schnurren/rbsR, in Abbildung 4, wird als Duplikat klassifiziert).

Sobald wir eine vorläufige Klassifikation hatten, bestätigten wir sie, indem wir auf nahe Homologe (durch BLASTp) überprüften, die in der Genfamilie fehlen könnten (aufgrund der Einschränkungen der Genfamilienzuordnung) und indem wir einen kleineren und genaueren phylogenetischen Stammbaum für ein ausgewähltes . erstellten Teilmenge von Homologen. Um diese qualitativ hochwertigeren Bäume zu bauen, verwendeten wir MUSCLE [52], um die Proteinkodierungssequenzen auszurichten, Gblocks, um die Ausrichtungen zu trimmen [53] und sowohl TreePuzzle [54] als auch phyml [55], um phylogenetische Bäume zu erstellen.

Wir haben auch gefragt, ob das mutmaßliche HGT-Ereignis die E coli Abstammung. Zum Beispiel, wie für . gesehen crp (Abbildung 5), schlägt der Baum ein Transferereignis von E coli's Vorfahren zu einer anderen Linie, aber das bedeutet nicht, dass E coli's Vorfahren haben das Gen von HGT erworben. Diese Gene wurden als nativ klassifiziert.

Wir gehen davon aus, dass diese Gene von anderen Bakterien in die E coli Abstammung, anstatt und umgekehrt, obwohl es theoretisch möglich ist, dass diese TFs in den E coli Linie vor relativ kurzer Zeit und wurden dann an einen anderen Ort übertragen. Da die meisten TFs zu großen Familien gehören, die in vielen anderen Bakterienstämmen vorkommen, und auch weil diese TFs oft entfernte Paraloge in E coli, ein neuer Ursprung dieser Familien innerhalb der E coli Abstammung ist nicht plausibel.

Baumart

Der Artenbaum wurde aus den Maximum-Likelihood-Bäumen verketteter Proteine ​​unter Verwendung der Matrixdarstellung der Sparsamkeit berechnet [56]. Die Maximum-Likelihood-Bäume wurden aus einem Leitbaum geringerer Qualität erzeugt, indem für jeden internen Knoten im Leitbaum eine kleine Anzahl von Nachkommengenomen und nahen Fremdgruppen (insgesamt weniger als 20 Genome) ausgewählt wurde. Angesichts dieser kleinen Genomgruppe identifizierten wir COGs [22], die in jedem Genom als einzelne Kopie vorhanden sind. Da diese Genomgruppen normalerweise aus nahen Verwandten bestanden, gab es typischerweise Hunderte von konservierten Genen. Wir haben jedes COG ausgerichtet und getrimmt, wiederum mit MUSCLE und Gblocks, und die Ausrichtungen verkettet. Da die resultierenden Alignments oft sehr groß waren, haben wir invariante Sites entfernt, und wenn das Alignment immer noch über 5.000 Positionen enthielt, haben wir eine Zufallsstichprobe von Sites gezogen. Wir haben dann mit Phyml einen Baum erstellt, der vier Kategorien von Evolutionsraten verwendet. Wir haben die Bäume in eine Zeichenmatrix [56] umgewandelt und PAUP 4.0b10 [57] verwendet, um den sparsamsten Baum abzuleiten. Schließlich verwendeten wir PHYLIP [58], um aus einem verketteten Alignment von 74 hochkonservierten Proteinen die maximale Wahrscheinlichkeit der Verzweigungslängen mit gamma-verteilten Raten abzuleiten.

Eine ausführlichere Beschreibung der Baumstruktur der Art ist online verfügbar [49]. Der Baum enthält keine Bootstrap-Werte, aber die meisten Quellbäume haben eine starke Bootstrap-Unterstützung und sind deckungsgleich (Daten nicht gezeigt). Die relevantesten Unsicherheiten sind die Platzierung von Fotorhabdus, und ob Sodalis sollte mit den anderen Insekten-Endosymbionten gruppiert werden (Buchnera und so weiter).

Bemusterung von Reglern

Wir haben alle Top 20 der globalen Regulierungsbehörden untersucht, auf die etwa zwei Drittel der regulatorischen Interaktionen in RegulonDB entfallen. Für benachbarte Regulatoren haben wir diejenigen untersucht, die in einer früheren Zusammenstellung regulatorischer Interaktionen, ColiNet 1.1 [59] beschrieben wurden, die wir in der Anfangsphase dieses Projekts verwendet haben. Obwohl dies keine wirklich zufällige Stichprobe ist, kennen wir keinen Grund, warum die neueren charakterisierten Regulatoren eine unterschiedliche Evolutionsgeschichte haben. Wir haben eine Zufallsstichprobe von 23 der anderen charakterisierten Regulatoren in RegulonDB untersucht. Auch hier handelte es sich in erster Linie um Regulatoren, die im ColiNet beschrieben wurden.

Wir identifizierten mutmaßliche Regulatoren in E coli K12 durch Suche nach Genontologie GO:0003700 ('Transcription Factor Activity') unter Verwendung der MicrobesOnline-Datenbank. Wir wählten 20 von ihnen zufällig aus, um sie zu untersuchen, und wir überprüften, dass sie Helix-Turn-Helix-Domänen enthalten (unter Verwendung von InterPro), dass sie nicht als Restriktionsenzyme oder DNA-Modifikationsenzyme annotiert wurden und dass sie nicht bereits charakterisiert wurden nach EcoCyc [47].

Automatische Identifizierung von HGT-Genen

Um HGT automatisch zu identifizieren, suchten wir in aufeinanderfolgenden Gruppen verwandter Bakterien nach Genen, denen enge Homologe fehlen (Abbildung 9). Wir haben „nahe“ Homologe durch BLAST-Werte definiert, und um das mutmaßliche HGT zu bestätigen, haben wir einen Quartetttest verwendet (siehe Abbildung 9). Dieser Ansatz steht im Gegensatz zu Ansätzen, die stark auf dem Genbaum beruhen [13, 24] und ähnelt eher Präsenz-/Abwesenheitsanalysen [60, 61]. Obwohl die Methode konservativ ist und viele HGT-Ereignisse übersieht (Daten nicht gezeigt), klassifiziert sie etwa ein Viertel der proteinkodierenden Gene in E coli K12 als HGT, was eine ausreichend große Probe für die Analyse ergibt.

Automatisierte Identifizierung von HGT-Genen. Wir untersuchten die höchsten Scores des Basic Local Alignment Search Tool (BLAST) von Homologen innerhalb von Genomgruppen in zunehmenden Abständen von Escherichia coli. War der BLAST-Score in zwei aufeinanderfolgenden Gruppen im Vergleich zu seinem besten Score in weiter entfernten Genomen wesentlich niedriger (um den Faktor 1,3), dann wurde das Gen als Kandidat für den horizontalen Gentransfer (HGT) angesehen. Bei solchen Kandidaten haben wir dann mit einem Quartetttest festgestellt, ob der beste Treffer aus dem weiter entfernten Genom tatsächlich näher mit dem E coli Gen als die besten Hits von Zwischengenomen waren. Der Quartetttest bestätigte HGT in 92 % dieser Fälle, und für 71 % der Gene, deren Quartetttopologie HGT anzeigte, wurde die Topologie stark unterstützt (P < 0,05, durch Shimodaira-Hasegawa-Test in Baumrätsel [54]). 'HPVS' bezieht sich auf Hämophilus, Pasteurella, Vibrio, Shewanella, und verwandte Arten.

Der Quartetttest wurde nicht durchgeführt, wenn in jeder der Genomgruppen, denen gute Treffer zum Gen „fehlen“, kein weiter entferntes Homolog vorlag, da wir in diesen Fällen nicht über vier Gene verfügen, aus denen ein Quartett gebildet werden könnte. Wenn wir ein Gen aus jeder Genomgruppe hatten, richteten wir die vier Gene mit MUSCLE aus, entfernten Positionen mit Lücken und testeten die Wahrscheinlichkeit aller drei Topologien mit einem Baumrätsel [54] unter Verwendung von Gamma-verteilten Evolutionsraten.

Gemischtes Regulierungsnetzwerk

Um zu testen, ob die regulatorischen Ähnlichkeiten zwischen Paralogen häufiger auftraten, als wir es zufällig erwarten würden, haben wir eine einfache Nullhypothese verwendet, dass sich das regulatorische Netzwerk zufällig entwickelt. Diese Nullhypothese entspricht einem vereinfachten neutralen Modell, bei dem Bindungsstellen für Regulatoren neutral auftreten und Bindungsstellen für globale Regulatoren häufiger auftreten als für andere Regulatoren, so dass sie mehr Gene regulieren.

Um diese Nullhypothese zu testen, haben wir das Netzwerk so gemischt, dass die Anzahl der Interaktionen für jeden TF und für jedes regulierte Gen unverändert blieb (ähnlich dem Bericht von Maslov und Sneppen [62], jedoch für regulatorische Netzwerke). Genauer gesagt haben wir die regulierten Gene für jeden TF ausgewählt, indem wir aus dem vollständigen Satz regulierter Gene ersatzlos Proben genommen haben. Wir haben Teile des Netzwerks erneut abgetastet, um doppelte Interaktionen zwischen regulierten Genen und TFs zu vermeiden. Dies ergab Netzwerke mit dem gleichen Verteilungsgrad wie das ursprüngliche Netzwerk, sowohl für TFs als auch für regulierte Gene.

Ein alternativer Randomisierungstest besteht darin, die Paralogie-Beziehungen anstelle der regulatorischen Netzwerke zu permutieren. (Siehe den Bericht von Teichmann und Babu [4], obwohl sie eher die Terminologie von 'Domänenarchitekturen' als Paralogie verwenden.) Dieser Test bestätigte, dass konvergente Evolution im realen Netzwerk häufiger vorkommt als zufällig erwartet alle drei Arten konvergenter Ähnlichkeiten in Tabelle 1 waren im realen Netzwerk häufiger als in 999 oder mehr der 1.000 Paralogie-Shuffles, die wir durchgeführt haben.

Vorhersage von Bindungsstellen für globale Regulatoren

Wir erhielten charakterisierte CRP-Bindungsstellen in E coli von DPInteract [34]. Wir haben diese Sites mit MEME ausgerichtet [63], das Alignment in eine Gewichtsmatrix mit palindromischer Symmetrie umgewandelt und mit Patser [64] nach Sites gesucht. Wir suchten von -200 bis +100 relativ zum Startcodon jedes Gens und betrachteten nur potentielle Stellen mit einem Score von 6,0 Bit oder höher. Dieser Cut-off ist ziemlich schwach und führt zu einer hohen Sensitivität, aber einer bescheidenen Spezifität, die wir an Stellen gefunden haben E coli für 13 der 16 von uns untersuchten CRP-regulierten Gene, aber 13% der zufällig ausgewählten Upstream-Regionen für Xenologe von E coli Gene hatten einen Hit bei 6.0 Bit oder höher. Dennoch ist es unwahrscheinlich, dass die xenologischen CRP-Standorte in Tabelle 2 zufällig entstanden sind yiaK und gntK Hits über 10 Bit haben, was in weniger als 1% der Upstream-Regionen auftritt, und araB hat zwei benachbarte Stellen, was auf eine kooperative Bindung hindeutet und auch nicht zufällig auftritt.

Analysen für andere globale Regulierungsbehörden, die Gewichtsmatrizen in DPInteract haben, wurden ähnlich durchgeführt, jedoch ohne dass die Gewichtsmatrix palindromisch ist. Einige der Sigma-Faktoren haben mehrere Modelle, in diesem Fall haben wir die beste Punktzahl für jedes Modell verwendet. Die Gewichtsmatrizen für lrp und fis wurden wegen ihrer geringen Spezifität nicht verwendet [34].


Verweise

Lee TI, Rinaldi NJ, Robert F, Odom DT, Bar-Joseph Z, Gerber GK, Hannett NM, Harbison CT, Thompson CM, Simon I, et al.: Transkriptionelle Regulierungsnetzwerke in Saccharomyces cerevisiae. Wissenschaft. 2002, 298: 799-804. 10.1126/science.1075090.

Stormo GD: DNA-Bindungsstellen: Darstellung und Entdeckung. Bioinformatik. 2000, 16: 16-23. 10.1093/Bioinformatik/16.1.16.

Cliften P, Sudarsanam P, Desikan A, Fulton L, Fulton B, Majors J, Waterston R, Cohen BA, Johnston M: Funktionsmerkmale finden in Saccharomyces Genome durch phylogenetisches Footprinting. Wissenschaft. 2003, 301: 71-76. 10.1126/science.1084337.

Kellis M, Patterson N, Endrizzi M, Birren B, Lander ES: Sequenzierung und Vergleich von Hefearten zur Identifizierung von Genen und regulatorischen Elementen. Natur. 2003, 423: 241-254. 10.1038/natur01644.

Aparicio S, Morrison A, Gould A, Gilthorpe J, Chaudhuri C, Rigby P, Krumlauf R, Brenner S: Nachweis konservierter Regulationselemente mit dem Modellgenom des japanischen Kugelfisches, Fugu rubripes. Proc Natl Acad Sci USA. 1995, 92: 1684-1688.

Pritsker M, Liu YC, Beer MA, Tavazoie S: Entdeckung von Transkriptionsfaktor-Bindungsstellen im gesamten Genom durch Konservierung auf Netzwerkebene. Genom-Res. 2004, 14: 99-108. 10.1011/gr.1739204.

Hughes JD, Estep PW, Tavazoie S, Church GM: Computergestützte Identifizierung von cis -regulatorische Elemente, die mit Gruppen funktionell verwandter Gene in assoziiert sind Saccharomyces cerevisiae. J. Mol. Biol. 2000, 296: 1205-1214. 10.1006/jmbi.2000.3519.

Zhu J, Zhang MQ: SCPD: eine Promotordatenbank der Hefe Saccharomyces cerevisiae. Bioinformatik. 1999, 15: 607-611. 10.1093/Bioinformatik/15.7.607.

Yamaguchi-Iwai Y, Dancis A, Klausner RD: AFT1: ein Mediator der eisenregulierten Transkriptionskontrolle in Saccharomyces cerevisiae. EMBO J. 1995, 14: 1231–1239.

Beer MA, Tavazoie S: Vorhersage der Genexpression anhand der Sequenz. Zelle. 2004, 117: 185-198. 10.1016/S0092-8674(04)00304-6.

Erives A, Levine M: Koordinierte Enhancer haben gemeinsame organisatorische Merkmale im Drosophila-Genom. Proc Natl Acad Sci USA. 2004, 101: 3851-3856. 10.1073/pnas.040611101.

Sudarsanam P, Pilpel Y, Church GM: Genomweites gemeinsames Auftreten von Promotorelementen zeigt eine cis-regulatorische Kassette von rRNA-Transkriptionsmotiven in Saccharomyces cerevisiae. Genom-Res. 2002, 12: 1723-1731. 10.1011/gr.301202.

Blaiseau PL, Thomas D: Mehrere Transkriptionsaktivierungskomplexe binden den Hefeaktivator Met4 an DNA. EMBO J. 1998, 17: 6327–6336. 10.1093/emboj/17.21.6327.

Chiang DY, Moses AM, Kellis M, Lander ES, Eisen MB: Phylogenetisch und räumlich konservierte Wortpaare im Zusammenhang mit Veränderungen der Genexpression in Hefen. Genom Biol. 2003, 4: R43-10.1186/gb-2003-4-7-r43.

Davidson EH: Genomische Regulierungssysteme. 2001, San Diego, CA: Akademische Presse

Coghlan A, Wolfe KH: Viermal schnellere Genomumlagerungsrate bei Nematoden als bei Drosophila. Genom-Res. 2002, 12: 857-867. 10.1011/gr.172702.

Maduro MF, Rothman JH: Wurm-Eingeweide machen: das Genregulationsnetzwerk der Caenorhabditis elegans Endoderm. Entwickler Biol. 2002, 246: 68-85. 10.1006/dbio.2002.0655.

Cui M, Han M: Cis-regulatorische Anforderungen für die vulvazellspezifische Expression des Caenorhabditis elegans Fibroblasten-Wachstumsfaktor-Gen egl-17. Entwickler Biol. 2003, 257: 104-116. 10.1016/S0012-1606(03)00033-2.

Gaudet J, Mango SE: Regulation der Organogenese durch die Caenorhabditis elegans FoxA-Protein PHA-4. Wissenschaft. 2002, 295: 821-825. 10.1126/science.1065175.

Maduro MF, Meneghini MD, Bowerman B, Broitman-Maduro G, Rothman JH: Die Beschränkung des Mesendoderms auf ein einzelnes Blastomere durch die kombinierte Wirkung von SKN-1 und einem GSK-3-Homolog wird durch MED-1 und -2 in vermittelt C. elegans. Mol Zelle. 2001, 7: 475-485. 10.1016/S1097-2765(01)00195-2.

Harfe BD, Fire A: Muskel- und nervenspezifische Regulation eines neuartigen Homöodomänenfaktors der NK-2-Klasse in Caenorhabditis elegans. Entwicklung. 1998, 125: 421-429.

Jantsch-Plunger V, Fire A: Kombinatorische Struktur eines körpermuskelspezifischen Transkriptionsverstärkers in Caenorhabditis elegans. J. Biol. Chem. J. Biol. 1994, 269: 27021-27028.

Tsukiyama T, Becker PB, Wu C: ATP-abhängige Nukleosomenzerstörung an einem Hitzeschock-Promotor, vermittelt durch die Bindung des GAGA-Transkriptionsfaktors. Natur. 1994, 367: 525-532. 10.1038/367525a0.

King-Jones K, Korge G, Lehmann M: Die Helix-Loop-Helix-Proteine ​​dAP-4 und Tochterlos binden sowohl in vitro als auch in vivo an SEBP3-Stellen, die für die transkriptionelle Aktivierung des Drosophila-Gens Sgs-4 erforderlich sind. J. Mol. Biol. 1999, 291: 71-82. 10.1006/jmbi.1999.2963.

Krause M, Fire A, Harrison SW, Priess J, Weintraub H: CeMyoD-Akkumulation bestimmt das Schicksal der Körperwandmuskelzellen während C. elegans Embryogenese. Zelle. 1990, 63: 907-919. 10.1016/0092-8674(90)90494-Y.

Hu YF, Luscher B, Admon A, Mermod N, Tjian R: Transkriptionsfaktor AP-4 enthält mehrere Dimerisierungsdomänen, die die Dimerspezifität regulieren. Gene Dev.1990, 4: 1741-1752.

Blackwell TK, Weintraub H: Unterschiede und Ähnlichkeiten in DNA-Bindungspräferenzen von MyoD- und E2A-Proteinkomplexen, die durch die Auswahl der Bindungsstelle aufgedeckt wurden. Wissenschaft. 1990, 250: 1104-1110.

Krause M, Park M, Zhang J, Yuan J, Harfe B, Xu S, Greenwald I, Cole M, Paterson B, Fire A: A C. elegans E/tochterloses bHLH-Protein markiert die neuronale, aber nicht quergestreifte Muskelentwicklung. Entwicklung. 1997, 124: 2179-2189.

Furuyama T, Nakazawa T, Nakano I, Mori N: Identifizierung der differentiellen Verteilungsmuster von mRNAs und Konsensus-Bindungssequenzen für Maus-DAF-16-Homologe. Biochem. J. 2000, 349: 629-634. 10.1042/0264-6021:3490629.

Murphy CT, McCarroll SA, Bargmann CI, Fraser A, Kamath RS, Ahringer J, Li H, Kenyon C: Gene, die stromabwärts von DAF-16 wirken und die Lebensdauer von . beeinflussen Caenorhabditis elegans. Natur. 2003, 424: 277-283. 10.1038/natur01789.

Lee SS, Kennedy S, Tolonen AC, Ruvkun G: DAF-16-Zielgene, die kontrollieren C. elegans Lebensdauer und Stoffwechsel. Wissenschaft. 2003, 300: 644-647. 10.1126/science.1083614.

Gronostajski RM: Analyse der Bindung von nuklearem Faktor I an DNA unter Verwendung degenerierter Oligonukleotide. Nukleinsäuren Res. 1986, 14: 9117-9132.

Lee W, Mitchell P, Tjian R: Gereinigter Transkriptionsfaktor AP-1 interagiert mit TPA-induzierbaren Enhancer-Elementen. Zelle. 1987, 49: 741-752. 10.1016/0092-8674(87)90612-X.

Kockel L, Homsy J, Bohmann D: Drosophila AP-1: Lehren von einem Wirbellosen. Onkogen. 2001, 20: 2347-2364. 10.1038/sj.onc.1204300.

Karin M, Liu Z, Zandi E: AP-1 Funktion und Regulation. Curr Opin Cell Biol. 1997, 9: 240-246. 10.1016/S0955-0674(97)80068-3.

Grandori C, Cowley SM, James LP, Eisenman RN: Das Myc/Max/Mad-Netzwerk und die transkriptionelle Kontrolle des Zellverhaltens. Annu Rev Cell Dev Biol. 2000, 16: 653-699. 10.1146/annurev.cellbio.16.1.653.

Rice DA, Mouw AR, Bogerd AM, Parker KL: Ein gemeinsames Promotorelement reguliert die Expression von drei steroidogenen Enzymen. Mol Endokrinol. 1991, 5: 1552-1561.

H. Ueda, GC Sun, T. Murata, S. Hirose: Ein neuartiges DNA-Bindungsmotiv grenzt an die Zinkfingerdomäne des nuklearen Hormonrezeptors FTZ-F1 von Insekten und an das lange terminale Repeat-Bindungsprotein der Maus. Mol Cell Biol. 1992, 12: 5667–5672.

Shaywitz AJ, Greenberg ME: CREB: ein Stimulus-induzierter Transkriptionsfaktor, der durch eine Vielzahl extrazellulärer Signale aktiviert wird. Annu Rev. Biochem. 1999, 68: 821–861. 10.1146/annurev.biochem.68.1.821.

Dijk MAV, Voorhoeve PM, Murre C: Pbx1 wird beim Erwerb der N-terminalen Region von E2A bei akuter lymphoblastoider Prä-B-Zell-Leukämie in einen Transkriptionsaktivator umgewandelt. Proc. Natl. Acad. Sci. U. S. A. 1993, 90: 6061-6065.

Manak JR, Mathies LD, Scott MP: Regulation eines dekapentaplegischen Mitteldarm-Enhancers durch homöotische Proteine. Entwicklung. 1994, 120: 3605–3619.

Mauhin V, Lutz Y, Dennefeld C, Alberga A: Definition des DNA-Bindungsstellenrepertoires für den Drosophila-Transkriptionsfaktor SNAIL. Nukleinsäuren Res. 1993, 21: 3951-3957.

Huber HE, Edwards G, Goodhart PJ, Patrick DR, Huang PS, Ivey-Hoyle M, Barnett SF, Oliff A, Heimbrook DC: Transkriptionsfaktor E2F bindet DNA als Heterodimer. Proc. Natl. Acad. Sci. U. S. A. 1993, 90: 3525–3529.

Boxem M, vanden Heuvel S: C. elegans Synthetische Multivulva-Gene der Klasse B wirken in der G(1)-Regulation. Curr Biol. 2002, 12: 906-911. 10.1016/S0960-9822(02)00844-8.

Ceol CJ, Horvitz HR: dpl-1 DP und efl-1 E2F wirken mit lin-35 Rb, um die Ras-Signalgebung in zu antagonisieren C. elegans Entwicklung der Vulva. Mol Zelle. 2001, 7: 461-473. 10.1016/S1097-2765(01)00194-0.

Kwon JY, Hong M, Choi MS, Kang S, Duke K, Kim S, Lee S, Lee J: Ethanol-Response-Gene und ihre Regulation analysiert durch einen Mikroarray und vergleichenden genomischen Ansatz im Nematoden Caenorhabditis elegans. Genomik. 2004, 83: 600-614. 10.1016/j.ygeno.2003.10.008.

Lund J, Tedesco P, Duke K, Wang J, Kim SK, Johnson TE: Transkriptionsprofil des Alterns in C. elegans. Curr Biol. 2002, 12: 1566-1573. 10.1016/S0960-9822(02)01146-6.

Ohler U, Yekta S, Lim LP, Bartel DP, Burge CB: Muster der flankierenden Sequenzkonservierung und ein charakteristisches Upstream-Motiv für die microRNA-Genidentifikation. RNA. 2004, 10: 1309-1322. 10.1261/rna.5206304.

Celniker SE, Rubin GM: Die Drosophila melanogaster Genom. Annu Rev Genomics Hum Genet. 2003, 4: 89-117. 10.1146/annurev.genom.4.070802.110323.

Matsukage A, Hirose F, Hayashi Y, Hamada K, Yamaguchi M: Die DRE-Sequenz TATCGATA, ein mutmaßliches Promotor-aktivierendes Element für Drosophila melanogaster zellproliferationsbezogene Gene. Gen. 1995, 166: 233-236. 10.1016/0378-1119(95)00586-2.

Choi T, Cho N, Oh Y, Yoo M, Matsukage A, Ryu Y, Han K, Yoon J, Baek K: Das DNA replication-related element (DRE)-binding factor (DREF) System könnte an der Expression von beteiligt sein das Drosophila melanogaster TBP-Gen. FEBS Lett. 2000, 483: 71-77. 10.1016/S0014-5793(00)02085-8.

Park SY, Kim YS, Yang DJ, Yoo MA: Transkriptionelle Regulation des Drosophila-Katalase-Gens durch das DRE/DREF-System. Nukleinsäuren Res. 2004, 32: 1318-1324. 10.1093/nar/gkh302.

Hanes SD, Brent R: Ein genetisches Modell für die Interaktion der Homöodomänen-Erkennungshelix mit DNA. Wissenschaft. 1991, 251: 426–430.

Anderson MG, Perkins GL, Chitick P, Shrigley RJ, Johnson WA: Drifter, ein Transkriptionsfaktor der Drosophila-POU-Domäne, ist für die korrekte Differenzierung und Migration von Trachealzellen und Mittellinienglia erforderlich. Gene Dev. 1995, 9: 123-137.

Bhat KM, Poole SJ, Schedl P: Die miti-mere und pdm1-Gene kooperieren bei der Spezifikation der RP2/sib-Linie in Drosophila Neurogenese. Mol Cell Biol. 1995, 15: 4052-4063.

Junger MA, Rintelen F, Stocker H, Wasserman JD, Vegh M, Radimerski T, Greenberg ME, Hafen E: The Drosophila Der Forkhead-Transkriptionsfaktor FOXO vermittelt die Reduktion der Zellzahl, die mit einer reduzierten Insulinsignalisierung verbunden ist. J Biol. 2003, 2: 20-10.1186/1475-4924-2-20.

Erickson JW, Cline TW: Schlüsselaspekte des primären Geschlechtsbestimmungsmechanismus bleiben über die Gattung hinweg erhalten Drosophila. Entwicklung. 1998, 125: 3259–3268.

Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, An P, et al: Initiale Sequenzierung und vergleichende Analyse des Mausgenoms. Natur. 2002, 420: 520-562. 10.1038/natur01262.

Suske G: Die Sp-Familie der Transkriptionsfaktoren. Gen. 1999, 238: 291-300. 10.1016/S0378-1119(99)00357-1.

Ramji DP, Foka P: CCAAT/Enhancer-bindende Proteine: Struktur, Funktion und Regulation. Biochem. J. 2002, 365: 561-575.

Latchman D: Eukaryotische Transkriptionsfaktoren. 1997, London: Akademische Presse

Vo N, Goodman RH: CREB-bindendes Protein und p300 in der Transkriptionsregulation. J. Biol. Chem. J. Biol. 2001, 276: 13505-13508.

Bernards R: Transkriptionelle Regulierung. Umlegen des Myc-Schalters. Curr Biol. 1995, 5: 859-861. 10.1016/S0960-9822(95)00173-4.

Nasrin N, Ercolani L, Denaro M, Kong XF, Kang I, Alexander M: Ein Insulin-Response-Element im Glyceraldehyd-3-Phosphat-Dehydrogenase-Gen bindet ein Kernprotein, das durch Insulin in kultivierten Zellen und durch Ernährungsmanipulationen in vivo induziert wird. Proc Natl Acad Sci U S A. 1990, 87: 5273–5277.

Suzuki F, Goto M, Sawa C, Ito S, Watanabe H, Sawada J, Handa H: Funktionelle Interaktionen von menschlichen GA-bindenden Proteinuntereinheiten des Transkriptionsfaktors. J. Biol. Chem. J. Biol. 1998, 273: 29302-29308. 10.1074/jbc.273.45.29302.

Zimmermann AG, Wright KL, Ting JP, Mitchell BS: Regulation der Inosin-5'-Monophosphatdehydrogenase Typ II Genexpression in humanen T-Zellen. Rolle für eine neuartige 5'-palindromische Oktamersequenz. J. Biol. Chem. J. Biol. 1997, 272: 22913-22923. 10.1074/jbc.272.36.22913.

Gottlieb S, Hanes SD, Golden JA, Oakey RJ, Budarf ML: Gänsehaut-ähnlich, ein bei DiGeorge- und velokardiofazialen Syndromen deletiertes Gen, erkennt DNA mit einer bicoidähnlichen Spezifität und wird im sich entwickelnden Mausgehirn exprimiert. Hum Mol Genet. 1998, 7: 1497-1505. 10.1093/hmg/7.9.1497.

Singh H, Sen R, Baltimore D, Sharp PA: Ein nuklearer Faktor, der an ein konserviertes Sequenzmotiv in transkriptionalen Kontrollelementen von Immunglobulin-Genen bindet. Natur. 1986, 319: 154-158. 10.1038/319154a0.

Nie Z, Mei Y, Ford M, Rybak L, Marcuzzi A, Ren H, Stiles GL, Ramkumar V: Oxidativer Stress erhöht die A1-Adenosinrezeptor-Expression durch Aktivierung des Kernfaktors Kappa B. Mol Pharmacol. 1998, 53: 663-669.

Glasgow JN, Wood T, Perez-Polo JR: Identifizierung und Charakterisierung von nuklearen Faktor-κB-Bindungsstellen im murinen bcl-x-Promotor. J Neurochem. 2000, 75: 1377-1389. 10.1046/j.1471-4159.2000.0751377.x.

Whitfield ML, Sherlock G, Saldanha AJ, Murray JI, Ball CA, Alexander KE, Matese JC, Perou CM, Hurt MM, Brown PO, Botstein D: Identifizierung von Genen, die periodisch im menschlichen Zellzyklus exprimiert werden und ihre Expression in Tumoren. Mol Biol Zelle. 2002, 13: 1977-2000. 10.1091/mbc.02-02-0030..

Rustici G, Mata J, Kivinen K, Lio P, Penkett CJ, Burns G, Hayles J, Brazma A, Nurse P, Bahler J: Periodisches Genexpressionsprogramm des Spalthefezellzyklus. Nat Genet. 2004, 36: 809-817. 10.1038/ng1377.

Stormo GD, Fields DS: Spezifität, freie Energie und Informationsgehalt in Protein-DNA-Interaktionen. Trends Biochem Sci. 1998, 23: 109-113. 10.1016/S0968-0004(98)01187-6.

Kalir S, Alon U: Verwendung einer quantitativen Blaupause zur Neuprogrammierung der Dynamik des Flagellen-Gennetzwerks. Zelle. 2004, 117: 713-720. 10.1016/j.cell.2004.05.010.

Waterman MS, Eggert M: Ein neuer Algorithmus für beste Subsequenz-Alignments mit Anwendung auf tRNA-rRNA-Vergleiche. J. Mol. Biol. 1987, 197: 723-728. 10.1016/0022-2836(87)90478-5.

Wolfertstetter F, Frech K, Herrmann G, Werner T: Identifizierung von funktionellen Elementen in nicht ausgerichteten Nukleinsäuresequenzen durch einen neuartigen Tupelsuchalgorithmus. Comput Appl Biosci. 1996, 12: 71-80.

Zhang MQ: Identifizierung menschlicher Genkernpromotoren in silico. Genom-Res. 1998, 8: 319-326.

Curwen V, Eyras E, Andrews TD, Clarke L, Mongin E, Searle SM, Clamp M: Das automatische Genannotationssystem von ENSEMBL. Genom-Res. 2004, 14: 942-950. 10.1011/gr.1858004.

Human Genome Sequencing Center am Baylor College of Medicine: Drosophila-Genomprojekt. [http://www.hgsc.bcm.tmc.edu/projects/drosophila]

Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, et al.: Genontologie: Werkzeug zur Vereinheitlichung der Biologie. Das Genontologie-Konsortium. Nat Genet. 2000, 25: 25-29. 10.1038/75556.

Mewes HW, Amid C, Arnold R, Frishman D, Guldener U, Mannhaupt G, Munsterkotter M, Pagel P, Strack N, Stumpflen V, et al: MIPS: Analyse und Annotation von Proteinen aus ganzen Genomen. Nukleinsäuren Res. 2004, D41-D44. 10.1093/nar/gkh092. 32 Datenbank

Gusfield D: Algorithmen für Strings, Bäume und Sequenzen. 1997, Cambridge, Großbritannien: Cambridge University Press

Press WH, Flannery BP, Teukolsky SA, Vetterling WT: Numerical Recipes in C: The Art of Scientific Computing. 1993, Cambridge, Großbritannien: Cambridge University Press

Pilpel Y, Sudarsanam P, Church GM: Identifizierung regulatorischer Netzwerke durch kombinatorische Analyse von Promotorelementen. Nat Genet. 2001, 29: 153-159. 10.1038/ng724.

Yuh CH, Bolouri H, Davidson EH: Genomic cis -Regulatorische Logik: experimentelle und computergestützte Analyse eines Seeigels. Wissenschaft. 1998, 279: 1896-1902. 10.1126/science.279.5358.1896.

Needleman SB, Wunsch CD: Ein allgemeines Verfahren, das auf die Suche nach Ähnlichkeiten in der Aminosäuresequenz von zwei Proteinen anwendbar ist. J. Mol. Biol. 1970, 48: 443-453.

Matys V, Fricke E, Geffers R, Gössling E, Haubrock M, Hehl R, Hornischer K, Karas D, Kel AE, Kel-Margoulis OV, et al: TRANSFAC: Transkriptionsregulation, von Mustern zu Profilen. Nukleinsäuren Res. 2003, 31: 374-378. 10.1093/nar/gkg108.

Gollub J, Ball CA, Binkley G, Demeter J, Finkelstein DB, Hebert JM, Hernandez-Boussard T, Jin H, Kaloper M, Matese JC, et al.: The Stanford Microarray Database: Datenzugriff und Qualitätsbewertungstools. Nukleinsäuren Res. 2003, 31: 94-96. 10.1093/nar/gkg078.

Stuart JM, Segal E, Koller D, Kim SK: Ein Gen-Coexpressionsnetzwerk für die globale Entdeckung konservierter genetischer Module. Wissenschaft. 2003, 302: 249-255. 10.1126/science.1087447.

Lieb JD, Liu X, Botstein D, Brown PO: Promoter-spezifische Bindung von Rap1 durch genomweite Karten der Protein-DNA-Assoziation. Nat Genet. 2001, 28: 327-334. 10.1038/ng569.

Balasubramanian B, Lowry CV, Zitomer RS: Der Rox1-Repressor der Saccharomyces cerevisiae hypoxic genes ist ein spezifisches DNA-bindendes Protein mit einem hochmobilen Gruppenmotiv. Mol Cell Biol. 1993, 13: 6071-6078.

Gasch AP, Spellman PT, Kao CM, Carmel-Harel O, Eisen MB, Storz G, Botstein D, Brown PO: Genomische Expressionsprogramme in der Reaktion von Hefezellen auf Umweltveränderungen. Mol Biol Zelle. 2000, 11: 4241-4257.


Diskussion

Phänotypische Unterschiede zwischen humanen und Maus-orthologen Genen werden oft als Versagen von Mausmodellen angesehen und werden in bestimmten Fällen selten berichtet ( Bakker et al. 2013 Chandrasekera und Pippin 2013 Seok et al. 2013). Daher ist es noch unklar, welche orthologen Gene signifikante phänotypische Veränderungen erfahren haben und welche Arten von molekularen evolutionären Ereignissen zu den phänotypischen Unterschieden beigetragen haben. In der vorliegenden Studie haben wir zum ersten Mal einen integrierten Ansatz für den Genotyp-Phänotyp-Vergleich etabliert, um verschiedene molekulare Evolutionsereignisse aufzudecken, die wahrscheinlich zu Phänotypunterschieden beitragen, die aus Unterschieden zwischen menschlichen und Mausgenomen resultieren. Wir entwickelten ein quantitatives PS-Scoring-System (Abb. 1), um Phänotypvergleiche auf Genomskala zu kartieren, um die Konkordanz oder Diskrepanz zwischen menschlichen Erkrankungen und Maus-Phänotypen zu analysieren. Wir entdeckten, dass phänotypische Diskrepanzen teilweise durch Divergenzen in nicht-kodierenden regulatorischen Elementen und transkriptomischen Profilen und nicht durch Unterschiede in proteinkodierenden Sequenzen erklärt wurden (Abb. 2–4).

PS-Scores liefern eine statistische Bewertung der Signifikanz der phänotypischen Ähnlichkeit im Vergleich zum erwarteten Modell basierend auf Orthologie-Funktions-Vermutungen ( Abb. 1). Wir fragten uns jedoch, ob die Genauigkeit der PS-Scores durch die Unvollständigkeit der aktuellen Genotyp-Phänotyp-Kartierung beeinflusst wird. Somit bestätigten wir, dass die Berechnung der PS-Scores robust war, wenn 15 % der Genotyp-Phänotyp-Zuordnungen entfernt wurden (Pearson ρ = 0,95) oder bei Verwendung älterer Versionen der Mapping-Datenbanken (ρ = 0,91) und simuliert damit die Unvollständigkeit des Mappings ( Ergänzungsbild S16 , Ergänzungsmaterial online). Wir bestätigten auch, dass unser Datensatz für den Phänotypvergleich nicht auf eine bestimmte Phänotypklasse ausgerichtet war, und zeigten, dass er aktuelle Gen-Phänotyp-Karten von Mensch und Maus repräsentiert (ergänzende Abb. S17, Ergänzendes Material online). Insbesondere korrelierte der Anteil der Gene mit HPO- und MPO-Klassen in unserem Datensatz stark mit dem Anteil in OMIM- bzw. MGI-Datenbanken (ρ = 1,00 in OMIM, ρ = 0,98 in MGI), was darauf hinweist, dass die Zusammensetzung der Phänotypterme in unserem Datensatz eine gute Darstellung derjenigen in den vollständigen Gensets bietet. Zusammenfassend könnte unser phänomenischer Ansatz mit dem PS-Score für den Vergleich aktueller Gen-Phänotyp-Beziehungen zwischen den beiden Arten geeignet sein.

Wir fanden, dass regulatorische Divergenz mit phänotypischen Unterschieden in den orthologen Genen von Mensch und Maus assoziiert war ( Abb. 3). Das häufige Auftreten phänotypischer Unterschiede könnte eher auf evolutionäre Divergenzen zwischen Arten als auf zufällige Fehler bei Genotyp-Phänotyp-Vergleichen zurückzuführen sein. Es wurde berichtet, dass Veränderungen in Genregulationssequenzen eine Quelle der phänotypischen Evolution sein könnten (Carroll 2008 Indjeian et al. 2016). Gengruppen werden oft gemeinsam reguliert und ihre Funktionen durch Schaltermutationen in regulatorischen Genen beeinflusst (Babu et al. 2004 Voordeckers et al. 2015). Tatsächlich fanden wir, dass Gene, die sich im gleichen Signalweg oder Funktionsmodul befinden, dazu tendierten, gleichzeitige phänotypische Unterschiede zu zeigen, was mit früheren Berichten übereinstimmt, die darauf hindeuten, dass phänotypische Veränderungen auf modulare Weise auftreten können ( Ryan et al. 2013 Han et al. 2015 Kachroo et al. 2015). Aus der LPG-Analyse beispielsweise wiesen 13 von 17 Fanconi-Anämie-Pfad-(FAP)-Genen mit ähnlichen PS-Werten signifikante phänotypische Unterschiede auf (Ergänzungstabelle S4, Ergänzungsmaterial online). Tatsächlich zeigen Mutationen von Maus-FAP-Genen nicht die Entwicklungsanomalien, die häufig bei menschlichen FA-Patienten beobachtet werden ( Bakker et al. 2013).

Unsere Ergebnisse belegen, dass eine vergleichende transkriptomische Datenanalyse durchgeführt werden sollte, um zu identifizieren, in welchen Geweben die Maus-Genexpression ein geeignetes Modell für menschliche Krankheiten ist, und weisen auf die Notwendigkeit hin, den sorgfältigen Einsatz von Tiermodellen zu optimieren. Unsere Ergebnisse zeigten, dass in vielen Fällen Veränderungen der gewebespezifischen Expressionsprofile zwischen Spezies die phänotypischen Unterschiede zwischen humanen und Maus-orthologen Genen erklären können ( Abb. 4). Jüngste vergleichende Transkriptomdaten zeigten, dass viele orthologe Gene von Mensch und Maus unterschiedliche Transkriptomprofile in verschiedenen Geweben oder Zelltypen aufweisen ( Forrest et al. 2014 Yue et al. 2014). Der Vergleich von Transkriptomdaten kann von unschätzbarem Wert sein, um zu identifizieren, welche Gewebe oder Zelltypen mit phänotypischen Veränderungen oder der Konservierung eines bestimmten Gens zwischen Mensch und Modellorganismus verbunden sind ( Breschi et al. 2017), da transkriptomische Veränderungen als „mittlerer molekularer Phänotyp“ angesehen werden. und eine Folge genetischer Variation, die den aktuellen Zustand eines Systems (dh eines Gewebes, Organs oder einer Spezies) widerspiegelt ( Burga und Lehner 2013).

Phenologs, orthologe Gene mit artenübergreifend identischen Phänotypen, sind hilfreich bei der Untersuchung der molekularen Mechanismen, die menschlichen Krankheitsphänotypen durch Mausgenetik-Ansätze zugrunde liegen ( McGary et al. 2010 McWhite et al. 2015). Die Entdeckung von Phenologen ist jedoch schwierig, da häufig phänotypische Unterschiede zwischen orthologen Genen beobachtet werden und die Kartierung der Genotyp-Phänotyp-Beziehungen von Mensch und Maus oft unvollständig ist. Daher untersuchten wir die gewebespezifische Expressionskonservierung in allen orthologen Genen von Mensch und Maus unter Verwendung der Datenbanken FANTOM und ENCODE ( Ergänzende Daten S2, Ergänzendes Material online und siehe unsere Begleitseite https://sbi.postech.ac.kr/w/PS ). Orthologe Gene mit hoher Expressionskonservierung sind wahrscheinlich nützlich für die Identifizierung mutmaßlicher Phenologs.

In unserer Analyse konnte die Divergenz von Protein-kodierenden Sequenzen die phänotypischen Unterschiede zwischen humanen und Maus-orthologen Genen nicht erklären ( Abb. 2). Nach der neutralen Theorie der molekularen Evolution könnte die Sequenzdivergenz von Genen aus der Fixierung vieler zufälliger neutraler Mutationen sowie der positiven Selektion nützlicher Mutationen resultieren, die die adaptive Evolution von Phänotypen beeinflussen (Orr 2005). Aufgrund der hohen Komplexität der Genotyp-Phänotyp-Kartierung konnten phänotypische Unterschiede nur durch die Integration verschiedener molekularer evolutionärer Merkmale erklärt werden, die aus speziesübergreifenden Vergleichen von Multi-Omics-Ansätzen gewonnen wurden, einschließlich molekularer evolutionärer Merkmale im Zusammenhang mit nicht-kodierenden oder kodierenden Sequenzen ( Maher 2012 Breschi et al. 2017). Daher sind weitere Studien zu verschiedenen molekularen Evolutionsereignissen notwendig, um phänotypische Unterschiede zwischen Arten besser zu verstehen. Wir gehen davon aus, dass sich unser artenübergreifender Vergleich von Genotyp-Phänotyp-Karten in Kombination mit der Verwendung von Daten aus Multi-Omics-Ansätzen als wertvolle Ressource erweisen wird, unter anderem als Referenzsatz für das Training und die Konstruktion von Computermodellen, die die komplexe Natur von phänotypische Unterschiede durch molekulare Evolutionsmerkmale ( Breschi et al. 2017).


Einführung

Der erwachsene menschliche Körper besteht aus

37 Billionen Zellen 1 , die die Funktionseinheiten von Organismensystemen sind. Obwohl jede Zelle fast identische genomische Informationen enthält, wird erwartet, dass im menschlichen Körper mindestens mehrere hundert Hauptzelltypen mit unterschiedlicher Morphologie, Verhalten und Funktionen existieren. Die Abweichung von der vorgesehenen Identität funktioneller Zellen ist eine der Hauptursachen für menschliche Krankheiten. Unterschiedliche zelluläre Zusammensetzungen von Tumorgewebe können zu unterschiedlichen Arzneimittelreaktionen und Prognosen führen. Krankheitsassoziierte genetische Varianten betreffen nur bestimmte Zelltypen, was die funktionelle Validierung von Kandidatenvarianten aus genomweiten Assoziationsstudien erschwert 2 . Daher ist das Verständnis der Funktionsweise des menschlichen Körpers mit zellulärer Auflösung das ultimative Ziel in Biologie und Medizin.

Die Untersuchung einzelner Zelltypen in vivo ist technisch anspruchsvoll. Die Durchflusszytometrie-Analyse wurde in den letzten Jahrzehnten für die Einzelzell-Profilierung verwendet 3 , wenn auch mit einigen Einschränkungen. Erstens handelt es sich um eine gezielte Analysemethode nur für einen vorausgewählten Satz von Molekülen. Zweitens kann diese Methode aufgrund der spektralen Begrenzung fluoreszierender Proteine ​​bis zu 17 Proteine ​​gleichzeitig profilieren, was auf erweitert wird

40 Proteine ​​durch Massenzytometrie 4 . In letzter Zeit haben wir eine rasante Verbesserung der Technologie der Einzelzell-RNA-Sequenzierung (scRNA-seq) beobachtet, die in der Tat einen Wendepunkt auf dem Gebiet der Einzelzellbiologie darstellt. Die aktuelle scRNA-seq-Technologie kann aus einer einzigen Sequenzierungsreaktion leicht Gesamttranskriptomdaten für Hunderte bis Tausende von Zellen generieren und Schlüsselgene identifizieren, die mit jedem Zelltyp oder -zustand durch differentielle Expressionsanalyse über verschiedene Zellgruppen ähnlicher Transkriptome verbunden sind. Daher charakterisieren wir nun einzelne Zelltypen oder Zustände in einem Gewebe, das im Allgemeinen aus diversen Zelltypen besteht. Bis heute wurde eine Vielzahl von Methoden zur Generierung und Analyse von scRNA-seq-Daten entwickelt, die in anderen hervorragenden Übersichtsartikeln ausführlich beschrieben werden 4,5,6,7. Jüngste Benchmarking-Studien zeigten auch, dass sich scRNA-seq-Protokolle in ihrer Fähigkeit, RNA einzufangen, Skalierbarkeit und Kosteneffizienz erheblich unterscheiden 8,9.

Trotz vieler Verbesserungen reichen Einzelzell-Omics möglicherweise nicht aus, um die zelluläre Heterogenität zu verstehen. Obwohl die differentielle Expressionsanalyse von scRNA-seq-Daten Gene identifizieren kann, die für Zelltypen und -zustände spezifisch sind, wäre es eine entmutigende Aufgabe, die zelluläre Identität einfach aus einer Liste von hoch- oder herunterregulierten Genen zu verstehen, da die funktionellen Auswirkungen von Genen von ihren Beziehungen abhängen. Genfunktionen und die Auswirkungen von krankheitsassoziierten Varianten sind weitgehend auf die Interaktionspartner dieser Gene im gegebenen zellulären Kontext zurückzuführen 10,11 . Aus systembiologischer Sicht wird die Netzwerkmodellierung von Genen sehr nützlich sein, um funktionelle Organisationen von Schlüsselregulatoren zu verstehen, die an den Betriebswegen jedes Zellzustands beteiligt sind 12 . Die Netzwerkbiologie hat unsere Wahrnehmung einer Zelle von einem System, das hauptsächlich aus linearen Signalwegen besteht, zu einem System mit vielen hochkomplexen, ineinander verschlungenen Verbindungen zwischen Molekülen verlagert. Insbesondere das Genregulationsnetzwerk (GRN) ist ein intuitives, aber vielseitiges Graphenmodell für die Funktionsanalyse, das in den letzten zehn Jahren umfassend genutzt wurde. GRNs haben bedeutende Beiträge zur Identifizierung von Krankheitsbiomarkern und therapeutischen Zielen geleistet und wurden schließlich als entscheidendes Werkzeug zur Entschlüsselung medizinischer Genomdaten 13 erkannt. Die Untersuchung der regulatorischen Interaktionen zwischen Genen in verschiedenen biologischen Kontexten wird wertvolle Erkenntnisse darüber liefern, wie die entstehenden Funktionen eines bestimmten lebenden Systems reguliert werden sollten.

In diesem Übersichtsartikel stellen wir die Definition der Einzelzell-Netzwerkbiologie vor und stellen die aktuellen Methoden vor, um GRNs aus scRNA-seq-Daten abzuleiten und zu bestimmen, wie sie unser Verständnis von Regelkreisen für die zelluläre Identität verbessern und die Praxis der Präzisionsmedizin erleichtern können.


Materialen und Methoden

Wachstumsmedien und Stämme

Bakterien wurden in T-Salz-Minimalmedium kultiviert, das mit Glucose (0,2% w/v) plus 30 μM KH . ergänzt war2Bestellung4 für Chemostate oder 1 mM KH2Bestellung4 für Batchkultur (Spira et al. 1995). Bakterien für phänotypische Tests wurden gezüchtet oder Minimalmedium A oder L-Brühe (wie von Miller [1972] beschrieben). Das gesamte Wachstum erfolgte bei 37 °C. Für Langzeit-Chemostaten wurde MC4100TF über Nacht in T-Salzen gezüchtet und in einen 80-ml-Chemostaten mit T-Salzen, 0,2 % Glucose und 30 μM KH . geimpft2Bestellung4 wie beschrieben (Spira und Ferenci 2008). Die Bakterienkonzentration im Chemostat war 37 Tage lang stabil, zwischen 1,5 und 2,5 × 10 8 Bakterien/ml.

Die in dieser Studie verwendeten Stämme sind in Tabelle 2 beschrieben. Die verschiedenen Allele von rpoS, hfq, und Stelle wurden von evolvierten Stämmen in Vorfahrenstämme oder von Vorfahrenstämmen in evolvierte Stämme durch P1-Transduktion übertragen, wie in Miller (1972) beschrieben. Für die Übertragung der Stelle Mutation, zib563::Tn10 wurde als verknüpfter Selektionsmarker verwendet. Für die Übertragung von rpoS und hfq von weiterentwickelten Isolaten zu Ahnenstamm oder von Ahnen zu weiterentwickelten Isolaten, haben wir zuerst konstruiert cysD::amp und purA::tet Stämme unter Verwendung des in Yu und Court (1998) beschriebenen Protokolls. Die Nähe von cysD::Amp ort zu rpoS und purA::tet ort zu hfq erlaubte Kotransduktion (㺐% Kotransduktion in beiden Fällen). Die Transduktanten wurden durch Sequenzierung auf Allele getestet.

Tabelle 2

In der Studie verwendete Stämme

StämmeRelevanter GenotypReferenz oder Herkunft
MC4100TFF-araD139 D(argF-lac)U169 rspL150 deoCl relA1 thiA ptsF25 flb5301 rbsRSpiraet al. (2008)
BW4218Chemostat entwickeltes IsolatDiese Studie
BW4223Chemostat entwickeltes IsolatDiese Studie
BW4227Chemostat entwickeltes IsolatDiese Studie
BW4236Chemostat entwickeltes IsolatDiese Studie
BW3454MC4100TF metC162::Tn10Notley-McRobb und Ferenci (1999)
BW4239Chemostat entwickeltes IsolatDiese Studie
BW5151DY330 purA:: Tn10Diese Studie
BW5153MC4100TF purA:: Tn10Diese Studie
BW5166MC4100 hfq4223Diese Studie
BW6006BW4223 hfq4100Diese Studie
BW5197BW4236 Stelle4100TFDiese Studie
BW5199MC4100 Stelle4236Diese Studie
BW5200MC4100TF zib563::Tn10Spiraet al. (2008)
BW6007DY330 cysD::AmpereDiese Studie
BW6008MC4100TF cysD::ampDiese Studie
BW6009BW4218 cysD::AmpereDiese Studie
BW6010BW4227 cysD::AmpereDiese Studie
BW6011BW4239 cysD::AmpereDiese Studie
BW6012MC4100 rpoS4218Diese Studie
BW6013MC4100 rpoS4227Diese Studie
BW6014MC4100 rpoS4239Diese Studie
BW6015BW4218 rpoS4100Diese Studie
BW6016BW4227 rpoS4100Diese Studie
BW6017BW4239 rpoS4100Diese Studie
DY330W3110 ΔlacU169 gal490 㮼l857 Δ(cro-bioA)Yuet al. (2000)

Erkennung von rpoS Status

Der RpoS-Spiegel wurde durch Anfärben von Glykogen mit Jod bestimmt, wobei die Intensität der braunen Farbe je nach σ S-Spiegel in der Zelle variiert (Notley-McRobb et al. 2002). Zur Quantifizierung wurden die Fotografien densitometrisch über 2-μl-gefleckte Flecken auf L-Agar unter Verwendung der Image J-Software und den Dichten in Bezug auf die Vorfahrenwerte gescannt. Für Blots wurden Bakterienkulturen über Nacht in LB-Medium bei 37 °C gezüchtet. Proteine ​​aus 2 × 10 9 Zellen wurden durch Natriumdodecylsulfat (SDS)–Polyacrylamid-Gelelektrophorese in einem 12,5%igen Gel aufgetrennt und RpoS in Blots nachgewiesen mit verdünnten monoklonalen Anti-RpoS-Antikörpern (NeoClone). Das Super Signal West Pico Kit (Pierce) wurde verwendet, um die vom Hersteller empfohlenen RpoS-Banden zu erkennen. Die Signalintensitäten auf Autoradiogrammen wurden gescannt und mit der Image J-Software berechnet. Mindestens drei Replikatkulturen wurden verwendet und auf statistische Signifikanz getestet.

Alkalischer Phosphatase-Assay

p-Nitrophenylphosphat (p-NPP) wurde wie beschrieben als Substrat verwendet (Spira et al. 1995), und AP-Aktivitätseinheiten sind definiert als die Zunahme der Extinktion bei 410 nm/min. Optische Zelldichte bei 600/nm.

SDS-Empfindlichkeitstest

Die Sensitivität gegenüber SDS wurde von Übernachtkulturen, die in L-Brühe gezüchtet wurden, durch Auftüpfeln von Kulturen (2 μl) auf L-Agarplatten, die 3% (w/v) SDS enthielten, getestet. Flüssigkulturen, die 3% SDS enthielten, wurden durch Messung der Extinktion von 6-fachen Wiederholungen von Stämmen in L-Brühe in Mikrotiterplatten verfolgt.

Methyl-α-glucosid (α-MG)

Um die Empfindlichkeit gegenüber α-MG zu testen, wurde Kultur (2 μl) auf Minimalmedium A 0,2% Glycerin-Agarplatte mit oder ohne 1% α-MG getüpfelt. Zur Quantifizierung wurden die Fotografien densitometrisch über die Wachstumsfelder mit der Software Image J gescannt und die Dichten bezogen auf die Vorfahrenwerte.

Wachstumserträge

Die Ausbeuten wurden durch Messung der optischen Dichte der Kulturen bei 600 nm bestimmt.

Biolog-Assay

Der Katabolismus des Ausgangsstamms und der Chemostat-Isolate mit 95 Substraten wurde wie zuvor beschrieben mit dem kommerziell erhältlichen Biolog GN2 (Biolog) bestimmt (King et al. 2004).

Stressresistenz-Assays

Bakterien aus Übernachtkulturen in L-Brühe wurden zweimal gewaschen und in 0,9% NaCl auf eine Dichte von 𢏄 × 10 3 Zellen/ml verdünnt. Bei oxidativem Stress frisch verdünntes H2Ö2 wurde zu 1 ml Kultur bis zu Endkonzentrationen von 1, 2, 3, 4 und 5 mM zugegeben und 30 min bei Raumtemperatur gehalten. Für die Osmolarität wurden Suspensionen von 4 × 10 3 Zellen/ml in 1, 2, 3, 4, 5 M NaCl für 1 h bei Raumtemperatur inkubiert.

Pi-Aufnahme-Assay

Für Transportassays wurden 500 μl Bakterien aus 30 Stunden alten Pi-limitierten Chemostatkulturen mit 5 μl von 100 μM KH . gemischt2Bestellung4 und 10 μl von 1㯌i 32 P/μl (MP Biomedicals). Zu bestimmten Zeitpunkten entnommene Proben (100 μl) wurden durch Filter mit Porengröße von 0,45-μm filtriert und sofort mit 5-ml-Waschlösung (T-Salz plus 100 μM KH .) gewaschen2Bestellung4). Die Aufnahmeraten wurden durch Messung der Szintillation von 32 P in den 5 × 10 7 Zellen auf den Filtern bestimmt.

PpGpp-Assay

Exponentiell in T-Salzen/Glucose wachsende Zellen wurden mit 0,25 mM 32 P-KH . ergänzt2Bestellung4 (100 㯌i/ml) bei einer OD600 = 0,2. Die Proben wurden nach 70, 80 und 90 Minuten geerntet. Die markierten Proben wurden wie in Spira et al. (2008).

Fitnessexperimente in Chemostaten

Für Fitnessvergleiche wurde ein Tetracyclin-resistentes Derivat von MC4100TF mit a getroffenEs wurde eine C::Tn10-Insertion verwendet, und das Medium wurde mit 4 µg/ml Methionin ergänzt. Chemostat-Wettbewerbe waren wie zuvor beschrieben (Maharjan et al. 2006) und die Auswahlkoeffizienten basierten auf den Gleichungen in Dykhuizen und Hartl (1983).

Details und Strategien zur Proteomik und Genomik sind in den ergänzenden Tabellen S1 und S2 (Supplementary Material online) und den dazugehörigen Legenden beschrieben.


Schau das Video: GENETIKA - Mendelovy zákony dědičnosti (Dezember 2022).