ANÁLISE IN SILICO DE PROMOTORES DE ESCHERICHIA COLI RECONHECIDOS PELO FATOR σ28

Gabriel Dall'Alba, Scheila de Avila e Silva, André Gustavo Adami, Sergio Echeverrigaray

Resumo


A regulação da transcrição gênica em seres procariotos desempenha um papel importante para a resposta adequada destes organismos às mudanças ambientais. Neste processo, a especificidade da expressão dos genes se dá por meio da ligação do fator σ na enzima RNA polimerase, e o posterior reconhecimento do promotor.  O objetivo deste trabalho foi analisar a composição das sequências promotoras reconhecidas pelo fator σ28(relacionado com mobilidade e patogenicidade bacteriana) e a relação proteína-proteína dos produtos biológicos associados a estas sequências. Os promotores de Escherichia coli foram agrupados utilizando a técnica de mineração de dados denominada de clusterização, com o algoritmo k-means. O conteúdo dos agrupamentos foi analisado com as ferramentas Weblogo, String-DB e Gene Ontology. Os resultados obtidos mostram que os agrupamentos formados apresentam o conteúdo da sequência divergente ao padrão biológico canônico. Adicionalmente, a análise da interação proteína-proteína indica que a função celular não está relacionada diretamente com a estrutura de nucleotídeos dos promotores, uma vez que este último foi o critério a utilizado pelo algoritmo K-means para realizar os agrupamentos.

 

IN SILICO ANALYSIS OF ESCHERICHIA COLI PROMOTERS RECOGNIZED BY σ28 FACTOR 

 

ABSTRACT

The regulation of gene expression in prokaryotes provides the adequate response to environmental changes. The recognition of the promoter sequence plays an important role in the specificity of gene expression, since σ factor binds in RNA polymerase enzyme starting the process. In this context, the aim of this study was to analyze the composition of promoter sequences recognized by σ28 factor of Escherichia coli (related to mobility and bacterial pathogenicity) and protein-protein ratio of organic products associated with these sequences. The promoters were grouped by clustering (a data mining technique) with k-means algorithm. The content of clusters was analyzed with Weblogo, String-DB and Gene Ontology tools. The sequence of clusters shows some degree of discrepancy with canonical biologic pattern. Besides, none of the clusters presented metabolic function specificity. Furthermore, the protein-protein interaction analysis indicates that there is no relation between cellular function and nucleotide content, since this was the main criterion used by k-means algorithm in the generation of clusters.


Palavras-chave


promotor; clusterização; patogenicidade.

Texto completo:

PDF

Referências


(1) ATTWOOD, T. K. et al. Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective. In: Trends and Methodologies, MAHDAVI, Mahmood A. (Ed.). Croácia: Intech, 2011. Cap. 1. p. 1-2.

(2) KREBS, J.; GOLDSTEIN, S.; KILPATRICK, S. T. Genes XI. 11. ed. Sudbury, Massachusetts: Jones and Bartlett, 2014. 930 p.

(3) de AVILA e SILVA, S.; ECHEVERRIGARAY, S. Bacterial Promoter Features Description and Their Application on E. coli in silico Prediction and Recognition Approaches. In: Bioinformatics, PÉREZ-SÁNCHEZ, Horacio (Ed.). Croacia: Intech, 2012. Cap. 10. p. 241-260.

(4) KAZMIERCZAK, M. J. et al. Alternative Sigma Factors and Their Roles in Bacterial Virulence. Microbiology and Molecular Biology Reviews. v. 69, n. 4, p. 527 - 543, 2005.

(5) MAES, A. et al. Role of polyadenylation in regulation of the flagella cascade and motility in Escherichia coli.Biochimie, v. 95, n. 2, p.410-418, fev. 2013.

(6) FONTANA, E. A. Algoritmos de Clusterização Aplicados na Análise Genômica da Bactéria Escherichia coli. 2013. Trabalho de Conclusão de Curso. Universidade de Caxias do Sul. Centro de Computação e Tecnologia da Informação.

(7) CROOKS, G. E. et al. WebLogo: A Sequence Logo Generator. Genome Research, v. 14, n. 6, p.1188-1190, 12 maio 2004.

(8) FRANCESCHINI, A. et al. STRING v9.1: protein-protein interaction networks, with increased coverage and integration. Nucleic Acids Research, v. 41, n. 1, p.D808-D815, 29 nov. 2012.

(9) SHBURNER, M. et al. Gene Ontology: tool for the unification of biology. Nature Genetics, v. 25, n. 1, p.25-29, maio 2000.

(10) SALGADO, H. et al. RegulonDB v8.0: omics data sets, evolutionary conservation, regulatory phrases, cross-validated gold standards and more. Nucleic Acids Research, v. 41, n. 1, p. D203-D213, 29 nov. 2012.

(11) HE, J. Improving feature representation of natural language gene functional annotations using automatic term expansion.2008 IEEE Symposium On Computational Intelligence In Bioinformatics And Computational Biology, [s.l.], p.173-179, set. 2008.

(12) BANDYOPADHYAY, S.; WANG, J. T.; MAULIK, U. Computational Intelligence and Pattern Analysis in Biology Informatics. Nova Jersey: John Wiley & Sons, Inc, 2010. 372 p.

(13) HUERTA, A. M.; COLLADO-VIDES, J. Sigma70 Promoters in Escherichia coli: Specific Transcription in Dense Regions of Overlapping Promoter-like Signals. Journal Of Molecular Biology, v. 333, n. 2, p. 261-278, out. 2003.

(14) GOÑI, J. R. et al. Determining promoter location based on DNA structure first-principles calculations. Genome Biol, v. 8, n. 12, p. R263, 2007.

(15) TAMAYO, R.; PRATT, J. T.; CAMILLI, A. Roles of Cyclic Diguanylate in the Regulation of Bacterial Pathogenesis. Annu. Rev. Microbiol., v. 61, n. 1, p.131-148, out. 2007.

(16) BROWN, P. N. et al. Mutational Analysis of the Flagellar Protein FliG: Sites of Interaction with FliM and Implications for Organization of the Switch Complex. Journal Of Bacteriology, v. 189, n. 2, p. 305-312, 3 nov. 2006.

(17) LI, C. et al. Differential Regulation of the Multiple Flagellins in Spirochetes. Journal Of Bacteriology, v. 192, n. 10, p. 2596-2603, 19 mar. 2010.




   

 

 

 

Licença Creative Commons
SaBios-Revista de Saúde e Biologia está licenciada com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional.