ANÁLISE IN SILICO DE PROMOTORES DE ESCHERICHIA COLI RECONHECIDOS PELO FATOR σ28
Palavras-chave:
promotor, clusterização, patogenicidade.Resumo
A regulação da transcrição gênica em seres procariotos desempenha um papel importante para a resposta adequada destes organismos às mudanças ambientais. Neste processo, a especificidade da expressão dos genes se dá por meio da ligação do fator σ na enzima RNA polimerase, e o posterior reconhecimento do promotor. O objetivo deste trabalho foi analisar a composição das sequências promotoras reconhecidas pelo fator σ28(relacionado com mobilidade e patogenicidade bacteriana) e a relação proteína-proteína dos produtos biológicos associados a estas sequências. Os promotores de Escherichia coli foram agrupados utilizando a técnica de mineração de dados denominada de clusterização, com o algoritmo k-means. O conteúdo dos agrupamentos foi analisado com as ferramentas Weblogo, String-DB e Gene Ontology. Os resultados obtidos mostram que os agrupamentos formados apresentam o conteúdo da sequência divergente ao padrão biológico canônico. Adicionalmente, a análise da interação proteína-proteína indica que a função celular não está relacionada diretamente com a estrutura de nucleotídeos dos promotores, uma vez que este último foi o critério a utilizado pelo algoritmo K-means para realizar os agrupamentos.
IN SILICO ANALYSIS OF ESCHERICHIA COLI PROMOTERS RECOGNIZED BY σ28 FACTOR
ABSTRACT
The regulation of gene expression in prokaryotes provides the adequate response to environmental changes. The recognition of the promoter sequence plays an important role in the specificity of gene expression, since σ factor binds in RNA polymerase enzyme starting the process. In this context, the aim of this study was to analyze the composition of promoter sequences recognized by σ28 factor of Escherichia coli (related to mobility and bacterial pathogenicity) and protein-protein ratio of organic products associated with these sequences. The promoters were grouped by clustering (a data mining technique) with k-means algorithm. The content of clusters was analyzed with Weblogo, String-DB and Gene Ontology tools. The sequence of clusters shows some degree of discrepancy with canonical biologic pattern. Besides, none of the clusters presented metabolic function specificity. Furthermore, the protein-protein interaction analysis indicates that there is no relation between cellular function and nucleotide content, since this was the main criterion used by k-means algorithm in the generation of clusters.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Direitos Autorais para artigos publicados nesta revista são cedidos pelo autor à SaBios-Revista de Saúde e Biologia, que está autorizada a publicá-lo em meio impresso, digital, ou outro existente, sem retribuição financeira para os autores. Em virtude da aparecerem nesta revista de acesso público, os artigos são de uso gratuito, com atribuições próprias, em aplicações educacionais e não-comerciais.
Copyright of articles published in this journal are transferred by the author to SaBios-Journal of Health and Biology, which is authorized to publish them in printed, digital or other existing way, without financial reward for authors. Considering that articles appear in this public accessed journal, they are free to be used in educational and non-commercial applications.