Uso da base de dados decundária KOG como ferramenta para caracterização de expressão gênica e mineração de dados em projetos transcriptoma
Abstract (Summary)
São apresentados neste trabalho um conjunto de novos resultados, técnicas eferramentas destinadas à mineração de dados e ao auxÃlio na análise deEtiquetas de Seqüências Expressas (EST) geradas em projetos transcriptoma.A base de dados de proteÃnas secundárias KOG foi utilizada como ferramenta no alinhamento e anotação automática de seqüências EST de quatroorganismos, A. thaliana, C. elegans, D. melanogaster e H. sapiens. Estesalinhamentos foram utilizados para diversos fins e em diversos experimentos,entre eles: inferência de valores de corte para similaridade utilizandotBLASTn entre seqüências de EST e proteÃnas do mesmo organismo;desenvolvimento de um teste de anotação entre EST e proteÃnas KOG;avaliação da qualidade da anotação usando os valores de corte inferidos;avaliação da qualidade da anotação utilizando uniques gerados pelo programaTGICL; caracterização funcional das EST com KOG; caracterização daamostragem de EST ou expressão gênica com KOG; avaliação da cobertura dabase KOG por quantidades incrementais de EST e inferência de um númeromÃnimo para cobri-la; criação de uma ferramenta web denominada K-EST, que disponibiliza dados de amostragem de EST por KOG e também deconservação entre agrupamentos KOG; inferência de perda de genes ou pelomenos de expressão gênica em organismos pertencentes ou não à base KOG,utilizando dados de amostragem de EST e conservação.
Bibliographical Information:
Advisor:Jose Miguel Ortega; Glaura da Conceicao Franco; Gloria Regina Franco; Arthur Gruber; Sandro José de Souza
School:Universidade Federal de Minas Gerais
School Location:Brazil
Source Type:Master's Thesis
Keywords:Mineração de dados (Computação) Teses.
ISBN:
Date of Publication:07/12/2007