Details

Reconhecimento de padrões proteômicos e genômicos por aprendizagem de máquinas para o disgnóstico médico.

by Carvalho, Paulo Costa

Abstract (Summary)
Objetivo: Aplicar aprendizagem de máquinas para revelar padrões moleculares criptografados no nossoperfil proteômico / genômico humano para auxilio no diagnóstico médico personalizado.Resultados e conclusões:1. Estudos referentes ao perfil proteômico: Foi realizada uma comparação entre o perfil proteômico do soro depacientes com doença de Hodgkin (HD) e de teóricos saudáveis (CS), com o intuito de buscar padrõesmoleculares diferencialmente expressos para a obtenção de diagnóstico personalizado. Inicialmente, foi feito umgel unidimensional que revelou duas bandas sobre-expressas (~26 e 18 kDa) em pacientes com HD (plt;0.01).Posteriormente, por espectrometria de massa (electrospray - ESI), foram obtidos espectros oriundos do soro de30 CS e 30 pacientes com HD. Foi implementado um classificador baseado em máquinas de vetor de suporte(SVM) que classificou corretamente todos os espectros como pertencentes ao seu respectivo conjunto baseandoseno método de validação cruzada leave-one-out. Um novo algorítmo intitulado ?analise por divergênciamáxima? (MDA) foi utilizado no espectro multicarga para rastrear biomarcadores. Com apenas dois marcadores,já era possível classificar corretamente 97% de todos os indivíduos. Acreditamos que esta foi a primeira vez queSVM foi aplicado a espectros ESI para fins de diagnóstico médico.Uma nova abordagem para problemas multi-classe que denominamos ?máquina de clusterização porelipsóides? (ECM) foi utilizada para selecionar regiões no espectro livre dos efeitos da doença de Hodgkin emapeá-los no espaço de características. Todos os CS e pacientes com HD foram corretamente classificados peloteste de validação cruzada leave-one-out. As fronteiras elípticas aqui modeladas poderiam representar umadefinição geométrica de um soro controle. Eventualmente, ao assimilar novos biomarcadores, acreditamos que omodelo poderá ser utilizado para o diagnóstico simultâneo de diversos tipos de câncer.2. Análise de perfis genéticos: Neste estudo é demonstrada uma abordagem computacional para avaliaçãopersonalizada da severidade de hipertensão, combinando marcadores genômicos associados ao sistema reninaangeotensina-aldosterona (RAAS) e dados clínicos. Os marcadores genômicos mais relevantes para a tomada dedecisão são prontamente selecionados de um banco de dados, com combinações pré-computadas relativas aogenótipo e dados clínicos do indivíduo, para um diagnóstico personalizado. O risco da doença é avaliado pormodelo gerado a partir da técnica de vetor de suporte, e depois é mensurada a distância Euclidiana até a fronteirade decisão do modelo. Para gerar este banco de dados, uma nova metodologia híbrida de seleção decaracterísticas foi utilizada, tendo como conjunto de treinamento dados clínicos e genômicos de brasileiroshipertensos e normotensos. A seleção de características aplicada aos dados aplótipos RAAS confirmaram a suaassociação com a hipertensão e elucidaram padrões distintos de polimorfismo para grupos com diferentes etnias.3. Computação distribuída ? A maioria das soluções grid existentes possuem instalações complexas requerendoespecialistas e são limitados a um único sistema operacional. Neste trabalho apresentamos Squid, um softwaremulti-plataforma, código aberto, objetivando simplicidade de uso para oferecer computação de alto desempenhopara aplicações complexas. Squid também possui um sistema de contingência de falhas, capaz de redirecionartrabalho em caso de queda de nós remotos, e se recuperar mesmo em caso de falha do nó principal.
This document abstract is also available in English.
Bibliographical Information:

Advisor:Gilberto Barbosa Domont; Wim Maurits Sylvain Degrave

School:Faculdades Oswaldo Cruz

School Location:Brazil

Source Type:Master's Thesis

Keywords:BIOLOGIA MOLECULAR Análise de perfis genéticos Computação distribuída

ISBN:

Date of Publication:11/24/2005

© 2009 OpenThesis.org. All Rights Reserved.