Análise e modelagem do comportamento de SPAMMERS e dos usuários legÃtimos em redes de email
Abstract (Summary)
E-mail é um meio de comunicação cada vez mais importante e largamente utilizado para interação entre indivÃduos e/ou organizações, facilitando o contato entre indivÃduos e possibilitando melhoria da produtividade nas organizações. Entretanto, o uso de ferramentas automáticas para envio de e-mails não autorizados, conhecidos como spam, vem, dia-a-dia, enfraquecendo a atratividade deste meio de comunicação. Até hoje, a maioria da atenção dedicada à detecção de spam focalizou no corpo do e-mail ou nos endereços ou domÃnios associados aos remetentes de spam. Neste trabalho, nós propusemos uma forma nova de tratar o problema causado por spam. Nosso objetivo é desenvolver uma compreensão profunda das caracterÃsticas fundamentais do tráfego spam, do comportamento dos spammers e dos relacionamentos entre spammers e usuários legÃtimos em redes de e-mail. Esperamos que tal conhecimento possa ser usado, no futuro, como base para projetos de técnicas mais eficazes para detectar e combater spam. Primeiro, nós apresentamos uma caracterização extensiva de uma carga e-mails contendo spam e e-mails legÃtimos, que visa identificar e quantificar as caracterÃsticas fundamentais que distinguem o tráfego spam do de e-mails legÃtimos, avaliando o impacto do tráfego spam no agregado e fornecendo dados para criar geradores de tráfegos sintéticos. Em seguida, nós apresentamos uma análise teórica de um modelo de redes de e-mail baseado em teoria dos grafos, mostrando que existem diferenças fundamentais entre as relações desenvolvidas por spammers e seus pares e as relações desenvolvidas por remetentes e destinatários de e-mails legÃtimos. Em terceiro lugar, nós usamos as propriedades reveladas acima, do comportamento dos spammers e dos usuários legÃtimos, a fim de propor dois novos algoritmos para detecção de spam. Os algoritmos propostos utilizam as propriedades estruturais dos relacionamentos entre remetentes e destinatários de e-mails como base para a detecção de spam. Nossos algoritmos se propõem a corrigir classificações errôneas de um algoritmo auxiliar usado para detecção de spam. A precisão dessas classificações foi avaliada utilizando duas carga de dados, uma real e outra sintética. Finalmente, como a maioria do tráfego de e-mails, representada pelo tráfego do spam, exibe relações oportunÃsticas ao invés de relações sociais comuns, nós usamos este tráfego para quantificar as diferenças entre relações sociais e anti-sociais (representadas aqui pelo comportamento dos spammers) em redes de e-mail. Embora nenhuma métrica de tráfego ou comportamental estudada possa diferenciar inequivocamente e-mails legÃtimos de spam, a combinação de diversas delas mostra um retrato claro do processo por meio do qual os e-mails legÃtimos e spam são criados. Por esta razão, supomos, o conhecimento gerado poderá ser usado para aumentar a eficácia, como nos algoritmos propostos, dos mecanismos de detecção de e-mail ilegÃtimos, assim como para melhor compreender o comportamento malicioso em redes de comunicações.
Bibliographical Information:
Advisor:Virgilio Augusto Fernandes Almeida; Jussara Marques de Almeida; Luis Bettencourt; Valmir Carneiro Barbosa; Eduardo Sany Laber; Wagner Meira Junior
School:Universidade Federal de Minas Gerais
School Location:Brazil
Source Type:Master's Thesis
Keywords:Correio eletrônico Teses. Redes de computação Medidas segurança. Teses Mensagens eletrônicas não solicitadas.
ISBN:
Date of Publication:05/05/2006