Artigo

DESENVOLVIMENTO DE CLASSIFICADORES HIERÁRQUICOS LOCAIS

SIMOES, Lucas Felipe1; NIEVOLA, Julio Cesar2;

Resumo

Introdução:Dentro da computação existe uma área de pesquisa que trata da Aprendizagem de Máquina e Mineração de Dados no que diz respeito à classificação de dados em que os mesmos pertencem a um conjunto finito de classes que estão em um mesmo nível. Dentre vários problemas estão os de natureza hierárquica, em que classes podem ser subclasses ou superclasses de outras classes. Com relação aos problemas hierárquicos, um ou mais exemplos podem ser associados a mais uma ou mais classes simultaneamente. A determinação da função de proteínas é um destes casos.

Objetivo:Realizar a classificação da função de proteínas, utilizando um subconjunto dos atributos originais, de tal forma que este subconjunto crie um modelo mais adequado, ou seja, que permita obter uma boa taxa de acerto na tarefa de predição, usando um modelo mais compreensível.

Metodologia:O classificador hierárquico usado foi o denominado por nó, ou seja, para cada nó do grafo é criado um classificador binário; este classificador indica se a proteína sendo prevista possui ou não a função especificada pelo nó correlato. O método de seleção de atributos usado para realizar a seleção dos atributos mais relevantes foi o Relief, conhecido na literatura pelo seu bom desempenho e por ser um método filtro, ou seja, ele avalia diretamente os atributos sem a necessidade do classificador no meio do processo, o que tornaria a operação muito pesada computacionalmente.

Resultados:Após a seleção do subconjunto de atributos, foram criados classificadores para cada nó do grafo, tanto com o conjunto original quanto com o conjunto selecionado. Os resultados em cada nó não seguem a mesma tendência, ou seja, em alguns casos o conjunto original teve melhor desempenho enquanto que em outros o maior acerto foi do subconjunto gerado. Entretanto, como um todo, a taxa de acerto do classificador hierárquico foi melhor com o subconjunto de atributos.

Conclusões:O uso da seleção de atributos permite obter resultados melhores, tanto em termo da taxa de acerto quanto da compreensibilidade do modelo gerado. Portanto, é importante continuar com o trabalho e avaliar se a mesma situação acontece com outros tipos de classificadores hierárquicos, tais como o modelo baseado em nó-pai e em camadas.

Palavras-chave:Classificação hierárquica. Modelo baseado por nó. Relief.

Legendas

    1. Estudante
    2. Orientador