Variantes do Índice Silhueta para Validação de Agrupamentos

Autores/as

  • Victória Vargas Escola Nacional de Ciências Estatísticas (ENCE-IBGE)
  • Eduardo Rodrigues Amorim Universidade Anhanguera (Campus Niterói)
  • José André de Moura Brito Escola Nacional de Ciências Estatísticas (ENCE-IBGE)
  • Gustavo Silva Semaan Universidade Federal Fluminense (INFES-UFF)

DOI:

https://doi.org/10.12957/cadinf.2021.68558

Resumen

O presente artigo traz a proposta de avaliação de quatro variantes do índice de silhueta quanto `a sua capacidade de detectar soluções de boa qualidade para problemas de agrupamento. Neste sentido, foram realizados cinco experimentos computacionais, contemplando 51 instâncias da literatura diversificadas (dados reais e artificiais). Como medidas de dissimilaridade foram utilizadas as distâncias euclidiana e de Manhattan, além de três algoritmos clássicos de agrupamento, a saber: PAM, DBSCAN e Bisecting k-means. De modo adicional, experimentos com a Estatística de Hopkins foram realizados com o intuito de verificar a existência de tendência de agrupamentos nas instâncias reais, em que o número de grupos k não é conhecido a priori. Os resultados obtidos indicam que a variante baseada na mediana constitui-se como boa alternativa para detectar soluções de qualidade.

Publicado

2022-06-28

Cómo citar

Vargas, V., Amorim, E. R., Brito, J. A. de M., & Semaan, G. S. (2022). Variantes do Índice Silhueta para Validação de Agrupamentos. Cadernos Do IME - Série Informática, 46, 118–127. https://doi.org/10.12957/cadinf.2021.68558

Número

Sección

Artigos