Análise preditiva de preços imobiliários utilizando técnicas de aprendizado supervisionado.
DOI:
https://doi.org/10.12957/cadinf.2025.91017Resumo
. Este trabalho abordou a aplicação de técnicas de aprendizado supervisionado no conjunto de dados Ames Housing, explorando a previsão de valores de propriedades residenciais em Ames, Iowa. O estudo enfatizou a análise exploratória de dados (AED), revelando insights sobre a distribuição de variáveis, padrões e anomalias cruciais para a modelagem preditiva. Foram desenvolvidos 6 modelos empregando técnicas de regressão, incluindo Regressão Linear, "Elastic Net", "Random Forest" e "XGBoost". Estas técnicas foram aplicadas sequencialmente, destacando a evolução da precisão e complexidade dos modelos preditivos. O processamento dos dados, incluindo tratamento de dados ausentes, “outliers”, codificação de variáveis categóricas e transformação de variáveis, foi crucial para o aprimoramento dos modelos. A metodologia proporcionou insights sobre o “trade-off” entre simplicidade e precisão, com o XGBoost apresentando os melhores resultados. O estudo também abordou desafios da modelagem de dados reais, como distribuição não normal dos resíduos, heterocedasticidade, colinearidade e dimensionalidade. Os resultados obtidos foram comparados à literatura, corroborando a eficácia do método proposto para previsão em regressão com dados reais.