Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso
Resumo
O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.
Palavras-chave
Texto completo:
PDFDOI: https://doi.org/10.12957/palimpsesto.2023.65733
Apontamentos
- Não há apontamentos.
Direitos autorais 2023 ANDRE LUIZ SIQUEIRA ALENCAR
ISSN 1809-3507 | DOI: 10.12957/palimpsesto
Palimpsesto é uma publicação do corpo discente do Programa de Pós-Graduação em Letras da UERJ:
Indexado nas seguintes bases:
A Palimpsesto utiliza uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional.