Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso

Andre Luiz Siqueira Alencar

Resumo


O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.


Palavras-chave


Atribuição de autoria; Orange Canvas; TreeTagger.

Texto completo:

PDF


DOI: https://doi.org/10.12957/palimpsesto.2023.65733

Apontamentos

  • Não há apontamentos.


Direitos autorais 2023 ANDRE LUIZ SIQUEIRA ALENCAR

 


ISSN 1809-3507 | DOI: 10.12957/palimpsesto


Palimpsesto é uma publicação do corpo discente do Programa de Pós-Graduação em Letras da UERJ:

UERJ >> Instituto de Letras >> Programa de Pós-graduação em Letras

 


Indexado nas seguintes bases:

 

Periodicos CAPES Latindex Find in a library with WorldCat MLA Livre MIAR ResearchBib BASE Logo UF Libraries University of Texas Libraries  Library Logo UCLA Library University of Wisconsin - Madison Libraries EZB


Licença Creative Commons

A Palimpsesto utiliza uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional.