Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso

Autores

  • Andre Luiz Siqueira Alencar Pontifícia Universidade Católica de São Paulo

DOI:

https://doi.org/10.12957/palimpsesto.2023.65733

Palavras-chave:

Atribuição de autoria, Orange Canvas, TreeTagger.

Resumo

O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.

Downloads

Publicado

2023-04-21

Como Citar

Alencar, A. L. S. (2023). Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso. Palimpsesto - Revista Do Programa De Pós-Graduação Em Letras Da UERJ, 22(41), 70–100. https://doi.org/10.12957/palimpsesto.2023.65733

Edição

Seção

Estudos de Língua