Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso

Auteurs-es

  • Andre Luiz Siqueira Alencar Pontifícia Universidade Católica de São Paulo

DOI :

https://doi.org/10.12957/palimpsesto.2023.65733

Mots-clés :

Atribuição de autoria, Orange Canvas, TreeTagger.

Résumé

O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.

Téléchargements

Les données relatives au téléchargement ne sont pas encore disponibles.

Téléchargements

Publié-e

2023-04-21

Comment citer

ALENCAR, Andre Luiz Siqueira. Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso. Palimpsesto - Revista do Programa de Pós-Graduação em Letras da UERJ, Rio de Janeiro, v. 22, n. 41, p. 70–100, 2023. DOI: 10.12957/palimpsesto.2023.65733. Disponível em: https://www.e-publicacoes.uerj.br/palimpsesto/article/view/65733. Acesso em: 7 avr. 2026.

Numéro

Rubrique

Estudos de Língua (Tema livre)