Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso

Authors

  • Andre Luiz Siqueira Alencar Pontifícia Universidade Católica de São Paulo

DOI:

https://doi.org/10.12957/palimpsesto.2023.65733

Keywords:

Atribuição de autoria, Orange Canvas, TreeTagger.

Abstract

O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.

Downloads

Download data is not yet available.

Published

2023-04-21

How to Cite

ALENCAR, Andre Luiz Siqueira. Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso. Palimpsesto - Revista do Programa de Pós-Graduação em Letras da UERJ, Rio de Janeiro, v. 22, n. 41, p. 70–100, 2023. DOI: 10.12957/palimpsesto.2023.65733. Disponível em: https://www.e-publicacoes.uerj.br/palimpsesto/article/view/65733. Acesso em: 11 may. 2025.

Issue

Section

Estudos de Língua (Tema livre)