Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso
DOI:
https://doi.org/10.12957/palimpsesto.2023.65733Palavras-chave:
Atribuição de autoria, Orange Canvas, TreeTagger.Resumo
O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.
Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
A revista Palimpsesto publica artigos e resenhas inéditos, referentes as áreas de Letras e Linguística. Publica volumes mistos e/ou temáticos, com artigos e resenhas em português, inglês, espanhol e francês.
Autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution, que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
Palimpsesto utiliza uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional.