Atribuição de autoria por meio de ferramentas computacionais gratuitas – um estudo de caso
DOI:
https://doi.org/10.12957/palimpsesto.2023.65733Keywords:
Atribuição de autoria, Orange Canvas, TreeTagger.Abstract
O objetivo deste artigo é avaliar duas ferramentas computacionais gratuitas, que, usadas conjuntamente, podem trazer resultados significativos para uma primeira análise do estilo de um autor: o Orange Canvas e o etiquetador TreeTagger. Três workflows foram criados no Orange Canvas, por meio das tagsets do português disponíveis na plataforma do TreeTagger. Três classificadores foram usados: Logistic Regression, Support Vector Machine e Random Forest, juntamente com dois corpora de estudo. Os resultados mostram que o Logistic Regression e a tagset UD_Portuguese-Bosque forneceram as melhores combinações para a análise dos corpora. Há indícios de que, se usados corretamente, as ferramentas aqui avaliadas podem fornecer os primeiros subsídios sólidos para investigações posteriores mais aprofundadas por parte do perito.
Downloads
Downloads
Published
How to Cite
Issue
Section
License
Palimpsesto journal publishes original articles and reviews in the field of Literature, Language and Linguistics. We also publish mixed and/or thematic issues, with articles and reviews in Portuguese, English, Spanish, and French.
Authors retain copyright and grant the journal the right of its first publication, with the work simultaneously licensed under Creative Commons Attributions License, which allows sharing of the work with an acknowledgement of authorship and initial publication in this journal.
Palimpsesto uses a Creative Commons - Atribuição-NãoComercial 4.0 Internacional license.