Corpus psicolinguístico Léxico do Português Brasileiro
DOI :
https://doi.org/10.12957/soletras.2017.29702Mots-clés :
Psicolinguística. Linguística computacional. Corpus, Lexicografia, Linguístic, Português brasileiro.Résumé
O Léxico do Português Brasileiro foi desenvolvido com o objetivo de oferecer um corpus baseado em palavras para a pesquisa em psicolinguística no português brasileiro. Ele foi criado a partir de um corpus com mais de 32 milhões de palavras. Assim, o Léxico do Português Brasileiro contém mais de 215 mil entradas lexicais e apresenta 21 colunas com informações metalinguísticas e psicolinguísticas relevantes, como categoria gramatical, frequência ortográfica, número de letras, vizinhos ortográficos, entre outras. Ele é um corpus aberto e de livre acesso na internet, possuindo uma plataforma amigável e dinâmica para pesquisas simples e complexas. O Léxico do Português Brasileiro ainda disponibiliza uma série de dados já computados, oferece um motor de geração de pseudopalavras do português brasileiro e um conjunto de ferramentas de linguística e estatística. Sendo assim, o presente artigo tem como objetivo introduzir e apresentar o Léxico do Português Brasileiro, e servir como seu manual de utilização. Ainda, é realizada uma descrição do desenvolvimento e criação do corpus. Enfim, o Léxico do Português Brasileiro preenche uma enorme lacuna na pesquisa em psicolinguística e linguística computacional, oferecendo um corpus baseado em palavras com valiosas informações metalinguísticas e psicolinguísticas do português brasileiro.
http://dx.doi.org/10.12957/soletras.2017.29702
Téléchargements
Publié-e
Numéro
Rubrique
Licence
L'approbation des articles implique le transfert immédiat et gratuit des droits de publication dans ce magazine. L’auteur ou les auteurs autorisent le programme de Post-Graduation en Lettres et Linguistique (PPLIN) à le reproduire et à le publier dans le magazine SOLETRAS, les termes "reproduction" et "publication" en accordant avec l'article 5e de la Loi 9610/98. Le ou les auteurs continueront d’avoir le droit d’auteur pour les publications futures. L’article peut être consulté par le réseau informatique mondial (http://www.e-publicacoes.uerj.br/index.php/soletras), étant autorisé, à titre gratuit, à la consultation et à la reproduction d’une copie de l’article. Les cas de plagiat ou d'illégalité dans les textes présentés n'engagent que leurs auteurs.