Corpus psicolinguístico Léxico do Português Brasileiro
DOI:
https://doi.org/10.12957/soletras.2017.29702Keywords:
Psicolinguística. Linguística computacional. Corpus, Lexicografia, Linguístic, Português brasileiro.Abstract
O Léxico do Português Brasileiro foi desenvolvido com o objetivo de oferecer um corpus baseado em palavras para a pesquisa em psicolinguística no português brasileiro. Ele foi criado a partir de um corpus com mais de 32 milhões de palavras. Assim, o Léxico do Português Brasileiro contém mais de 215 mil entradas lexicais e apresenta 21 colunas com informações metalinguísticas e psicolinguísticas relevantes, como categoria gramatical, frequência ortográfica, número de letras, vizinhos ortográficos, entre outras. Ele é um corpus aberto e de livre acesso na internet, possuindo uma plataforma amigável e dinâmica para pesquisas simples e complexas. O Léxico do Português Brasileiro ainda disponibiliza uma série de dados já computados, oferece um motor de geração de pseudopalavras do português brasileiro e um conjunto de ferramentas de linguística e estatística. Sendo assim, o presente artigo tem como objetivo introduzir e apresentar o Léxico do Português Brasileiro, e servir como seu manual de utilização. Ainda, é realizada uma descrição do desenvolvimento e criação do corpus. Enfim, o Léxico do Português Brasileiro preenche uma enorme lacuna na pesquisa em psicolinguística e linguística computacional, oferecendo um corpus baseado em palavras com valiosas informações metalinguísticas e psicolinguísticas do português brasileiro.
http://dx.doi.org/10.12957/soletras.2017.29702
Downloads
Published
Issue
Section
License
The approval of the article implies the immediate and free transfer of the publication rights in this journal. The author (s) authorize the Postgraduate Program in Literature and Linguistics (PPLIN) to reproduce it and publish it in Revista SOLETRAS, understanding the terms "reproduction" and "publication" in accordance with Definition of article 5 of Law 9610/98. The author (s) will continue to own the copyright for subsequent publications. The article can be accessed by the world wide web (http://www.e-publicacoes.uerj.br/index.php/soletras), being allowed, free of charge, the consultation and the reproduction of copy of the article for own use. Cases of plagiarism or any illegalities in the submitted texts are the sole responsibility of their authors.