Corpus psicolinguístico Léxico do Português Brasileiro
DOI:
https://doi.org/10.12957/soletras.2017.29702Palavras-chave:
Psicolinguística. Linguística computacional. Corpus, Lexicografia, Linguístic, Português brasileiro.Resumo
O Léxico do Português Brasileiro foi desenvolvido com o objetivo de oferecer um corpus baseado em palavras para a pesquisa em psicolinguística no português brasileiro. Ele foi criado a partir de um corpus com mais de 32 milhões de palavras. Assim, o Léxico do Português Brasileiro contém mais de 215 mil entradas lexicais e apresenta 21 colunas com informações metalinguísticas e psicolinguísticas relevantes, como categoria gramatical, frequência ortográfica, número de letras, vizinhos ortográficos, entre outras. Ele é um corpus aberto e de livre acesso na internet, possuindo uma plataforma amigável e dinâmica para pesquisas simples e complexas. O Léxico do Português Brasileiro ainda disponibiliza uma série de dados já computados, oferece um motor de geração de pseudopalavras do português brasileiro e um conjunto de ferramentas de linguística e estatística. Sendo assim, o presente artigo tem como objetivo introduzir e apresentar o Léxico do Português Brasileiro, e servir como seu manual de utilização. Ainda, é realizada uma descrição do desenvolvimento e criação do corpus. Enfim, o Léxico do Português Brasileiro preenche uma enorme lacuna na pesquisa em psicolinguística e linguística computacional, oferecendo um corpus baseado em palavras com valiosas informações metalinguísticas e psicolinguísticas do português brasileiro.
http://dx.doi.org/10.12957/soletras.2017.29702
Downloads
Publicado
Edição
Seção
Licença
A aprovação dos artigos implica a cessão imediata e sem ônus dos direitos de publicação nesta revista. O(s) autor(es) autoriza(m) ao Programa de Pós-graduação em Letras e Linguística (PPLIN) a reproduzi-lo e publicá-lo na revista SOLETRAS, entendendo-se os termos “reprodução” e “publicação” conforme definição do artigo 5° da Lei 9610/98. O(s) autor(es) continuará(rão) a ter os direitos autorais para publicações posteriores. O artigo poderá ser acessado pela rede mundial de computadores (http://www.e-publicacoes.uerj.br/index.php/soletras), sendo permitidas, a título gratuito, a consulta e a reprodução de exemplar do artigo para uso próprio de quem o consulta. Casos de plágio ou quaisquer ilegalidades nos textos apresentados são de inteira responsabilidade de seus autores.