Corpus psicolinguístico Léxico do Português Brasileiro
Resumo
O Léxico do Português Brasileiro foi desenvolvido com o objetivo de oferecer um corpus baseado em palavras para a pesquisa em psicolinguística no português brasileiro. Ele foi criado a partir de um corpus com mais de 32 milhões de palavras. Assim, o Léxico do Português Brasileiro contém mais de 215 mil entradas lexicais e apresenta 21 colunas com informações metalinguísticas e psicolinguísticas relevantes, como categoria gramatical, frequência ortográfica, número de letras, vizinhos ortográficos, entre outras. Ele é um corpus aberto e de livre acesso na internet, possuindo uma plataforma amigável e dinâmica para pesquisas simples e complexas. O Léxico do Português Brasileiro ainda disponibiliza uma série de dados já computados, oferece um motor de geração de pseudopalavras do português brasileiro e um conjunto de ferramentas de linguística e estatística. Sendo assim, o presente artigo tem como objetivo introduzir e apresentar o Léxico do Português Brasileiro, e servir como seu manual de utilização. Ainda, é realizada uma descrição do desenvolvimento e criação do corpus. Enfim, o Léxico do Português Brasileiro preenche uma enorme lacuna na pesquisa em psicolinguística e linguística computacional, oferecendo um corpus baseado em palavras com valiosas informações metalinguísticas e psicolinguísticas do português brasileiro.
http://dx.doi.org/10.12957/soletras.2017.29702
Palavras-chave
Texto completo:
PDFDOI: https://doi.org/10.12957/soletras.2017.29702
SOLETRAS online - ISSN 2316 8838
Revista do Departamento de Letras
Faculdade de Formação de Professores da UERJ
Rua Dr. Francisco Portela, 1470 - Patronato - São Gonçalo - RJ
Cep: 24435-005 - e-mail: soletrasonline@yahoo.com.br