Corpus psicolinguístico Léxico do Português Brasileiro

Gustavo Lopez Estivalet, Fanny Meunier

Resumo


O Léxico do Português Brasileiro foi desenvolvido com o objetivo de oferecer um corpus baseado em palavras para a pesquisa em psicolinguística no português brasileiro. Ele foi criado a partir de um corpus com mais de 32 milhões de palavras. Assim, o Léxico do Português Brasileiro contém mais de 215 mil entradas lexicais e apresenta 21 colunas com informações metalinguísticas e psicolinguísticas relevantes, como categoria gramatical, frequência ortográfica, número de letras, vizinhos ortográficos, entre outras. Ele é um corpus aberto e de livre acesso na internet, possuindo uma plataforma amigável e dinâmica para pesquisas simples e complexas. O Léxico do Português Brasileiro ainda disponibiliza uma série de dados já computados, oferece um motor de geração de pseudopalavras do português brasileiro e um conjunto de ferramentas de linguística e estatística. Sendo assim, o presente artigo tem como objetivo introduzir e apresentar o Léxico do Português Brasileiro, e servir como seu manual de utilização. Ainda, é realizada uma descrição do desenvolvimento e criação do corpus. Enfim, o Léxico do Português Brasileiro preenche uma enorme lacuna na pesquisa em psicolinguística e linguística computacional, oferecendo um corpus baseado em palavras com valiosas informações metalinguísticas e psicolinguísticas do português brasileiro.

http://dx.doi.org/10.12957/soletras.2017.29702


Palavras-chave


Psicolinguística. Linguística computacional. Corpus; Lexicografia; Linguístic; Português brasileiro.

Texto completo:

PDF


DOI: https://doi.org/10.12957/soletras.2017.29702

Licença Creative Commons

SOLETRAS online - ISSN 2316 8838

Revista do Departamento de Letras

Faculdade de Formação de Professores da UERJ

Rua Dr. Francisco Portela, 1470 - Patronato - São Gonçalo - RJ

Cep: 24435-005 - e-mail: soletrasonline@yahoo.com.br