Multidimensional Analysis of Multilevel Learner Corpus of English Language

Authors

DOI:

https://doi.org/10.12957/palimpsesto.2024.79135

Keywords:

Linguística de Corpus, Linguística de Corpus de Aprendiz, Níveis de Proficiência, Análise Multidimensional.

Abstract

ABSTRACT: This article aims to identify the dimensions of variation in the patterns of lexicogrammatical elements used by English learners, using the Multilevel Corpus of Brazilian English Learners (COBRA-7), compiled by W. M. Dantas in 2012. COBRA-7 consists of 2516 school essays, divided into six proficiency levels, totaling 571,564 words. The research falls within the field of Learner Corpus Linguistics (LCL), which investigates authentic texts produced by foreign language learners. The methodology employed is Functional Multidimensional Analysis (AMD) within the context of Corpus Linguistics, using computational tools. The analysis aimed to identify the grammatical-functional dimensions of variation in the corpus and, through the use of the ANOVA statistical procedure, examined functional multidimensional variation in relation to independent variables such as "school," "level," and "gender." The results indicated the existence of statistical variation among different proficiency levels.

Key words: Corpus Linguistics; Larner Corpus Research; Proficiency Levels; Multidimensional Analysis.

Downloads

Download data is not yet available.

Author Biography

Cicero Soares da Silva, Pontifícia Universidade Católica de São Paulo (PUC-SP)

Doutorando em Linguística Aplicada e Estudos da Linguagem pela PUC/SP, Mestre em Linguística Aplicada e Estudos da Linguagem pela PUC/SP (Pontifícia Universidade Católica de São Paulo), Licenciado em Letras - Língua Portuguesa pela Universidade Anhembi Morumbi (2019). Possui o CELTA ( Certificate in Teaching English to Speakers of Other Languages) da Universidade de Cambridge. Leciona Inglês há mais de 25 anos no Ensino Fundamental, Médio, e, principalmente, em empresas e cursos particulares com ênfase em Inglês para fins Específicos para todos os níveis de proficiência: A1, A2, B1, B2, C1 e C2, com base no Quadro Comum Europeu de Referência para Línguas (CEFR), habilitado em cursos preparatórios para os Exames da Universidade de Cambridge ( KEY, PET, FCE, CAE, CPE, IELTS E LINGUASKILL), TOEIC E TOEFL IBT. Membro do grupo de pesquisa em Linguística de Corpus -GELC .

References

ACUNZO, Cristina Mayer. O que e como escrevemos na web: um estudo multidimensional de variação de registro em Língua Inglesa. 2018, 129 f. Tese de Doutorado em Linguística Aplicada e Estudos da Linguagem – LAEL - PUC. São Paulo, 2018.

ATKINS, Sue.; CLEAR, Jeremy. Corpus design criteria. Literary and Linguistic Computing 7(I): 1-16, 1992.

BERBER-SARDINHA, Tony. Linguística de Corpus. São Paulo: Manole, 2004.

BERBER-SARDINHA, Tony. Como usar a Linguística de Corpus no ensino de língua estrangeira. Por uma Linguística de Corpus educacional brasileira. In: VIANA, Vander; TAGNIN, Stella. Corpora no ensino de línguas estrangeiras. São Paulo: Editora Contexto. 2013, pp. 293-348.

.

BERBER-SARDINHA, Tony. Linguística de Corpus: histórico e problemática D.E.L.T.A., Vol. 16, N º 2, pp. 323 – 367, 2000.

BERBER-SARDINHA, Tony. A abordagem Metodológica da Análise Multidimensional, Gragoatá, Niterói, n. 29, pp. 107-125, 2. Sem. 2010.

BERBER-SARDINHA, Tony. Register Variation in metaphor: a multi-dimensional perspective. In: BERBER-SARDINHA, T.; HERRMANN, B. (Eds) metaphor specialist discourse. Amsterdam/Philadephia: John Benjamins, 2015, pp. 17-52.

BERBER-SARDINHA, Tony; KAUFFMAN, Carlos; ACUNZO, Cristina Mayer. “A Multi-dimensional analysis of register variation in Brazilian Portuguese”. Corpora (2014): 239-271.

BESNIER, Nico. The linguistics relationship of spoken and written Nukulaelae register. Language, v. 64, n. 4, 1988, p. 707-736.

BIBER, Douglas et al. Grammar of Spoken and Written English. London, Pearson. 1999.

BIBER, Douglas; CONRAD, Susan; REPPEN, Randi. Corpus Linguistics: investigating language structure and use. Cambridge University Press. 1994.

BIBER, Douglas. The Cambridge handbook of English Corpus Linguistics. Cambridge University Press. 2005.

BIBER, Douglas. Variation across Speech and Writing. Cambridge University Press, 1988.

BIBER, Douglas.; CONRAD, Susan. Register, Genre and Style. Cambridge; New York: Cambridge University Press, 2009.

BIBER, Douglas.; TRACY-VENTURA, Nicole. Dimensions of register variation in Spanish. In: PARODI, Giovanni. (Org.). Working with Spanish Corpora. London: Continuum, 2007. p. 54-89.

BRITISH COUNCIL. Quadro Comum Europeu de Referência para Línguas (CEFR). Disponível em: <https://www.britishcouncil.org.br>. Acesso em 4 dez. 2021.

CHOMSKY, Noam. The Logical Structure of Linguistic Theory. Massachusetts: M.I.T. Library, 1955.

SOUZA, Renata Condi de. A revista Time em uma perspectiva multidimensional. 2012. 330 f. Tese de Doutorado em Linguística Aplicada e Estudos da Linguagem – LAEL- PUC. São Paulo, 2012.

CROSSLEY, Scott; LOUWERSE, Max. Multi-dimensional register classification using bi-grams. International Journal of Corpus Linguistics, v. 12, n. 4, p. 453-478, 2007.

DANTAS, Wendel Mendes. Erros de escrita em Inglês por brasileiros: Identificação, classificação e variação entre níveis. 2012. 164 f. Dissertação de Mestrado em Linguística Aplicada e Estudos da Linguagem- LAEL, PUC, São Paulo, 2012.

DELFINO, Maria Claudia Nunes. Uso de música para o Ensino de Inglês como Língua Estrangeira em um ambiente baseado em Corpus. 2016. 159 f. Dissertação de Mestrado em Linguística Aplicada e Estudos da Linguagem - LAEL, PUC. São Paulo, 2016.

DE MÖNNINK, Inge et al. Using the MF/MD method for automatic text classification. In: GRANGER, SYLVIANE.; PETCH TYSON, STEPNANIE. (Org.). Extending the scope of corpus based research: new applications new challenges. Amsterdam: Rodopi, 2003. p. 15-25.

OLIVEIRA, Marcos Roberto de. Aquisição de terceira pessoa do singular na língua inglesa: Uma perspectiva da linguística de corpus. 2020. 82 f. Dissertação de Mestrado em Letras – Universidade Federal de São Paulo, Escola de Filosofia, Letras e Ciências Humanas, 2020.

ARAÚJO, Rafael Fonseca de. A linguagem dos reality TV shows norte-americanos: análise e classificação. 2017. 242 f. Dissertação de Mestrado em Linguística Aplicada e Estudos da Linguagem – LAEL, PUC. São Paulo, 2017.

GIL, Cristina Borges. A incidência do princípio idiomático e do princípio da escolha aberta na produção escrita de alunos brasileiros de inglês como língua estrangeira. 2014. 102 f. Dissertação de Mestrado em Linguística Aplicada e Estudos da Linguagem - LAEL. PUC, São Paulo, 2014.

GRANGER, Sylviane et al. International Corpus of Learner English, version 3. Presses Universitaires de Louvain, Belgium, 2020.

GRANGER, Sylviane. Learner English on Computer. Longman London and New York, 1998.

GRANGER, Sylviane; GILQUIN, Gaetanelle; MEUNIER, Fanny. The Cambridge Handbook of Learner Corpus Research. Cambridge University Press, United Kingdom, 2015.

GRANGER, Sylviane; HUNG, Joseph; PETCH-TYSON, Stephanie. Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching. John Benjamins B. V., 2002.

HALLIDAY, Michael Alexander Kirkwood. An introduction to Functional Grammar, 3rd ed. Hodder Arnold. 2004.

HUNSTON, Susan. Corpora in Applied Linguistics. Cambridge: Cambridge University Press, 2002.

KAUFFMANN, Carlos. O corpus do jornal: variação lingüística, gêneros e dimensões da imprensa diária escrita. 2005. 203 f. Dissertação de Mestrado em Linguística Aplicada e Estudos da Linguagem - LAEL, PUC, São Paulo, SP, 2005.

KIM, Young Jin.; BIBER, Douglas. A corpus-based analysis of register variation in Korean. In: BIBER, Douglas.; FINEGAN, Edward. (Org.). Sociolinguistic perspectives on register. Oxford: Oxford University Press, 1994. pp. 157-181.

KRASHEN, Stephen, Second Language Acquisition and second Language learning. New York: Pergamon Press, 1981.

LAMB, William. Scottish Gaelic speech and writing: register variation in an endangered language. Belfast: Cló Ollscoil na Banríona, 2008.

LEE, David Yue-Wei. Modelling variation in spoken and written language: the Multi-Dimensional Approach revisited. 2000. Unpublished Doctoral Dissertation. – Department of Linguistics and Modern English Language- Lancaster University, Reino Unido, 1999.

LEWIS, Michael (Ed.). Teaching Collocation: Further Developments in the Lexical Approach. Boston: Thomson Heinle, 2000.

PARODI, Giovanni. Variation across registers in Spanish: Exploring the El-Grial PUCV Corpus. In: PARODI, GIOVANNI. (Org.). Working with spanish corpora. London: Continuum, 2007. pp. 11-53.

PARTINGTON, Alan. Patterns and Meanings: Using Corpora for English Language Research and Teaching. Amsterdam: John Benjamins, 1998.

SILVEIRA, Gustavo Estef Lino da. A linguística de corpus e o ensino de inglês: um estudo de produção escrita de aprendizes brasileiros. Palimpsesto – A revista do corpo discente do Programa de Pós-graduação em Letras da UERJ, ano 11, n. 15, p. 2-30, 2012.

SINCLAIR, John Mchardy. Corpus, Concordance, Collocation. Oxford University Press. 1991.

SINCLAIR, John Mchardy. How to use corpora in Language Teaching. John Benjamins B.V. 2004.

SINCLAIR, John Mchardy. Trust the Text. Language, corpus, and discourse. Routledge. 2004.

TARONE, Elaine. Interlanguage. Elsevier ldt., v.4, p. 1715–1719, 1994.

VEIRANO-PINTO, Marcia. A linguagem dos filmes norte-americanos ao longo dos anos: uma Abordagem Multidimensional. 2013. 489 f. Tese de Doutorado em Linguística Aplicada e Estudos da Linguagem – LAEL, PUC. São Paulo, 2013.

Published

2024-01-30

How to Cite

SILVA, Cicero Soares da. Multidimensional Analysis of Multilevel Learner Corpus of English Language. Palimpsesto - Revista do Programa de Pós-Graduação em Letras da UERJ, Rio de Janeiro, v. 23, n. 44, p. 67–98, 2024. DOI: 10.12957/palimpsesto.2024.79135. Disponível em: https://www.e-publicacoes.uerj.br/palimpsesto/article/view/79135. Acesso em: 23 may. 2025.

Issue

Section

Estudos de Língua (Tema livre)