COPLE2

 

 R&D Unit funded by

Learner Corpus do Português L2 - COPLE2

O Corpus de Português Língua Estrangeira/Língua Segunda (COPLE2) é um conjunto de textos escritos e orais produzidos por estudantes de Português como segunda língua/língua estrangeira no Instituto de Cultura e Língua Portuguesa (ICLP – FLUL) e por candidatos para exames no Centro de Avaliação de Português Língua Estrangeira (CAPLE – FLUL).

O corpus apresenta textos de aprendizes com 15 línguas nativas (L1s) diferentes, niveles de proficiência que vão do A1 ao C1 e diferentes tópicos e tipos de tarefa. Os textos estão codificados em formato TEI através da plataforma do TEITOK.

Cada texto oferece completos metadatos relativos ao perfil do aprendente, o tipo de tarefa e as circunstâncias nas que o texto foi produzido. Os manuscritos originais e os ficheiros de áudio estão também disponíveis, com as modificações realizadas pelos alunos e os professores codificadas. O corpus oferece ainda anotações para POS, lema e erros dos aprendentes. Toda a informação codificada é pesquisável através da CQP query language.

O projeto é atualmente financiado pela Fundação Calouste Gulbenkian através do projeto RECAP, e foi previamente financiado pela Associação para o Desenvolvimento da Faculdade de Letras da Universidade de Lisboa (ADFLUL), Instituto de Cultura e Língua Portuguesa (ICLP)
Fundação Calouste Gulbenkian através do projeto LeCIEPLE. É o resultado de uma parceria entre diversas instituições, como ICLP, CAPLE e Centro de Linguística da Universidade de Lisboa (CLUL).

 

Como citar o corpus

Mendes, Amália, Sandra Antunes, Maarten Janssen & Anabela Gonçalves (2016) The COPLE2 Corpus: A Learner Corpus for Portuguese. In: Proceedings of the Tenth Language Resources and Evaluation Conference – LREC’16, 23-28 May 2016, Portoroz, Slovenia, 3207-3214.