CoKri

 

 R&D Unit funded by

CoKri

Um corpus do kriol da Guiné-Bissau 

 

O kriol (ou guineense) é a língua mais falada na Guiné-Bissau e representa não só a língua franca como a língua de identidade nacional. É também a principal língua das comunidades da Guiné-Bissau na sua diáspora em diferentes países do mundo. A importância estratégica do kriol na Guiné-Bissau é representada pelo facto de permitir uma comunicação interétnica no país: aqui, cerca de vinte e um línguas nacionais (atlânticas e mande) são faladas. Enquanto o Kriol representa a principal L1 (primeira língua) nas cidades, esta é falada essencialmente como L2 (segunda língua) nas áreas rurais, onde uma ou mais línguas nacionais representam as L1s dos grupos dominantes. Apesar da importância crucial do kriol no país, a única língua oficial da Guiné-Bissau é o português.

O CoKri pretende ser um instrumento para a documentação e o aprofundamento da investigação do kriol, que ainda é considerada uma língua subestudada. Este corpus anotado e pesquisável de kriol é composto por cerca de trinta e sete horas de materiais áudio transcritos de gravações obtidas durante sessões de entrevista com falantes nativos de kriol na Guiné-Bissau entre 2018 e 2019. Um propósito adicional do CoKri é representar a variação intralinguística no kriol: apesar deste assunto nunca ter sido seriamente abordado na literatura científica sobre esta língua, existe um certo grau de variação morfofonológica e lexical no kriol. Quer estes sejam vestígios das variedades históricas do kriol (setentrional, central, e oriental) - considerados como quase extintos já no início dos anos de 1990 - ou quer estes sejam devidos à variação geográfica e ao contacto entre o kriol e outras línguas faladas no país, isto é algo que precisa de ser mais estudado. Em resumo, o CoKri apresenta uma imagem do kriol atual.

Por favor, note que o corpus se encontra presentemente sob revisão final. Os materiais informativos sobre as escolhas ortográficas para as transcrições dos dados de áudio e sobre as etiquetas POS (part-of-speech) usadas para a anotação serão disponibilizadas em breve.

A escolha de ter o lema tanto em português como em inglês, assim como o tipo de interface de pesquisa, foram adotados do corpus LUDViC (Pratas 2020).

 

Equipa
Chiara Truppi (IR)
Rute Gomes
 
Apoio técnico
José Aires
Raïssa Gillier
 
Financiamento
FCT, Fundação para a Ciência e a Tecnologia (SFRH/BPD/118401/2016)
CLUL, Centro de Linguística da Universidade de Lisboa (UIDB/00214/2020)
 
Termos de utilização
Todos os materiais presentes neste corpus estão protegidos por uma licença "Creative Commons", de acordo com os termos e condições descritos aqui:
logo

Crédito devido em todas as circunstâncias
Truppi, Chiara. 2022. CoKri: a corpus of Guinea-Bissau Kriol / um corpus do Kriol da Guiné-Bissau. http://teitok.clul.ul.pt/cokri