Downloads

Os investigadores que preferirem lidar com os dados do Cordial-Sin usando ferramentas próprias encontram no quadro abaixo os ficheiros de texto apropriados, organizados por excerto, localidade e nível de transcrição/anotação. XXXXX

Distribuição Transcrição(1) Edição(1) Versão anotada(1) Treebank(2, 3)
Por excerto (2058 ficheiros) transcription_excerpt.zip edition_excerpt.zip annotation_excerpt.zip treebank_excerpt.zip
Por localidade (42 ficheiros) transcription_location.zip edition_location.zip annotation_location.zip treebank_location.zip
Corpus total (1 ficheiro) transcription_corpus.zip edition_corpus.zip annotation_corpus.zip treebank_corpus.zip

 

XML corpus PSDX corpus
XML_corpus.zip PSDX_corpus.zip

 

(1) Este trabalho é financiado por fundos nacionais através da FCT – Fundação para a Ciência e a Tecnologia, I.P., no âmbito do projeto PTDC/LLT-LIN/32086/2017.

(2) Este trabalho é financiado por fundos nacionais através da FCT – Fundação para a Ciência e a Tecnologia, I.P., no âmbito dos projetos PTDC/LIN/71559/2006, PTDC/LLT-LIN/32086/2017, UID/LIN/00214/2013 and UID/00214/2019.

(3) Os ficheiros PSD são pesquisáveis com a ferramenta CorpusSearch. O alojamento no TEITOK dos ficheiros PSDX equivalentes está atualmente em curso. Concluído o processo, os dados sintáticos também serão pesquisáveis online.