Menú principal
Powered by <TEI:TOK>
Maarten Janssen, 2014-
Los investigadores que prefieran trabajar con nuestros datos usando herramientas propias encontrarán en las tablas siguientes los archivos de texto apropiados.
Tabla 1: Distribución del corpus por lengua, siglo y formato:
(1) Las búsquedas en los archivos PSD se realizan con la herramienta Corpus Search. Las búsquedas en los archivos PSDX se realizan online en TEITOK.
(2) La anotación morfosintáctica del corpus español está en proceso de revisión.
Tabla 2: Distribución del corpus por sexo, lengua, siglo y formato:
Tabla 3: Distribución del corpus por estatus social3, lengua, siglo y formato:
Santo Oficio | |||||
---|---|---|---|---|---|
Lengua | Siglo | Texto original ISLRN: 375-405-009-147-2 | Texto normalizado ISLRN: 375-405-009-147-2 | Anotación POS ISLRN: 321-583-358-829-1 | Anotación sintáctica ISLRN: 662-489-499-707-7 |
Portugués | XVI | PT1500inq_ORIG_TXT.ZIP | PT1500inq_MOD_TXT.ZIP | PT1500inq_POS.ZIP | PT1500inq_PSD.ZIP |
Portugués | XVII | PT1600inq_ORIG_TXT.ZIP | PT1600inq_MOD_TXT.ZIP | PT1600inq_POS.ZIP | PT1600inq_PSD.ZIP |
Portugués | XVIII | PT1700inq_ORIG_TXT.ZIP | PT1700inq_MOD_TXT.ZIP | PT1700inq_POS.ZIP | PT1700inq_PSD.ZIP |
Portugués | XIX | No hay datos | No hay datos | No hay datos | No hay datos |
Lengua | Siglo | Texto original ISLRN: 305-406-112-712-3 | Texto normalizado ISLRN: 305-406-112-712-3 | Anotación POS ISLRN: 042-997-465-008-9 | Anotación sintáctica ISLRN: |
Español | XVI | ES1500inq_ORIG_TXT.ZIP | ES1500inq_MOD_TXT.ZIP | ES1500inq_POS.ZIP | ES1500inq_PSD.ZIP |
Español | XVII | ES1600inq_ORIG_TXT.ZIP | ES1600inq_MOD_TXT.ZIP | ES1600inq_POS.ZIP | ES1600inq_PSD.ZIP |
Español | XVIII | ES1700inq_ORIG_TXT.ZIP | ES1700inq_MOD_TXT.ZIP | ES1700inq_POS.ZIP | No hay datos |
Español | XIX | No hay datos | No hay datos | No hay datos | No hay datos |
Caballeros de hábito | |||||
---|---|---|---|---|---|
Lengua | Siglo | Texto original ISLRN: 375-405-009-147-2 | Texto normalizado ISLRN: 375-405-009-147-2 | Anotación POS ISLRN: 321-583-358-829-1 | Anotación sintáctica ISLRN: 662-489-499-707-7 |
Portugués | XVI | PT1500kni_ORIG_TXT.ZIP | PT1500kni_MOD_TXT.ZIP | PT1500kni_POS.ZIP | PT1500kni_PSD.ZIP |
Portugués | XVII | PT1600kni_ORIG_TXT.ZIP | PT1600kni_MOD_TXT.ZIP | PT1600kni_POS.ZIP | PT1600kni_PSD.ZIP |
Portugués | XVIII | PT1700kni_ORIG_TXT.ZIP | PT1700kni_MOD_TXT.ZIP | PT1700kni_POS.ZIP | No hay datos |
Portugués | XIX | PT1800kni_ORIG_TXT.ZIP | PT1800kni_MOD_TXT.ZIP | PT1800kni_POS.ZIP | PT1800kni_PSD.ZIP |
Lengua | Siglo | Texto original ISLRN: 305-406-112-712-3 | Texto normalizado ISLRN: 305-406-112-712-3 | Anotación POS ISLRN: 042-997-465-008-9 | Anotación sintáctica ISLRN: 306-113-341-591-4 |
Español | XVI | No hay datos | No hay datos | No hay datos | No hay datos |
Español | XVII | ES1600kni_ORIG_TXT.ZIP | ES1600kni_MOD_TXT.ZIP | ES1600kni_POS.ZIP | ES1600kni_PSD.ZIP |
Español | XVIII | ES1700kni_ORIG_TXT.ZIP | ES1700kni_MOD_TXT.ZIP | ES1700kni_POS.ZIP | No hay datos |
Español | XIX | No hay datos | No hay datos | No hay datos | No hay datos |
Universitarios | |||||
---|---|---|---|---|---|
Lengua | Siglo | Texto original ISLRN: 375-405-009-147-2 | Texto normalizado ISLRN: 375-405-009-147-2 | Anotación POS ISLRN: 321-583-358-829-1 | Anotación sintáctica ISLRN: 662-489-499-707-7 |
Portugués | XVI | PT1500uni_ORIG_TXT.ZIP | PT1500uni_MOD_TXT.ZIP | PT1500uni_POS.ZIP | PT1500uni_PSD.ZIP |
Portugués | XVII | PT1600uni_ORIG_TXT.ZIP | PT1600uni_MOD_TXT.ZIP | PT1600uni_POS.ZIP | No hay datos |
Portugués | XVIII | PT1700uni_ORIG_TXT.ZIP | PT1700uni_MOD_TXT.ZIP | PT1700uni_POS.ZIP | No hay datos |
Portugués | XIX | PT1800uni_ORIG_TXT.ZIP | PT1800uni_MOD_TXT.ZIP | PT1800uni_POS.ZIP | No hay datos |
Lengua | Siglo | Texto original ISLRN: 305-406-112-712-3 | Texto normalizado ISLRN: 305-406-112-712-3 | Anotación POS ISLRN: 042-997-465-008-9 | Anotación sintáctica ISLRN: 306-113-341-591-4 |
Español | XVI | ES1500uni_ORIG_TXT.ZIP | ES1500uni_MOD_TXT.ZIP | ES1500uni_POS.ZIP | ES1500uni_PSD.ZIP |
Español | XVII | ES1600uni_ORIG_TXT.ZIP | ES1600uni_MOD_TXT.ZIP | ES1600uni_POS.ZIP | ES1600uni_PSD.ZIP |
Español | XVIII | ES1700uni_ORIG_TXT.ZIP | ES1700uni_MOD_TXT.ZIP | ES1700uni_POS.ZIP | ES1700uni_PSD.ZIP |
Español | XIX | ES1800uni_ORIG_TXT.ZIP | ES1800uni_MOD_TXT.ZIP | ES1800uni_POS.ZIP | No hay datos |
(3) Además de los siete tipos de estatus social recogidos en esta tabla, en el corpus se registra un octavo tipo, esclavos, asignado a una única autora (Teresa de Jesus Faria), que cuenta con una única carta (PSCR0620).
Tabla 4: Corpus equilibrado (una carta por autor) distribuido por lengua, siglo y formato:
Table 5: Acceso a los documentos en versión XML-TEI P5:
La tabla siguiente ofrece el archivo digital de Post Scriptum en versión XML-TEIP5, validable mediante la personalización del esquema TEI del citado proyecto. Este esquema de validación se puede obtener automáticamente a partir del archivo ODD de Post Scriptum (haciendo uso de la herramienta Roma, por ejemplo) o se puede obtener directamente en formato Relax NG pinchando en Esquema TEI de Post Scriptum. Por defecto, el esquema debe guardarse en el mismo directorio que los archivos XML. Además del archivo digital, este esquema también permite validar las versiones XML-TEIP5 de la Base de Datos Biográficos (accesible en cdd.xml ) y de la Clasificación sociohistórica (accesible en kw.xml ).
Para una información detallada de las versiones TEIP5 de Post Scriptum, véase P.S. Post Scriptum: Archivo digital de escritura cotidiana. Personalización del esquema TEI y documentación
Lengua | Siglo | XML-TEI: P5. Corpus entero | XML-TEI: P5. Corpus equilibrado(4) |
---|---|---|---|
Portugués | XVI | PT1500_XML-TEI_P5.ZIP | PT1500bal_XML-TEI_P5.ZIP |
Portugués | XVII | PT1600_XML-TEI_P5.ZIP | PT1600bal_XML-TEI_P5.ZIP |
Portugués | XVIII | PT1700_XML-TEI_P5.ZIP | PT1700bal_XML-TEI_P5.ZIP |
Portugués | XIX | PT1800_XML-TEI_P5.ZIP | PT1800bal_XML-TEI_P5.ZIP |
Lengua | Siglo | XML-TEI: P5. Corpus entero | XML-TEI: P5. Corpus equilibrado |
Español | XVI | ES1500_XML-TEI_P5.ZIP | ES1500bal_XML-TEI_P5.ZIP |
Español | XVII | ES1600_XML-TEI_P5.ZIP | ES1600bal_XML-TEI_P5.ZIP |
Español | XVIII | ES1700_XML-TEI_P5.ZIP | ES1700bal_XML-TEI_P5.ZIP |
Español | XIX | ES1800_XML-TEI_P5.ZIP | ES1800bal_XML-TEI_P5.ZIP |
(4) El corpus equilibrado es un subcorpus creado a partir de la selección automática de una única carta por autor, que generalmente es la que presenta un mayor número de tipos de palabras diferentes en la edición normalizada (cf. apartado 1.3.1.3. en Manual de Edición y Anotación en TEITOK de los Materiales de P.S. Post Scriptum).
Las estadísticas sobre la versión normalizada de 478 cartas portuguesas, contrastada con la versión original, puede consultarse en la web de la herramienta DICER, de Alistair Baron, bajo el nombre Portuguese Post Scriptum by eDictor. Como su nombre indica, la estandarización manual se realizó con la herramienta eDictor.