Menu principal
Powered by <TEI:TOK>
Maarten Janssen, 2014-
No projeto P.S. (Post Scriptum) desenvolve-se pesquisa sistemática, edição e estudo histórico-linguístico de cartas privadas escritas durante a Idade Moderna em Portugal e em Espanha. Estes documentos são escritos epistolares quase todos eles inéditos, feitos por autores de diferentes proveniências sociais. Podiam ser amos ou criados, adultos ou crianças, homens ou mulheres, ladrões, soldados, artesãos, padres, militantes políticos e outros tipos de agentes sociais. Em grande parte, a sua epistolografia sobreviveu por razões excecionais, quando os seus percursos se cruzaram com os meios de perseguição da Inquisição e dos tribunais civis, eclesiásticos e militares, instituições que costumavam fazer uso da correspondência privada como prova de delitos. Em outros casos, já mais raros, as cartas foram preservadas em contexto não criminal, mas foram também trocadas numa interação de bastidores e são enquadráveis em termos situacionais. Estas fontes textuais apresentam frequentemente uma retórica (quase) oral, tematizando assuntos do quotidiano que até hoje não tem sido fácil estudar senão a partir de pequenos exemplos. O projeto P.S. não só reúne uma ampla coleção destas cartas privadas, como as apresenta em dois formatos pesquisáveis: o da edição crítica digital e o do corpus linguisticamente anotado.
Desenvolvem-se as abreviaturas, devidamente assinaladas, e normaliza-se a fronteira de palavra (exceto no caso das formas enclíticas), bem como a distribuição das letras «i», «j», «u» e «v». O desenvolvimento das abreviaturas, as conjeturas, as leituras difíceis, as rasuras e os acrescentos são visualizáveis por contraste de cor.
Modernizações para efeito de anotação do corpus: normaliza-se a grafia dos tokens e introduz-se pontuação própria do português contemporâneo. O léxico não-padrão também se normaliza graficamente e é depois ancorado às formas do português padrão correspondentes. As soluções das conjeturas são integradas no texto modernizado e os trechos omissos, independentemente da sua causa, marcam-se com reticências entre parênteses retos.
1) Descarregar o Manual em espanhol ou a sua tradução em inglês P.S. Post Scriptum Guidelines.
2) Descarregar o guia de trabalho em ambiente TEITOK: Manual de Edición y Anotación en TEITOK de los Materiales de P.S. Post Scriptum.
3) Descarregar a especificação ODD (One Document Does it all) do Post Scriptum: ODD do Post Scriptum.
4) Consultar a documentação completa das versões TEIP5 (em espanhol): P.S. Post Scriptum: Archivo digital de escritura cotidiana. Personalización del esquema TEI y documentación.
O corpus P.S. Post Scriptum recebe anotação tanto morfossintática como sintática. A anotação morfossintática adota o sistema de etiquetas Eagles para o espanhol com pequenas modificações (cf. Sistema de etiquetas P.S. Post Scriptum). A anotação sintática (que para já apenas cobre c. 25% de um corpus equilibrado, com uma carta por autor) usa o sistema originalmente criado para os Penn Parsed Corpora of Historical English e adaptado à anotação do português em colaboração com as equipas dos projetos Tycho Brahe, da Universidade de Campinas, e dos projetos CORDIAL-SIN e WOChWEL, do Centro de Linguística da Universidade de Lisboa.
Podem consultar-se algumas estatísticas sobre o estado atual do corpus na janela Distribuição de Palavras.