Ludvic

 

 R&D Unit funded by

Pesquisa no corpus

Pesquisa CQL: construção da pesquisa | ver | opções

 

O sistema de pesquisas está dividido em dois grupos de informação distinta: a anotação linguística (Pesquisa no Texto) e a informação metalinguística (Pesquisa no Documento).

As pesquisas podem ser realizadas individualmente em qualquer um dos níveis de informação. Por exemplo, com uma pesquisa através do lexema kaza obtêm-se as diferentes formas lexicais kaza, kazinha, kazas, etc. Do mesmo modo, uma pesquisa por Variedade Linguística resultará numa lista com todas as entrevistas correspondentes à variedade linguística selecionada.  

O campo de pesquisa Palavra é sensível às letras maiúsculas e minúsculas. Para obter todos os resultados correspondentes a uma determinada forma lexical, sugere-se que as pesquisas neste nível sejam sempre realizadas com letra maiúscula e minúscula (ex: e). Nos campos Lexema, Lema versão EN e Lema versão PT, as formas lexicais pretendidas devem ser digitadas em letras minúsculas (com exceção dos nomes próprios).

Os vários níveis de pesquisa disponíveis podem ser combinados entre si, o que permite refinar os resultados pretendidos. A combinação do lexema kaza com a etiqueta POS V, por exemplo, restringe os resultados às formas verbais, excluindo os substantivos. Se a esta pesquisa se acrescentar a variável Nível de Instrução, os resultados serão todas as formas verbais correspondentes ao lexema kaza produzidas pelos falantes com o nível de instrução selecionado.

Cada campo de pesquisa referente à anotação linguística contém um pequeno ‘menu’ com as opções igual a, início da palavra, terminação e contém, cuja seleção determina os resultados obtidos. Esta funcionalidade é particularmente relevante no que diz respeito às ltag. Dado que uma forma lexical pode ter mais do que uma ltag (ex: a palavra bonh tem duas ltags: a-o, C-fin), sugere-se que as pesquisas neste nível se realizem com a opção contains selecionada, de forma a evitar a exclusão de algum resultado.

Pode consultar mais informações sobre as ltag aqui.

Para além das opções de pesquisa pré-definidas, pode fazer pesquisas através da caixa de texto CQL Query localizada no topo da página. A construção de queries CQL permite obter resultados mais finos, nomeadamente na especificação dos contextos de ocorrência. A query [lemma="el"] [pos="V.*"], por exemplo, devolverá como resultado todas as ocorrências do pronome pessoal el, em todas as suas variantes fonológicas, cada uma delas seguida de uma qualquer forma verbal.

A lista de atributos dos campos pesquisáveis pode ser consultada aqui. Pode consultar mais informações sobre a sintaxe CQL aqui.