PT | EN | ES

Menu principal


Powered by <TEI:TOK>
Maarten Janssen, 2014-

Downloads

Os investigadores que preferirem lidar com os nossos dados usando ferramentas próprias encontram no quadro abaixo os ficheiros de texto apropriados.

Tabela 1: Distribução do corpus por língua, século e formato:

Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática(1) ISLRN: 662-489-499-707-7
Português XVI PT1500_ORIG_TXT.ZIP PT1500_MOD_TXT.ZIP PT1500_POS.ZIP PT1500_PSD.ZIP
Português XVII PT1600_ORIG_TXT.ZIP PT1600_MOD_TXT.ZIP PT1600_POS.ZIP PT1600_PSD.ZIP
Português XVIII PT1700_ORIG_TXT.ZIP PT1700_MOD_TXT.ZIP PT1700_POS.ZIP PT1700_PSD.ZIP
Português XIX PT1800_ORIG_TXT.ZIP PT1800_MOD_TXT.ZIP PT1800_POS.ZIP PT1800_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS(2) ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500_ORIG_TXT.ZIP ES1500_MOD_TXT.ZIP ES1500_POS.ZIP ES1500_PSD.ZIP
Espanhol XVII ES1600_ORIG_TXT.ZIP ES1600_MOD_TXT.ZIP ES1600_POS.ZIP ES1600_PSD.ZIP
Espanhol XVIII ES1700_ORIG_TXT.ZIP ES1700_MOD_TXT.ZIP ES1700_POS.ZIP ES1700_PSD.ZIP
Espanhol XIX ES1800_ORIG_TXT.ZIP ES1800_MOD_TXT.ZIP ES1800_POS.ZIP ES1800_PSD.ZIP

(1) Os ficheiros PSD são pesquisáveis com a ferramenta CorpusSearch. Os ficheiros PSDX estão alojados no TEITOK e são pesquisáveis online.
(2) A anotação POS do corpus espanhol está ainda em processo de revisão.

Tabela 2: Distribução do corpus por sexo, língua, século e formato:

Masculino
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500m_ORIG_TXT.ZIP PT1500m_MOD_TXT.ZIP PT1500m_POS.ZIP PT1500m_PSD.ZIP
Português XVII PT1600m_ORIG_TXT.ZIP PT1600m_MOD_TXT.ZIP PT1600m_POS.ZIP PT1600m_PSD.ZIP
Português XVIII PT1700m_ORIG_TXT.ZIP PT1700m_MOD_TXT.ZIP PT1700m_POS.ZIP PT1700m_PSD.ZIP
Português XIX PT1800m_ORIG_TXT.ZIP PT1800m_MOD_TXT.ZIP PT1800m_POS.ZIP PT1800m_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500m_ORIG_TXT.ZIP ES1500m_MOD_TXT.ZIP ES1500m_POS.ZIP ES1500m_PSD.ZIP
Espanhol XVII ES1600m_ORIG_TXT.ZIP ES1600m_MOD_TXT.ZIP ES1600m_POS.ZIP ES1600m_PSD.ZIP
Espanhol XVIII ES1700m_ORIG_TXT.ZIP ES1700m_MOD_TXT.ZIP ES1700m_POS.ZIP ES1700m_PSD.ZIP
Espanhol XIX ES1800m_ORIG_TXT.ZIP ES1800m_MOD_TXT.ZIP ES1800m_POS.ZIP ES1800m_PSD.ZIP
Feminino
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500f_ORIG_TXT.ZIP PT1500f_MOD_TXT.ZIP PT1500f_POS.ZIP PT1500f_PSD.ZIP
Português XVII PT1600f_ORIG_TXT.ZIP PT1600f_MOD_TXT.ZIP PT1600f_POS.ZIP PT1600f_PSD.ZIP
Português XVIII PT1700f_ORIG_TXT.ZIP PT1700f_MOD_TXT.ZIP PT1700f_POS.ZIP PT1700f_PSD.ZIP
Português XIX PT1800f_ORIG_TXT.ZIP PT1800f_MOD_TXT.ZIP PT1800f_POS.ZIP PT1800f_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500f_ORIG_TXT.ZIP ES1500f_MOD_TXT.ZIP ES1500f_POS.ZIP ES1500f_PSD.ZIP
Espanhol XVII ES1600f_ORIG_TXT.ZIP ES1600f_MOD_TXT.ZIP ES1600f_POS.ZIP ES1600f_PSD.ZIP
Espanhol XVIII ES1700f_ORIG_TXT.ZIP ES1700f_MOD_TXT.ZIP ES1700f_POS.ZIP ES1700f_PSD.ZIP
Espanhol XIX ES1800f_ORIG_TXT.ZIP ES1800f_MOD_TXT.ZIP ES1800f_POS.ZIP ES1800f_PSD.ZIP

Tabela 3: Distribução do corpus por estatuto social3, língua, século e formato:

Nobreza
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500nob_ORIG_TXT.ZIP PT1500nob_MOD_TXT.ZIP PT1500nob_POS.ZIP PT1500nob_PSD.ZIP
Português XVII PT1600nob_ORIG_TXT.ZIP PT1600nob_MOD_TXT.ZIP PT1600nob_POS.ZIP PT1600nob_PSD.ZIP
Português XVIII PT1700nob_ORIG_TXT.ZIP PT1700nob_MOD_TXT.ZIP PT1700nob_POS.ZIP PT1700nob_PSD.ZIP
Português XIX PT1800nob_ORIG_TXT.ZIP PT1800nob_MOD_TXT.ZIP PT1800nob_POS.ZIP Não há dados
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500nob_ORIG_TXT.ZIP ES1500nob_MOD_TXT.ZIP ES1500nob_POS.ZIP ES1500nob_PSD.ZIP
Espanhol XVII ES1600nob_ORIG_TXT.ZIP ES1600nob_MOD_TXT.ZIP ES1600nob_POS.ZIP ES1600nob_PSD.ZIP
Espanhol XVIII ES1700nob_ORIG_TXT.ZIP ES1700nob_MOD_TXT.ZIP ES1700nob_POS.ZIP ES1700nob_PSD.ZIP
Espanhol XIX ES1800nob_ORIG_TXT.ZIP ES1800nob_MOD_TXT.ZIP ES1800nob_POS.ZIP ES1800nob_PSD.ZIP
Clero
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500ecc_ORIG_TXT.ZIP PT1500ecc_MOD_TXT.ZIP PT1500ecc_POS.ZIP PT1500ecc_PSD.ZIP
Português XVII PT1600ecc_ORIG_TXT.ZIP PT1600ecc_MOD_TXT.ZIP PT1600ecc_POS.ZIP PT1600ecc_PSD.ZIP
Português XVIII PT1700ecc_ORIG_TXT.ZIP PT1700ecc_MOD_TXT.ZIP PT1700ecc_POS.ZIP PT1700ecc_PSD.ZIP
Português XIX PT1800ecc_ORIG_TXT.ZIP PT1800ecc_MOD_TXT.ZIP PT1800ecc_POS.ZIP PT1800ecc_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500ecc_ORIG_TXT.ZIP ES1500ecc_MOD_TXT.ZIP ES1500ecc_POS.ZIP ES1500ecc_PSD.ZIP
Espanhol XVII ES1600ecc_ORIG_TXT.ZIP ES1600ecc_MOD_TXT.ZIP ES1600ecc_POS.ZIP ES1600ecc_PSD.ZIP
Espanhol XVIII ES1700ecc_ORIG_TXT.ZIP ES1700ecc_MOD_TXT.ZIP ES1700ecc_POS.ZIP ES1700ecc_PSD.ZIP
Espanhol XIX ES1800ecc_ORIG_TXT.ZIP ES1800ecc_MOD_TXT.ZIP ES1800ecc_POS.ZIP ES1800ecc_PSD.ZIP
Santo Ofício
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500inq_ORIG_TXT.ZIP PT1500inq_MOD_TXT.ZIP PT1500inq_POS.ZIP PT1500inq_PSD.ZIP
Português XVII PT1600inq_ORIG_TXT.ZIP PT1600inq_MOD_TXT.ZIP PT1600inq_POS.ZIP PT1600inq_PSD.ZIP
Português XVIII PT1700inq_ORIG_TXT.ZIP PT1700inq_MOD_TXT.ZIP PT1700inq_POS.ZIP PT1700inq_PSD.ZIP
Português XIX Não há dados Não há dados Não há dados Não há dados
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN:
Espanhol XVI ES1500inq_ORIG_TXT.ZIP ES1500inq_MOD_TXT.ZIP ES1500inq_POS.ZIP ES1500inq_PSD.ZIP
Espanhol XVII ES1600inq_ORIG_TXT.ZIP ES1600inq_MOD_TXT.ZIP ES1600inq_POS.ZIP ES1600inq_PSD.ZIP
Espanhol XVIII ES1700inq_ORIG_TXT.ZIP ES1700inq_MOD_TXT.ZIP ES1700inq_POS.ZIP Não há dados
Espanhol XIX Não há dados Não há dados Não há dados Não há dados
Militares
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500mil_ORIG_TXT.ZIP PT1500mil_MOD_TXT.ZIP PT1500mil_POS.ZIP PT1500mil_PSD.ZIP
Português XVII PT1600mil_ORIG_TXT.ZIP PT1600mil_MOD_TXT.ZIP PT1600mil_POS.ZIP PT1600mil_PSD.ZIP
Português XVIII PT1700mil_ORIG_TXT.ZIP PT1700mil_MOD_TXT.ZIP PT1700mil_POS.ZIP PT1700mil_PSD.ZIP
Português XIX PT1800mil_ORIG_TXT.ZIP PT1800mil_MOD_TXT.ZIP PT1800mil_POS.ZIP PT1800mil_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500mil_ORIG_TXT.ZIP ES1500mil_MOD_TXT.ZIP ES1500mil_POS.ZIP ES1500mil_PSD.ZIP
Espanhol XVII ES1600mil_ORIG_TXT.ZIP ES1600mil_MOD_TXT.ZIP ES1600mil_POS.ZIP Não há dados
Espanhol XVIII ES1700mil_ORIG_TXT.ZIP ES1700mil_MOD_TXT.ZIP ES1700mil_POS.ZIP ES1700mil_PSD.ZIP
Espanhol XIX ES1800mil_ORIG_TXT.ZIP ES1800mil_MOD_TXT.ZIP ES1800mil_POS.ZIP ES1800mil_PSD.ZIP
Cavaleiros de hábito
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500kni_ORIG_TXT.ZIP PT1500kni_MOD_TXT.ZIP PT1500kni_POS.ZIP PT1500kni_PSD.ZIP
Português XVII PT1600kni_ORIG_TXT.ZIP PT1600kni_MOD_TXT.ZIP PT1600kni_POS.ZIP PT1600kni_PSD.ZIP
Português XVIII PT1700kni_ORIG_TXT.ZIP PT1700kni_MOD_TXT.ZIP PT1700kni_POS.ZIP Não há dados
Português XIX PT1800kni_ORIG_TXT.ZIP PT1800kni_MOD_TXT.ZIP PT1800kni_POS.ZIP PT1800kni_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI Não há dados Não há dados Não há dados Não há dados
Espanhol XVII ES1600kni_ORIG_TXT.ZIP ES1600kni_MOD_TXT.ZIP ES1600kni_POS.ZIP ES1600kni_PSD.ZIP
Espanhol XVIII ES1700kni_ORIG_TXT.ZIP ES1700kni_MOD_TXT.ZIP ES1700kni_POS.ZIP Não há dados
Espanhol XIX Não há dados Não há dados Não há dados Não há dados
Universitários
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500uni_ORIG_TXT.ZIP PT1500uni_MOD_TXT.ZIP PT1500uni_POS.ZIP PT1500uni_PSD.ZIP
Português XVII PT1600uni_ORIG_TXT.ZIP PT1600uni_MOD_TXT.ZIP PT1600uni_POS.ZIP Não há dados
Português XVIII PT1700uni_ORIG_TXT.ZIP PT1700uni_MOD_TXT.ZIP PT1700uni_POS.ZIP Não há dados
Português XIX PT1800uni_ORIG_TXT.ZIP PT1800uni_MOD_TXT.ZIP PT1800uni_POS.ZIP Não há dados
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500uni_ORIG_TXT.ZIP ES1500uni_MOD_TXT.ZIP ES1500uni_POS.ZIP ES1500uni_PSD.ZIP
Espanhol XVII ES1600uni_ORIG_TXT.ZIP ES1600uni_MOD_TXT.ZIP ES1600uni_POS.ZIP ES1600uni_PSD.ZIP
Espanhol XVIII ES1700uni_ORIG_TXT.ZIP ES1700uni_MOD_TXT.ZIP ES1700uni_POS.ZIP ES1700uni_PSD.ZIP
Espanhol XIX ES1800uni_ORIG_TXT.ZIP ES1800uni_MOD_TXT.ZIP ES1800uni_POS.ZIP Não há dados
Estatuto ordinário
Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500ord_ORIG_TXT.ZIP PT1500ord_MOD_TXT.ZIP PT1500ord_POS.ZIP PT1500ord_PSD.ZIP
Português XVII PT1600ord_ORIG_TXT.ZIP PT1600ord_MOD_TXT.ZIP PT1600ord_POS.ZIP PT1600ord_PSD.ZIP
Português XVIII PT1700ord_ORIG_TXT.ZIP PT1700ord_MOD_TXT.ZIP PT1700ord_POS.ZIP PT1700ord_PSD.ZIP
Português XIX PT1800ord_ORIG_TXT.ZIP PT1800ord_MOD_TXT.ZIP PT1800ord_POS.ZIP PT1800ord_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500ord_ORIG_TXT.ZIP ES1500ord_MOD_TXT.ZIP ES1500ord_POS.ZIP ES1500ord_PSD.ZIP
Espanhol XVII ES1600ord_ORIG_TXT.ZIP ES1600ord_MOD_TXT.ZIP ES1600ord_POS.ZIP ES1600ord_PSD.ZIP
Espanhol XVIII ES1700ord_ORIG_TXT.ZIP ES1700ord_MOD_TXT.ZIP ES1700ord_POS.ZIP ES1700ord_PSD.ZIP
Espanhol XIX ES1800ord_ORIG_TXT.ZIP ES1800ord_MOD_TXT.ZIP ES1800ord_POS.ZIP ES1800ord_PSD.ZIP

(3) Para além dos sete tipos de estatuto social incluídos nesta tabela, ocorre no corpus um oitavo tipo, escravos, para o qual só há uma autora (Teresa de Jesus Faria), que conta com uma única carta (PSCR0620).

Tabela 4: Corpus equilibrado (uma carta por autor). distribuído por língua, século e formato:

Língua Século Texto original ISLRN: 375-405-009-147-2 Texto normalizado ISLRN: 375-405-009-147-2 Anotação POS ISLRN: 321-583-358-829-1 Anotação sintática ISLRN: 662-489-499-707-7
Português XVI PT1500bal_ORIG_TXT.ZIP PT1500bal_MOD_TXT.ZIP PT1500bal_POS.ZIP PT1500bal_PSD.ZIP
Português XVII PT1600bal_ORIG_TXT.ZIP PT1600bal_MOD_TXT.ZIP PT1600bal_POS.ZIP PT1600bal_PSD.ZIP
Português XVIII PT1700bal_ORIG_TXT.ZIP PT1700bal_MOD_TXT.ZIP PT1700bal_POS.ZIP PT1700bal_PSD.ZIP
Português XIX PT1800bal_ORIG_TXT.ZIP PT1800bal_MOD_TXT.ZIP PT1800bal_POS.ZIP PT1800bal_PSD.ZIP
Língua Século Texto original ISLRN: 305-406-112-712-3 Texto normalizado ISLRN: 305-406-112-712-3 Anotação POS ISLRN: 042-997-465-008-9 Anotação sintática ISLRN: 306-113-341-591-4
Espanhol XVI ES1500bal_ORIG_TXT.ZIP ES1500bal_MOD_TXT.ZIP ES1500bal_POS.ZIP ES1500bal_PSD.ZIP
Espanhol XVII ES1600bal_ORIG_TXT.ZIP ES1600bal_MOD_TXT.ZIP ES1600bal_POS.ZIP ES1600bal_PSD.ZIP
Espanhol XVIII ES1700bal_ORIG_TXT.ZIP ES1700bal_MOD_TXT.ZIP ES1700bal_POS.ZIP ES1700bal_PSD.ZIP
Espanhol XIX ES1800bal_ORIG_TXT.ZIP ES1800bal_MOD_TXT.ZIP ES1800bal_POS.ZIP ES1800bal_PSD.ZIP

Tabela 5: Acesso aos documentos em versão XML-TEI P5:

A tabela abaixo contém o arquivo digital do Post Scriptum na versão XML-TEIP5, a validar mediante recurso à versão personalizada do esquema TEI do mesmo projeto. Tal esquema de validação pode obter-se automaticamente a partir do ficheiro ODD do Post Scriptum (recorrendo à ferramenta Roma, por exemplo) ou então diretamente no formato Relax NG se se selecionar Esquema TEI do Post Scriptum. O esquema deve guardar-se na mesma pasta dos demais ficheiros XML. Para além do arquivo digital, este recurso também permite validar as versões XML-TEIP5 da Base de Datos Biográficos (acessível em cdd.xml ) e da classificação socio-histórica (acessível em kw.xml ).

Para uma informação detalhada das versões TEIP5 do Post Scriptum, consulte-se o documento em espanhol  P.S. Post Scriptum: Archivo digital de escritura cotidiana. Personalización del esquema TEI y documentación.

Língua Século XML-TEI: P5. Corpus integral XML-TEI: P5. Corpus equilibrado(4)
Português XVI PT1500_XML-TEI_P5.ZIP PT1500bal_XML-TEI_P5.ZIP
Português XVII PT1600_XML-TEI_P5.ZIP PT1600bal_XML-TEI_P5.ZIP
Português XVIII PT1700_XML-TEI_P5.ZIP PT1700bal_XML-TEI_P5.ZIP
Português XIX PT1800_XML-TEI_P5.ZIP PT1800bal_XML-TEI_P5.ZIP
Língua Século XML-TEI: P5. Corpus integral XML-TEI: P5. Corpus equilibrado
Espanhol XVI ES1500_XML-TEI_P5.ZIP ES1500bal_XML-TEI_P5.ZIP
Espanhol XVII ES1600_XML-TEI_P5.ZIP ES1600bal_XML-TEI_P5.ZIP
Espanhol XVIII ES1700_XML-TEI_P5.ZIP ES1700bal_XML-TEI_P5.ZIP
Espanhol XIX ES1800_XML-TEI_P5.ZIP ES1800bal_XML-TEI_P5.ZIP

(4) O corpus equilibrado é um subcorpus criado a partir da seleção automática de uma única carta por autor, que geralmente é a que possui um número maior de tipos diferentes de palavras na sua versão estandardizada (cf. secção 1.3.1.3. do Manual de Edición y Anotación en TEITOK de los Materiales de P.S. Post Scriptum).

 

VARIANTES GRÁFICAS

As estatísticas sobre a versão estandardizada de 478 cartas portuguesas, contrastada com a versão original, podem ser consultadas no site da ferramenta DICER, de Alistair Baron, sob o nome Portuguese Post Scriptum by eDictor. Como se vê pelo nome, a estandardização manual apoiou-se na ferramenta eDictor.