• Aucun résultat trouvé

1 Impostazione generale della ricerca

1.6 Teoria e pratica dei corpora per lo studio dei calchi sintattici

1.6.2.2 Estremi cronologici

Per quanto riguarda il criterio degli estremi cronologici, è possibile pronunciarsi solo per il CORIS e l’OVI. Quest’ultimo contiene testi precedenti al 1375, anno della morte di Boccaccio. Nel CORIS i testi si collocano tra gli anni Ottanta e il 2000; tuttavia per quest’ultimo, gli autori hanno previsto di affiancare al corpus principale un corpus di monitoraggio più piccolo di circa dieci milioni di parole. Il suo scopo è quello di sopperire all’inevitabile invecchiamento, soprattutto lessicale, del corpus. Quindi si può dire che il CORIS è una piattaforma mobile proiettata continuamente nel presente grazie a questo sistema di monitoraggio. Ulteriori informazioni sui subcorpora sono disponibili nella sezione seguente.

1.6.2.3 Varietà

1.6.2.3.1 L’Opera del Vocabolario Italiano

Per quanto riguarda le varietà dei testi dell'Opera del Vocabolario Italiano (OVI), si tratta di opere in versi e in prosa che includono i primi maestri della letteratura italiana, tra i quali troviamo Dante, Petrarca e Boccaccio. Il corpus contiene anche testi meno conosciuti di poeti, mercanti e storici medievali e spesso anche anonimi. Il database OVI è stato creato in supporto alla compilazione di un dizionario storico della lingua italiana, il Tesoro della Lingua Italiana delle Origini, parte del quale è oggi disponibile in rete38. Per quanto possa sorprendere, la scelta di corpora tipologicamente non omogenei per i raffronti diacronici come, ad esempio, Internet e il CORIS da un lato e l’OVI o la LIZ dall’altro, si inserisce

38 Ulteriori informazioni sono disponibili all’indirizzo internet: http://ovisun198.ovi.cnr.it/italnet/OVI/index.html

coerentemente nel quadro teorico già delineato. Non si mira qui tanto ad un confronto dei corpora tra loro, quanto alla verifica diacronica della presenza di alcuni tratti sintattici in corpora di italiano di epoche diverse. Dato che per l’italiano antico i corpora accessibili sono quelli dell’OVI e del LIZ, questi ultimi sono stati selezionati come corpora diacronici di verifica. Obiettivi diversi, ma uguale preoccupazione metodologica ha animato gli autori di Mutamenti sintattici nell’italiano contemporaneo (Rombi e Policarpi 1985:228) il cui corpus diacronico comprendeva pure maggiormente testi letterari.

1.6.2.3.2 Il CORIS

Per quanto riguarda, invece, la sua composizione, il CORIS si configura come un tentativo di avvicinamento alla varietà astratta che gli autori chiamano italiano attuale. Dato che in ambito teorico vi sono varie maniere di definire questa varietà di italiano, si è optato per testi che provenissero da fonti attendibili (giornali, riviste, ecc.) e allo stesso tempo ricorrenti nella comunicazione sociale. Tutti i testi scelti appartengono allo scritto. Per includere le diverse varietà di italiano e poterle poi rintracciare o combinare, il corpus è stato suddiviso in più parti, consentendo quindi una certa flessibilità nelle ricerche. Ciò permette di tenere conto delle ipotesi di ricerca dei vari studiosi senza venir meno alle esigenze di rappresentatività del corpus stesso. Sebbene nel corpus siano presenti anche testi molto specialistici (linguaggio burocratico), a detta degli autori, la loro singolarità sfuma nella massa dei dati. In altre parole, nel complesso, il corpus si configura più come un continuum che come un insieme di testi specialistici. Segue una sezione in cui vengono descritti i caratteri generali delle varietà, secondo la nomenclatura utilizzata dal CORIS e una tabella contenente tutte le abbreviazioni.

1.6.2.3.2.1 Stampa

Il materiale per questo corpus è stato tratto da documenti apparsi tra la fine degli anni Novanta e i primi del 2000 e, più precisamente, da quotidiani a tiratura nazionale, da periodici e riviste, oltre che da testi provenienti da alcuni supplementi.

1.6.2.3.2.2 Narrativa

I testi sono stati suddivisi in 3 varietà: romanzi, racconti e varie. Ognuna di queste varietà è corredata da una sezione parallela che contiene testi di narrativa tradotta in italiano. È anche possibile sapere se l’occorrenza riscontrata appartiene o meno a un testo tradotto: nei due esempi seguenti, gentilmente forniti da Corrado Seidenari del gruppo di ricerca del CORIS, si

osserverà che il primo proviene da un testo appartenente alla varietà NARRATIVA-romanzo non tradotta e il secondo, invece, da un testo della stessa varietà ma tradotto.

NARRATRoma: […] zioni formavano ormai una specie di ventaglio pizzicato […]

NARRATTrRo: […] uto, di veli color malva, del suo ventaglio di piume […]

Si noti inoltre che le frasi sono state troncate. Ciò è dovuto al fatto che il CORIS consente di visualizzare solo un certo numero di caratteri prima e dopo il termine ricercato.

1.6.2.3.2.3 Prosa accademica

Si tratta genericamente di materiale divulgativo e saggistico. Proviene sia da saggi che da articoli di riviste come Le Scienze o da supplementi come Tutto Scienze della Stampa.

1.6.2.3.2.4 Prosa giuridico-amministrativa

Materiale tratto da varie riviste, leggi, sentenze, codici, decreti.

1.6.2.3.2.5 Ephemera

I documenti di questa varietà provengono per lo più dalla rete, ma i testi sono accomunati dalla caratteristica di un breve ciclo di produzione e consumo. Sostanzialmente si tratta di lettere, opuscoli e istruzioni.

1.6.2.3.2.6 Miscellanea

Si tratta di materiale eterogeneo che non ha trovato una soddisfacente collocazione nelle altre varietà.

Tabella 2 - Abbreviazioni delle varietà del CORIS

Varietà Abbreviazione

stampa-quotidiani STAMPAQuot stampa-periodici STAMPAPeri stampa-supplementi STAMPASupp

narrativa-romanzi NARRATRoma narrativa-racconti NARRATRacc narrativa-varie NARRATVari narrativa-tradotta-romanzi NARRATTrRo narrativa-tradotta-racconti NARRATrRa narrativa-tradotta-varie NARRATTrVari prosa accademica-riviste PRACCRivis prosa accademica-volumi PRACCVolum prosa giur-amm-documenti PRGAMMDocu prosa giur-amm-riviste PRGAMMRivist prosa giur-amm-volumi PRGAMMVolu ephemera-lettere EPHEMLette ephemera-opuscoli EPHEMOpusc miscellanea-documenti MISCDocume miscellanea-riviste MISCRivist miscellanea-volumi MISCVolumi

1.6.2.3.3 Il web italiano

Il corpus web italiano si situa nella varietà dello scritto trasmesso (D'Achille 2003) in quanto gli articoli, nella maggior parte dei casi, sono scritti in rete per essere fruiti in questo stesso ambiente virtuale39. La lingua del web può essere considerata un continuum di varietà linguistiche (Bonomi 2002). Per una trattazione più esaustiva della lingua di Internet, cfr. § 1.5.2.2.