Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Ricerca e analisi del testo ("text analysis")

Partager "Ricerca e analisi del testo ("text analysis")"

N/A

N/A

Protected

Année scolaire: 2021

Info

Protected

Academic year: 2021

Partager "Ricerca e analisi del testo ("text analysis")"

Copied!

4

0

0

4

0

0

Chargement.... (Voir le texte intégral maintenant)

Télécharger maintenant ( 4 Page )

Texte intégral

(1)

HAL Id: halshs-02476005

https://halshs.archives-ouvertes.fr/halshs-02476005

Submitted on 21 Feb 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Ricerca e analisi del testo (”text analysis”)

Caroline Muller

To cite this version:

Caroline Muller. Ricerca e analisi del testo (”text analysis”). La storia in digitale. Teorie e metodolo-

gie, 2019. �halshs-02476005�

(2)

Bussole 293 RICERCA E ANALISI DEL TESTO

(«TEXT ANALYSIS») Caroline Muller

L’analisi di grandi volumi di dati non è nuova: storici e storiche hanno approfittato, sin dalla fine degli anni Cinquanta, delle possibi- lità offerte dai computer. Dopo un periodo di crisi dovuto alle critiche metodologiche rivolte alle statistiche seriali, l’ingresso nell’era digitale ha rivitalizzato queste modalità d’analisi, ad esempio riguardo all’ana- lisi del testo (“text mining”). L’inserimento in rete di grandi volumi di testi (atti parlamentari, giornali, corrispondenza privata, politica o pontificia...) consente di porre in maniera differente alcune que- stioni storiche. La lettura «distante» (Moretti) aiuta a visualizzare i processi, le reti, a evidenziare le informazioni altrimenti invisibili senza il supporto dell’algoritmo. Il progetto Numapresse di Julien Schuh studia, a partire da un database di migliaia di giornali digita- lizzati, ad esempio, lo spazio che occupano i rimandi, gli echi e i ri- ferimenti nella stampa francese, costruendo così una storia della vi- ralità mediatica. La lettura remota e l’analisi dei testi contribuiscono alla nascita di nuovi approcci ai processi storici, rendendo possibile formulare ipotesi o rileggere, sfumare e completare quelli nati dalla lettura «ravvicinata» dei documenti.

Perché un tale lavoro sia possibile, è necessario tenere conto del

“trattamento” dei documenti, cioè del modo in cui passiamo dalla struttura iniziale dell’informazione (il giornale, le sue rubriche, poi il suo repertorio fotografico) e un formato di testo interrogabile da un robot. Per fare questo, i documenti devono essere “ocerizzati”

¹

, cioè trasformati in testo da un software di riconoscimento automatico.

Questo è uno dei grandi progetti legati alla ricerca testuale. Affinché il corpus testuale possa essere “scavato” o incrociato con altri, deve esse-

1

Il neologismo fa riferimento al trattamento attraverso un software di rico-

noscimento ottico dei caratteri (in inglese Optical Character Recognition, OCR)

[NdT].

(3)

Bussole 294

re stato oggetto di diversi procedimenti: l’“ocerizzazione” e la codifica, il tutto in una logica di interoperabilità, così da poter essere impiegato dalla maggior parte dei sistemi e strumenti. Anche il corpus testuale deve essere rintracciabile, il che implica lo sviluppo di adeguati stru- menti di ricerca. Fermo restando il rispetto di questi differenti vincoli, compete poi ai ricercatori cogliere queste opportunità, questione che mette alla luce le nuove esigenze nel campo della formazione. Progetti su larga scala come la Venice Time Machine (EPFL) prevedono la di- gitalizzazione, il trattamento di dati, la ricerca e la visualizzazione di migliaia di documenti testuali contenuti negli archivi di Venezia, che alla fine consentiranno la realizzazione di una «macchina per tornare indietro nel tempo».

L’analisi testuale non riguarda solamente i corpora digitalizzati, ma include anche nuove fonti testuali per scrivere la storia, come lo status sui social network, i tweet e gli archivi di pagine web. Questi documenti dischiudono molte piste di ricerca; si può menzionare lo studio di come i social network digitali influenzino le celebrazioni (Clavert 2018), la storia delle telecomunicazioni e di Internet (Scha- fer 2018), la storia della costruzione di comunità “virtuali” (Milligan 2017). L’ingresso nell’era dei big data corrisponde quindi all’inizio dell’era dell’utilizzo da parte degli storici delle fonti native digitali in- terrogabili per la ricerca testuale e la loro successiva visualizzazione.

Bibliografia

F. Clavert, Face au passé: la Grande Guerre sur Twitter, «Le Temps des médias» 31 (2018), 2, pp. 173-186, URL: < https://www.cairn.

info/revue-le-temps-des-medias-2018-2-page-173.htm > [consul- tato il 27 maggio 2019].

S. Graham, I. Milligan, S. Weingart, Exploring Big Historical Data:

The Historian’s Macroscope, London, World Scientific Publishing Company, 2015.

C. Lemercier, C. Zalc, Quantitative Methods in the Humanities: An Introduction, Charlottesville-London, University of Virginia Press, 2019.

I. Milligan, Welcome to the web: The online community of GeoCi- ties during the early years of the World Wide Web, «UWSpace»

(2017), URL: < http://hdl.handle.net/10012/11859 > [consultato il 28 maggio 2019].

F. Moretti, Distant Reading, London, Verso Books, 2013.

(4)

Bussole 295 V. Schafer, En construction: la fabrique française d’internet et du

web dans les années 1990, Bry-sur-Marne, INA, 2018.

Sitografia

Numapresse, URL : < https://numapresse.hypotheses.org/1 > [con-

sultato il 27 maggio 2019].

Références

Télécharger maintenant ( PDF - 4 Page - 1.12 MB )

Documents relatifs

Competenza e Ricerca

www.slidetube.it.. Gli operatori delle professioni sanitarie dell'area delle scienze infermieristiche e della professione sanitaria ostetrica svolgono con autonomia

Nasce a Roma il Centro di Eccellenzaper la Cultura e la Ricerca InfermieristicaNasce a Roma il Centro di Eccellenzaper la Cultura e la Ricerca Infermieristica

Per quanto riguarda invece la valorizza- zione professionale, la Direzione infermieristica ha cercato di implementare il coinvolgimento degli infermieri rispetto all’adozione

Sulla ricerca delle soluzioni intere di un tipo notevole di equazioni diofantee

~IOBGANTINI, Sulla risotuzione dett’ equazione diofantea (Annali Triestini (IV), Vol.. 2) una congruenza di parabole razionali (che in casi particolari si riducono

Costruire e gestire ambienti di apprendimento che integrino strumenti tecnologici: analisi di un caso di studio

Con questo lavoro si voleva analizzare come un corso del tipo proposto potesse essere utile per l’insegnante nella progettazione e nella gestione dell’attività

Modificabilita degli atteggiamenti e ruolo del laboratorio in questo processo: Primi dati di una ricerca-azione

-Una proposta coerente. Come si diceva sopra, una delle cause piu credibili dell'inadeguatezza di tutte le scuole di formazione degli insegnanti in occidente 2 la

Il possessivo e gli avverbi di luogo nel fumetto italiano: dal progetto di ricerca all'uso pedagogico

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

La sentiment analysis come strumento di studio del parlato emozionale?

Abbiamo utilizzato il corpus LibriSpeech, da cui abbiamo estratto valori di sentiment analysis a livello di frase e di parola, nonché vari indici acustici e spettrali

Dati Digitali e Metodologia della Ricerca Archeologica

Manacorda possiamo comprendere, anche se indirettamente, come la progressiva introduzione di metodologie informatiche nella registrazione del

Documents relatifs

Le relazioni diplomatiche tra la Repubblica di Venezia e la Santa Sede negli anni del papato di Paolo IV. Prospettive di ricerca

Le relazioni diplomatiche tra la Repubblica di Venezia e la Santa Sede negli anni del papato di Paolo IV. Prospettive di ricerca

29

0

0

- مساهمة لجان التدقيق في ضبط التقارير المالية لشركات المساهمة - دراسة ميدانية

- مساهمة لجان التدقيق في ضبط التقارير المالية لشركات المساهمة - دراسة ميدانية

260

0

0

Linear Functions and Formulas

Linear Functions and Formulas

4

0

0

Proceedings of the Joint NSC-NRC Workshop on Construction Technologies, April 26-27, 2004, Taipei, Taiwan

Proceedings of the Joint NSC-NRC Workshop on Construction Technologies, April 26-27, 2004, Taipei, Taiwan

218

0

0

Vacuolar transporters and their essential role in plant metabolism

Vacuolar transporters and their essential role in plant metabolism

20

0

0

Appendice. Il disegno della ricerca e le modalità di lavoro

Appendice. Il disegno della ricerca e le modalità di lavoro

8

0

0

Contestualizzare l'azione pubblica: ricerca del consenso e varietà di strumenti nelle politiche locali per i rom e i sinti

Contestualizzare l'azione pubblica: ricerca del consenso e varietà di strumenti nelle politiche locali per i rom e i sinti

34

0

0

« Effets de réel » et artifices dans Les illustres Françaises de Robert Challe : à la recherche d'un langage commun aux arts

« Effets de réel » et artifices dans <i>Les illustres Françaises</i> de Robert Challe : à la recherche d'un langage commun aux arts

114

0

0