Carocci editore - L’analisi automatica dei testi

Password dimenticata?

Registrazione

TFA e formazione

Banner

crediti formativi

Banner

Promo del mese

Banner
Banner
L’analisi automatica dei testi

Sergio Bolasco

L’analisi automatica dei testi

Fare ricerca con il text mining. Prefazione di Tullio De Mauro

Edizione: 2013

Collana: Studi Superiori (922)

ISBN: 9788843070183

  • Pagine: 408
  • Prezzo:33,00 28,05
  • Acquista

In breve

Che cosa si nasconde in un testo? Quali conoscenze si ricavano esplorandolo? Nel web, dove i fenomeni sono misurabili più efficacemente che nei sondaggi e dove le lingue sono attualizzate meglio che in ogni loro rappresentazione teorica, la ricerca ha oggi la possibilità di estrarre conoscenze scavando nella marea di testi fruibili. Le logiche e gli strumenti del text mining sono una risposta: grazie all’informatica, si possono fare automaticamente analisi attraverso regole e risorse, rigorosamente da costruire per scoprire quel che cerchiamo. Il libro descrive criteri, metodi e casi di studio, ripercorrendo ricerche ed esperienze dell’analisi automatica dei testi.


Il volume è corredato di materiali on line periodicamente aggiornati.

Indice

Prefazione di Tullio De Mauro

Introduzione

Parte prima

Questioni di teoria e di metodo

1. Prospettive di analisi e concetti generali

Che cos’è l’analisi automatica dei testi in una logica di tipo metrico/Definizioni e concetti generali

2. Tipi di corpora

Corpora per analisi specifiche/Corpora come risorse di riferimento/Problematiche generali del trattamento automatico di un corpus

3. Unità di analisi, dati e meta-dati

Le unita di contesto/Obiettivi di studio e scelta delle unita lessicali/Le unita di testo/Il trattamento del testo/Criteri per individuare le unita lessicali su cui intervenire/Meta-dati sulle unita lessicali e sulle unita testuali/Integrazione fra dati non strutturati e dati codificati

4. Tipi, livelli e fasi dell’analisi automatica dei testi

In cosa consiste l’analisi di tipo lessicale/Selezione di keywords nel vocabolario del corpus/Meta-informazioni delle unita di testo/In cosa consiste l’analisi di tipo testuale/Criteri per valorizzare, selezionare e categorizzare le unità di contesto/Meta-informazioni delle unita di contesto/Riepilogo sulle annotazioni di tipo lessicale e testuale/Le matrici dei dati per l’analisi del contenuto

5. Estrazione di informazione e costruzione di modelli

Definizioni e criteri per il recupero ed estrazione di informazioni/Query di tipo lessicale/Query di tipo testuale/Il processo di trasformazione di informazioni non strutturate in dati strutturati/Ricerca di entità complesse/ Sui tipi di modelli e loro utilizzi/Modelli per la costruzione di risorse/ Modelli per la rappresentazione del senso

6. Elementi di statistica testuale e text mining

Regolarità dei dati linguistici e altre misure lessicometriche/Sul concetto di frequenza delle parole/Un indice diacronico sul ciclo di vita delle parole/Misure di associazione fra parole e di distanza o similarita fra testi/Alcune tecniche di posizionamento o mapping multidimensionale/Soluzioni per il text mining

Parte seconda

Risorse e strumenti

7. Risorse statistico-linguistiche

Corpus di riferimento/Risorse linguistiche/Risorse statistiche/Liste di frequenza di forme flesse/Impieghi dei lessici e delle liste di frequenza/Come misurare il sentiment di un testo

8. Esperienze d’uso delle risorse: esempi di linguistica dei

corpora

Quadro di riferimento in letteratura/Analisi di strutture a elementi variabili/Studio di una grammatica locale di locuzioni verbali/Tendenze diacroniche del linguaggio della stampa

9. Software: strumenti e logiche di studio

Software di Analisi Automatica dei Testi/Gli attrezzi fondamentali per l’analisi automatica dei testi/TaLTaC2: logica delle operazioni e fasi del trattamento/Strategie di analisi in TaLTaC2

Parte terza

Casi di studio e applicazioni

10. Uno studio sul linguaggio della critica enogastronomica

Obiettivi e materiali/Una prima impronta: l’abbondanza di qualificazione/Le tipologie di sostantivi/Il linguaggio peculiare/Le specificità del gustare e degustare/Le parole discriminanti/Dal lessicale al testuale attraverso differenti analisi del contenuto/Una estensione dalle parole ai concetti: fra tradizione e innovazione

11. Ricerca e misura di entità e concetti sull’uso del tempo in un vasto corpus di diari individuali

Introduzione/Lo studio preliminare di alcune entità/Misurare il concetto del “parlare con qualcuno”/Sulle attività contemporanee/L’individuazione dei luoghi delle attività quotidiane

12. Modelli di senso nell’analisi del contenuto

Un’analisi degli scambi epistolari di emigrati/Una rassegna stampa sugli sbarchi di immigrati /Un’analisi di interviste sulla percezione della banca

13. Analisi sul linguaggio politico

Il lessico programmatico di governo/Le parole di Berlusconi/Alcuni tratti del linguaggio dei leader politici della prima e seconda Repubblica

Riferimenti bibliografici

Allegati

Il download degli allegati è disponibile agli utenti registrati che hanno fatto il login.