Il progresso dell’informatica si traduce in una continua e rapida diminuzione dei tempi di trattamento delle informazioni, in un aumento delle capacità di immagazzinamento dei dati su supporti magnetici, in una riduzione dei tempi di accesso alle informazioni desiderate e, ancora, in un accentuato sviluppo di software adeguato ad esigenze sempre più raffinate. La massa dei dati suscettibili di analisi è quindi molto grande e l’elaborazione deve fornire sintesi che consentano di individuare con chiarezza la struttura dei fenomeni e le relazioni sottostanti per fini di indagine, di decisione e di intervento. Da qui il ruolo cruciale che assume l’analisi dei dati come disciplina finalizzata allo studio di un grande numero di caratteri qualitativi e quantitativi. Questo manuale espone i principi e le tecniche della materia: corredato da molti esempi e applicazioni basate sul software largamente diffuso, è destinato a tutti coloro che, avendo a disposizione masse di dati fornite dagli elaboratori elettronici, hanno necessità di sintesi interpretative.
Il progresso dell’informatica si traduce in una continua e rapida diminuzione dei tempi di trattamento delle informazioni, in un aumento delle capacità di immagazzinamento dei dati su supporti magnetici, in una riduzione dei tempi di accesso alle informazioni desiderate e, ancora, in un accentuato sviluppo di software adeguato ad esigenze sempre più raffinate.
[…]
Premessa
1.Le matrici dei dati
1.1.Le matrici (n, k)
Caratteri qualitativi / Caratteri misti / Matrici di contingenza / Diversi tipi di matrici dei dati / L’analisi dei dati per le diverse matrici
1.2.Le trasformazioni delle matrici (n, k)
Le matrici delle percentuali / Le matrici degli scarti / Le matrici degli scarti standardizzati per colonna / Le matrici standardizzate / Le matrici ‘pro-capite’
1.3.Le matrici (k, k)
Le matrici delle devianze e codevianze / Le matrici di correlazione
1.4.Trasformazioni di variabili
Individuazione della trasformazione / Le variabili doppie
1.5.Ricodifica dei dati
Diverse possibilità di codifica
1.6.Matrici di dati rilevate a tempi successivi
Le matrici cubiche / Il coefficiente di
Escoufier / Una diverse interpretazione
2.Misure di diversità tra unità statistiche
2.1.Distanze
Distanza di Minkowski
2.2.Altri tipi di distanze
Distanze tra graduatorie / Distanze tra insiemi binari / Distanze medie di ordine t
2.3.Ultrametriche
2.4.Indici di diversità
Indici statistici basati sugli indici di diversità / Limitazioni nell’uso delle distanze e degli indici di diversità
2.5.Distanza di Mahalonobis
Distanza generalizzata tra due punti / Distanze in sistemi di riferimento non ortogonali
2.6.Indice di similarità e di dissimilarità
Indice di distanza / Variabili binarie / Variabili qualitative sconnesse
2.7.Dissimilarità tra gruppi di unità
Nucleo
3.Analisi dei gruppi
3.1.I principi dell’analisi dei gruppi
Premessa / L’analisi dei gruppi / Considerazioni sul concetto di gruppo / Definizione assiomatica di gruppo / Le tecniche di clumping / Numero di clusters / Individuazione delle variabili e mutabili statistiche / La standardizzazione dei dati / Problemi operativi / La scelta del metodo di clustering / Particolari finalità nell’analisi dei gruppi / Analisi dei gruppi e stratificazione / Classificazione degli algoritmi di clustering / Metodi gerarchici e non gerarchici
3.2.Algoritmi scissori
Partizione di un insieme / Metodo di Edwards e Cavalli-Sforza / Metodi di Friedman e Rubin / Applicazioni / Tecniche di segmentazione del mercato / Problemi computazionali
3.3.Algoritmi aggregativi
Premessa / Metodo delle unità più vicine o del legame singolo / Metodo centroide o del legame medio / Partizione ben strutturata / Applicazione I / Applicazione II
3.4.Altri metodi
Metodo di Kendall / Metodo delle aggregazioni dinamiche / Metodo delle nubi dinamiche / Metodo di Ward / Algoritmo di Mulvey e Crowder / Algoritmo di Gordon e Henderson / Il problema della ricerca di una partizione ottimale / Metodo delle aggregazioni a catena / Algoritmo di clustering HARRY
3.5.Confronto tra metodi di cluster
Applicazione
3.6.Software disponibile
4.Analisi lineari
4.1.Analisi delle componenti principali
Determinazione delle componenti principali con metodo analitico / Contribuzione relativa / Il cerchio delle correlazioni / Applicazione I / Applicazione II
4.2.Analisi delle corrispondenze
Metrica del X² / Relazione tra gli autovalori e autovettori / Contribuzioni assolute e relative / Rappresentazione grafica nell’analisi delle corrispondenze / Applicazione / Cenni sull’analisi delle corrispondenze multiple / La matrice di Burt
4.3.Correlazione canonica
Determinazione delle combinazioni lineari
4.4.Software disponibile
5.Altre tecniche di analisi dei dati
5.1.Graduazione multidimensionale (Multidimensional Scaling)
Descrizione di un algoritmo MDS / Indice di Shepard / Indice di Kruskal / Metodi MDS metrici e non metrici
5.2.Analisi della struttura latente
Il modello / Applicazione
Appendice. Le fasi dell’analisi dei dati
di Mary Fraire
1.Premessa
2.I dati grezzi o momento della raccolta dei dati
3.La codifica a priori dei dati grezzi
4.La codifica a posteriori
5.La scelta della tabella dei dati
6.La scelta della distanza (o similarità) tra unità
7.La scelta del metodo e del programma di a.d.d.
8.L’output di sintesi dei risultati
Bibliografia
Già professore ordinario di Teoria dell’inferenza statistica alla Sapienza-Università di Roma, ha tenuto per molti anni il corso Integrità e sicurezza dei dati.
Per fornire le migliori esperienze, utilizziamo tecnologie come i cookie per memorizzare e/o accedere alle informazioni del dispositivo. Il consenso a queste tecnologie ci permetterà di elaborare dati come il comportamento di navigazione o ID unici su questo sito. Non acconsentire o ritirare il consenso può influire negativamente su alcune caratteristiche e funzioni.
Funzionale
Sempre attivo
L'archiviazione tecnica o l'accesso sono strettamente necessari al fine legittimo di consentire l'uso di un servizio specifico esplicitamente richiesto dall'abbonato o dall'utente, o al solo scopo di effettuare la trasmissione di una comunicazione su una rete di comunicazione elettronica.
Preferenze
L'archiviazione tecnica o l'accesso sono necessari per lo scopo legittimo di memorizzare le preferenze che non sono richieste dall'abbonato o dall'utente.
Statistiche
L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici.L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici anonimi. Senza un mandato di comparizione, una conformità volontaria da parte del vostro Fornitore di Servizi Internet, o ulteriori registrazioni da parte di terzi, le informazioni memorizzate o recuperate per questo scopo da sole non possono di solito essere utilizzate per l'identificazione.
Marketing
L'archiviazione tecnica o l'accesso sono necessari per creare profili di utenti per inviare pubblicità, o per tracciare l'utente su un sito web o su diversi siti web per scopi di marketing simili.