Corso di Laurea in Scienza della Produzione e Trasformazione del Latte
Analisi Statistica dei Dati
Esercitazioni
Dati per le esercitazioni
Esercitazioni
- Variabili aleatorie
- Caricare in Excel il file cason.txt, contenente un campionamento di una variabile aleatoria.
- Calcolare la media campionaria di ogni campionamento.
- Provare a ipotizzare il tipo di variabile aleatoria analizzata.
Media campionaria (e teorema centrale della statistica)
- Caricare in Excel il file dado.txt, contenente una matrice 50×100 di campionamenti di una variabile aleatoria discreta uniforme nell'intervallo [1, 7]; ogni colonna rappresenta un campionamento di dimensione 50, e la matrice rappresenta così una collezione di 100 campionamenti.
- Calcolare la media campionaria di ogni campionamento.
- Si può verificare che i valori della media campionaria variano per ogni campionamento: la media campionaria può essere interpretata come una variabile aleatoria.
- Stilare l'istogramma della media campionaria: dovrebbe disporsi tendendo verso una gaussiana.
- Verificare che la media campionaria delle medie campionaria tende al valore atteso della variabile aleatoria.
Legge dei grandi numeri debole
- Caricare in Excel il file pi_greco.txt, contenente una matrice 500×2 di campionamenti di una variabile aleatoria continua uniforme nell'intervallo [-1, 1].
- Ogni colonna può essere interpretata come un elemento della coordinata di un punto nello spazio bidimensionale (X,Y). Ogni riga rappresenta perciò un punto all'interno di un quadrato di lato 2, centrato nell'origine, (0,0). Si può generare il grafico (scattered point) dei punti campionati, per rendersi qualitativamente conto che si tratta di un campionamento uniforme sul quadrato.
- Generare la variabile aleatoria Z, di tipo bernoulliano, che vale 1 se il punto campionato cade all'interno della circonferenza di raggio 1 centrata nell'origine, 0 altrimenti.
- La probabilità che si verifichi l'evento favorevole (punto interno alla circonferenza) è pari al rapporto tra le aree del cerchio e del quadrato: π/4.
- Poiché la variabile bernoulliana ha media μ pari alla probabilità dell'evento favorevole, la media campionaria della variabile aleatoria Z sarà un'approssimazione di μ = π/4: calcolare la media campionaria di Z.
- La legge dei grandi numeri debole ci dà un'idea di quanto possiamo essere fiduciosi nella bontà dell'approssimazione. Innanzittutto osserviamo che la varianza di Z è pari a π/4(1-π/4). Pertanto, poiché il teorema dice che se n>=σ2/(ε2δ), allora P(|m-μ|<ε)>= 1-δ, dove m è la media campionaria su n campioni, possiamo verificare se con n=500 possiamo ottenere una buona approssimazione (ε piccolo) con una buona probabilità (δ piccolo).
esempio di soluzione
Regressione
- Caricare in Excel il file regressione.xls, contenente i dati relativi ad un esame.
- La prima colonna riporta il numero di ore di studio, mentre la seconda colonna il voto conseguito.
- Calcolare la retta di regressione delle ore di studio rispetto al voto finale.
- Che considerazioni si possono trarre?