------------------------------------------------- Esercizi data frames: ------------------------------------------------- Es.1 : Costruire un data frame da.fr che abbia come componenti un vettore numerico casuale v di lunghezza 20, una matrice casuale m con 4 colonne ed una lista i cui componenti siano 3 matrici a piacere. v<-runif(20) m<-matrix(runif(80),ncol=4) li<-list( a=matrix(rnorm(80),ncol=4), b=matrix(runif(80),ncol=4), c=matrix(rnorm(80),ncol=4) ) da.fr<-data.frame(v,m,li) Es.2 : Costruire una lista che abbia come componenti 3 vettori a caratteri. Trasformare la lista in un data frame tramite la funzione as.data.frame. Quali sono le restrizioni che si devono applicare alle liste perche' siano dei data frame? li<-list(v1=rep("a",10), v2=rep("b",10), v3=rep("c",10)) da.fr<-as.data.frame(li) Es.3 : Selezionare dal data set iris le osservazioni relative alle specie 'virginica' con Petal.Length>5.890. data(iris) iris$Petal.Length>5.890 & iris$Species=="virginica" # e' un vettore logico iris[iris$Petal.Length>5.890 & iris$Species=="virginica",] Es.4 : Tramite la funzione summary ricavare informazioni statistiche di base sulla specie 'versicolor' del data set iris. summary(iris[iris$Species=="versicolor",]) Es.5 : Si dispone di un insieme di dati sperimentali (ad es: dati clinici e dati bio-molecolari) da utilizzare a fini diagnostici, relativi ad un insieme di pazienti. Si discuta se ed in quali condizioni i dati siano rappresentabili tramite data frame. Provate a rispondere. ------------------------------------------------- Esercizi Fattori: ------------------------------------------------- Es. 1: Costruisci un fattore di 25 elementi (stringhe), caratterizzato da 3 diversi livelli f<-factor(rep(c("basso","medio","alto"),c(10,10,5))) Es. 2: Costruisci un fattore ordinato di 15 elementi di livelli basso < medio < alto. Genera un corrispondente vettore di misurazioni di lunghezza 15 e calcola il valor medio e la deviazione standard (funzione sd) di ogni livello tramite la funzione tapply. f<-factor(rep(c("basso","medio","alto"),c(5,5,5)),levels=c("basso","medio","alto"),ordered=TRUE) x<-rnorm(15) tapply(x,f,summary) Es. 3: Quali strutture dati si potrebbero scegliere per modellare un data set caratterizzato da un insieme di pazienti sani e malati sottoposti a 5 diversi tipi di analisi cliniche? Provate a rispondere.