Esercizio: Analisi dei dati di espressione di pazienti ALL (Leucemia Linfoblastica Acuta). 1. Caricare il data set ALL del package omonimo ALL. 2. A quale classe appartiene l'oggetto ALL? 3. Quanti sono gli array raccolti nel data set ALL? Quanti sono i probeset per ogni campione? 4. Selezionare due sottogruppi di pazienti con fenotipo ALL1/AF4 ed E2A/PBX1 e memorizzarli nell'oggetto ALL.selected. 5. Quanti sono i pazienti aventi tale fenotipo? 6. Selezionare nei soli pazienti ALL.selected solo i geni aventi espressione media maggiore di 100. Quanti sono? 7. Utilizzare il t-test per selezionare i geni aventi espressione media maggiore di 100 e differenzialmente espressi nei due sottogruppi ALL1/AF4 e E2A/PBX1 a livello di significativita' 0.0002 (cioe' con p-value < 0.0002). Quanti sono i geni differenzialmente espressi? 8. Visualizzare i geni differenzialmente espressi nei pazienti ALL1/AF4 e E2A/PBX1 con una heatmap. 9. Preparare una tabella le cui righe corrsipondono ai geni differenzailmente espressi, la prima colonna all' identificatore Affymetrix dl probe set, la seconda al gene symbol name, la terza all'Entrez ID e la quarta al p-value ottenuto al punto 7. La tabella deve essere ordinata secondo la significativita' dei probe set selezionati. 10. Selezionare i geni differenzialmente espressi utilizzando il Wilcoxon rank sum test. Applicando il livello di significativita' utilizzato per il t-test al punto 7, quanti geni vengono selezionati? Scegliere un livello di significativita' che consenta di selezionare un numero di geni compreso fra 50 e 100.