Università degli Studi di Milano

Facoltà di Scienze M.F.N.

Corso di laurea specialistica in Genomica Funzionale e Bioinformatica a.a. 2008/09

Linguaggi di programmazione per la Bioinformatica

Docente: Giorgio Valentini

DSI, Dip. Scienze dell'Informazione,  Universita' degli Studi di Milano

e-mail: valentini@dsi.unimi.it


Il corso si propone di fornire conoscenze di base sui linguaggi di programmazione ad alto livello, e capacita' di utilizzare, modificare e sviluppare programmi in linguaggio R per applicazioni in ambito bioinformatico.

In particolare, alla fine del corso gli studenti dovrebbero acquisire:
  • Conoscenze di base sui linguaggi di programmazione ad alto livello
  • Capacità di sviluppare semplici programmi secondo il paradigma di programmazione imperativo ed object oriented
  • Capacità di modificare ed utilizzare librerie software per sviluppare applicazioni in ambito bioinformatico

Programma del corso:


0. Introduzione.
Linguaggi di programmazione a basso ed alto livello. Linguaggi interpretati e compilati. Linguaggi di programmazione per la bioinformatica.

1. Il linguaggio di programmazione R:
  • Identificatori e variabili; tipi di dati base; operatori, espressioni e istruzioni
  • Strutture dati fondamentali in R: vettori, fattori, matrici, array, liste, data frame ed environment
  • Strutture di controllo del flusso di esecuzione: istruzioni condizionali, iterazioni
  • Funzioni e script
  • Operazioni di I/O
  • L'ambiente grafico di R
  • Package ed "estensioni" del linguaggio R
  • Programmazione object oriented in R.
2. Analisi di dati bio-molecolari con R:
  • I package di Bioconductor
  • Pre-processing di dati di microarray
  • Analisi dell'espressione differenziale con dati di microarray
  • Clusterizzazione di dati di espressione genica
  • Tecniche di visualizzazione di dati biomolecolari complessi
  • Analisi delle delle relazioni tra dati di espressione e di interazione proteina-proteina
  • Integrazione di dati bio-molecolari eterogenei per la predizione  di classi funzionali di geni
  • Supporto alla diagnostica bio-molecolare ed analisi della sopravvivenza di pazienti  oncologici.

Bibliografia:
  • G.Valentini Il linguaggio di programmazione R: slide del corso
  • R. Gentleman, R Programming for Bioinformatics, CRC/Computer Science & Data Analysis Volume 12, Chapman & Hall, 2008.
  • R. Gentleman, V. Carey, W. Huber, R. Irizarry, S. Dudoit, Bioinformatics and Computational Biology Solutions Using R  and Bioconductor, Springer, 2005.

Periodo di svolgimento, orari e sede del corso:

Periodo: 2 marzo - maggio 2009
Aula informatica Via Celoria 20, Milano
Lunedi ore 10.30-13.30
Mercoledi ore 13.30-16.30


Slide del corso:

Un articolo di John Chambers, introduttivo alla programmazione object-oriented in S:
Classes and Methods in the S language

Script di esempio in R:




Link utili: