Bioinformatica A.A. 2012/2013

Corso di Laurea: BIOTECNOLOGIE DEL FARMACO (I anno)
Ricevimento studenti: concordare appuntamento via e-mail (stanza T313 III piano DSI, via Comelico 39 Milano).
Docente: Matteo Re
Email: re (at) di.unimi.it

Nel corso vengono fornite nozioni di base di programmazione e gli strumenti necessari per scrivere semplici script e programmi in linguaggio R, sfruttando le ampie librerie open source disponibili.
In particolare, alla fine del corso gli studenti dovrebbero acquisire:

  • Conoscenze di base sul linguaggio e l'ambiente di programmazione R.
  • Capacita' di scrivere semplici script e programmi in linguaggio R.
  • Capacita' di utilizzare package R per sviluppare applicazioni software.
  • Capacita' di realizzare (in R) esperimenti basati su analisi di reti farmacologiche.

Orario lezioni :
  • Giorno Data Mese Aula Orario Ore
    GIO 16 Maggio 310 09:30-13:30 4
    VEN 17 Maggio 310 09:30-13:30 4
    LUN 20 Maggio 307 13:30-17:30 4
    LUN 27 Maggio 307 10:30-12:30 , 13:30-17:30 6
    LUN 3 Giugno 307 10:30-12:30 , 13:30-17:30 6
    LUN 10 Giugno 307 13:30-17:30 4
    MAR 21 Maggio 307 10:30-12:30 , 13:30-17:30 6
    MAR 28 Maggio 307 13:30-17:30 4
    MER 29 Maggio 307 10:30-12:30 2

Eventuali variazioni a questi orari verranno discussi preventivamente con gli studenti e comunicati a tutti mediante una mailing list dedicata al corso.
IMPORTANTE: Durante il corso della prima lezione tutti gli studenti sono cortesemente pregati di inviare una email al docente contenente Nome, Cognome, Numero matricola e avente, come oggetto 'CORSO BIOINFORMATICA 2013 BDF'.

Programma del corso:

0 : Introduzione
Algoritmi e linguaggi di programmazione. Linguaggi di programmazione a basso ed alto livello. Linguaggi interpretati e compilati.

1 : Il linguaggio e l'ambiente di programmazione R

  • L'interfaccia grafica per l'utente di R
  • Identificatori e variabili; tipi di dati base; operatori, espressioni e istruzioni
  • Strutture dati fondamentali in R: vettori, fattori, matrici, array, liste, data frame ed environment
  • Strutture di controllo del flusso di esecuzione: blocchi, istruzioni condizionali, iterazioni
  • Funzioni e script
  • Operazioni di I/O
  • L'ambiente grafico di R

2 : Il liguaggio R per l'analisi di dati farmacologici e biomolecolari:
Tipologie di package disponibili in Bioconductor. Bioconductor package: Chemminer. Utilizzo da R del Chemistry Development Kit. Banche dati pubbliche (DrugBank e PubChem).

3. Apprendimento automatico:
Paradigmi di apprendimento. Metodi non supervisionati, supervisionati e semisupervisionati. Rappresentazione di molecole. Calcolo della similarita' tra strutture molecolari. Similarita' tra proteine: comparazione sequenze amminoacidiche.

4. Riposizionamento di famaci:
Banche dati dedicate all'annotazione funzionale dei farmaci. DrugBank. Categorie terapeutiche. Analisi di reti farmacologiche per la predizione della categoria farmaceutica. Predizione della categoria terapeutica mediante Random Walk su rete.

Materiale didattico:

In questa sezione verranno pubblicate le slide del corso. Le slide saranno rese disponibili di lezione in lezione.

Gruppi esame Bioinformatica:

Definizione dei gruppi per il progetto da realizzare per l'esame (programmazione R / drug repositioning) :

Data : 10/06/2013

File esercizi prorammazione : :


In questa sezione verranno pubblicati i file necessari per svolgere gli esercizi di programmazione. I file saranno resi disponibili di lezione in lezione.

  1. Drugbank 3: approved.sdf
  2. Drugbank 3: approved SMILES

Bibliografia: