# Il tipo di grafico utilizzato piu' di frequente nell'analisi dei dati e' indubbiamente il grafico di dispersione (scatterplot). Ogni volta che vuoi capire la natura della relazione tra due variabili la prima scelta ricade invariabilmente su questo tipo di grafico. # Esso puo' essere ottenuto utilizzando la funzione ggplot() del package (libreria) ggplot2 in R mediante l'utilizzo di geom_point(), una sottofunzione che si occupa di disegnare un punto dati due valori. In aggiunta una seconda funzione, geom_smooth() e' utile per disegnare una linea che prova a 'ricapitolare' localmente la dispersione dei punti. geom_smoot() e' basata, di default, su loess (che sta per LOcal regrESSion). Si puo' lavorare con questa funzione per ottenere un fitting ottimale dei punti impostando il sue parametro method='lm') che implica l'utilizzo di un modello lineare # NB: in R ... se non e' ancora stato installato il package ggplot2 scrivere: # install.packages("ggplot2") options(scipen=999) # turn-off scientific notation like 1e+48 # caricamento package (libreria funzioni) library(ggplot2) # impostazione tema (bw) theme_set(theme_bw()) # caricamento dati data("midwest", package = "ggplot2") # Grafico di dispersione (scatterplot) # per consultare manuale (in R): ?ggplot() # NB: in R le funzioni possono essere scritte su piu' righe ... si puo' dedicare una riga ad ogni parametro (piu' facile da leggere) # FASE I : costruzione dell'oggetto grafico # dati modello utilizzo gg <- ggplot(midwest, aes(x=area, y=poptotal)) + geom_point(aes(col=state, size=popdensity)) + # funzione per disegnare i punti geom_smooth(method="loess", se=F) + # linea che approssima localmente dispersione punti xlim(c(0, 0.1)) + # limiti asse x (forniti come intervallo, coppia di valori) ylim(c(0, 500000)) + # limiti asse y labs(subtitle="Area Vs Population", # sottotitolo del grafico y="Population", # titolo asse y x="Area", # titolo asse x title="Scatterplot", # titolo principale del grafico caption = "Source: midwest") # caption # FASE II: plot del grafico (visualizzazione) plot(gg)