Statistica – Economia La Sapienza – Esame 4 – Esercizio 3

Per un campione casuale di 40 appartamenti sono stati rilevati il prezzo (variabile Y, espressa in migliaia di euro) e la dimensione (variabile X, espressa in m2). Le informazioni raccolte sono di seguito sintetizzate: M(X)=94; M(Y)=475; Var(X)=410; Var(Y)=9350; Cov(X,Y)=1394.
Dopo aver stimato l’equazione della retta che esprime Y in funzione di X, stimare la varianza di popolazione \(\sigma^2\) e calcolare l’indice \(R^2\) di determinazione lineare. Infine, verificare la significatività del legame lineare tra le due variabili, al livello di significatività \(\alpha = 0,06\).

Soluzione

La stima dell’equazione della retta suddetta consiste nella determinazione dei coefficienti \(b_1\) e \(b_0\) della retta di regressione \(\hat{Y}=b_0+b_1X\):

\(b_1=\frac{COV(X,Y)}{VAR(X)}=\frac{1394}{410}=3.4\)
\(b_0=M(Y)-b_1M(X)=475-3.4\cdot 94=155.4\)

Per calcolare l’indice di determinazione e la stima della varianza della popolazione ti consiglio la lettura preliminare di questo articolo.
Calcoliamo l’indice di determinazione che, nel caso della regressione semplice, coincide con il coefficiente di correlazione al quadrato:

\(R^2=r^2=\frac{COV(X,Y)^2}{VAR(X)\cdot VAR(Y)}=\frac{1394^2}{410\cdot 9350}=0.5069\)

La stima della varianza della popolazione, si trova mediante la seguente formula:

\(s_e^2=\frac{DEV_{residua}}{n-2}\)

Calcoliamo la devianza residua sapendo dalla formula inversa del coefficiente di determinazione

\(\begin{array}{l}
R^2=\frac{DEV_{spiegata}}{DEV_{totale}}\\
R^2=\frac{DEV_{totale}-DEV_{residua}}{DEV_{totale}}\\
R^2=1-\frac{DEV_{residua}}{DEV_{totale}}\\
DEV_{residua}=(1-R^2)\cdot DEV_{totale}=(1-0.5069)\cdot 9350\cdot 40=184419.4 \end{array}\)

Quindi, la stima per la varianza della popolazione è

\(s_e^2=\frac{184419.4}{38}=4853.14\)

La significatività del legame tra X e Y si verifica mediante il seguente test di ipotesi sul coefficiente angolare della retta:
\(\begin{cases}H_0: \beta_1 = 0\\ H_1: \beta_1\neq 0\end{cases}\)

Calcoliamo dapprima la varianza del coefficiente \(b_1\):

\(s_{b_1}^2=\frac{s_e^2}{(n-1)VAR(X)}=\frac{4853.14}{39\cdot 410}=0.3035\)

Successivamente la statistica test:

\(T=\frac{b_1}{s_{b_1}}=\frac{3.4}{\sqrt{0.3035}}=6.1716\)

e infine il valore critico \(t_{0.03}(38) < 2.024\) che possiamo leggere dalle tavole della distribuzione t di Student

Dato che \(|T|= 6.1716 > t_{0.06}(38)\) rifiuto l’ipotesi nulla dicendo che il modello risulta significativo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *