Statistica – Economia Unito – Esame 1 – Esercizio 1

In questo articolo spiegheremo come superare un esame di statistica tipo assegnato in un corso di laurea di Economia.

Esercizio 1 (Parametri e istogramma da una distribuzione di frequenza)
Rappresentare l’istogramma e la funzione di ripartizione della variabile \(X_i\) seguente e con riferimento ai dati della variabile raccolti in classi calcolare
a) Media.
b) Scarto quadratico medio.
c) Varianza.
d) Primo quartile.
e) Mediana.
f) Terzo quartile.

Soluzione

Per prima cosa notiamo che le \(f_i\) sono le frequenze relative ovvero la proporzione di dati presenti in ciascuna classe. L’istogramma non è altro che un grafico formato da rettangoli tutti uniti tra di loro le cui basi sono le ampiezze delle classi e le altezze sono le frequenze relative. L’immagine seguente rappresenta quanto appena detto:

La funzione di ripartizione \(F(x)\), anche detta funzione di distribuzione cumulativa, si trova calcolando le frequenze cumulate \(f_i^c\) mediante la seguente formula:

\[f_i^c=\sum_{j=1}^i f_j\]
Si capisce che la prima frequenza cumulata \(f_1^c\) coincide con la prima frequenza relativa \(f_1\), mentre ad esempio la terza frequenza cumulata risulta \(f_3^c=f_1+f_2+f_3=0.23+0.17+0.24=0.64\)

Aggiungiamo quindi la colonna delle frequenze cumulate alla tabella data:

Si ha:

\[F(x)=\begin{cases}
0 && \mbox{se } x < 0\\
0.23 && \mbox{se } 0\leq x < 35\\
0.4 && \mbox{se } 35\leq x < 55\\
0.64 && \mbox{se } 55\leq x < 75\\
1 && \mbox{se } x \geq 75\end{cases}\]

Il suo grafico è chiaramente una funzione a gradini:

Calcoliamo le ampiezze \(A_i\), i valori centrali \(m_i\) , i valori centrali al quadrato \(m_i^2\) e le frequenze cumulate percentuali \(f_i^c \%\) per ciascuna classe.
Indicando con \((x_i,x_{i+1})\) e \(f_i\) rispettivamente gli estremi e la frequenza relativa della classe i-esima, si ha:

\[A_i=x_{i+1}-x_i\]
Per esempio, l’ampiezza della prima classe è \(A_1=35-0=35\).

\[m_i=\frac{x_i+x_{i+1}}{2}\]
Per esempio, il valore centrale della seconda classe è \(m_2=\frac{35+35}{2}=45\).

Le frequenze cumulate percentuali, invece, si calcolano moltiplicando le frequenze cumulate per \(100\%\):
\[f_i^c\ \%=f_i^c*100\%\]

La tabella che otteniamo facendo tutti i calcoli è la seguente:

a) Indicando con \(\mu\) la media dei dati raggruppati nelle \(k=4\) classi, si ha:

\[\begin{eqnarray*}
\mu &=& \sum_{i=1}^k m_i*f_i=m_1*f_1+m_2*f_2+m_3*f_3+m_4*f_4=\\
&=& 17.5*0.23+45*0.17+65*0.24+90*0.36=13.525\end{eqnarray*}\]

Osserviamo che non abbiamo usato l’usuale formula del valor medio. Questo è dovuto al fatto che l’esercizio ci dà le frequenze relative piuttosto che le frequenze assolute.

b)\[\begin{eqnarray*}
\sigma &=&\sqrt{\sum_{i=1}^k (m_i^2*f_i)-\mu^2}=\\
&=& \sqrt{m_1^2*f_1+m_2^2*f_2+m_3^2*f_3+m_4^2*f_4-\mu^2}=\\
&=& \sqrt{17.5^2*0.23+45^2*0.17+65^2*0.24+90^2*0.36-13.525^2}=64.51\end{eqnarray*}\]

c)\[\sigma^2=(\sigma)^2=64.51^2=4161.54\]

d)Il primo quartile è quel valore di X che lascia alla sua sinistra il 25% della distribuzione dei dati. Per calcolarlo, innanzitutto bisogna trovare la classe in cui si trova: è quella presente nella riga della tabella precedente in cui compare la prima \(f_i^c\%\) maggiore di 25, ossia la seconda.
Indicando genericamente con \(j\) tale classe, possiamo calcolare il primo quartile mediante la formula:

\[Q_1=x_{j}+A_j*\frac{0.25-f_{j-1}^c}{f_j^c-f_{j-1}^c}=\]

Nel nostro caso specifico, sostituendo \(j=2\) nella formula precedente otteniamo:

\[Q_1=x_{2}+A_2*\frac{0.25-f_{1}^c}{f_2^c-f_{1}^c}=35+20*\frac{0.25-0.23}{0.4-0.23}=37.2529\]

e)La mediana o secondo quartile (\(Q_2)\), invece, è il valore centrale della distribuzione, ossia quel valore di \(X\) che lascia alla sua sinistra il 50% della distribuzione dei dati. Analogamente a quanto fatto per \(Q_1\), troviamo la classe mediana: la prima \(f_i^c\%\) che supera il 50% è \(f_3^c\%=64%\), quindi la classe mediana è la terza. La formula per il calcolo del valore mediano, si ottiene da quella usata per calcolare \(Q_1\) sostituendo al posto di 0.25 il valore 0.5:

\[Me=Q_2=x_{j}+A_j*\frac{0.5-f_{j-1}^c}{f_j^c-f_{j-1}^c}\]

Sostituendo \(j=3\) nella formula precedente otteniamo:

\[Me=Q_2=x_{3}+A_3*\frac{0.25-f_{2}^c}{f_3^c-f_{2}^c}=55+20*\frac{0.5-0.4}{0.64-0.4}=63.3333\]

f) Analogamente a quanto fatto per il 1° e il 2° quartile, la classe in cui si trova \(Q_3\) è la quarta poichè in corrispondenza della prima frequenza cumulata percentuale maggiore del 75% e il valore di \(Q_3\) è:

\[Q_3=x_{4}+A_4*\frac{0.75-f_{3}^c}{f_4^c-f_{3}^c}=75+30*\frac{0.75-0.64}{1-0.64}=84.1667\]

A cura di Samuel Leanza

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.