Calcolo indici di eterogeneità assoluta e relativa
Tra le tipologie di soggiorno scelte dagli italiani per trascorrere le proprie vacanze estive nel 2016 in Italia, al primo posto ci sono gli alberghi, scelti dal 26,7%, seguiti, nell’ordine, dalla casa di parenti o amici (22,4%), dalla casa di proprietà (13,5%), dai villaggi turistici (12,1%), dagli appartamenti in affitto (11,3%), dai residence (8,7%) e dai campeggi (5,3%). Misurare l’eterogeneità della distribuzione delle scelte.
Soluzione
Bisogna misurare l’eterogeneità assoluta e relativa a partire dalla seguente distribuzione di frequenza delle scelte:
Date \(k=7\) modalità della variabile soggiorno, l’eterogeneità assoluta si calcola mediante l’indice di Gini cosi definito:
\[\begin{eqnarray*}G &=& 1-\sum_{i=1}^kf_i^2=\\
&=& 1-(0.0713+0.0502+0.0182+0.0146+0.0128+0.0076+0.0028)=0.8225\end{eqnarray*}\]
Poichè si ha sempre:
\[0\leq G\leq\frac{k-1}{k}\ \Rightarrow\ 0\leq G\leq\frac{6}{7}=0.8571 \]
possiamo dire che i dati sono distribuiti in modo altamente eterogeneo sulle 7 scelte (cioè le scelte relative alle tipologie di soggiorno sono molto simili tra loro).
In alternativa a quanto appena fatto, si possono avere informazioni sul grado di maggiore o minore elevatezza dell’eterogeneità, se utilizziamo un indice relativo, ossia l’indice di Gini normalizzato:
\[G_N=\frac{G}{\frac{k-1}{k}}=\frac{0.8225}{0.8571}=0.9596\]
Tale indice, essendo compreso tra 0 e 1, ci conferma l’elevata eterogeneità tra i dati della distribuzione.