Tra
il 2004 ed il 2020 è diminuita in media del 34,19% nelle regioni italiane
considerate
L’Istat calcola la
mortalità infantile. La mortalità infantile è definita come il numero dei
decessi nel primo anno di vita per 1.000 nati vivi residenti. I dati fanno
riferimento al periodo tra il 2004 ed il 2020. La Valle d’Aosta è stata esclusa
dall’analisi per mancanza di una serie storica completa.
Ranking
delle regioni italiane per valore della mortalità infantile nelle regioni
italiane nel 2020. La Calabria è al primo posto per valore
della mortalità infantile nel 2020 con un ammontare di 3,9 unità, seguita dalla
Campania e dalla Sicilia con un valore pari a 3,3 unità. A metà classifica vi
sono il Molise e la Basilicata con un valore pari a 2,3 unità ed il Trentino
Alto Adige con un valore pari a 2,2 unità. Chiudono la classifica la Toscana
con un valore di 1,8 unità, l’Emilia Romagna con 1,7 unità, e la Sardegna con
un ammontare di 1,3 unità.
Ranking
delle regioni italiane per valore della variazione percentuale della mortalità
infantile tra il 2004 ed il 2020. Il Friuli Venezia
Giulia è al primo posto per valore della variazione percentuale della mortalità
infantile tra il 2004 ed il 2020 con un valore pari a +11,11% pari a 0,2 unità,
seguito dall’Umbria con un valore di -3,03% pari ad un ammontare di -0,1 unità,
e dalla Lombardia con un ammontare di -14,29% pari a un valore di -0,4 unità. A
metà classifica vi sono il Veneto con un valore pari -29,63% pari a -0,8 unità,
seguito dal Lazio con un valore pari a -31,58% pari ad un ammontare di -1,2
unità e dalla Sicilia con un valore di -32,65% pari ad un ammontare di -1,6
unità. Chiudono la classifica la Toscana con un valore pari a -51,35% pari ad
un ammontare di -1,9 unità, seguita dall’Emilia Romagna con un valore di
-52,78% pari a -1,9 unità e dalla Sardegna con un valore di -63,89% pari ad un
ammontare di -2,3 unità.
Macro-regioni
italiane. Considerando il 2020 come anno di riferimento
possiamo notare che il Mezzogiorno ed il Sud Italia sono al primo posto per
valore della mortalità infantile con un valore pari a 3,2 unità, seguiti dalle
Isole con un valore pari a 3, dal Nord-Ovest e dal Centro con un ammontare di
2,3 unità, dal Nord con un valore di 2,1 e dal Nord-Est con un valore di 1,9
unità. Considerando il periodo tra il 2004 ed il 2020 possiamo notare che le
macro-regioni nelle quali si è verificata una maggiore riduzione della
mortalità infantile sono: Nord-Est con un valore di -36,67%, Centro con
-36,11%, Isole con -34,78%. Infine seguono: Mezzogiorno con -33,33%, Isole con
-33,33%, Nord con -27,59% e Nord-Ovest con -14,81%.
Clusterizzazione
con algoritmo k-Means ottimizzato con il coefficiente di Silhouette.
Di seguito viene presentata una clusterizzazione con algoritmo k-Means ottimizzato
con il coefficiente di Silhouette. I dati mostrano la presenza di due clusters
ovvero:
- ·
Cluster
1:
Veneto, Piemonte, Toscana, Lombardia, Marche, Friuli Venezia Giulia, Sardegna,
Emilia Romagna, Liguria, Trentino Alto Adige, Umbria, Molise, Lazio;
- ·
Cluster
2:
Sicilia, Calabria, Campania, Basilicata, Abruzzo, Puglia.
Dal punto di vista dell’ordinamento dei clusters possiamo notare che il Cluster 2 domina il Cluster 1 ovvero C2>C1. Nel caso della mortalità infantile appare quindi assolutamente evidente l’esistenza di un divario tra il Sud Italia, che ha dei livelli di mortalità infantile elevati, ed il Centro-Nord Italia che ha un livello di mortalità infantile ridotto. Possiamo notare che le uniche regioni del Sud Italia a partecipare del cluster 1 ovvero del cluster con valori della mortalità infantile ridotti sono il Molise e la Sardegna. Ne deriva l’esistenza di un evidente diseguaglianza socio-sanitaria tra regioni del Centro-Nord Italia e regioni del Sud Italia.
Machine
Learning and Predictions. Di seguito presentiamo una analisi
di machine learning per la predizione del valore futuro del valore della
mortalità infantile nelle regioni italiane. Otto algoritmi sono stati
addestrati in base alla loro capacità di massimizzare il valore dell’R-Squared
e di minimizzare i seguenti errori statistici ovvero: Mean Absoluste Error, Mean
Squared Error, Root Mean Squared Error. Ciascun algoritmo è stato addestrato
con il 70% dei dati, mentre il restante 30% dei dati è utilizzato per la
predizione vera e propria. In seguito sono state costruite delle classifiche
degli algoritmi per ciascun indicatore. Il posizionamento dell’algoritmo in ogni
classifica è stato sommato in un payoff totale. L’algoritmo con minore payoff
totale è stato considerato con il più efficiente dal punto di vista metrico per
la predizione. E’ stato quindi ottenuto il seguente ordinamento degli algoritmi
ovvero:
- ·
Tree Ensemble Regression con un valore del
payoff pari a 4;
- ·
ANN-Artificial Neural Network con un
valore del payoff pari a 8;
- ·
PNN-Probabilistic Neural Network con un
valore del payoff pari a 13;
- ·
Random Forest Regression con un valore del
payoff pari a 15;
- ·
Gradient Boosted Trees Regression con un
valore del payoff pari a 20;
- ·
Simple Regression Tree con un valore del
payoff pari a 24;
- ·
Linear Regression con un valore del payoff
pari a 29;
- ·
Polynomial Regression con un valore del
payoff pari a 31.
Pertanto applicando l’algoritmo
maggiormente performante dal punto di vista della predizione ovvero il Tree
Ensemble Regression è possibile effettuare le seguenti predizioni relative all’andamento
della mortalità infantile ovvero:
- ·
Lombardia con una riduzione da un
ammontare di 2,4 unità fino ad un valore di 1,908 unità ovvero pari ad un
valore di -20,50%;
- ·
Friuli Venezia Giulia con una riduzione
dell’8,25% della mortalità infantile;
- ·
Lazio con una crescita dello 0,15% della
mortalità infantile;
- ·
Abruzzo con una crescita della mortalità
infantile pari a 4,43%;
- ·
Trentino Alto Adige con una crescita della
mortalità infantile pari a 3,55%:
- ·
Liguria con una crescita della mortalità
infantile pari al 4,00%.
In media il valore della
mortalità infantile è predetta in riduzione di un ammontare pari a -2,77%.
Conclusioni.
La
mortalità infantile è diminuita significativamente nelle regioni italiane tra
il 2004 ed il 2020. Tuttavia esistono significativi divari socio-sanitari di
carattere regionale coincidenti con le diseguaglianze reddituali ed economiche.
Da un lato vi sono infatti le regioni del Sud Italia con elevati livelli di
mortalità infantile e dall’altro lato vi sono le regioni del Centro-Nord Italia
con livelli assai ridotti di mortalità infantile. Tuttavia, anche all’interno
delle regioni meridionali vi sono delle differenze. Infatti, Molise e Sardegna
performano assai meglio delle altre regioni meridionali partecipando del
cluster delle regioni del Centro-Nord come dimostrato dall’analisi di
clusterizzazione con l’utilizzo dell’algoritmo k-Means.
Nessun commento:
Posta un commento