Tra
il 2005 ed il 2019 sono aumentati del 28,77%
L’Istat-BES calcola il
valore della percentuale di persone che hanno completato almeno la scuola
secondaria superiore sul totale delle persone che hanno tra i 25 ed i 64 anni.
Ranking delle regioni
italiane per numero di persone con almeno il diploma.
L’Umbria è al primo posto per valore delle persone con almeno il diploma con un
valore pari a 71,3, seguita dal Lazio con un valore pari a 70,3 unità e dal Friuli-Venezia
Giulia con un ammontare pari a 70,1 unità. A metà classifica vi sono le Marche
con un valore pari a 65,3, la Toscana con un valore pari a 64,8 unità ed il Veneto
con un valore pari a 64,7 unità. Chiudono la classifica la Campania con un
valore pari a 52,9 unità, seguita dalla Sicilia con un valore pari a 51,8 unità
e dalla Puglia con un valore pari a 51,3 unità.
Ranking delle regioni
italiane per numero di persone con almeno il diploma tra il 2005 ed il 2019.
La Sardegna è al primo posto per variazione percentuale delle persone con
almeno il diploma tra il 2005 ed il 2020 con un valore pari a 37,91% ovvero
pari ad un ammontare di 14,9 unità, seguita dal Veneto con un valore pari a
37,08% pari ad un ammontare di 17,5 unità, e dalla Valle d’Aosta con un valore
pari a 36,04% pari ad un ammontare di 16,4 unità. A metà classifica vi sono il
Piemonte con un ammontare pari a 30,93% ed un valore pari a 15 unità, seguito
dalla Puglia con un valore pari a 28,25% pari ad un ammontare di 11,3, e dal
Molise con un valore pari a 26,98% pari ad un ammontare di 13,3 unità. Chiudono
la classifica la Liguria con un valore pari a 21,52% pari ad un ammontare di
12,2 unità, il Lazio con un valore pari a 18,55% pari ad un ammontare di 11
unità e la Calabria con una variazione pari ad un ammontare di 17,38% pari ad
un ammontare di 8,1 unità. Complessivamente il valore in media delle persone
con il diploma è cresciuto di un ammontare pari a 28,77% pari ad un ammontare
di 14 unità.
Macro-Regioni Italiane.
Il numero di diplomati nel Nord Italia è cresciuto nel periodo tra il 2004 ed
il 2019 da un ammontare di 50,50 unità fino ad un valore di 65,70 unità ovvero
una variazione pari ad un ammontare di 15,20 unità pari ad un ammontare di
30,10%. Nel Centro Italia il valore del numero dei diplomati è cresciuto da un
ammontare di 54,90 unità fino ad un valore di 68,10 unità ovvero pari ad una
variazione di 13,20 unità pari ad un ammontare di 24,04%. Il numero di diplomati
nel Mezzogiorno è cresciuto da un ammontare di 42,70 unità fino ad un valore di
54,00 unità ovvero pari ad una variazione di 11,30 unità pari ad un valore di
26,46%. Complessivamente il valore dei diplomati nelle macro-regioni italiane
tra il 2004 ed il 2019 è cresciuto da un ammontare di 48,70 unità fino ad un
valore di 62,20 unità ovvero pari ad una variazione di 13,50 unità pari al 27,72%.
Clusterizzazione con
algoritmo k-Means ottimizzato con il coefficiente di Silhouette.
Di seguito viene presentato un modello di clusterizzazione attraverso l’utilizzo
dell’algoritmo k-Means ottimizzato con il coefficiente di Silhouette. L’analisi
mette in risalto l’esistenza di due diversi clusters ovvero:
- ·
Cluster 1: Emilia-Romagna, Friuli-Venezia
Giulia, Marche, Abruzzo, Lombardia, Trentino-Alto Adige, Liguria, Umbria, Lazio,
Veneto, Piemonte, Toscana, Molise, Basilicata;
- ·
Cluster 2: Sicilia, Sardegna, Campania,
Puglia, Calabria, Valle d’Aosta.
Dal punto di vista della
mediana dei clusters è possibile osservare che il valore mediano del cluster
1-C1 è pari ad un ammontare di 66,5 unità mentre il valore mediano del cluster
2-C2 è pari a 53,55 unità. Ne deriva il seguente ordinamento dei clusters
ovvero C1=66,5>C2=53,55. Dal punto di vista geografico vi è quindi una distinzione
tra Centro-Nord Italia con valori elevati del numero dei diplomati e Sud Italia
con valori ridotti. Tuttavia, non tutte le regioni del Sud Italia fanno parte
del secondo clusters, ve ne sono anche talune che sono ricomprese nel primo
cluster come per esempio Molise, Basilicata ed Abruzzo. Inoltre, il Cluster 2-C2
non è solo comprensivo delle regioni meridionali ed infatti comprende anche la
Valle d’Aosta. È comunque possibile rinvenire una sostanziale contrapposizione
tra Centro-Nord e Sud Italia che offre un’ulteriore specificazione, questa
volta di tipo scolastico, alla tradizionale determinazione economico-finanziaria
del divario italiano.
Network analysis con l’utilizzo
della distanza di Manhattan. Di seguito viene utilizzato il
metodo della distanza di Manhattan per verificare la presenza di strutture a
network nella struttura dei dati relativi alla presenza di diplomati nelle
regioni italiane. L’analisi mostra la presenza di una struttura a rete
complessa e di 4 strutture semplificate. La struttura complessa è complessa è
composta da Sicilia, Puglia e Sardegna. In modo particolare esistono le seguenti
relazioni ovvero:
- ·
La Sicilia ha una connessione con la
Puglia pari ad un valore di 0,6, ed un link con la Sardegna pari ad un valore
di 0,44 unità;
- ·
La Sardegna ha una relazione con la Puglia
per un valore pari a 0,47 e con la Sicilia per un valore pari a 0,44;
- ·
La Puglia ha una relazione con la Sicilia per
un valore pari a 0,6 e con la Sardegna con un valore pari a 0,47.
Inoltre, sono presenti le
seguenti strutture semplificate ovvero:
- ·
La Basilicata ed il Molise sono connessi
con un valore del link pari ad un ammontare di 0,5 unità;
- ·
Emilia-Romagna e Friuli-Venezia Giulia
sono connessi con un valore del link pari a 0,42 unità;
- ·
Veneto e Piemonte sono connessi con un link
avente valore pari a 0,55 unità;
- ·
Marche e Lombardia sono connesse con un
link avente un valore pari a 0,25 unità.
La struttura a network
complessa se paragonata alla clusterizzazione sembra confermare la presenza di
una relazione tra alcune regioni meridionali ovvero Sardegna, Puglia e Sicilia,
mentre dall’altro lato le relazioni tra le regioni del cluster 1 sono
sfilacciate e mancano di presentare elementi di complessità.
Machine Learning and predictions. Di seguito viene ad essere realizzato
un modello di machine learning per la predizione del valore futuro dei diplomati
nelle regioni italiane. Vengono considerati 10 algoritmi analizzati sulla base
della capacità di minimizzare gli errori statistici MSE, RMSE, MAE e di
massimizzare R2. Gli algoritmi sono stati addestrati attraverso l’utilizzo dell’80%
dei dati mediante l’utilizzo della cross validation. In base a tale
classificazione viene quindi presentata la seguente classifica degli algoritmi
ovvero:
- ·
SGD con un valore del payoff pari a 4;
- ·
kNN con un valore del payoff pari a 10;
- ·
Random Forest con un valore del payoff pari
a 11;
- ·
Gradient Boosting con un valore del payoff
pari a 15;
- ·
Linear Regression con un valore del payoff
pari a pari a 21;
- ·
AdaBoost con un valore del payoff pari a 23;
- ·
Tree con un valore del payoff pari a 28;
- ·
SVM con un valore del payoff pari a 32;
- ·
Costant con un valore del payoff pari a
36;
- ·
Neural Network con un valore del payoff
pari a 40.
Attraverso l’utilizzo dell’algoritmo
maggiormente performante ovvero SGD è quindi possibile verificare le regioni
che sono winners and losers in termini di crescita o riduzione del numero dei
diplomati. L’algoritmo SGD predice le seguenti regioni winners-ovvero regioni
che hanno un valore del numero dei diplomati predetto in crescita:
- ·
Calabria con una crescita da 54,7 unità
fino ad un valore di 56,92 unità ovvero pari ad un valore di 2,22 unità pari ad un valore di
4,06%;
- ·
Campania con una variazione da 52,9 unità
fino ad un valore di 54,57 unità ovvero pari ad un valore di 1,67 unità pari ad
un valore di 3,16%;
- ·
Lazio con una variazione da un ammontare
di 70,3 unità fino ad un valore di 72,37 unità ovvero una crescita di 2,07
unità pari ad un ammontare di 2,94%;
Inoltre di seguito
vengono ad essere indicate le variazioni diminutive più significative, ovvero
quelle regioni losers, ossia regioni per le quali l’algoritmo SGD predice una
variazione diminutiva rilevante. Tali regioni sono:
- ·
Valle d’Aosta con una variazione da un
ammontare di 61,9 unità fino ad un valore di 60,21 unità ovvero pari ad una
variazione di -1,69 unità pari ad una variazione di -2,73%;
- ·
Friuli Venezia Giulia con una variazione
da un ammontare di 70,14 fino ad un valore di 68,11 unità ovvero pari ad una
variazione di -2,03 unità pari ad un valore di -2,89%;
- ·
Sardegna con una variazione diminutiva da
un ammontare di 54,2 unità fino ad un valore di 51,84 unità ovvero pari ad una
variazione di -2,36 unità ovvero pari ad una variazione di -4,35%.
Tuttavia è possibile
anche utilizzare gli algoritmi per calcolare la probabilità di una regione di superare
il valore medio italiano per numero di diplomati. In questo caso viene costruita
una nuova variabile costituita dalla differenza tra il valore medio del numero
di diplomati in Italia ed il numero di diplomati per regione. Nel caso in cui
la variazione sia positiva viene assegnato un valore pari a 1 in caso contrario
viene assegnato un valore pari a 0. In questo senso gli algoritmi vengono
analizzati in termini di accuracy. L’analisi mostra la presenza dei seguenti
ordinamenti in termini di accuracy ovvero:
- ·
Gradient
Boosting, AdaBoost, Naive Bayes hanno un valore di accuracy pari a 1;
- ·
kNN, Tree, Random Forest, SVM, Neural
Network, CN2 Rule Inducer, Logistic Regression e SGD hanno un valore di accuracy
pari a 0,95;
- ·
Costant ha un valore di accuracy pari a
0,7.
Conclusioni. L’analisi mostra che il numero dei diplomati nelle regioni italiane è significativamente aumentato tra il 2005 ed il 2019. Tuttavia, vi sono delle significative distinzioni tra Centro-Nord Italia e Sud Italia in termini di numero di diplomati. In modo particolare se da un lato nelle regioni del Nord Italia nella popolazione tra 25 e 64 anni vi sono circa 66 diplomati su 100 persone tale valore risulta essere di 54,00 su 100 nelle regioni del Mezzogiorno. Ovvero per ogni 100 persone nella fascia di età 25-64 anni nel Nord Italia vi sono 12 diplomati in più rispetto al Mezzogiorno. Ovviamente questi dati sono di tipo quantitativo e non hanno la capacità di mettere in evidenza quelle che sono invece le differenze di tipo qualitativo, che pure esistono, dei modelli di insegnamento tra Nord e Sud Italia. Inoltre occorre considerare che tali valori non prendono neanche in considerazione le tipologie di istituzioni scolastici frequentati dagli studenti. I diplomati nel Mezzogiorno sono quindi di meno rispetto a quelli del Nord Italia e molto probabilmente hanno anche un tipo di formazione qualitativamente ridotta con delle strutture scolastiche tendenzialmente meno adeguate. Inoltre, occorre considerare che ovviamente un minore numero di diplomati tende a riflettersi anche in termini di riduzione del numero degli studenti iscritti nelle istituzioni universitarie. Infine, è necessario rilevate che i dati analizzati fanno riferimento al 2019 e che probabilmente tali valori sono significativamente peggiorati nel corso della pandemia del covid 19. Infatti, i lockdown e le forme di didattica a distanza hanno sostanzialmente peggiorato la qualità della formazione scolastica e hanno promozionato il fenomeno dell’abbandono scolastico. Infine, è assai probabile che il basso numero di diplomati nel Sud Italia rispetto alle altre aree d’Italia rifletta una condizione più grave della popolazione meridionale ovvero il fatto di non vedere più nella scuola e nella formazione un elemento essenziale per la crescita economica, sociale, civile, individuale e collettiva. Uno scetticismo nei confronti della cultura che rischia di gravare ancora di più sul ritardo del Mezzogiorno soprattutto nell’attuale contesto economico internazionale caratterizzato dal dominio dell’economia della conoscenza e dell’innovazione tecnologica. A tal proposito è quindi necessario che le politiche economiche italiane ed europee diano maggiori risorse all’economie del Mezzogiorno per fare in modo che il numero dei diplomati del Sud Italia raggiunga almeno il livello medio italiano.
Nessun commento:
Posta un commento