L’utilizzo
degli open data è cresciuto tra il 2016 ed il 2021 di un ammontare pari a 7,64
unità ovvero di un ammontare pari a 218,79%
E’ un indicatore che
considera due elementi ovvero: in che misura un pase ha delle politiche sugli
open data e quali sono gli impatti politici, sociali ed economici degli open
data. La variabile prende in considerazione le funzionalità, la reperibilità
dei dati e l’utilizzo dei portali di open data nazionali. La serie storica
analizzata è compresa tra il 2016 ed il 2021. Il Regno Unito è escluso dal
calcolo delle variabili costitutive del DESI Index.
Ranking dei paesi
europei per valore degli open data. La Danimarca è al primo
posto con un valore degli open data pari ad un ammontare di 13,67, seguita
dalla Spagna con un valore pari a 13,49 unità, e dalla Francia con un ammontare
pari a 13,47. A metà classifica vi sono la Grecia con un valore pari a 12,18
unità, seguito dalla Finlandia con un valore di 12,15 unità e dalla Slovenia
con un valore pari a 12,01 unità. Chiudono la classifica il Portogallo con un
ammontare pari a 6,8 unità, seguito da Malta con un valore di 6,71 unità e
dall’Ungheria con un valore pari a 4,82 unità.
Ranking dei paesi
per valore della variazione assoluta del valore degli open data tra il 2016 ed
il 2021. La Danimarca è al primo posto per valore
della variazione assoluta degli open data tra il 2016 ed il 2021 con un valore
pari a 9,56, seguito dalla Spagna con un valore pari a 9,44 unità, e la Francia
con un valore pari a 9,42 unità. A metà classifica vi sono la Grecia con un
valore pari a 8,52 unità, seguita dalla Finlandia pari ad un ammontare di 8,50
unità, e dalla Slovenia pari ad un valore di 8,40 unità. Chiudono la classifica
la Slovacchia con un valore pari a 3,71 unità, seguito dall’Ungheria con un
valore di 3,38 unità e dal Portogallo con un valore di 2,99 unità.
Clusterizzazione
con algoritmo k-Means. Di seguito viene presentata una
clusterizzazione attraverso l’utilizzo dell’algoritmo k-Means ottimizzato per
il tramite del coefficiente di Silhouette. L’analisi mostra la presenza di due
diversi clusters ovvero:
- ·
Cluster 1: Malta, Portogallo, Slovacchia,
Ungheria, Belgio, Lussemburgo;
- ·
Cluster 2: Romania, Repubblica Ceca,
Bulgaria, Lettonia, Danimarca, Spagna, Francia, Croazia, Irlanda, Svezia,
Slovenia, Estonia, Polonia, Austria, Finlandia, Grecia, Paesi Bassi, Lituania,
Germania, Italia, Cipro.
Dal punto di vista
metrico risulta che il valore della mediana del cluster 2 è pari ad un
ammontare di 12,21 mentre il valore della mediana del cluster 1 è pari ad un
ammontare di 7,22 unità. Ne deriva pertanto che C2=12,21>C1=7,22.
Machine Learning
and predictions. Di seguito viene realizzata una analisi
attraverso l’utilizzo di un confronto tra 10 diversi algoritmi di machine
learning per la predizione del valore futuro del valore della variabile open
data. Gli algoritmi sono addestrati con l’80 % dei dati disponili. Viene
realizzata una classifica in base alla capacità degli algoritmi di massimizzare
l’R-squared e di minimizzare gli errori statistici MAE, MSE, RMSE. Di seguito
viene indicato l’ordinamento degli algoritmi in base alla performance ovvero:
- ·
Linear Regression con un valore del payoff
pari a 4;
- ·
SGD con un valore del payoff pari a 8;
- ·
AdaBoost con un valore del payoff pari a
12;
- ·
Gradient Boosting con un valore del payoff
pari a 16;
- ·
Random Forest con un valore del payoff
pari a 20;
- ·
kNN con un valore del payoff pari a 24;
- ·
Tree con un valore del payoff pari a 24;
- ·
SVM con un valore del payoff pari a 31.
- ·
Costant con un valore del payoff pari a
36;
- · Neural Network con un valore del payoff pari a 40.
Pertanto l’algoritmo
Linear Regression è il best predictor per la serie storica della variabile Open
Data nell’ambito dell’analisi del dataset del DESI Index.
Network Analysis
con la Distanza di Manhattan. Di seguito viene
realizzata una analisi con lo strumento della network analysis ottimizzato con
la distanza di Manhattan. Nello specifico vengono individuati delle strutture a
network complesse, ovvero delle strutture aventi più di tre nodi e delle strutture
a network semplificate ovvero delle strutture aventi soltanto due nodi.
Esiste una struttura a
network complessa tra Grecia, Paesi Bassi, Lituania, Finlandia ovvero:
- ·
La Grecia ha una connessione con i Paesi
Bassi per un valore pari a 0,0078, con la Finlandia per un valore pari a 0,015
unità, con la Lituania per un valore pari a 0,023 unità;
- ·
I Paesi Bassi hanno una connessione con la
Grecia per un valore pari a 0,0078 unità, con la Finlandia per un valore pari a
0,023 unità e con la Lituania per un valore pari a 0,015 unità;
- ·
La Lituania ha una connessione con i Paesi
Bassi per un valore pari a 0,015 unità, con la Grecia per un valore pari a 0,023
unità, con la Finlandia per un valore pari a 0,039;
- ·
La Finlandia ha una connessione con i
Paesi Bassi per un valore pari a 0,023, con la Lituania per un valore pari a
0,039, con la Grecia per un valore pari a 0,015 unità.
Esiste una connessione
tra Austria, Polonia ed Estonia. In modo particolare:
- ·
L’Austria ha una connessione con la
Polonia per un valore pari a 0,031 unità;
- ·
La Polonia ha una connessione con l’Austria
per un valore pari a 0,031 unità e con l’Estonia per un ammontare di 0,074
unità;
- ·
L’Estonia ha una connessione pari ad un
valore di 0,074 con la Polonia.
Esiste una connessione
tra Cipro, Italia e Germania ovvero:
- ·
Cipro ha una connessione con l’Italia per
un valore pari a 0,027;
- ·
L’Italia ha una connessione con Cipro per
un valore pari a 0,027 e con la Germania per un valore pari a 0,085 unità;
- ·
La Germania ha una connessione con
l’Italia per un valore pari a 0,085.
Esiste una relazione
biunivoca tra i seguenti paesi ovvero:
- ·
La Svezia e la Slovenia hanno una
connessione per un valore pari a 0,039;
- ·
La Francia e la Spagna hanno una
connessione per un valore pari a 0,012 unità.
Conclusioni.
L’utilizzo degli open data è ancora molto scarso nei paesi DESI. Nel paese più
avanzato in termini di Open Data, ovvero la Danimarca, la variabile ha
raggiunto il valore di 13,67 unità. In molti paesi la variabile è stabile al di
sotto del valore di 10, compresa la Germania dove il valore è 8,76 e l’Italia
con 8,68 unità. Se la possibilità di utilizzare degli open data è scarsa,
ancora più rara è ovviamente la capacità di fare business con gli open data.
Sono ancora troppo poche le aziende in grado di fare business con gli open data
attraverso l’utilizzo del machine learning, dell’intelligenza artificiale e dei
big data. Vi sono certamente delle opportunità anche di miglioramento della
pubblica amministrazione, che tuttavia non vengono adeguatamente colte dagli
enti pubblici. Ne deriva che sia il settore privato che il settore pubblico
sono ampiamente indietro nell’utilizzo degli open data e così facendo aumentano
la distanza tra economia potenziale ed economia reale.
Nessun commento:
Posta un commento