domenica 26 giugno 2022

Il Fatturato da e-Commerce delle PMI in Europa


E’ cresciuto del 24,40% in media tra il 2016 ed il 2021 peri paesi del DESI Index.

Il DESI Index calcola la percentuale del fatturato che le PMI realizzano dall’e-commerce sul totale del fatturato da e-commerce. L’indicatore calcola quindi la capacità delle PMI di acquisire fette di mercato nell’e-commerce. I dati sono disponibili tra il 2016 ed il 2021 per 27 paesi. Il fatto che una impresa di piccole e medie dimensioni riesca ad ottenere un fatturato dall’e-commerce è un indicatore sintetico rappresentativo della capacità di utilizzare le nuove tecnologie per generare profitto.

Ranking dei paesi per fatturato da e-commerce delle PMI nel 2021. L’Irlanda è al primo posto per valore del fatturato da e-commerce nel 2021 con un valore pari a 10,907, seguita dalla Danimarca con un ammontare pari a 8,794 e dalla Repubblica Ceca con un ammontare pari a 8,669. A metà classifica vi sono Malta con un valore pari a 5,5857, seguita dall’Estonia con un valore pari a 5,3729 e dalla Spagna con un valore pari a 5,3688. Chiudono la classifica il Lussemburgo con un valore pari a 3,0655 unità, seguita dalla Grecia con un valore pari a 2,43 e dalla Bulgaria con un ammontare pari a 1,9099.

Ranking dei paesi per valore della variazione percentuale del fatturato delle PMI derivante dall’e-commerce nel periodo tra il 2016 ed il 2021. La Romania è al primo posto per valore della variazione percentuale del fatturato derivante da PMI con un ammontare pari a 122,73% pari ad un ammontare di 2,28 unità, seguita dalla Grecia con un valore pari a 63,58% equivalente ad un ammontare di 0,95 unità, seguita dalla Croazia con un ammontare di 50,94% pari ad un ammontare di 2,42 unità. A metà classifica vi sono i Paesi Bassi con un ammontare pari a 28,55% pari ad un ammontare di 1,42 unità, seguiti dalla Lettonia con una variazione pari ad un ammontare di 27,71>% pari ad un ammontare di 0,76 unità e dall’Ungheria con un ammontare pari a 27,3% pari ad un ammontare di 0,81 unità. Chiudono la classifica Cipro con un ammontare pari a 4,24% pari ad un ammontare di 0,16 unità, seguita dalla Germania con un valore pari a -7,09% pari ad un ammontare di -0,4 unità e dalla Francia con un valore pari a -9,16% pari ad un ammontare di -0,44 unità.

Clusterizzazione con algoritmo k-Means ottimizzato con il coefficiente di Silhouette. Di seguito viene presentata una clusterizzazione con algoritmo k-Means ottimizzato con il coefficiente di Silhouette. L’analisi mostra la presenza di tre clusters come indicato di seguito ovvero:

  • ·         Cluster 1: Lussemburgo, Lettonia, Polonia, Grecia, Italia, Bulgaria, Ungheria, Cipro, Romania.
  • ·         Cluster 2: Repubblica Ceca, Belgio, Danimarca, Irlanda, Svezia;
  • ·         Cluster 3: Croazia, Slovenia, Malta, Portogallo, Paesi Bassi, Austria, Germania, Finlandia, Francia, Estonia, Spagna, Lituania, Slovacchia.

Calcolando il valore della mediana risulta evidente che C2=8,66975> C3=5,8059> C1=3,68685. Dal punto di vista geografico la clusterizzazione mette in evidenza la dominanza dei paesi scandinavi sui paesi del Nord Europa e soprattutto sui paesi dell’Europa del Sud-Est con eccezione di Spagna e Portogallo. Tuttavia, vi sono alcune eccezioni come, per esempio, la Repubblica Ceca che per valore del fatturato derivante dall’e-commerce risulta essere nel cluster di testa pure essendo un paese appartenente all’Europa centro-orientale.

Network Analysis con la distanza di Manhattan. Di seguito viene realizzata una network analysis attraverso l’utilizzo della distanza di Manhattan. I dati mostrano la presenza di tre strutture a network complesse di una struttura a network semplificata.

Esiste una struttura a network complessa costituita da Lussemburgo, Lettonia, Italia, Bulgaria, Polonia. In modo particolare sono rilevante le seguenti connessioni:

  • ·         Il Lussemburgo ha una connessione con la Lettonia con un valore pari a 0,28 unità, e con la Polonia con un valore pari a 0,27 unità;
  • ·         La Lettonia ha una connessione con il Lussemburgo per un valore pari a 0,28 unità, con la Polonia con un valore pari a 0,16 e con l’Italia per un valore pari a 0,25;
  • ·         La Polonia ha una connessione con il Lussemburgo con un valore pari a 0,27 unità, con la Lettonia con un valore pari a 0,26 e con l’Italia per un valore pari a 0,13.
  • ·         La Bulgaria ha una connessione con l’Italia pari a 0,29 unità.

Inoltre viene rilevata una struttura a rete complessa tra Spagna, Estonia, Irlanda e Austria. In modo particolare:

  • ·         La Spagna ha una connessione con l’Estonia pari ad un ammontare di 0,29 unità;
  • ·         L’Estonia ha una connessione con la Spagna pari ad un ammontare di 0,29 e con l’Irlanda pari ad un ammontare di 0,3 unità;
  • ·         L’Irlanda ha una connessione con l’Estonia pari ad un ammontare di 0,3 unità e con l’Austria pari ad un valore di 0,21 unità;
  • ·         L’Austria ha una connessione con l’Irlanda pari ad un ammontare di 0,21 unità.

Esiste una struttura a rete complessa composta dalla Slovenia, dalla Croazia e da Malta. Nello specifico:

  • ·         La Slovenia è connessa alla Croazia per un valore pari a 0,26;
  • ·         La Croazia è connessa alla Slovenia per un valore pari a 0,26 e con Malta per un valore pari a 0,16;
  • ·         Malta è connessa alla Croazia con un valore pari a 0,16.  

Esiste infine una struttura a network semplificata tra Germania e Portogallo con un valore pari a 0,18.

Machine Learning and Predictions. Di seguito viene realizzata una analisi per la predizione dei valori futuri del fatturato derivante dall’e-commerce nei paesi europei.  Vengono utilizzati vari algoritmi confrontati in base alla loro capacità di massimizzare l’R-squared e di minimizzare l’MSE, RMSE e MAE. Gli algoritmi sono stati addestrati utilizzando l’80% dei dati disponibili con il metodo della cross validations. È stato quindi ottenuto il seguente ordinamento degli algoritmi ovvero:

  • ·         Linear Regression con un payoff pari a 4;
  • ·         SGD con un payoff pari a 8;
  • ·         Random Forest con un payoff pari a 13;
  • ·         kNN con un valore del payoff pari a 15;
  • ·         AdaBoost con un valore del payoff pari a 21;
  • ·         Gradient Boosting con un valore del payoff pari a 26;
  • ·         Tree con un valore del payoff pari a 28;
  • ·         SVM con un valore del payoff pari a 29;
  • ·         Neural Network con un valore del payoff pari a 36.

Pertanto, applicando l’algoritmo maggiormente performante ovvero il Linear Regression risulta che in media il valore del fatturato derivante dall’e-commerce è predetto in crescita con un valore assoluto pari a 0,026 e pari ad una variazione percentuale di 0,47%. In modo particolare tra i maggiori winners in termini di crescita del fatturato derivante dall’e-commerce sono indicati la Bulgaria con un valore pari a 16,75% pari a 0,32, seguita dalla Grecia con un valore pari a 15,82% pari ad un ammontare di 0,385, e da Cipro con un valore pari a 14,32% pari ad un ammontare di 0,56 unità e dall’Ungheria con un valore pari a +13,19% pari ad un ammontare di 0,4965 unità. I paesi che sono invece losers, ovvero per i quali è predetta una riduzione assai significativa del valore del fatturato derivante dall’e-commerce sono la Lituania con un valore predetto pari a -10,3% pari a -0,78 unità, la Danimarca con un valore pari a -10,84% pari a -0,954 unità, la Croazia con una variazione pari a -20,688% pari a -1,48 unità e dalla Romania con un valore pari a -23,70% pari a -0,982 unità.

Confronto degli algoritmi in termini di accuracy. Di seguito viene proposta un confronto tra gli algoritmi in termini di accuracy per verificare la capacità di predire la performance di un paese rispetto alla media europea. Se un paese supera in termini di fatturato dall’e-commerce la media europea viene attribuito un valore pari a 1. In caso contrario un valore pari a 0. Gli algoritmi sono addestrati con l’80% dei dati disponibili attraverso il metodo della cross validation. L’analisi mostra che in termini di accuracy i migliori algoritmi sono Tree, SGD, kNN, Logistic Regression e Random Forest con una capacità predittiva pari a 96,3%. Al secondo posto in termini di accuracy vi sono CN2 Rule Inducer, AdaBoost, SVM, Neural Network, Gradient Boosting con una capacità predittiva pari a 92,6%.

Conclusioni. La capacità delle PMI di realizzare un fatturato dall’e-commerce è un segnale molto rilevante dalla diffusione delle competenze digitali a livello nazionale. I dati mostrano una crescita a livello paese della capacità di realizzare fatturato in termini di e-commerce nei vari paesi europei. Persiste un significativo divario tra Nord Europa e Sud-Est Europa. Gli algoritmi predicono in media una crescita moderata del fatturato dall’e-commerce per le PMI. Taluni paesi potrebbero crescere assai più di altri come per esempio Bulgaria, Grecia e Cipro. Vi sono ancora molti margini per aumentare l’implementazione dell’e-commerce nei business plans delle PMI. Le PMI hanno molti margini di profitto dall’utilizzo dell’e-commerce. Le politiche economiche europee potrebbero intervenire per promozionare l’utilizzo dell’e-commerce soprattutto nei paesi dell’Europa Meridionale ed Orientale.

 






















L’Applicazione delle Tecnologie Digitali per il Business in Europa

 

E’ cresciuta del 65,52% in media tra il 2016 ed il 2021

  

Nell’ambito del DESI-Index viene calcolata la variabile Digital Technologies for Business. Si tratta di una variabile costituita da un insieme di sotto variabili ovvero: Electronic Information Sharing, Social Media, Big Data, Cloud, AI, ICT for Environmental Sustainability, e-Invoices. La variabile fa parte di una macro variabile più grande ovvero Integration of Digital Technologies. I dati sono disponibili nel periodo 2016-2021 per 27 paesi.

Ranking dei paesi europei per valore delle tecnologie digitali per il business nel 2021. La Finlandia è al primo posto per valore delle tecnologie digitali per il business con un valore pari a 41,10 unità, seguita dalla Svezia con un valore pari a 37,61 unità e dalla Danimarca con un valore pari a 36,45 unità. A metà classifica vi sono l’Austria con un valore pari a 26,95 unità, l’Estonia con un valore pari a 26,36 unità e la Spagna con un valore pari a 25,91 unità. Chiudono la classifica la Bulgaria con un valore pari a 17,06 unità, seguita dalla Polonia con un valore pari a 16,88 unità e dall’Ungheria con un valore pari a 15,41 unità.

Ranking dei paesi europei per variazione percentuale delle tecnologie digitali per il business tra il 2016 ed il 2021. L’Estonia è al primo posto per valore della variazione percentuale delle tecnologie digitali per il business tra il 2016 ed il 2021 con un valore pari a 113,54% ovvero pari ad un ammontare di 14,02 unità, seguita dalla Lettonia con una variazione pari a 109,00% pari ad un ammontare di 10,38%, e dall’Italia con una variazione pari a 97,37% pari ad un valore assoluto di 14,26 unità. A metà classifica vi sono la Svezia con un valore pari a 70,35% pari ad un ammontare di 15,53 unità, seguita dall’Austria con un valore pari a 68,13% pari ad un ammontare di 10,92 unità e dal Lussemburgo con un a variazione pari ad un ammontare di 67,41% pari ad un ammontare di 11,46 unità. Chiudono la classifica la Grecia con una variazione percentuale pari a 44,67% pari ad un ammontare di 6,90 unità, seguita dal Portogallo con una variazione di 40,79% pari ad un ammontare di 7,42 unità e dalla Slovacchia con una variazione pari a 35,63% pari ad un ammontare di 5,00 unità.

Clusterizzazione con algoritmo k-Means. Di seguito viene proposta una clusterizzazione attraverso l’utilizzo dell’algoritmo k-Means ottimizzato attraverso il coefficiente di Silhouette. L’analisi mostra la presenza di due diversi clusters ovvero:

  • ·         Cluster 1: Romania, Estonia, Germania, Slovacchia, Bulgaria, Cipro, Italia, Lettonia, Croazia, Polonia, Francia, Repubblica Ceca, Ungheria, Grecia, Austria;
  • ·         Cluster 2: Danimarca, Malta, Belgio, Svezia, Paesi Bassi, Irlanda, Lithuania; Slovenia, Portogallo, Finlandia, Lussemburgo, Spagna.

Calcolando il valore della mediana dei clusters risulta che il valore della mediana del cluster 2-C2 è pari a 30,44, mentre il valore del cluster 1-C1 è pari a 22,33. Ne deriva pertanto il seguente ordinamento dei clusters ovvero: C2=30,44>C1=22,33. Dal punto di vista geografico risulta evidente la contrapposizione tra i paesi del Nord Europa- con aggiunta di Spagna e Portogallo, ed i paesi del Centro-Sud Europa.

Network Analysis attraverso l’utilizzo della distanza di Manhattan. Attraverso l’utilizzo della distanza di Manhattan vengono rilevate 3 strutture a network delle quali due sono complesse ed una è semplificata.

Esiste una struttura a network complessa tra Repubblica Ceca, Francia, Croazia, Cipro, Italia e Grecia. In modo specifico:

  • ·         La Repubblica Ceca ha un link con la Francia per un valore pari a 0,092;
  • ·         La Francia ha una connessione con la repubblica Ceca pari ad un ammontare di 0,092 e con la Croazia per un valore pari a 0,091;
  • ·         La Croazia ha una connessione con la Grecia per un valore pari a 0,24, con l’Italia per un ammontare pari a 0,11, con Cipro con un valore pari a 0,2 e con la Francia con un valore pari a 0,091;
  • ·         L’Italia ha una connessione con la Grecia per un valore pari a 0,24, con la Croazia per un valore pari a 0,11, con Cipro per un valore pari a 0,2;
  • ·         Cipro ha una connessione con l’Italia per un valore pari a 0,2 e con la Croazia per un valore pari a 0,2.

Esiste inoltre una struttura complessa costituita da Portogallo, Slovenia, Lituania, e Irlanda. In modo particolare:

  • ·         Il Portogallo ha una connessione con la Slovenia pari ad un ammontare di 0,18;
  • ·         La Slovenia ha una connessione con il Portogallo per un valore pari a 0,18, con l’Irlanda per un valore pari a 0,15 e con la Lituania per un valore pari a 0,21;
  • ·         La Lituania ha una connessione con la Slovenia per un valore pari a 0,21 unità e con l’Irlanda con un valore pari a 0,07;

·         L’Irlanda ha una connessione con la Lituania per un valore pari a 0,07 unità e con la Slovenia pari ad un ammontare di 0,15 unità.

Inoltre, esiste una struttura a network semplice tra Estonia e Germania avente un valore di 0,16 unità.

Machine Learning and Prediction. Di seguito viene realizzata una predizione attraverso l’utilizzo degli algoritmi di machine learning. In modo particolare vengono confrontati nove diversi algoritmi di machine learning in base alla loro capacità di massimizzare R2 e di minimizzare MSE, RMSE e MAE. Gli algoritmi sono stati addestrati con un valore del learning rate pari a 80%. L’analisi ha manifestato l’esistenza del seguente ordinamento degli algoritmi per efficienza predittiva ovvero:

  • ·         Linear Regression con un valore del payoff pari a 6;
  • ·         SGD con un valore del payoff pari a 7;
  • ·         kNN con un valore del payoff pari a 12;
  • ·         Random Forest con un valore del payoff pari a 15;
  • ·         Gradient Boosting con un valore del payoff pari a 20;
  • ·         AdaBoost con un valore del payoff pari a 26;
  • ·         Tree con un valore del payoff pari a 27;
  • ·         SVM con un valore del payoff pari a 31;
  • ·         Neural Network con un valore del payoff pari a 36.

Pertanto, applicando l’algoritmo con le migliori performance ovvero Linear Regression è possibile predire una riduzione in media per i paesi considerati pari a -0,04% del valore delle digital technologies for business. Nello specifico l’algoritmo predice che i paesi che avranno maggiore crescita nel senso della digitalizzazione del business sono il Portogallo con un valore pari a +12,6%, la Slovacchia con un valore pari a +11,84%, la Bulgaria con +11,84% e la Romania con un valore pari a +11,39%. I paesi per i quali l’algoritmo Linear Regression predice un arretramento dell’applicazione delle tecnologie digitali al business sono la Danimarca con -7,96%, la Croazia con un valore pari a -8,26%, l’Italia con un valore pari a-23,99%, e l’Estonia con -24,86%.


Under and Over the European Union Mean. Inoltre è possibile utilizzare gli algoritmi per calcolare la probabilità dei paesi di superiore il valore della media europea che è pari nel 221 a 25,33. Pertanto se nel 2021 il valore della variabile di interesse è superiore alla media europea viene attribuito un valore pari a 1 in caso contrario un valore pari a 0. Attraverso questa analisi viene realizzata una nuova analisi per il confronto di performance degli algoritmi questa volta considerati in termini di accuracy. Gli algoritmi sono stati addestrati con l’80% dei dati disponibili. L’analisi mostra che in termini di accuracy il seguente ordinamento degli algoritmi ovvero:

  • ·         Gradient Boosting e AdaBoost con un’accuracy pari a 1;
  • ·         Tree con un’accuracy pari a 0,96;
  • ·         Neural Network e kNN con un’accuracy pari a 0,93;
  • ·         SGD, SVM e Random Forest con un’accuracy pari a 0,89.

Conclusioni. L’analisi mostra un andamento crescente dell’applicazione delle tecnologie digitali per il business nei paesi europei. Tuttavia vi sono ampi divari in termini di crescita tra le aree del Nord Europa e le aree del Centro-Sud Europa. L’analisi a clusters ed anche l’analisi a network confermano l’idea che vi siano dei gruppi di paesi strettamente connessi nella performance in termini di tecnologie digitali per il business. La predizione con algoritmi di machine learning mette in risalto quelli che probabilmente saranno i losers and i winners nell’applicazione della digital technology per il business in Europa. E’ probabile che tale valore comunque cresca o tenda a convergere verso la media europea, anche se tali improvements mancano di essere indifferenti rispetto all’applicazione di politiche economiche europee.
























sabato 25 giugno 2022

L’Adeguata Alimentazione nelle Regioni Italiane

 

Cresce in tutte le macro-regioni tranne che nel Sud Italia

 

L’ISTAT-BES calcola il valore dell’adeguata alimentazione. L’adeguata alimentazione è definita come “Proporzione standardizzata di persone di 3 anni e più che consumano quotidianamente almeno 4 porzioni di frutta e/o verdura sul totale delle persone di 3 anni e più”. I dati sono disponibili nel periodo 2005-2020.

Ranking delle regioni italiane per valore dell’adeguata alimentazione nel 2020. Il Piemonte è al primo posto nel ranking dell’adeguata alimentazione nel 2020 con un valore pari a 26,7, seguito dall’Emilia Romagna con un valore pari 23,2 e dalla Toscana con un ammontare pari a 22,8 unità. A metà classifica vi sono la Valle d’Aosta con un valore pari a 21, la Liguria con un ammontare pari a 20,6 ed il Veneto con un ammontare pari a 20,4 unità. Chiudono la classifica la Basilicata e la Calabria con un ammontare pari a 12,6 e la Campania con un ammontare pari a 10,7.

Ranking delle regioni italiane per variazione percentuale dell’adeguata alimentazione nel periodo 2005-2020. La Sardegna è al primo posto per variazione percentuale dell’adeguata alimentazione tra il 2005 ed il 2020 con un valore pari a 21,20% pari ad un ammontare di 3,90 unità, seguita dalla Calabria con un valore pari a 21,15% pari ad un ammontare di 2,20 unità e dalla Basilicata con un valore pari a 17,76% pari ad un ammontare di 1,90 unità. A metà classifica vi sono la Toscana con un ammontare pari a 5,56% pari ad un ammontare di 1,20 unità, seguita dal Molise con una variazione percentuale pari ad un ammontare di 5,00% pari a 0,80 unità e la Liguria con un ammontare pari a 4,04% pari ad un ammontare di 0,80 unità. Chiudono la classifica il Veneto con nu valore pari a -7,27% pari ad un ammontare di -1,60 unità, seguito dal Friuli-Venezia Giulia con un valore pari a 14,17% pari ad un ammontare di -3,60 unità e dalla Campania con un valore pari a 26,21% pari ad un ammontare di -3,80 unità.

Macro-Regioni italiane. Tra il 2005 ed il 2020 il valore dell’adeguata alimentazione è cresciuto in tutte le macro-regioni italiane con eccezione del Mezzogiorno. In modo particolare nel Nord Italia il valore dell’adeguata alimentazione è cresciuto da un ammontare di 21,00 unità fino ad un valore di 21,70 unità ovvero un ammontare pari a 0,70 unità pari ad una variazione di 3,33%. Tra il 2005 ed il 2020 il valore dell’adeguata alimentazione nel Centro Italia è cresciuto da un ammontare di 21,00 unità fino ad un valore di 21,10 unità ovvero pari ad un ammontare di 0,10 unità pari ad un ammontare di 0,48%. Tra il 205 ed il 2020 il valore dell’adeguata alimentazione è diminuita nel Sud Italia da un ammontare di 13,6 unità fino ad un valore di 13,4 unità ovvero pari ad una variazione di -0,20 unità pari ad un ammontare di -1,47%. Complessivamente in Italia il valore dell’adeguata alimentazione è cresciuto da un ammontare di 18,4 fino ad un valore di 18,8 unità ovvero una variazione di 0,40 unità pari ad un ammontare di 2,17%.

Clusterizzazione con algoritmo k-Means. Di seguito viene realizzata una clusterizzazione mediante l’utilizzo dell’algoritmo k-Means ottimizzato con il coefficiente Silhouette. Sono stati rilevati due clusters ovvero:

  •                      Cluster 1: Calabria, Puglia, Molise, Basilicata, Sicilia, Campania, Abruzzo;
  •                      Cluster 2: Emilia-Romagna, Friuli-Venezia Giulia, Toscana, Marche, Lombardia, Umbria, Piemonte, Lazio, Trentino-Alto Adige, Liguria, Sardegna, Veneto, Valle d’Aosta.  

Calcolando la mediana dei due clusters risulta evidente la dominanza del cluster 2 rispetto a quella del cluster 1 ovvero: C2=21,8>C1=12,9. Ne deriva che il valore della mediana dell’adeguata alimentazione del Centro Nord è pari a circa il 168% del valore delle regioni meridionali. Ne deriva pertanto che la differenza tra Centro-Nord e Sud non opera soltanto a livello reddituale quanto retroagisce anche a livello di adeguata alimentazione. E ovviamente mancando l’adeguata alimentazione è probabile che vi sia un maggiore carico dei sistemi sanitari meridionali rispetto al valore dei sistemi sanitari settentrionali. Ne deriva che le politiche sanitarie che agiscano nel cambiamento degli abitudini alimentari diventano anche delle politiche in grado di ridurre prospetticamente la spesa sanitaria pro-capite a livello regionale.

Network Analysis con l’utilizzo della distanza di Manhattan. Di seguito viene ad essere realizzata una network analysis attraverso l’utilizzo della distanza di Manhattan. I dati mostrano la presenza di due strutture a network delle quali una è complessa e l’altra presenta una struttura semplificata. La struttura complessa è costituita dalle seguenti regioni ovvero: Veneto, Lazio, Lombardia, Liguria, Trentino-Alto Adige. Le relazioni tra le regioni sono indicate di seguito:

  •                      Il Veneto ha una connessione con il Lazio con link avente valore pari a 1,1 e con la Lombardia con un valore pari a 1,2 unità;
  •                      Il Lazio ha una connessione con il Veneto con un link avente un valore pari a 1,1, e con la Lombardia con un valore pari a 1,2;
  •                      La Lombardia ha una connessione con il Veneto con un link avente un valore pari a 1,2, un link con il Lazio con un ammontare pari a 1,2, con la Liguria con un valore pari a 1,1, con il Trentino-Alto Adige con un valore pari a 0,87;
  •                      Il Trentino-Alto Adige ha una connessione con la Lombardia con un valore pari a 0,87 unità, e con la Liguria con un link pari a 0,85 unità.
  •                      La Liguria ha una connessione con la Lombardia pari ad un ammontare di 1,1 unità e con il Trentino-Alto Adige con un valore pari a 0,85 unità.
  • Esiste inoltre un link semplificato tra Campania e Sicilia biunivoco avente un valore di 1,1 unità.

La struttura a network conferma l’idea della contrapposizione tra Centro-Nord e Sud e mette in risalto da un lato la centralità della dinamica numerica della Lombardia nel Centro-Nord e dall’altro lato la connessione tra Campania e Sicilia in termini di adeguata alimentazione.

Machine learning and predictions. Di seguito vengono confrontati nove algoritmi di machine learning per la predizione del valore futuro dell’adeguata alimentazione nelle regioni italiane. Gli algoritmi sono stati addestrati con l’80% dei dati disponibili. Inoltre, è stata realizzata una cross validation con 20 folds. Gli algoritmi sono stati confrontati in termini di efficienza predittiva sulla base della loro capacità di massimizzare l’R-quadro e di minimizzare gli errori statistici MSE, RMSE e MAE. I dati mostrano il seguente ordinamento degli algoritmi:

  • 1.      Random Forest con un valore del payoff pari a 5;
  • 2.      AdaBoost con un valore del payoff pari a 7;
  • 3.      kNN con un valore del payoff pari a 12;
  • 4.      Gradient Boosting con un valore del payoff pari a 16;
  • 5.      SGD con un valore del payoff pari a 16;
  • 6.      Tree con un valore del payoff pari a 24;
  • 7.      SVM con un valore del payoff pari a 28;
  • 8.      Linear Regression con un valore del payoff pari a 28.

Pertanto, utilizzando l’algoritmo Random Forest è stato possibile predire i seguenti risultati ovvero:

  •                      Piemonte con una variazione diminutiva da un ammontare di 26,70 fino ad un valore di 22,4 ovvero una variazione di -4,26 unità pari ad un ammontare di -15,96%;
  •                      Valle d’Aosta con una variazione aumentativa da un ammontare di 21,00 fino ad un valore di 21,46 ovvero pari ad una variazione di 0,46 unità pari ad un ammontare di 2,19%;
  •                      Liguria con una variazione aumentativa da un ammontare di 20,60 unità fino ad un valore di 21,46 unità ovvero pari ad una variazione di 0,34 pari ad un ammontare di 1,65%;
  •                      Lombardia con una variazione aumentativa da un ammontare di 19,70 unità fino ad un valore di 20,88 unità pari ad una variazione di 1,18 unità pari ad un ammontare di 5,99%;
  •                      Trentino-Alto Adige con una variazione diminutiva da un ammontare di 21,10 unità fino ad un valore di 20,73 unità ovvero pari ad una variazione di -0,37 unità pari ad un ammontare di -1,75%;
  •                      Veneto con una variazione aumentativa da un ammontare di 20,40 unità fino ad un valore di 20,48 ovvero pari ad un valore di 0,08 unità pari ad un ammontare di 0,42%;
  •                      Friuli-Venezia Giulia con una variazione aumentativa da un ammontare di 21,80 unità fino ad un valore di 22,31 unità ovvero pari ad una variazione di 0,51 unità pari ad un ammontare di 2,33;
  •                      Emilia-Romagna con una variazione diminutiva da un ammontare di 23,20 unità fino ad un valore di 22,65 unità ovvero pari ad un ammontare di -0,55 unità pari a -2,39%;
  •                      Toscana con una variazione diminutiva da un ammontare di 22,80 unità fino ad un valore di 21,63 unità ovvero pari ad un valore di -1,17 unità pari ad una variazione di -5,13%;
  •                      Umbria con una variazione aumentativa da un ammontare di 22,10 unità fino ad un valore di 22,30 unità ovvero pari ad un valore di 0,20 unità pari ad un ammontare di 0,90%;
  •                      Marche con una variazione da un ammontare di 21,90 unità fino ad un valore di 21,57 unità ovvero pari ad una variazione di -0,33 unità pari ad un ammontare di -1,51%;
  •                      Lazio con una variazione aumentativa da un ammontare di 19,70 unità fino ad un valore di 20,88 unità ovvero pari ad una variazione di 1,18 unità pari ad un ammontare di 5,99%;
  •                      Abruzzo con una variazione aumentativa da un ammontare di 14,30 unità fino ad un valore di 14,49 unità ovvero pari ad una variazione di 0,19 unità pari ad un ammontare di 1,33%;
  •                      Molise con una variazione diminutiva da un ammontare di 16,80 unità fino ad un valore di 13,07 unità ovvero pari ad una variazione di -3,73 unità pari ad un ammontare di -22,21%;
  •                      Campania con una variazione aumentativa da un ammontare di 10,70 unità fino ad un valore di 13,36 unità ovvero pari ad una variazione di 2,66 unità pari ad un ammontare del 24,86%;
  •                      Puglia con una variazione aumentativa da un ammontare di 12,90 unità fino ad un valore di 13,54 unità ovvero pari ad una variazione di 0,64 unità pari ad una variazione di 4,96%;
  •                      Basilicata con una variazione aumentativa da un ammontare di 12,60 unità fino ad una variazione di 14,00 unità ovvero pari ad una variazione di 1,40 unità pari ad un ammontare di 11,11%;
  •                      Sicilia con una variazione aumentativa da un ammontare di 14,00 unità fino ad un valore di 14,16 unità ovvero pari ad una variazione di 0,16 unità pari ad un ammontare di 1,14%;
  •                      Sardegna con una variazione aumentativa da un valore di 22,30 unità fino ad un valore di 20,44 unità ovvero pari ad un valore di -1,86 unità pari al -8,34%.

Complessivamente il valore medio dell’adeguata alimentazione è predetto in diminuzione da un ammontare pari a 18,86 unità fino ad un valore di 18,79 unità ovvero pari ad una variazione di -0,07 unità pari ad un ammontare di -0,37%.

Conclusioni. In sintesi, l’adeguata alimentazione è migliorata in tutte le macro regioni italiane tra il 2005 ed il 2020 con eccezione del sud Italia. L’analisi a cluster manifesta la presenza di un chiaro divario tra le regioni del centro-nord Italia che hanno dei valori elevati in termini di adeguata alimentazione e le regioni Meridionali che sono significativamente arretrate. La network analysis conferma la presenza di una struttura a rete complessa tra le regioni del Nord che ha nella Lombardia un elemento centrale mentre nel Sud Italia la dinamica della serie storica della Sicilia e della Campania risultano essere significativamente correlate. Inoltre, la predizione con il machine learning manifesta un andamento marginalmente riduttivo dell’adeguata alimentazione nelle regioni italiane. Occorre considerare che l’adeguata alimentazione svolge una funzione preventiva rispetto alla probabilità di utilizzare il sistema sanitario e pertanto regioni caratterizzate da una peggiore performance in termini di adeguata alimentazione potrebbero avere prospetticamente una crescita della spesa pubblica per i main diseases.