Dall’econometria al Machine Learning: la sfida della previsione
Il caso del Prezzo Unico Nazionale (PUN) orario
Pubblicato da Riccardo Gentilucci. .
Energia Elettrica Determinanti dei prezziNegli ultimi anni l'intelligenza artificiale e il Machine Learning hanno visto una crescente diffusione anche nel campo dell'analisi dati, proponendosi come strumenti alternativi ai modelli statistici ed econometrici tradizionali per la previsione e la stima delle relazioni tra variabili. Ciò solleva un interrogativo: i modelli strutturali ed econometrici tradizionali continuano a garantire prestazioni migliori, o i sistemi di Machine Learning sono diventati più efficaci?
Nel campo dell'analisi dati è possibile distinguere tre diversi approcci metodologici:
- Approccio Econometrico Tradizionale: l'analisi si basa su una struttura teorica esplicitamente definita dall'utente (equazione matematica, assunzioni ecc.) e viene poi condotta seguendo il modello specificato.
- Approccio Machine Learning: l'analisi è eseguita autonomamente dal programma, senza che l'utente imponga alcuna struttura econometrica. Il modello apprende direttamente dai dati, ottimizzando la propria performance predittiva.
- Approccio Ibrido: l'utente definisce alcune componenti del modello, ma lascia che sia il programma a completare l'analisi, sfruttando tecniche di Machine Learning.
L’obiettivo di questo lavoro è confrontare le performance predittive di questi diversi sistemi sul Prezzo Unico Nazionale (PUN) orario del mercato elettrico italiano, prendendo in esame quattro modelli rappresentativi e utilizzando come metrica di valutazione il Root Mean Squared Error (RMSE). Come punto di riferimento viene utilizzato un modello strutturale sviluppato per il PUN, che costituisce il benchmark dell’analisi grazie al livello di dettaglio e approfondimento con cui è stato costruito.
Vuoi restare aggiornato sull’andamento dei mercati delle commodity?
Iscriviti gratuitamente alla newsletter PricePedia!
Ciclo di previsioni
Per eseguire il confronto, si utilizza un ciclo di previsioni con finestra temporale mobile. In particolare, ogni modello produce previsioni fino al venerdì successivo alle ore 23:00, a partire da tre diversi periodi iniziali:
- P7: previsione settimanale, con dati disponibili fino al giovedì della settimana precedente alle ore 23:00;
- P5: previsione di cinque giorni, con dati disponibili fino alla domenica precedente alle ore 23:00;
- P3: previsione di tre giorni, con dati disponibili fino al martedì precedente alle ore 23:00.
Con questa modalità, vengono eseguite previsioni con tre orizzonti temporali differenti.
Il ciclo viene ripetuto per un campione di 16 settimane consecutive: si parte dal 30 maggio 2025, data della prima previsione, e si prosegue di settimana in settimana fino al 12 settembre 2025.
In seguito, per ciascun modello vengono calcolati i valori di RMSE associati alle previsioni P7, P5 e P3, rendendo possibile valutare come le performance dei modelli varino al crescere dell’orizzonte di previsione. Questi valori, ripetuti per tutte le settimane considerate, danno origine a tre distribuzioni statistiche che sintetizzano le performance previsive di ciascun sistema nei diversi orizzonti temporali.
Dall’analisi di tali distribuzioni è possibile ricavare alcuni indicatori chiave: la media (RMSE_mean), che consente di individuare il modello mediamente più accurato per ciascun orizzonte di previsione; e il massimo (RMSE_max), che fornisce una misura del rischio legato ai casi di errore più elevato. L’analisi delle distribuzioni degli errori consente di individuare sistemi che, pur essendo mediamente buoni, possono presentare occasionali errori estremi, e viceversa modelli più stabili anche se leggermente meno precisi in media.
Modello Econometrico Strutturale
Il modello sviluppato ha l’obiettivo di spiegare e prevedere il Prezzo Unico Nazionale (PUN) orario del mercato elettrico italiano, tenendo conto sia dei principali driver noti sia di componenti sistematiche legate all’ora del giorno.
La variabile dipendente è il PUN orario, espresso in €/Mwh. Tra le variabili indipendenti principali sono considerate il prezzo giornaliero del gas naturale al punto di scambio PSV, il prezzo dei permessi di emissione di CO₂, la domanda elettrica oraria complessiva in Italia e la quota oraria di produzione da fonti rinnovabili (FER), rappresentata da due variabili distinte: SFER_BASSO per quote inferiori al 70% e SFER_ALTO per quote pari o superiori al 70%.
Per isolare le variazioni sistematiche associate all’ora del giorno, il modello include inoltre 23 variabili dummy, una per ciascuna ora del giorno esclusa l’ora di riferimento, che permettono di stimare l’effetto medio specifico di ciascun orario sul PUN.[1]
Dopo aver stimato le componenti di lungo e breve periodo, il modello strutturale viene utilizzato per generare le previsioni Out-Of-Sample sui tre orizzonti temporali. I valori di RMSE derivanti sono:
Orizzonte | RMSE_mean | RMSE_max | RMSE%_mean | RMSE%_max |
---|---|---|---|---|
P7 | 14.09 | 26.35 | 13.09 | 27.51 |
P5 | 13.87 | 27.78 | 12.82 | 29.47 |
P3 | 11.03 | 20.64 | 9.59 | 16.70 |
Questi risultati segnalano che, mediamente, l’errore di previsione di questo modello è compreso tra 11 e 14 €/Mwh, a seconda della lunghezza dell’orizzonte di previsione. L’errore massimo risulta compreso tra 20 e 28 €/Mwh. Se si considera la variabilità per PUN orario nel corso di questa estate, questi risultati di previsione risultano particolarmente buoni.
Come potevamo aspettarci, la media dell’RMSE diminuisce con l’accorciarsi dell’orizzonte di previsione. L’RMSE massimo mostra una tendenza simile ma con qualche oscillazione: il valore più elevato si registra su P5.
Il modello strutturale mostra una ottima capacità predittiva, soprattutto su orizzonti brevi, con errori contenuti sia in valore assoluto che in percentuale. L’aumento dell’errore con l’allungarsi dell’orizzonte di previsione è coerente con la natura del problema e suggerisce che le fluttuazioni del PUN a medio-lungo termine sono più difficili da catturare, mentre le previsioni a pochi giorni risultano più affidabili.
La qualità dei risultati dipende non solo dalla precisione con cui le equazioni di breve e lungo periodo riproducono la relazione tra le variabili esplicative e il PUN orario, ma anche dal grado di corrispondenza tra i valori utilizzati nelle equazioni e quelli effettivamente osservati. In questo scenario, le variabili esplicative sono state considerate nei loro valori effettivi, creando così le condizioni ottimali per ottenere previsioni accurate del PUN orario.
È importante sottolineare che i risultati di questo modello econometrico strutturale non vanno interpretati come una previsione dei possibili esiti, bensì come un benchmark ottimale, utile per confrontare le prestazioni degli altri modelli presentati di seguito.
Modello Machine Learning: Tiny Time Mixers
Il modello Tiny Time Mixers (TTM) è un sistema Open Source sviluppato da IBM Research per la previsione di serie storiche, basato su algoritmi di Machine Learning avanzati.
La previsione Out-Of-Sample del PUN è stata eseguita in modalità Zero-Shot, ossia senza alcun addestramento specifico sui dati del mercato elettrico italiano. Sono state quindi sfruttate direttamente le capacità apprese durante il pre-training condotto dagli sviluppatori del modello, senza che i parametri venissero aggiornati con un ulteriore training. Ciò rende la performance del modello interamente basata sul Machine Learning, senza alcun apporto da parte dell’utente.
La descrizione approfondita di questo modello sarà l’argomento di un prossimo articolo.
La previsione Out-Of-Sample ha portato i seguenti risultati:
Orizzonte | RMSE_mean | RMSE_max | RMSE%_mean | RMSE%_max |
---|---|---|---|---|
P7 | 19.14 | 30.71 | 17.68 | 33.50 |
P5 | 16.55 | 25.50 | 14.49 | 25.05 |
P3 | 13.81 | 23.89 | 12.21 | 24.77 |
Il modello TTM mostra prestazioni meno precise rispetto al modello strutturale ma comunque accurate. Il RMSE medio è più alto in tutti gli orizzonti temporali, tuttavia rimangono su valori accettabili, in particolare l’errore si riduce sensibilmente al diminuire dell’orizzonte temporale. Lo stesso discorso vale per il RMSE massimo osservato: su orizzonti più brevi i picchi si riducono, segno che il modello riesce ad adattarsi meglio quando l’incertezza da catturare è più limitata.
Il TTM si dimostra un approccio flessibile e competitivo, soprattutto considerando che è stato utilizzato senza alcun addestramento specifico sul PUN. Questo suggerisce che, con un fine-tuning mirato o un training dedicato, il modello potrebbe ulteriormente migliorare le sue prestazioni e avvicinarsi a quelle del modello strutturale, diventando un’alternativa particolarmente valida.
Modello Econometrico: SARIMA
Il modello SARIMA (Seasonal Autoregressive Integrated Moving Average) è un'estensione del tradizionale modello ARIMA, progettata specificamente per serie temporali con andamenti stagionali. La sua struttura combina autoregressione (AR), integrazione (I), media mobile (MA) e stagionalità (s), permettendo di catturare le dipendenze sia di breve che di lungo periodo.
Formalmente è espresso come: SARIMA(p, d, q)(P, D, Q, s).
L’utente deve specificare manualmente l’ordine del modello, distinguendo tra parte stagionale e non stagionale. Nel nostro caso, le previsioni Out-Of-Sample sono state elaborate con un modello SARIMA(1, 0, 1)(1, 1, 1, 24).
Di seguito sono riportati i risultati in termini di RMSE:
Orizzonte | RMSE_mean | RMSE_max | RMSE%_mean | RMSE%_max |
---|---|---|---|---|
P7 | 19.95 | 32.15 | 18.48 | 35.07 |
P5 | 17.15 | 27.44 | 15.03 | 25.23 |
P3 | 15.22 | 32.52 | 13.39 | 28.42 |
I risultati mostrano una capacità previsiva che, anche in questo caso, migliora con l’accorciarsi dell’orizzonte temporale, in maniera analoga agli altri sistemi, ma rimane nel complesso meno precisa rispetto al modello strutturale e al Tiny Time Mixers. L’RMSE medio si attesta infatti su valori un po' più elevati, con una riduzione progressiva man mano che si passa dalle previsioni settimanali a quelle di tre giorni.
Un aspetto particolarmente rilevante riguarda l’RMSE massimo, che raggiunge valori ben più alti rispetto agli altri due modelli, questo indica che, nonostante una discreta stabilità media, il modello può produrre errori marcati, soprattutto in corrispondenza di fasi di forte volatilità del PUN.
Modello Ibrido: Prophet
Il modello Prophet, sviluppato da Meta[2], rappresenta un esempio di approccio ibrido all’analisi dei dati. Il modello assume una modellizzazione additiva della serie temporale, assumendo che l’osservazione al tempo t possa essere scomposta come segue:
y(t) = trend(t) + seasonality(t) + holidays(t) + error(t).
Allo stesso tempo Prophet individua automaticamente i nodi di cambiamento utilizzando un approccio bayesiano e attribuisce più peso ai nodi che migliorano la previsione, senza che l’utente debba indicarli manualmente. Questo tipo di apprendimento rende il modello adattivo ai pattern dei dati senza intervento manuale su ogni dettaglio.
La previsione Out-Of-Sample riportano:
Orizzonte | RMSE_mean | RMSE_max | RMSE%_mean | RMSE%_max |
---|---|---|---|---|
P7 | 22.49 | 56.74 | 20.51 | 49.51 |
P5 | 18.41 | 38.69 | 16.10 | 35.14 |
P3 | 17.97 | 30.54 | 15.75 | 28.30 |
Il modello ibrido Prophet mostra risultati nettamente più deboli rispetto agli altri modelli testati, infatti i valori RMSE medi si attestano su valori elevati. Ancora più significativa è l’analisi degli RMSE massimi, che evidenzia la fragilità del modello in contesti di elevata variabilità, con un picco molto alto per P7.
Prophet è certamente uno strumento esplorativo semplice da implementare, ma non competitivo per previsioni accurate in un mercato così volatile.
Conclusione
Il confronto conferma la robustezza del modello strutturale come strumento di riferimento per le previsioni del PUN, ma gli altri modelli rappresentano alternative interessanti, soprattutto se si cerca una configurazione più rapida e un’adattabilità ampia.
Il modello Tiny Time Mixers, pur non raggiungendo la stessa accuratezza complessiva del modello strutturale, mostra una buona capacità predittiva, in particolare per previsioni a breve termine. Inoltre, il fatto che sia stato utilizzato in modalità zero-shot, senza alcun addestramento specifico sul PUN, suggerisce che con un fine-tuning mirato le sue performance potrebbero ulteriormente avvicinarsi o magari superare quelle del modello strutturale in determinati scenari, tuttavia non rientrerebbe più in un approccio di analisi puramente Machine Learning.
I modelli SARIMA e Prophet risultano meno precisi in questo contesto, ma rimangono di facile interpretabilità, al contrario del TTM.
[1] Una descrizione dettagliata di questo modello è descritta nell’articolo: Prezzo PUN orario: esiste un effetto specifico “ora”?
[2] Prophet – Forecasting at scale