Speaker:
Luca Baggi (Machine Learning Engineer presso xtream)
Abstract:
Polars ha cambiato il mondo della manipolazione dati, diventando il più credibile successore di pandas. Ma c'è chi è pronto a scommettere che avrà un impatto anche in altri ambiti della data science, integrandosi con le librerie esistenti oppure diventando il motore di una "nuova generazione" di librerie: come functime, un framework in Python per il machine learning forecasting.
Gli sviluppatori di functime hanno deciso di concentrarsi sul forecasting perché è uno dei domini in cui l'utilizzo di Polars porta risultati evidenti: ad esempio, è più veloce di 1-2 ordini di grandezza sul feature engineering e nella cross-validation. Ma il miglioramento più significativo è nella scalabilità: con Polars e functime è possibile allenare un modello su migliaia di time series senza dover ricorrere a sistemi distribuiti, come Ray o PySpark. Questo è possibile anche perché functime non usa modelli locali come ARIMA, che vengono allenati su una time series alla volta, ma modelli globali come XGBoost, che sia nella letteratura che nelle competizioni di forecasting si sono affermati come valide alternative, se non addirittura le migliori, per grandi dataset.
Nel corso di questa serata utilizzeremo functime per una Kaggle Competition a tema forecasting. Useremo modelli globali per produrre stime puntuali e intervalli di confidenza, illustrando strategie di feature extraction e backtesting.
5 окт 2024