L'apprendimento supervisionato è un metodo fondamentale nell'intelligenza artificiale e nel machine learning, in cui un modello viene addestrato su set di dati etichettati. Ogni input del set di addestramento è associato all'output atteso (l'etichetta), consentendo all'algoritmo di imparare a prevedere o classificare nuovi dati. Si distingue dall'apprendimento non supervisionato, che non dispone di etichette, e dall'apprendimento per rinforzo, che si basa su un sistema di ricompense. L'apprendimento supervisionato implica l'ottimizzazione di funzioni di perdita, la validazione incrociata e la gestione dell'overfitting.

Casi d'uso ed esempi di applicazione

L'apprendimento supervisionato è ampiamente utilizzato nella classificazione delle immagini (riconoscimento facciale, rilevamento oggetti), rilevamento di spam, analisi del sentiment, riconoscimento vocale, previsione delle vendite o dei rischi finanziari e manutenzione predittiva. In ambito sanitario, ad esempio, consente la diagnosi di malattie da immagini mediche; in finanza, la previsione di insolvenze.

Principali strumenti software, librerie, framework

Gli strumenti principali sono scikit-learn, TensorFlow, PyTorch, Keras, XGBoost e LightGBM. Offrono una vasta gamma di algoritmi (regressione lineare, foreste casuali, reti neurali, SVM) e funzionalità di valutazione e visualizzazione.

Ultimi sviluppi, evoluzioni e tendenze

Gli sviluppi recenti riguardano l'automazione della selezione dei modelli (AutoML), il miglioramento della robustezza ai dati rumorosi e l'integrazione di apprendimento semi-supervisionato o attivo per sfruttare set di dati parzialmente etichettati. Le sfide attuali includono la gestione dei bias, la spiegabilità dei modelli e l'ottimizzazione della generalizzazione.