Învățarea supravegheată este o metodă fundamentală în inteligența artificială și învățarea automată, prin care un model este antrenat pe seturi de date etichetate. Fiecare intrare din setul de antrenament are asociată ieșirea așteptată (eticheta), permițând algoritmului să învețe să prezică sau să clasifice date noi. Această abordare se distinge de învățarea nesupravegheată (fără etichete) și de învățarea prin întărire (bazată pe recompense). Învățarea supravegheată implică optimizarea funcțiilor de pierdere, validarea încrucișată și gestionarea supraînvățării.
Cazuri de utilizare și exemple
Învățarea supravegheată este folosită la clasificarea imaginilor (recunoaștere facială, detecție de obiecte), detecția spamului, analiza sentimentului, recunoaștere vocală, previziuni de vânzări sau riscuri financiare, mentenanță predictivă. În sănătate, facilitează diagnosticarea bolilor pe baza imaginilor medicale; în finanțe, ajută la prezicerea riscurilor de neplată.
Principalele instrumente software, librării, framework-uri
Instrumente importante includ scikit-learn, TensorFlow, PyTorch, Keras, XGBoost și LightGBM. Acestea oferă o gamă largă de algoritmi (regresie liniară, păduri aleatoare, rețele neuronale, SVM) și funcționalități pentru evaluare și vizualizare.
Ultimele dezvoltări, evoluții și tendințe
Ultimele tendințe vizează automatizarea selecției modelelor (AutoML), creșterea robusteții la date zgomotoase și integrarea învățării semi-supervizate sau active pentru seturi de date parțial etichetate. Provocările actuale includ gestionarea biasului, explicabilitatea modelelor și optimizarea generalizării.