Come allenare un algoritmo di Machine Learning

Per l’allenamento di un algoritmo di Machine Learning sono necessarie diverse fasi durante le quali avremo la possibilità di raffinare sempre di più le performance del nostro agente.

Generalmente, partendo da un insieme di dati (dataset) organizzato secondo qualche criterio, si esegue una prima divisione in cui viene tenuta da parte una porzione di essi che verrà utilizzata in un secondo momento durante la fase di test dell’agente, nel tentativo di misurarne le performance reali.

Durante la fase di allenamento avremo però bisogno di dividere ulteriormente l’insieme di dati per permettere all’algoritmo di allenarsi non solo sulla base dei dati che già conosce, ma ponendosi già di fronte a dei dati mai visti dei quali conosciamo però già le caratteristiche che vogliamo fare in modo che l’agente impari, dunque le possiamo utilizzare come insieme di validazione per l’agente, che, attraverso esso, migliorerà le proprie performance durante la fase di allenamento stessa, senza aspettare di aver prima terminato tale fase per poter misurarne le performance.

Nota: nel caso in cui si abbia un insieme di dati non molto grande si può utilizzare la tecnica della cross validation.

In poche parole

‎‏‏‎ ‎‏‏‎✅ Per l’allenamento di un algoritmo si suddivide un dataset mantenendo una parte per il test finale. Durante l’allenamento, si divide ulteriormente il dataset (insieme di validazione) per permettere all’algoritmo di affrontare dati mai visti ma con caratteristiche già note che si desidera che l’agente impari. Per dataset piccoli si utilizza la cross validation per dividere il dataset.

Se hai trovato errori o informazioni mancanti scrivi a:
giacomo.dandria@esercizistem.com

Se hai trovato errori o informazioni mancanti scrivi a:
giacomo.dandria@esercizistem.com

Questa pagina è stata utile?
No
Torna in alto