Evitare incidenti giocando ai videogiochi

Evitare incidenti giocando ai videogiochi

Una guida completamente autonoma non è ancora realtà. Per ottenere un livello di guida che sia autonomia e sicuro, abbiamo bisogno di un enorme numero di immagini catturate durante la guida.Per di più, ogni frame catturato richiede circa un’ora di lavoro umano per essere etichettato. Una possibile soluzione per la raccolta dei dati può essere quella di usare dei simulatori che producano dati sintetici e già pre-etichettati.

Usiamo le Generative Adversarial Network per allineare i dati sintetici a quelli reali.

Perché abbiamo bisogno di questi dati?
Questi dati vengono utilizzati per addestrare reti neurali a riconoscere tutti gli elementi catturati da una camera installata sulla macchina (pedoni, segnali stradali, semafori). Questo processo è chiamato Segmentazione Semantica.

 

Demo video di ICNet sul dataset “cityscapes”

Perché abbiamo bisogno di allineare dati reali e sintetici?

Questi dati possono essere molto differenti tra loro: a livello di pixel i colori, i riflessi, la luminosità possono variare drasticamente. Questo problema è chiamato Domain Shift e rende inaccurata la rete addestrata. La situazione è simile a quando un professore assegna degli esercizi di preparazione all’esame ma poi quel giorno trovi delle domande completamente diverse. Nonostante i buoni risultati ottenuti durante gli studi, non sarai in grado di passare l’esame. Quello che vogliamo è addestrare un modello con dati provienti da una distribuzione sorgente (immagini sintetiche) che è differente da quella in cui la rete agirà (dati del mondo reale).

 

Fonte: Multi-Layer domain adaptation method for rolling bearing fault diagnosis

 

Come allineiamo i dati reali a quelli sintetici?

Ai giorni nostri, molte proposte di soluzione della domain adaptation propongono l’udo di Generative Adversarial Networks (GANs), uno degli argomenti caldi nel modno dell’ Intelligenza Artificiale. Questi vengono considerati:
“L’idea più interessante degli ultimi 10 anni di machine learning”
by Y. Le Cun, (one of the fathers of Deep Learning)

Il nostro esperimento

Noi abbiamo ridotto il domain shift applicando lo stile delle immagini reali a quello delle immagini sintetiche. Abbiamo usato una particolare versione di GAN chiamata Cycle-GAN. In questo modo, siamo riusciti a ridurre il domain shift del 20%.

Conclusioni

Abbiamo effettuato anche altri esperimenti come l’ adversarial training o l’aggiunta di task self-supervised. Puoi trovare ulteriori dettagli nel nostro articolo completo, accessile qui:
https://medium.com/analytics-vidhya/preventing-fatalities-by-playing-video-games-part-1-4948d1da390