Biblioteca Mario Rostoni - LIUC

Catalogo delle tesi di laurea

Facoltà: Ingegneria Gestionale - classe L-9
Collocazione: 19578

Autore: Lombardo Vincenzo
Data: 25/10/2021

Titolo: Le reti neurali a supporto dell'industria cinematografica: ottimizzazione della smart recommendation

Relatore: Mari Luca

Autorizzazione per la consultazione: NO
Le tesi si possono consultare unicamente in sede

Abstract

L’obiettivo di questo elaborato è utilizzare tecniche di machine learning, per la classificazione di immagini, applicate al mondo del cinema. Dato il periodo storico che stiamo attraversando, con l’inevitabile aumento di film e serie tv attualmente resi disponibili sulle piattaforme streaming (es. Netflix, PrimeVideo, Disney+), la scelta di cosa guardare diventa sempre più importante e la cosiddetta ‘smart recommendation’ costituisce un elemento fondamentale per l’esperienza di intrattenimento dello spettatore. Un grande problema che queste piattaforme si stanno trovando ad affrontare è dunque la modalità con cui consigliare ai clienti i titoli in base alle preferenze soggettive e il successivo miglioramento delle recommendation nel tempo. Le tecniche attuali infatti utilizzano la cronologia di visualizzazione dello spettatore e il rating fornito da altri clienti o da esperti del settore, questo però porta a risultati poco personalizzati perché la raccomandazione sarà riferita al film o alla serie tv più vista del momento e non al contenuto digitale più adatto al cliente. Sfruttando le potenzialità delle reti neurali, sarebbe possibile classificare, partendo da fotogrammi estratti opportunamente, tramite un codice Python, da trailer disponibili online, le inquadrature in opportune classi già stabilite. Tra le più utilizzate ricordiamo la figura intera, il mezzo busto, il primo piano e il primissimo piano. Nella prima parte del lavoro vengono introdotte le diverse tipologie di machine learning, con particolare attenzione all’architettura e alle principali funzioni delle reti neurali. Nei capitoli centrali si passa ad un necessario approfondimento sulle reti neurali convoluzionali (CCN) in quanto la rete utilizzata nell’analisi sperimentale, la VGG16, ne è un esempio. Il terzo capitolo introduce la classificazione, già nota, delle inquadrature cinematografiche più comuni, per delineare poi quali di esse, verranno utilizzate durante l’analisi. L'analisi sperimentale, descritta nel quarto capitolo, parte dalla creazione di un dataset che, come detto in precedenza, conterrà fotogrammi estratti da vari trailer di film noti. Tuttavia prima di essere mandato in input alla VGG16, esso dovrà seguire un iter di pre-processing, quale il cambio di aspect ratio a 16:9, utile a rendere l’immagine più leggibile dalla rete che richiede omogeneità in termini di dimensioni e formato. La classificazione automatica, essendo parte del Supervised Machine Learning, richiederà inoltre che i fotogrammi, considerati come parte integrante del dataset, una volta estratti, vengano opportunamente etichettati. Questo avverrà grazie ad un altro piccolo algoritmo scritto in Python. Se la bontà del modello risulterà sufficiente esso potrà essere utilizzato, in sinergia con altri algoritmi più complessi, in grado di riconoscere le soundtrack o i colori predominanti all’interno di una scena, per ottimizzare la funzione di smart recommendation. Le inquadrature contenute in un film infatti hanno tutte una loro funzione narrativa e spesso alcuni generi di film ne adoperano più frequentemente, durante le riprese, tipologie specifiche.

 
| Indice del sito della Biblioteca | Homepage del sito della Biblioteca