Sabato, 28 gennaio 2023 - ore 12.05

Campus Poli CR LAUREA MAGISTRALE IN MUSIC AND ACOUSTIC ENGINEERING SESSIONE DI LAUREA

Mercoledì 21 dicembre, a partire dalle ore 13:30 nell’Aula Magna Maffezzoni, sessione di Laurea Magistrale nel Campus di Cremona del Politecnico di Milano.

| Scritto da Redazione
Campus Poli  CR LAUREA MAGISTRALE IN MUSIC AND ACOUSTIC ENGINEERING SESSIONE DI LAUREA

Campus Poli  CR LAUREA MAGISTRALE IN MUSIC AND ACOUSTIC ENGINEERING SESSIONE DI LAUREA

 Mercoledì 21 dicembre, a partire dalle ore 13:30 nell’Aula Magna Maffezzoni, sessione di Laurea Magistrale nel Campus di Cremona del Politecnico di Milano.

Saranno 6 gli studenti che completeranno il loro percorso con la discussione di laurea e raggiungeranno un ambito traguardo: la Laurea Magistrale in Music and Acoustic Engineering, prima ed unica in Italia interamente dedicata all’ingegneria della musica e dell’acustica. La proclamazione è prevista alle ore 16:45.

 Dei laureandi di questa sessione, cinque hanno scelto di approfondire la loro preparazione in tema di informatica musicale ed elaborazione del suono, mentre uno si è concentrato sull’acustica.

 Nata nella Città di Stradivari grazie al sostegno del territorio, in particolare della Fondazione Arvedi Buschini e del Comune di Cremona, questa Laurea Magistrale è attrattiva non solo per gli universitari italiani ma anche per i laureati internazionali provenienti da diversi Paesi Extra Ue, con una formazione sia ingegneristica che musicale.

 Il Campus di Cremona può vantare infatti un percorso estremamente innovativo che prevede la collaborazione con la Facoltà di Musicologia dell’Università degli Studi di Pavia e del Conservatorio di Milano e la presenza di un Laboratorio di Acustica Musicale, dotato di una camera anecoica, dedicato allo sviluppo di tecnologie avanzate per il miglioramento della tradizione liutaria e di metodologie sistematiche per la valutazione quantitativa delle caratteristiche fisiche e acustiche degli strumenti di liuteria. Due sono gli orientamenti tra cui gli interessati possono scegliere: Acoustic Engineering per chi vuole approfondire il tema dell’acustica musicale e Music Engineering per chi invece vuole focalizzarsi sullo studio dell’informatica musicale e l’elaborazione del suono.

 Gli interessati ad iscriversi a questo Corso di Laurea Magistrale potranno presentare richiesta di ammissione dal 9 gennaio al 18 febbraio 2023; per chi riceverà una valutazione positiva le immatricolazioni chiuderanno il 1° marzo 2023.

 Per ulteriori informazioni sul corso è possibile consultare il sito https://suono.polimi.it/, mentre maggiori dettagli sulla procedura di ammissione sono disponibili sul sito https://www.poliorientami.polimi.it/come-si-accede/ammissione-ai-corsi-di-laurea-magistrale-architettura-design-ingegneria/.

 Segue l’elenco dei laureandi con il titolo della tesi e l’abstract:

 CAZZANIGA SIMONE SHAWN

Titolo tesi: An Online Teaching Approach to Computer Architecture

Abstract

La letteratura evidenzia una generale correlazione negativa tra il numero di studenti di una classe e l'efficacia della retenzione dei concetti durante lezioni frontali tradizionali. Al tempo stesso l'uso di strumenti quali simulatori visuali è stato dimostrato essere utile per migliorare l'apprendimento, se inseriti in contesti adeguati e usati {in modo attivo} dagli studenti.

In primo luogo la tesi espone lo stato dell'arte nel campo del software di simulazione visuale per uso didattico e cognitivo, con particolare attenzione per i simulatori microarchitetturali di calcolatori, e propone un'analisi dei requisiti del software di simulazione ideale. Il nocciolo della tesi è un insieme coerente di attività autonome per la promozione di apprendimento attivo attraverso l'uso di simulazione visuale in un contesto online, basato su solidi principi tecnologici e cognitivi dalla letteratura. L'argomento migliore per tale attività è stato trovato nel pipelining architetturale, in quanto fornisce un caso ragionevolmente avanzato ma comunque accessibile di argomento che spesso genera complesse spiegazioni ed esercizi ripetitivi, i quali spesso incidono sulla possibilità per gli studenti di afferrarne gli aspetti principali, quali il suo parallelismo intrinseco. In ultimo, la tesi propone un design per un sistema di valutazione per tale classe di esperimenti didattici.

 COPPOLA ANDREA

Titolo tesi: Real-Time Pitch Shifting Techniques for Monophonic Voice Signals

Abstract

Il pitch shifting di segnali audio è una tecnica molto diffusa nell’industria della produzione musicale: dalla correzione delle performance artistiche all’uso creativo per l’armonizzazione di strumenti musicali. Applicare pitch shifting su segnali vocali senza accorgimenti può produrre risultati che suonano innaturali. La voce umana può essere rappresentata come una sorgente sonora, originante dalle corde vocali, che viene filtrata dal tratto vocale. Le risonanze acustiche del tratto vocale causano la generazione di componenti armoniche nel segnale di voce, chiamate formanti. Per ottenere un algoritmo di pitch shifting che suoni naturale sulla voce, è necessario trovare strategie che permettano di modificare il contenuto in frequenza della sorgente senza influenzare quello delle formanti. Desideriamo offrire questi metodi in un prodotto per figure creative e professionali perciò è fondamentale assicurarsi che tali algoritmi funzionino efficientemente in tempo reale. Dunque, questa tesi propone due metodi che affrontano il problema di restauro delle formanti durante un'operazione di pitch shifting. Il primo, basato sull'algoritmo di Glottal Flow Model Iterative Adaptive Inverse Filtering, usa stime di filtri che approssimano gli effetti prodotti dal tratto vocale. Il secondo, invece, è basato sull'algoritmo di Pitch Synchronous Formants Shifting e permette il movimento delle formanti indipendentemente dal pitch. Ciò permette di riposizionare le formanti nella loro posizione originaria in seguito a una operazione di pitch shifting. La qualità degli algoritmi è stata valutata tramite un test percettivo. Questo test dimostrerà come gli algoritmi proposti siano capaci di produrre risultati che sono comparabili con altri prodotti standard di mercato per il pitch shifting della voce.

 GOBBATO LUCA

Titolo tesi: A Wave Digital Hierarchical Quasi-Newton Method for Virtual Analog Modeling

Abstract

Un nuovo metodo, basato su un risolutore Newton-Raphson (NR) nel dominio dei Filtri Digitali ad Onda Numerica (Wave Digital), è stato recentemente proposto per l'emulazione digitale di circuiti analogici. Tale metodo sfrutta un risolutore NR globale per la risoluzione di strutture Wave Digital costituite da una sola giunzione. L'obiettivo di questo lavoro di tesi è estendere l'applicabilità dello stesso risolutore a strutture gerarchiche costituite da molteplici giunzioni, organizzate in strutture ad albero. Inizialmente dimostriamo come sia possibile risolvere anche queste strutture con un risolutore globale di tipo NR. Successivamente dimostriamo come sia necessario ricondursi a metodi Quasi-Newton per poter applicare in maniera modulare risolutori locali iterativi a tutte le giunzioni costituenti la struttura ad albero. Infatti, studiando il risolutore globale introdotto, si dimostra come, per poter suddividere la computazione nei diversi livelli della struttura gerarchica, sia necessario introdurre delle approssimazioni, rientrando quindi nella classe dei metodi Quasi-Newton. In questo lavoro proponiamo inoltre l'utilizzo di porte vettoriali per scomporre la topologia, evitando cicli privi di elementi di ritardo che potrebbero comparire in circuiti con un alto grado di interconnessioni. Dopo aver presentato e testato diverse approssimazioni Quasi-Newton, il metodo proposto è stato utilizzato con successo per l'emulazione di una sezione di un sintetizzatore analogico, ottenendo una velocità di convergenza maggiore rispetto a metodi al punto fisso in termini di numero di iterazioni medio.

 LONGO GIACOMO

Titolo tesi: Influence of thickness profile in archtop guitars

Abstract

Nel mondo della produzione di strumenti musicali ci sono molti aspetti che non hanno ancora una chiara spiegazione. Negli ultimi decenni sono stati svolti diversi studi nell'ambito dell'acustica musicale, la maggior parte dei quali si è concentrata su strumenti tradizionali come il violino e la chitarra classica. In questi studi si analizza lo strumento tramite la caratterizzazione della sua risposta vibrazionale. Nel caratterizzare la risposta si cerca anche di individuare l'effetto che le diverse caratteristiche dello strumento hanno su di essa. In letteratura sono infatti presenti diversi studi che indagano l'effetto di caratteristiche come la geometria dello strumento, la vernice usata per la finitura o le proprietà meccaniche dei materiali. In questa tesi ci siamo occupati dello studio della chitarra archtop. Questo strumento viene inventato a fine Ottocento e prende le caratteristiche della chitarra classica e acustica, ad eccezione della tavola armonica e della tavola posteriore che non sono piatte ma ereditano dal violino la curvatura. Nella letteratura scientifica si possono trovare solo pochi studi riguardanti questo strumento. Lo scopo di questa tesi è quindi quello di approfondire la conoscenza dello strumento indagando in particolare l'influenza che lo spessore della tavola armonica ha sulla risposta meccanica e acustica del corpo della chitarra. Per fare ciò abbiamo costruito un modello 3D del corpo di una chitarra archtop in cui è possibile variare parametricamente il profilo di spessore della tavola armonica. Abbiamo quindi simulato il comportamento dei modelli ottenuti tramite un'analisi che ha sfruttato una metodologia a elementi finiti. Nelle simulazioni abbiamo condotto due studi: il primo consiste in un'analisi modale, mentre il secondo è stato svolto nel dominio delle frequenze caratterizzando l'ammettenza al ponte e la pressione sonora radiata. Questo lavoro vuole porsi come un progresso nella ricerca volta alla predizione dell'effetto che una scelta progettuale, come la scelta dello spessore della tavola armonica, ha sul comportamento vibratorio dello strumento e, in modo ancor più rilevante, sulla sua risposta sonora.

 MAVER FEDERICO

Titolo tesi: Real-time multimicrophone speaker separation for the automotive scenario, using a lightweight convolutional neural network.

Abstract

Negli ultimi anni, è costantemente aumentato l’interesse nei confronti di dispositivi che comprendono assistenti vocali personalizzati (IPA), i quali permettono all’utente di compiere numerose azioni per mezzo dell’interazione vocale. Questo tipo di tecnologia è stata implementata in diversi dispositivi, incluse le automobili; il settore automobilistico, in particolare, sta cercando di rendere fruibile un’esperienza di assistente vocale personalizzato e indipendente per ogni passeggero. Tuttavia, per poter funzionare correttamente, gli assistenti vocali, o più in generale tutti i dispositivi con interazione vocale (VUI), devono poter funzionare anche in condizioni audio difficili come quelle di un abitacolo, dove il segnale pulito della voce viene degradato dal rumore, dal riverbero e da altri parlatori; per questo sono richieste tecniche di separazione vocale. Diverse soluzioni sono state proposte in letteratura per affrontare quello che viene chiamato cocktail party problem, usando uno o più microfoni. Le soluzioni multimicrofono sono di particolare interesse poiché possono usufruire di informazioni spaziali per fare separazione, e recentemente sono state migliorate, grazie all’aumento di interesse nel deep learning (DL). Sfortunatamente, sono in genere molto sensibili al posizionamento e alle distanze fra i microfoni. In questo lavoro affrontiamo la separazione vocale multicanale proponendo due metodi causali e performanti basati su una deep neural network (DNN), che possano adattarsi a diverse condizioni di posizionamento e distanze fra i microfoni: il primo, che chiamiamo Doradus, è basato su una rete di tipo U-Net composta da layers convoluzionali e causali; il secondo, chiamato Gemini, condivide lo stesso tipo di struttura ma riduce il numero di parametri e la complessità computazionale grazie a layers convoluzionali separabili. Testiamo inoltre come i modelli proposti rispondono a diverse condizioni, variando il numero dei parlatori, le dimensioni delle stanze, i posizionamenti e le distanze fra microfoni e i livelli di rumore. I risultati sono comparati a soluzioni esistenti, dimostrando in media una migliore performance e una certa robustezza, specialmente ad elevate distanze tra i microfoni.

 TORELLI LUCA

Titolo tesi: Singing voice fingerprint: a study on the adaptation of speaker recognition deep learning models to the singing register

Abstract

Man mano che i sistemi di intelligenza artificiale diventano sempre più diffusi e accessibili al pubblico, contribuendo in maniera sostanziale ad ogni aspetto della nostra vita quotidiana, un'area di crescente interesse per ricercatori e sviluppatori è rappresentata dalle attività relative alla voce. A causa della sua natura pervasiva, gli avanzamenti nel campo del riconoscimento vocale hanno innescato lo sviluppo delle più diverse applicazioni e tecnologie. Tuttavia, nonostante un'eccezionale mole di ricerca dedicata allo studio della quasi totalità degli aspetti relativi al parlato, meno sforzi sono stati fatti finora riguardo l'affermazione di metodi efficaci per l'identificazione della voce cantata. Questo lavoro si pone l'obiettivo di contribuire alla ricerca sul riconoscimento della voce proponendo una pipeline per l'identificazione degli artisti che si concentra sulle caratteristiche vocali nel registro canoro. I pochi riferimenti in letteratura che riguardano soluzioni di deep learning per questo specifico problema testimoniano la maggior complessità nel riconoscimento della voce cantata rispetto allo stesso nel registro del parlato. Ciò si deve principalmente alla maggiore ricchezza vocale naturalmente esibita dalla voce umana quando impiegata nel contesto di performance artistiche. Il più ampio range di frequenze, i rapidi cambi di ritmo e tonalità, così come l'incredibile varietà di tecniche e stili vocali di cui godiamo quando ascoltiamo la loro musica, concorrono infatti nel rendere l'identificazione dei cantanti un compito piuttosto difficoltoso per un ascoltatore artificiale. L'approccio proposto coinvolge lo sfruttamento di diffusi modelli di speaker embedding, allenati cioè su voce parlata, assumendo che costituiscano una base solida per lo sviluppo di un sistema di singer identification. Questi modelli pre-allenati sono quindi stati sottoposti a test e ad un fine-tuning su dati di voce cantata, riscontrando infine un aumento nell'accuratezza pari all'8% dopo il processo di affinazione. Questo lavoro rappresenta il prodotto di un periodo di tirocinio circa i metodi di fingerprinting della voce cantata offerto da Musixmatch S.p.A., azienda leader nel campo dei music data e proprietaria del più grande catalogo di testi musicali al mondo.

442 visite

Articoli correlati

Petizioni online
Sondaggi online