Indices auditifs et modèles pour la localisation binaurale

Télécharger le fichier original (Mémoire de fin d'études) Indices auditifs et modèles pour la localisation binaurale La localisation binaurale consiste à déterminer l’origine spatiale de sources so-nores à partir d’une analyse du flux audio perçu par un récepteur binaural. Chez...

Variational Autoencoders with Gaussian Mixture Prior for Recommender Systems

In an era when more content is available electronically every day, it has become harder for consumers to find interesting media such as books, movies, TV shows, songs and textual information. The shear volume of information is overwhelming and provides...

The Proposed Approach – A Synthetic plus Variational Model

Still-to-Video Face Recognition Systems In a still-to-video FR scenario, there is typically one or more still image(s) to enroll an individual to the system while a set of video frames is available for recognition. Given one or few reference still...

Low-rank and gradient histogram preserving model

Image denoising Removing noise from images is an essential pre-processing step to many image analysis applications. The problem of image denoising can be defined formally as recovering the original image x from its noisy observation y = x + n,...

SPECTROSCOPIE ET CARACTERISATION DE MATERIAUX

Télécharger le fichier original (Mémoire de fin d'études) Banque d’images Dans le domaine ferroviaire et en particulier à la SNCF, il n’existait pas de données pour l’analyse d’images dans le but d’en déduire un coefficient d’adhérence. Le cas d’emploi n’ayant...

Découverte d’unités linguistiques à l’aide de méthodes d’apprentissage non supervisé

Découverte d’unités linguistiques à l’aide de méthodes d’apprentissage non supervisé Modélisation supervisée d’unités linguistiques de parole Plusieurs niveaux peuvent être concernés dans une tâche de modélisation d’unités linguistiques de parole : la phrase, le mot et les unités sous-lexicales (comme...

Structuration de l’information parlée

Structuration de l’information parlée La chaîne de structuration Speeral  Le système de structuration de parole du LIA effectue la transcription du contenu parlé d’un document audio et génère une segmentation en locuteurs tout en étiquetant les zones de silence et...

Analyse de la confusion introduite par les paramètres acoustiques

Les modèles acoustiques : modèles de Markov cachés Les modèles acoustiques sont des modèles stochastiques qui sont utilisés conjointement à un modèle de langage afin de prendre des décisions quant-à la suite de mots contenue dans la phrase. Le rôle...

Interpretability and disentanglement

 Problem statement and motivation An unsupervised representation for speech, i.e., one that could be trained directly with large amounts of unlabelled speech recordings, and could disentangle the main factors underlying speech variability, would have a major impact on many speech...

Bandwidth Extension Techniques of Bone Conducted Speech

Originating from bone and tissue conduction, the quality of BC speech must be enhanced by artificially extending its frequency bandwidth int the higher frequencies (2-4 kHz). There are many different techniques that could be used to extend the bandwidth of...