Return to site

Reconnaissance de noms d’artistes dans des corpus faiblement annotés

par Gabriel Bellard - Master AIC Recherche en Informatique - Université Paris Sud

Résumé :

Le mémoire donne une approche permettant de répondre à la problématique suivante :

Des ensembles de données faiblement et semi-annotés peuvent-ils permettre de reconnaître des noms d'artistes dans des textes variés ?

Nous utilisons des méthodes d'apprentissage automatique et de traitement automatique du langage naturel pour créer des algorithmes permettant de reconnaître des noms d'artistes dans des textes.

Reconnaître les noms d’artistes pourrait permettre de retrouver les artistes similaires par leur occurrences proches dans un texte. Les critiques d’albums, les biographies musicales, les messages postés sur les réseaux sociaux sont des données du domaine musical peu exploitées quand il s’agit de recommandation de musique alors que la quantité de ces données est immense sur internet.
Dans ce mémoire nous présentons les démarches qui ont permis d’exploiter ces données pour construire plusieurs nouveaux corpus semi et faiblement annotés sur des données hétérogènes et variées en terme de leur expression écrite, de vocabulaire et de style linguistique.

Buzzwords :

Apprentissage automatique #traitement automatique du langage naturel #réseaux de neurones #musique #corpus

En savoir plus sur Gabriel Bellard :

Gabriel Bellard est actuellement Data Scientist dans la start-up innovante MyPassPro. Il travaille sur des problématiques toujours liées au texte pour lesquelles je dois générer des textes courts pour être écrits sur les réseaux sociaux.

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly