Il y a peu, une idée un peu folle m’est venue : récupérer les paroles de chansons d’artistes mondialement connus afin de travailler sur le NLP (Natural Language Processing) et ainsi utiliser les techniques de « bag of words », « keyword extraction » et en tirer des analyses.
Par exemple :
- Quelles sont les thématiques récurrentes dans les chansons d’Eminem ? de Brassens ? etc.
- Quelles thématiques étaient abordées dans le ‘genre’ hip-hop dans les années 90 ?
- Les chansons des années 90 comportaient-elles plus de texte qu’en 2020 ?
Autant d’analyses possibles en passant par le « Data Cleaning » et l’EDA (Exploratory Data Analysis)
Afin de rendre accessible mon travail et ainsi donner du « blé à moudre » aux data-analystes du monde entier,
je vous mets en lien ci-dessous le dossier comportant les fichiers au format .csv comportant les noms de chaque artiste :