• Page d’accueil
  • Portfolio-projets
  • articles
  • Qui Suis-je ?
  • Suivez-moi sur

    Facebook Pagelike Widget
  • Page d’accueil
  • Portfolio-projets
  • articles
  • Qui Suis-je ?

Il y a peu, une idée un peu folle m’est venue : récupérer les paroles de chansons d’artistes mondialement connus afin de travailler sur le NLP (Natural Language Processing) et ainsi utiliser les techniques de « bag of words », « keyword extraction » et en tirer des analyses.

Par exemple :

  • Quelles sont les thématiques récurrentes dans les chansons d’Eminem ? de Brassens ? etc.
  • Quelles thématiques étaient abordées dans le ‘genre’ hip-hop dans les années 90 ?
  • Les chansons des années 90 comportaient-elles plus de texte qu’en 2020 ?

Autant d’analyses possibles en passant par le « Data Cleaning » et  l’EDA (Exploratory Data Analysis)

 



 

Afin de rendre accessible mon travail et ainsi donner du « blé à moudre » aux data-analystes du monde entier,

je vous mets en lien ci-dessous le dossier comportant les fichiers au format .csv comportant les noms de chaque artiste :

Databricks

 

 

 

 

BeautifulSoupdata cleaningEDANLPpythonRegexweb scraping

  • Share On Facebook
  • Tweet It


Michael Tirat



You might also like
Custom Snippet : automatisez vos routines de code sur VScode
juin 13, 2024
Injecter du html dans votre rapport Power BI
juin 10, 2024
Librairie Python ‘Random’ : aléatoire or not aléatoire ?
mai 31, 2024

  • Catégories

    • Base de données (1)
    • Data visualisation (1)
    • dataviz python (1)
    • pandas (1)
    • Power BI (2)
    • Projets (1)
    • Python (9)
    • SQL (3)
    • Tips (5)
    • web scraping (2)
  • Mots clé

    aleatoire astuce automatisation base de données BeautifulSoup carte choroplèthe dashboard data cleaning data visualisation dataviz départements EDA folium geospatial jupyter notebook NLP notebook pandas pivot plotly power BI python random Regex snippet SQL tableau de bord tips vscode web scraping





  • Connectons-nous !

    • github
    • linkedin

© Copyright Michaël Tirat 2024 - Data Analyst