ST4-SFJO24

Problématique :

L’e-réputation du premier ministre anglais Boris Jonhson : Comment le retour autour du scandale du "partygate" affecte les avis de internautes vis-à-vis de Boris Johnson sur Twitter ?

Cadre : ST4 DATA WEB

Groupe 4 :

NADALIN Marius
GARRIGUE Clément
DE LABOULAYE Bertrand
KACHA Lotfi
FRATTAROLI Martin

Objectif :

Quantifier, interpréter et visualiser l'impact du scandale du "partygate" sur l'e-réputation de Boris Jonhson.

Il s'agira de réaliser un scraping de données sur Twitter, d'analyser les sentiments (positif, négatif ou neutre) dans les tweets avant et après le vote de confiance au Royaume-Uni.

Outils Principaux :

Python
API.2 de Twitter ( scraping )
Base de donnée SQLite ( stockage des tweets )
Scikit-Learn ( apprentissage et mise en place d'un classifieur : arbre de décision )
Seaborn ( dataviz )

Utilisation :

0 ) Création de la base de donnée SQL et entrainement de l'arbre de décision :

Lancer le programme .\SQL_DB\sql_create.py

Depuis le programme tree_classifier.py : regenerate_classifier(csv_path = '.\csv\db_apprentissage.csv',filename = 'tree_classifier.sav')

1 ) Scrapping et remplissage de la base de donnée SQL:

Depuis le programme scraper.py : scrapping("Boris Johnson")

2 ) Scoring via le classifieur arbre de décision :

Depuis le programme scoring.py : score_database()

3 ) Scoring via Sentiwordnet :

Implémentation sur un Collab, non présent sur ce git Lien vers le Colab : https://colab.research.google.com/drive/1NdyFAIwuAchZHgBu5Dg8s0VP2q4hs1J9?usp=sharing

4 ) Visualisation des données :

Depuis le programme dataviz.py :

db = STDB.db_to_dataframe() db_senti = STDB.db_to_dataframe_sentiwordnet()

chart_bar_count(db) chart_bar_percent(db) chart_pie(db)

chart_bar_count_senti(db_senti) chart_bar_percent_senti(db_senti) chart_pie_senti(db_senti)

Name		Name	Last commit message	Last commit date
Latest commit History 119 Commits
SQL_DB		SQL_DB
__pycache__		__pycache__
chart		chart
csv		csv
raw_text		raw_text
utils		utils
.gitignore		.gitignore
README.md		README.md
classify.py		classify.py
create_vocabulary.py		create_vocabulary.py
credentials.py		credentials.py
dataviz.py		dataviz.py
scoring.py		scoring.py
scraper.py		scraper.py
tree_classifier.py		tree_classifier.py
tree_classifier.sav		tree_classifier.sav
twitter_connection_setup.py		twitter_connection_setup.py
vocabulary_dic.json		vocabulary_dic.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ST4-SFJO24

Objectif :

Utilisation :

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ST4-SFJO24

Objectif :

Utilisation :

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages