🛡️ EU Fact Force

A shared hub for coordinated response to health misinformation

About

EU Fact Force is a collaborative platform developed by EUPHA (European Public Health Association) with support from Data For Good volunteers. The platform empowers public health professionals to counter health misinformation by:

Connecting scientific evidence with disinformation narratives
Visualizing knowledge graphs of research articles, claims, and concepts
Tracking disinformation trends through integration with PGP (The Public Good Projects) monitoring data
Enabling rapid response with validated counter-narratives

Use Case

Marie, a health communicator at a national public health association, sees a viral post claiming "vaccines cause autism." She needs to respond quickly with solid evidence.

She searches "vaccines autism" on EU Fact Force and immediately sees:

An interactive graph showing 15+ peer-reviewed articles that refute this claim

The scientific consensus: "Refuted with high confidence"

Current disinformation trends: 1,200 mentions this week, peak in France/Belgium

Key evidence to cite in her response

Time to find relevant evidence: <30 s

Key Features

V0 (Minimum Viable Product - Target: April 2026)

Semantic Search (FR/EN): Find relevant scientific articles even without exact keyword matches
Interactive Knowledge Graph: Explore connections between articles, claims, and narratives
Disinformation Trends: Visualize PGP monitoring data (volume, geography, examples)
Researcher Upload: Members can upload scientific articles with auto-extracted metadata
Multilingual: Interface and search in French and English
Access Control: Authentication system for EUPHA members

Scope V0

3 priority narratives (e.g., vaccines-autism, moderate alcohol benefits, COVID misinformation)
100-150 scientific articles from EJPH, WHO, ECDC, and other trusted sources
20-30 claims per narrative (confirmed/refuted/nuanced)
Integration with PGP data (weekly batch updates)

Contributing

Project structure

14_EUFactForce/
├── .github/
│   └── workflows/
│       ├── d4g-utils.yml
│       └── pre-commit.yaml
├── docs/
├── eu_fact_force/
│   ├── exploration/ # code to keep track of benchmarks
│   ├── ingestion/ # ingestion and indexing of documents
│   └── app/ # web app
├── tests/

Installation

Installation de Python

Ce projet utilise uv pour la gestion des dépendances Python. Il est préréquis pour l'installation de ce projet.

Une fois installé, il suffit de lancer la commande suivante pour installer la version de Python adéquate, créer un environnement virtuel et installer les dépendances du projet.

uv sync
uv run pre-commit install

Pour exécuter le pipeline d'ingestion avec parsing Docling, installez aussi les dépendances de parsing :

uv sync --group parsing

Pour exécuter l'étape d'embedding dans le pipeline d'ingestion :

le modèle utilisé est intfloat/multilingual-e5-base
sentence-transformers est requis (installé via uv sync)
prévoir plus de RAM/temps au premier chargement du modèle

A l'usage, si vous utilisez VSCode, l'environnement virtuel sera automatiquement activé lorsque vous ouvrirez le projet. Sinon, il suffit de l'activer manuellement avec la commande suivante :

source .venv/bin/activate

Tests et formattage

Installer les precommit

uv run pre-commit run --all-files

Utiliser pytest pour tester votre code

uv run pytest

Déploiement de l'application

L'application se compose d'un serveur Django, d'une base PostgreSQL (avec pgvector) et de RustFS pour le stockage S3 (compatible AWS), avec une interface web pour déposer des fichiers manuellement. Pour déployer et utiliser l'application en local :

1. Prérequis

Python 3.12+ et uv
Docker et Docker Compose (pour Postgres et RustFS)

2. Variables d'environnement

Copiez le fichier d'exemple et adaptez les valeurs si besoin :

cp .env.template .env

Pour un usage local avec les services Docker, les valeurs par défaut de .env.template (notamment DATABASE_URL=postgresql://eu_fact_force:eu_fact_force@localhost:5432/eu_fact_force) conviennent.

3. Lancer les services (Postgres et RustFS)

À la racine du projet :

docker compose up -d

Cela démarre PostgreSQL (port 5432) et RustFS (API S3 sur le port 9000). Le bucket configuré est créé automatiquement au premier démarrage. Interface web RustFS : http://localhost:9001 — identifiants S3 (Access Key / Secret Key) : ceux définis dans .env (par défaut minioadmin). Vous pouvez y créer des buckets, des dossiers et déposer des fichiers manuellement.

4. Installer les dépendances et appliquer les migrations

uv sync
uv run python manage.py migrate

5. (Optionnel) Créer un superutilisateur

Pour accéder à l'interface d'administration Django :

uv run python manage.py createsuperuser

6. Démarrer le serveur Django

uv run python manage.py runserver

L'application est alors disponible sur http://127.0.0.1:8000/. L'admin Django est accessible à http://127.0.0.1:8000/admin/ si un superutilisateur a été créé.

Utilisation du stockage S3 en local

Avec docker compose, l’app est configurée pour utiliser RustFS. Pour lancer Django au host (sans conteneur app) et pointer vers RustFS, décommentez dans .env les variables S3 (voir .env.template) et définissez par exemple :

AWS_S3_ENDPOINT_URL=http://localhost:9000
AWS_ACCESS_KEY_ID=minioadmin
AWS_SECRET_ACCESS_KEY=minioadmin
AWS_STORAGE_BUCKET_NAME=eu-fact-force-files
AWS_S3_REGION_NAME=eu-west-1

Sans ces variables, l’application utilise le stockage fichier local par défaut.

Test de performance

Le projet propose un ensemble de documents relatifs aux liens entre les vaccins et l'autisme. Ces documents vont permettre de tester de bout en bout la pipeline :

parsing des pdf,
extraction des chunks,
vectorisation des chuncks,
mécanisme de recherche.

Puisque tous les documents ne sont pas nécessairement facilement accessible via les API, les documents et les metadata sont réunis dans un archive (puis un S3 dans un second temps). L'archive contient :

la liste des paragraphes les plus pertinents à extraire dans le json vaccins_annotated.json,
les fichiers pdf,
un fichier json par pdf contenant les métadonnées.

Le fichier json contient la structure suivante :

{
    "tags_pubmed": [
        "tag1",
        "tag2",
        "tag3"
    ],
    "title" : "Title",
    "category" : "category",
    "type" : "type",
    "journal": "journal",
    "authors" : ["first author", "seocond author"],
    "year": 2022,
    "url" : "http",
    "doi" : "test_doi"
}

Name		Name	Last commit message	Last commit date
Latest commit History 177 Commits
.github/workflows		.github/workflows
docker		docker
docs		docs
eu_fact_force		eu_fact_force
tests		tests
.dockerignore		.dockerignore
.env.template		.env.template
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml
manage.py		manage.py
pyproject.toml		pyproject.toml
tox.ini		tox.ini
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🛡️ EU Fact Force

Table of Contents

About

Use Case

Key Features

V0 (Minimum Viable Product - Target: April 2026)

Scope V0

Contributing

Project structure

Installation

Tests et formattage

Déploiement de l'application

Test de performance

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🛡️ EU Fact Force

Table of Contents

About

Use Case

Key Features

V0 (Minimum Viable Product - Target: April 2026)

Scope V0

Contributing

Project structure

Installation

Tests et formattage

Déploiement de l'application

Test de performance

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages