Fix/improve default search json by ThomGram · Pull Request #51 · dataforgoodfr/14_EUFactForce

ThomGram · 2026-04-13T13:27:03Z

Améliorer le json hardcodé pour le front graphe

Petite PR pour améliorer ingestion/data_collection/default_search.json

Ce nouveau json contient des chunks et les metadata associées provenant de papiers du kdrive portant sur les vaccins. Certains chunks ne sont pas très parlant on pourrait les modifier mais ça reflète ce que renverrait le backend.

J'ai gardé la nomenclature documentée dans la doc

…stic. Used real documents and chunks. Webpage is made up.

…e - see outline for details.

cgoudet

Juste une histoire de typage mais ok sinon

cgoudet · 2026-04-13T13:50:06Z

-            "title": "...",
-            "date": "...",
-            "journal": "...",
+        "5": {


Je dirais que les id doivent être des entiers pour correspondre à l'id de la base de données.

Si je ne me trompe pas, dans ce cas, il faudrait modifier la structure de la réponse, on ne peut pas mettre un int en key

Je sais pas si cela peut vous aider mais actuellement le front utilise ce fichier.

Bonsoir,

Pour info, comme je vais utiliser ce fichier pour côté front graph, pour tester j'ai pris le contenu du fichier de Thomas (déjà merci à lui pour cette version json) et j'ai remplacé avec le contenu du fichier que front utilise actuellement.(sans aucun autre changement et sur mon local)

J'ai une key error pour id 5, il ne voulait pas en int. Quand je les ai changé avec "5", il a accepté. Je crois que je dois changer le code app graph pour qu'il accepte les integer mais il les converti en string pour utiliser.

J'ai eu aussi un autre error KeyError: 'keywords'. Parce que dans fichier actuel, tous les chunks ont les keywords. Mais dans le fichier de cette PR les keywords sont dans la partie documents.

Pour l'instant je découvre le code de la partie dash app graph, donc je ne sais pas lequel est mieux. Mais dans le doc aussi les chunks ont des keywords.

Et j'ai une question ici, est-ce que tous les metadatas doivent être présents dans les chunks? Ou on doit modifier le code de app graph pour qu'il accepte même si tous ne sont pas dans les json des chunks ?

Merci pour tes commentaires. Concernant le key error, il me semble que pour un json le key doit être un string. Pour les keywords, je les garderais au niveau des documents, histoire de ne pas les répéter pour chaque chunk. Pour la dernière question, on peut imaginer que certaines metadata peuvent manquer. Il faut décider de ce qui est bloquant ou non. J'en discuterais plutôt sur mattermost au cas où afin d'avoir l'avis de tout le monde.

Oui, je parlais de document_id = 5, cette partie a donné une error chez moi. J'ai du changé comme document_id = "5" .

Ok on garde les keys en string puisque json oblige. Par contre, comme tu as fait, on maintient aussi int dans le document_id du chunk pour la cohérence.

cgoudet

LGTM

ThomGram added 2 commits April 13, 2026 14:44

Modified default_serach.json so the palce holder output is more reali…

102ad5c

…stic. Used real documents and chunks. Webpage is made up.

Modified default_search.json to follow response expected in V1 exampl…

ae35971

…e - see outline for details.

cgoudet approved these changes Apr 13, 2026

View reviewed changes

cgoudet and others added 2 commits April 14, 2026 14:15

Merge branch 'main' into fix/improve_default_search_json

2ab11aa

Add -theme- to narravite

83a30fa

cgoudet approved these changes Apr 16, 2026

View reviewed changes

cgoudet merged commit 2b07e5d into main Apr 16, 2026
1 check passed

cgoudet deleted the fix/improve_default_search_json branch April 16, 2026 06:41

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix/improve default search json#51

Fix/improve default search json#51
cgoudet merged 4 commits intomainfrom
fix/improve_default_search_json

ThomGram commented Apr 13, 2026 •

edited

Loading

Uh oh!

cgoudet left a comment

Uh oh!

cgoudet Apr 13, 2026

Uh oh!

ThomGram Apr 13, 2026

Uh oh!

githubzey Apr 13, 2026

Uh oh!

githubzey Apr 13, 2026 •

edited

Loading

Uh oh!

ThomGram Apr 14, 2026

Uh oh!

githubzey Apr 14, 2026

Uh oh!

cgoudet Apr 14, 2026

Uh oh!

cgoudet left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

ThomGram commented Apr 13, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Améliorer le json hardcodé pour le front graphe

Uh oh!

cgoudet left a comment

Choose a reason for hiding this comment

Uh oh!

cgoudet Apr 13, 2026

Choose a reason for hiding this comment

Uh oh!

ThomGram Apr 13, 2026

Choose a reason for hiding this comment

Uh oh!

githubzey Apr 13, 2026

Choose a reason for hiding this comment

Uh oh!

githubzey Apr 13, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

ThomGram Apr 14, 2026

Choose a reason for hiding this comment

Uh oh!

githubzey Apr 14, 2026

Choose a reason for hiding this comment

Uh oh!

cgoudet Apr 14, 2026

Choose a reason for hiding this comment

Uh oh!

cgoudet left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

ThomGram commented Apr 13, 2026 •

edited

Loading

githubzey Apr 13, 2026 •

edited

Loading