# 1. Installeer uv (zie https://docs.astral.sh/uv/getting-started/installation/)
curl -LsSf https://astral.sh/uv/install.sh | sh
# 2. Clone de repository
git clone https://github.com/cedanl/studentprognose.git
cd studentprognose
# 3. Draai het model met demodata
uv run main.pyNote
Demodata is meegeleverd in data/input, zodat je direct kunt starten. Controleer welke jaren en weken beschikbaar zijn — zonder specificatie gebruikt het script de huidige week, wat mogelijk niet werkt met de meegeleverde data.
Important
Dit model werkt met Studielink-telbestanden. Je hebt deze data nodig om voorspellingen te maken voor jouw instelling. Demodata is meegeleverd zodat je het model eerst kunt uitproberen.
Dit model is gebouwd voor data-analisten bij Nederlandse onderwijsinstellingen die werken met Studielink-data. Je hebt geen machine learning-expertise nodig.
| Bring Your Own Data | Je levert je eigen data aan — er wordt niets extern gedeeld |
| Privacy-vriendelijk | Draait volledig lokaal op je eigen machine |
| Open source | Transparant, aanpasbaar en gratis te gebruiken |
| Demo data inbegrepen | Direct uitproberen zonder eigen data — demobestanden zitten in data/input |
Specificeer jaar en week met -y en -w:
uv run main.py -w 6 -y 2024
uv run main.py -W 1 2 3 -Y 2024
uv run main.py -year 2023 2024
uv run main.py -week 40 41Gebruik slicing voor een reeks weken:
uv run main.py -w 10 : 20 -y 2023Er zijn twee datasets beschikbaar: individual (per student) en cumulative (geaggregeerd per opleiding/herkomst/jaar/week). Standaard worden beide gebruikt.
uv run main.py -d individual
uv run main.py -D cumulative
uv run main.py -dataset bothHet standaard configuratiebestand is configuration/configuration.json. Dit kan worden overschreven:
uv run main.py -c pad/naar/configuration.json
uv run main.py -configuration langer/pad/naar/config.jsonVoorspel eerstejaars voor 2023 en 2024, weken 10 t/m 20, met beide datasets:
uv run main.py -y 2023 2024 -w 10 : 20 -d bVoorspel eerstejaars voor collegejaar 2025/2026, week 5, alleen cumulatief:
uv run main.py -y 2025 -w 5 -d c| Instelling | Korte notatie | Lange notatie | Opties |
|---|---|---|---|
| Voorspellingsjaren | -y of -Y |
-year |
Eén of meer jaren, bijv. 2023 2024 |
| Voorspellingsweken | -w of -W |
-week |
Eén of meer weken, bijv. 10 11 12 |
| Slicing | Gebruik : voor reeksen, bijv. 10 : 20 |
||
| Dataset | -d of -D |
-dataset |
i/individual, c/cumulative, b/both |
| Configuratie | -c of -C |
-configuration |
Pad naar configuratiebestand |
| Bestand | Beschrijving |
|---|---|
| individual | Individuele (voor)aanmeldingen per student. Wordt gebruikt voor de SARIMA_individual voorspelling. |
| cumulative | Aantal aanmeldingen per opleiding, herkomst, jaar, week en herinschrijving/hogerejaars. Wordt gebruikt voor de SARIMA_cumulative voorspelling. Verkregen via Studielink. |
| latest | Per opleiding, herkomst, jaar en week: aanmeldingen, voorspellingen en foutwaarden (MAE/MAPE). Wordt gebruikt voor volume- en hogerjaarsvoorspellingen. |
| student_count_first-years | Werkelijk aantal eerstejaars studenten per jaar, opleiding en herkomst. |
| student_count_higher-years | Werkelijk aantal hogerjaars studenten per jaar, opleiding en herkomst. |
| student_volume | Werkelijk totaal aantal studenten (eerstejaars + hogerjaars) per jaar, opleiding en herkomst. |
| distances | Afstanden van woonplaatsen in Nederland tot de universiteit. Wordt samengevoegd met individuele data voor XGBoost. |
| weighted_ensemble | Gewichten per model voor de ensemble-voorspelling. |
| Bestand | Beschrijving |
|---|---|
| output_prelim.xlsx | Voorlopige output met alle voorspellingen van de huidige run. |
| output_first-years.xlsx | Volledige output met voorspellingen voor eerstejaars studenten. |
| output_higher-years.xlsx | Volledige output met voorspellingen voor hogerjaars studenten. |
| output_volume.xlsx | Volledige output met volume-voorspellingen (totaal). |
Zie de Technische README voor meer details over de architectuur.
Dit project wordt actief onderhouden door CEDA. Wil je bijdragen of meedenken? Sluit je aan bij de werkgroep.
Voor vragen of problemen:
- GitHub Issues: Probleem melden