Skip to content

cedanl/studentprognose

Repository files navigation

Studentprognose

Voorspel je studentinstroom maanden vooruit — met je eigen data, op je eigen machine.

Radboud Universiteit CEDA Contributors GitHub License
Python GitHub Last Commit Windows macOS Linux


📦 Aan de slag

# 1. Installeer uv (zie https://docs.astral.sh/uv/getting-started/installation/)
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. Clone de repository
git clone https://github.com/cedanl/studentprognose.git
cd studentprognose

# 3. Draai het model met demodata
uv run main.py

Note

Demodata is meegeleverd in data/input, zodat je direct kunt starten. Controleer welke jaren en weken beschikbaar zijn — zonder specificatie gebruikt het script de huidige week, wat mogelijk niet werkt met de meegeleverde data.


🗃️ Studielink Data

Important

Dit model werkt met Studielink-telbestanden. Je hebt deze data nodig om voorspellingen te maken voor jouw instelling. Demodata is meegeleverd zodat je het model eerst kunt uitproberen.


Waarom dit model?

Dit model is gebouwd voor data-analisten bij Nederlandse onderwijsinstellingen die werken met Studielink-data. Je hebt geen machine learning-expertise nodig.

Bring Your Own Data Je levert je eigen data aan — er wordt niets extern gedeeld
Privacy-vriendelijk Draait volledig lokaal op je eigen machine
Open source Transparant, aanpasbaar en gratis te gebruiken
Demo data inbegrepen Direct uitproberen zonder eigen data — demobestanden zitten in data/input

✨ Gebruik

Jaren en weken

Specificeer jaar en week met -y en -w:

uv run main.py -w 6 -y 2024
uv run main.py -W 1 2 3 -Y 2024
uv run main.py -year 2023 2024
uv run main.py -week 40 41

Gebruik slicing voor een reeks weken:

uv run main.py -w 10 : 20 -y 2023

Datasets

Er zijn twee datasets beschikbaar: individual (per student) en cumulative (geaggregeerd per opleiding/herkomst/jaar/week). Standaard worden beide gebruikt.

uv run main.py -d individual
uv run main.py -D cumulative
uv run main.py -dataset both

Configuratie

Het standaard configuratiebestand is configuration/configuration.json. Dit kan worden overschreven:

uv run main.py -c pad/naar/configuration.json
uv run main.py -configuration langer/pad/naar/config.json

Uitgebreid voorbeeld

Voorspel eerstejaars voor 2023 en 2024, weken 10 t/m 20, met beide datasets:

uv run main.py -y 2023 2024 -w 10 : 20 -d b

Voorspel eerstejaars voor collegejaar 2025/2026, week 5, alleen cumulatief:

uv run main.py -y 2025 -w 5 -d c

Syntax overzicht

Instelling Korte notatie Lange notatie Opties
Voorspellingsjaren -y of -Y -year Eén of meer jaren, bijv. 2023 2024
Voorspellingsweken -w of -W -week Eén of meer weken, bijv. 10 11 12
Slicing Gebruik : voor reeksen, bijv. 10 : 20
Dataset -d of -D -dataset i/individual, c/cumulative, b/both
Configuratie -c of -C -configuration Pad naar configuratiebestand

📁 Beschrijving van bestanden

Input

Bestand Beschrijving
individual Individuele (voor)aanmeldingen per student. Wordt gebruikt voor de SARIMA_individual voorspelling.
cumulative Aantal aanmeldingen per opleiding, herkomst, jaar, week en herinschrijving/hogerejaars. Wordt gebruikt voor de SARIMA_cumulative voorspelling. Verkregen via Studielink.
latest Per opleiding, herkomst, jaar en week: aanmeldingen, voorspellingen en foutwaarden (MAE/MAPE). Wordt gebruikt voor volume- en hogerjaarsvoorspellingen.
student_count_first-years Werkelijk aantal eerstejaars studenten per jaar, opleiding en herkomst.
student_count_higher-years Werkelijk aantal hogerjaars studenten per jaar, opleiding en herkomst.
student_volume Werkelijk totaal aantal studenten (eerstejaars + hogerjaars) per jaar, opleiding en herkomst.
distances Afstanden van woonplaatsen in Nederland tot de universiteit. Wordt samengevoegd met individuele data voor XGBoost.
weighted_ensemble Gewichten per model voor de ensemble-voorspelling.

Output

Bestand Beschrijving
output_prelim.xlsx Voorlopige output met alle voorspellingen van de huidige run.
output_first-years.xlsx Volledige output met voorspellingen voor eerstejaars studenten.
output_higher-years.xlsx Volledige output met voorspellingen voor hogerjaars studenten.
output_volume.xlsx Volledige output met volume-voorspellingen (totaal).

🏗️ Architectuur

Zie de Technische README voor meer details over de architectuur.


🤝 Bijdragen

Dit project wordt actief onderhouden door CEDA. Wil je bijdragen of meedenken? Sluit je aan bij de werkgroep.

🆘 Ondersteuning

Voor vragen of problemen:


Gebouwd met ❤️ door de CEDANL community

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors