Technieken

Deze pagina’s beschrijven een aantal technieken die in Mirror gebruikt worden. Het gaat daarbij om:

Kansen: een kans geeft aan hoe waarschijnlijk het is dat iets gaat gebeuren;

Vergelijkingen: dit zijn wiskundige beschrijvingen van relaties die bijvoorbeeld gebruikt kunnen worden om kansen uit te rekenen;

Overgangstabellen: deze tabellen geven historische kansen op overgangen.

In de detailpagina’s gaan we dieper in op deze onderwerpen.

Kansen

In Mirror worden vaak kansen gebruikt, bijvoorbeeld de kans om uit te stromen, de kans om meer te gaan werken, de kans om minder te gaan werken, et cetera. Deze kansen zijn vaak afkomstig van vergelijkingen zoals van het type logit of ordered logit. Stel dat de kans om uit te stromen voor een bepaald persoon 60% is. Stroomt deze persoon dan uit of niet? Om dit te bepalen wordt een willekeurig getal tussen 0 en 1 getrokken. Indien dit getal kleiner is dan 0,6 (=60% kans), dan is de uitkomst “ja”, anders “nee”. Stel dat bijvoorbeeld het getal 0,32 wordt getrokken, dan wordt besloten dat deze persoon in dit geval uitstroomt.

Omdat gemiddeld gesproken 60% van de willekeurig getrokken getallen onder het getal 0,6 valt, zal, indien de simulatie vaak herhaald wordt, de persoon in 60% van de gevallen uitstromen en in 40% van de gevallen niet. Na middelen over de herhaalde simulaties komt zo een gemiddeld patroon tevoorschijn. Mirror werkt daarom ook altijd met gemiddelden van meerdere herhalingen van de simulatie van de onderwijsarbeidsmarkt.

Het kansmechanisme kan ook algemener geformuleerd worden met behulp van de cumulatieve verdeling. Dit maakt het mogelijk ook uit meer dan 2 alternatieven te selecteren. In het bovenstaande voorbeeld is de cumulatieve verdeling [0,6, 1]. Het interval tussen 0 en 0,6 associëren we met “ja”, het interval tussen 0,6 en 1 met “nee”. Na het trekken van een willekeurig getal lopen we van links naar rechts door de verdeling en stoppen indien we een getal tegenkomen dat groter is. In het geval dat we 0,32 hadden getrokken, stoppen we direct bij het tegenkomen van het getal 0,6 en besluiten dus tot “ja”.

Dit kan ook met meer alternatieven. Stel dat de kansen van instromende leraren op de schalen LB, LC en LD respectievelijk 79%. 17% en 4% zijn. De verdeling wordt dan [0,79, 0,79+0,17=0,96, 1]. Indien we willekeurig het getal 0,84 trekken, ligt dit dus in het interval tussen 0,79 en 0,96 dat we associëren met schaal LC. In dit geval wordt dus schaal LC getrokken. Dit mechanisme wordt in Mirror gebruikt bij vergelijkingen van het type ordered logit en multinomial logit en bij overgangstabellen.

Vergelijkingen

Vergelijkingen kunnen gebruikt worden om grootheden of kansen uit te rekenen. Vergelijkingen zijn gebaseerd op historische data en vatten deze als het ware samen. In iedere vergelijking wordt rekening gehouden met een groot aantal factoren, zoals de leeftijd en het geslacht van een persoon, de inschaling, de taakomvang, et cetera. Mirror werkt met drie typen van vergelijkingen:

1.

lineair: berekent een grootheid, bijvoorbeeld de omvang van een deeltijdtaak in fte;

2.

logit: deze vergelijking geeft als uitkomst een kans;

3.

ordered logit: met deze vergelijking kan een keuze gemaakt worden uit een aantal geordende alternatieven;

4.

multinomial logit: deze vergelijking maakt een keuze uit een aantal niet-geordende alternatieven.

Hieronder gaan we in meer detail in op deze typen van vergelijkingen.

Lineair

De vergelijking van het type lineair wordt altijd opgebouwd uit een constante term en een groot aantal factoren die corrigeren voor specifieke kernmerken van de persoon, de taak, de school waar de taak aan verbonden is, de regio, et cetera. Iedere factor heeft een bepaalde bijdrage die berekend wordt aan de hand van historische data door middel van econometrische schattingstechnieken. Dit heet “het schatten van het model”. Een voorbeeld is de vergelijking die de omvang van de taakvergroting aangeeft voor leraren die geen taakverlies hebben ondergaan. Daarin zitten bijvoorbeeld de regio, (hogere machten van) de leeftijd, het schooltype, de denominatie van de school en het vak dat een persoon geeft.

Deze vergelijking bevat ook een term voor de standaardfout. Deze geeft een maat voor de afwijkingen in de data ten opzichte van de vergelijking en wordt gebruikt om variatie te genereren in de simulaties, zoals deze ook geobserveerd is in de data. Dit betekent dat indien deze vergelijking twee keer wordt uitgerekend voor dezelfde persoon in dezelfde situatie, de vergelijking toch een licht verschillend resultaat teruggeeft.

Logit

Een vergelijking van het type logit heeft in de kern ook een vergelijking van het type lineair. Echter, de grootheid die uit die vergelijking komt, wordt met een kansfunctie vertaald naar een kans op een gebeurtenis. Bij het schatten van het model wordt hiermee uiteraard rekening gehouden. Een kans zit altijd tussen 0% en 100%. Op de pagina Kansen kunt u meer lezen over hoe met kansen wordt omgegaan..

Ordered logit

Dit type vergelijkingen wordt gebruikt om een keuze te maken uit verschillende alternatieven die logisch geordend zijn, bijvoorbeeld een vergelijking voor het geheel aantal dagen per week dat men werkt: 1, 2, 3, 4 of 5. Dit type vergelijking heeft ook een lineaire kern, maar daarnaast wordt bij het schattingsproces een aantal grenswaarden berekend. Na omzetting naar kansen op dezelfde manier als bij logit, geven deze grenswaarden tezamen met het lineaire deel kansen op ieder mogelijk alternatief. De kansen kunnen bijvoorbeeld 10%, 30%, 20%, 15% en 25% worden. Het tweede alternatief (2 hele dagen werk) heeft daarmee de grootste kans. Meer details over kansen kunt u vinden op pagina Kansen.

Multinomial logit

Dit type vergelijkingen wordt gebruikt om een keuze te maken uit alternatieven die niet geordend zijn. Zo wordt bijvoorbeeld het voorkeursschooltype bepaald van iemand die een school verlaat (taakverlies). De keuze werkt op een vergelijkbare manier als ordered logit: voor alle alternatieven worden kansen bepaald afhankelijk van een groot aantal factoren, zoals het schooltype waar de persoon vertrekt. Vervolgens wordt met behulp van de kansverdeling een keuze gemaakt.

Overgangstabellen

Overgangstabellen zijn in principe simpele ordered logit vergelijkingen. In deze tabellen staan kansen voor bepaalde overgangen. Zo kan een tabel bijvoorbeeld definiëren dat een 30-jarige 30% kans heeft om LA te krijgen, 60% kans op LB en 10% kans op LC. Door meerdere overgangstabellen te gebruiken, kan rekening worden gehouden met achtergrondkenmerken. Zo zijn er overgangstabellen die de kansen op schalen definiëren voor iedere functie en ieder schooltype aangezien de inschaling historisch per schooltype verschillend is.

In Mirror zijn de volgende typen overgangstabellen opgenomen:

leeftijd & geslacht: met deze tabel wordt op basis van de historische verdeling een leeftijd en geslacht voor een instromend individu bepaald;

instroom schaal: afhankelijk van de leeftijdscategorie worden kansen op een specifieke schaal gegeven;

instroom periodiek: voor iedere schaal die onder “instroom schaal” mogelijk is, is een verdeling over periodieken beschikbaar afhankelijk van de leeftijdscategorie om de inschaling geheel te kunnen bepalen;

regionale instroom: voor instroom vanuit de stille reserve wordt een voorkeursregio bepaald op basis van historische kansen afhankelijk van de regio van uitstroom naar de stille reserve

taakverlies met regionale mobiliteit: indien bepaald is dat een persoon regionaal mobiel is, wordt met deze tabel een regio van bestemming getrokken, afhankelijk van de regio van oorsprong.

functiewijziging: deze tabel wordt gebruikt om de inschaling te bepalen van iemand die van functie wijzigt.

vak & graad: met deze tabel wordt een vak en graad toegewezen aan afstudeerders van de lerarenopleiding voor het vo.

Alle kansen in de tabellen zijn gebaseerd op historische gegevens.