De effecten van traditioneel en functioneel leesonderwijs in de latere jaren van het basisonderwijs

Publicatie datum: 1991-01-01
Collectie: 09
Volume: 09
Nummer: 3
Pagina’s: 15-36
ton van der geest ageeth jorna de effecten van traditioneel en functioneel leesonderwijs in de latere jaren van het basisonderwijs 1 inleiding recentelijk lijkt de oude leesstrijd weer te zijn aangewakkerd neuvel otter en bos 1988 presenteren een vergelijkend onderzoek over leesprestaties van leerlingen die met een traditionele methode voornamelijk veilig leren lezen versus een meer functionele methode veelal op een freinet achtige wijze hebben leren lezen in het onderzoek wordt zowel begrijpend als technisch lezen getoetst de voornaamste conclusie is dat het na drie jaar onderwijs in feite niet meer uitmaakt via welke methodiek de kinderen hebben leren lezen deze resultaten werden onder andere door mommers 1989 en van der geest 1990 becommentarieerd de eerste meent onder andere op grond van fouten in het onderzoeksdesign en de slechte ratio tussen onderwijsinspanning en opbrengst dat de traditionele methoden in feite gunstiger uit de bus kwamen dan de vernieuwen de de tweede beticht de eerste van onzorgvuldige bespreking van het onderzoek en betoogt bovendien dat door de onderzoekstekortkomingen die er overigens op zich begrijpelijk zijn de resultaten juist eerder ten voordele dan ten nadele van de functionele leesaanpak geinterpreteerd kunnen worden een opvallend aspect bleef bij de drie tot dusver genoemde auteurs wat onderbe licht hoewel de leerlingen van de functionele leesaanpak aanvankelijk d w z na plusminus negen maanden leesonderwijs achterbleven bij de leerlingen van de traditionele leesaanpak konden er bijna drie jaar later geen verschillen meer aangetoond worden als men de data longitudinaal zou interpreteren en op grond daarvan zou mogen extrapoleren naar de bovenbouw van de basisschool beide zaken zijn niet zo maar geoorloofd van der geest 1990 dan zou men kunnen verwachten dat de functionele aanpak een aanvankelijke achterstand zal omzetten in een voorsprong wet van de remmende voorsprong en of versnellende achter stand overigens geldt natuurlijk dat vooruitgang in het lezen in groep 6 7 en 8 niet alleen verklaard mag worden uit inspanningen in de groepen 3 4 en 5 maar mede afhangt van de manier waarop het verder lezen op school begeleid wordt deze hier aangeduide problematiek staat centraal in het onderzoek waarover we hier berichten om bij een hogere leeftijdsgroep een dergelijk vergelijkend onderzoek te kunnen verrichten zijn we in een orienterend onderzoek nagegaan in hoeverre het onderzoeksdesign met name het onderzoeksinstrumentarium bijge steld moet worden vandaar dat dit probleem in een aparte paragraaf 2 wordt behandeld na de problematiek in het algemeen gesteld te hebben worden in de subparagrafen 2 1 en 2 2 de toetsen voor technisch en begrijpend lezen uiteenge zet in 2 3 wordt de volgorde van afname en de tijdsduur daarvan verantwoord spiegel 9 1991 nr 3 15 36 een andere belangrijke voorwaarde voor toetsontwikkelingsonderzoek is de definitie en het bereik van de proefpersonen in termen van achtergrondvariabelen vanwege het belang van deze problematiek wordt hier buiten de onderzoeksopzet in paragraaf 4 om in paragraaf 3 aandacht besteed de onderzoeksopstelling en vraagstelling worden in paragraaf 4 besproken de eerste en belangrijkste vraagstelling betreft de geschiktheid van de ontwikkelde tests een essentiele eis hiervoor is dat deze tests differentieren tussen de verschil lende jaargroepen en dus leeftijden van de leerlingen dit te achterhalen is de hoofddoelstelling van dit onderzoek ook zijn we nagegaan of er aanwijzingen zijn dat een verschil in onderwijsmethode verschillen in leesprestaties met zich meebrengt het gaat hier slechts om indicaties omdat voor een dergelijke vraag een veel grootschaliger onderzoek noodzakelijk is in paragraaf 5 komen de resultaten van het onderzoek aan de orde het blijkt dat boven aangeduide tests daadwerkelijk tot die verlangde differentiatie in staat zijn verder blijkt dat er globaal genomen geen veiband bestaat tussen onderwijsaanpak en de geleverde testprestaties het onderzoek zou op dat moment dan ook afgesloten kunnen worden ware het niet dat we aanvullende gegevens hebben die niet tot het eigenlijke onderzoek behoren wanneer we die in de discussie meenemen komen we tot een door ons althans niet verwachte conclusie in paragraaf 6 2 probleemstelling het toetsinstrumentarium voor begrijpend en technisch lezen een gevaar dat men in veel evaluatieonderzoek loopt is dat de keuze van het te gebruiken toetsinstrumentarium ten voordele van de onderzoeks dan wel van de controlegroep uitpakt meestal en daar is overigens nauwelijks aan te ontko men wordt het traditionele onderwijs op deze manier bevoordeeld en het ver nieuwende onderwijs benadeeld ten behoeve van het traditionele onderwijs zijn namelijk door de jaren heen veel toetsen ontwikkeld die dicht bij dat onderwijs staan en die qua betrouwbaarheid en dergelijke behoorlijk zijn doorgemeten voor het vernieuwende onderwijs is dat niet of in veel mindere mate het geval vaak is vernieuwend onderwijs zelfs expliciet tegen toetsen en prestatievergelijking het vergelijkend onderzode van fendt en zijn groep lukesch 1979 zie van der geest 1982 ten aanzien van de duitse gesamtschulen is daar een schoolvoor beeld van in de vernieuwingsscholen stond het communicatieve aspect in het vreemde talenonderwijs centraal anders dan in veel nederlandse scholen la v communicatief onderwijs nog gebruikelijk is anceaux 1990 werd niet veel aandacht geschonken aan grammatica en andere traditionele deelvaardigheden in het vergelijkend onderzoek werden echter standaardtoetsen uit de zgn regel schulen gebruikt zoals die voor grammatica voor ons probleem het leesonderzoek hebben we een vergelijkbaar geval neuvel e a 1988 vergelijken het lezen op traditionele scholen en vernieu 16 wingsscholen hiervoor hanteren ze toetsen uit de traditionele didactiek de controle groep het traditionele onderwijs is zeer vertrouwd met dit soort toetsen voor de vernieuwingsscholen althans het freinet achtige deel ervan geldt echter dat men zich tegen het gebruik van toetsen verzet hier wordt een goede leer kracht als het beste leerlingvolgsysteem beschouwd in de onderzoeksopzet ondervinden de vernieuwingsscholen op deze manier een dubbel nadeel ten eerste zijn de tests niet afgestemd op hun onderwijsinhouden aanpak en doelen en ten tweede beschikken de leerlingen in beduidend mindere mate over de noodzakelijke toetservaring dit probleem waaraan neuvel e a en mommers ons inziens met een wat al te groot gemak voorbij gaan zal onze grote aandacht moeten hebben helemaal te omzeilen zijn dergelijke storende variabelen echter niet in vergelijkend onderzoek zullen we vooral te maken blijven krijgen met een verschil in toetservaring c q systematische controle van de leerlingpresta ties gebruikmakend van bovenstaande inzichten zullen we respectievelijk in 2 1 en 2 2 ingaan op de toetsen voor technisch lezen tel en begrijpend lezen bel deze twee aspecten van lezen hebben onze aandacht om de volgende redenen ten eerste willen we in ons onderzoek aansluiten bij dat van neuvel die met name deze twee aspecten onderzocht ten tweede zijn er ondanks studies als die van aarnoutse e a 1986 1988 aanwijzingen dat het technisch lezen als vaardigheid ook in de bovenbouw van de basisschool nog volop in ontwikkeling is 2 1 technisch lezen tel in het traditionele leesonderwijs wordt voor technisch lezen veelvuldig gebruik gemaakt van brus en avi toetsen in het vemieuwingsonderwijs worden dit soort toetsen daarentegen nauwelijks gebruikt men is niet geneigd lezen op te splitsen in deelvaardigheden en men wil bovendien vooral in de onderbouw prestatietoet sen uit de weg gaan het gebruik van deze toetsen in vergelijkend onderzoek kan de resultaten dan ook danig beinvloeden een ander nadeel van deze toetsen is de moeilijkheidsgraad ze zijn slechts tot en met groep 6 goed bruikbaar voor ons onderzoek komen brus of avi achtige toetsen dan ook niet in aanmerking overigens moet men zich afvragen wat technisch lezen betekent in strikte zin staat het als opponent van begrijpend lezen voor decoderen en verklanken zonder gebruik te maken van begrip het gaat er met andere woorden om vast te stellen in welke mate de decodering van letters lettergroepen woorden en zinnen geautomatiseerd is in dit opzicht is het onderzoek van verhoeven 1987 inzicht gevend hij laat zien dat de verschillen tussen nederlandse en allochtone leerlin gen bij het hardop lezen van nederlandse woorden van een gecontroleerde letter dan wel foneemstructuur significant zijn als de nederlandse woorden echter door nonsenswoorden van een vergelijkbare structuur vervangen worden blijken deze verschillen veel kleiner na 10 maanden leesonderwijs niet significant meer de verschillen die dan toch nog bestaan tussen de nederlandse en de allochtone 17 turkse leerlingen kunnen gevoeglijk toegeschreven worden aan de omstandig heid dat de turkse leerlingen het onderwijs volgen in een voor hen tweede taal in elk geval is duidelijk dat kennis van de taal een belangrijke bron is voor het decoderen van woorden in een brusachtige test anders gezegd in dergelijke toetsen lopen twee verschillende processen door elkaar te weten bottom up1 en top down1 het is theoretisch verkieslijk dergelijke tegengestelde verwerkings processen uit elkaar te houden voor ons onderzoek betekent dat dat we voor het technisch lezen zoeken naar een testvorm waarin vrijwel uitsluitend bottom up decodeerprocessen gemeten worden woordherkenning wordt tot bel gerekend in de avi toetsen is de rol van begripsprocessen potentieel nog aanmerkelijk groter dan in de brus in de avi moeten kinderen snel correct en op goede leestoon een verhaal lezen het gelezene roept leesverwachtingen op de grammaticale on mogelijkheden gaan hun rol meespelen terwijl ook de morfologie en woord kennis ondersteunend werken bij het te bereiken resultaat toch is deze toets door neuvel e a gebruikt voor het meten van technisch lezen hoe moet de technische leesvaardigheid dan vastgesteld worden even afgezien van de kwestie dat de traditionele school veel geoefender is in tel toetsen wat het woordniveau betreft kan gesteld worden dat het hardop lezen van losse nonsenswoorden het gebruik van top down strategieen in belangrijke mate reduceert de kennis die men heeft van de combinatorische mogelijkheden van letters klanken in het nederlands blijft als enige hulpbron over voor de vergelij king van auto en allochtone leerlingen zou dit nog storend kunnen werken verhoeven heeft dit niet in zijn studie gecontroleerd overigens het zijn allemaal toevallig niet bestaande nederlandse woorden voor nederlandse kinderen in onderling vergelijk is dit onproblematisch aangezien voldoende kennis van dit systeem al verworven is en dat voor het overgrote deel in de buitenschoolse situatie vandaar dat we een nonsensversie van de brus ontwikkeld hebben nonsens brus zowel de structuur van de woorden als de opbouw van de lijst zijn verge lijkbaar met die van de brus aangenomen wordt dat een nonsens leesopdracht moeilijker is en dus voor de groepen 6 8 goed te gebruiken zal zijn technisch lezen is echter meer dan alleen maar woorden lezen het gaat ook om zinsdelen zinnen en teksten de natuurlijke informatie eenheid is tenslotte de zin of de tekst ook in dat geval willen we ons van nonsens teksten bedienen hiervoor hebben we de avi 9a en 9b als uitgangspunt genomen resp nonsens avi 1 en 2 zoals eerder opgemerkt is het bij het lezen van zinnen teksten in nog sterkere mate dan bij het lezen van woorden de vraag wat aan het technisch lezen toegeschreven kan worden en wat aan meer algemene kennis van de taal die de proefpersonen bezitten we besloten de avi teksten alleen op woordniveau te bewerken en ons bovendien te beperken tot de inhoudswoorden de grammati ca de morfologie en functiewoorden zoals lidwoorden lieten we ongemoeid deze keuze leek ons om de volgende redenen gerechtvaardigd 18 1 door de inhoudswoorden van betekenis te ontdoen is het niet mogelijk zich een beeld van de werkelijkheid te vormen dat als verwachting voor het verder lezen kan dienen 2 lidwoorden e d hebben dan geen referent in de werkelijkheid meer en bieden daarom geen top down steun voor de sowieso niet op gang komende inter pretatieprocessen op zins en tekstniveau 3 hetzelfde geldt voor de grammatica bovendien zullen de proefpersonen dit systeem gelijkelijk en ook hier buiten de onderwijssetting verworven hebben 4 als ook de grammaticale morfologische en functiewoordenkennis weggeno men zou worden ontstaan er geen zinnen teksten maar reeksen van gra feem groepen ingeleid door een hoofdletter en beeindigd door een punt een dergelijke toets zou als te kunstmatig ervaren worden en als zodanig zijn doel voorbij schieten we kunnen stellen dat op de hierboven geschetste manier meer recht gedaan wordt aan de operationalisering van technisch lezen deze deelvaardigheid kan nu eenduidiger en zuiverder onderscheiden worden van begrijpend lezen bovendien wordt voor de leeftijdsgroep die in ons onderzoek aan de orde is een moeilijker en toch aantrekkelijk testobject aangeboden de vraag is nu of de beide onderzoeksgroepen wel gelijk behandeld worden qua testervaring en onderwijsaanbod we mogen bij wijze van antwoord in ieder geval stellen dat het traditionele onderwijs door de inzet van nonsenstoetsen minder bevoordeeld wordt dan bij de gebruikelijke tel toetsen voor zover het zaken als lezen tegen de stopwatch betreft zal het verschil in toetservaring echter zeker in stand blijven of dit laatste nog enig effect heeft en hoe groot dat effect is valt moeilijk vast te stellen aan deze onzekerheid ontkomen we dan ook niet 12 begrijpend lezen bel van de recente ontwikkelingen met betrekking tot meer systematische aandacht voor begrijpend en studerend lezen is tot nog toe maar weinig doorgedrongen tot de onderwijspraktijk meestal bedienen scholen zich nog van de zogenaamde totaalmethoden opvallend bij deze methoden is dat ze geen leesdidactiek aanbieden maar uitsluitend oefeningen door middel van controlevragen bij de tekst deze vragen hebben vooral betrekking op woordkennis en lokaal begrip van tekstgedeelten bijvoorbeeld de alinea de leerlingen krijgen geen strategieen aangereikt om hun leesbegrip te vergroten maar ondervinden een voortdurende controle door tekstgebonden oefeningen ook de toetsen voor leesbegrip worden veelvuldig volgens bovengegeven procedures opgesteld daarnaast komen cloze toetsen nogal eens in beeld voor het meten van tekstbegrip of opdrachten als het herschrijven van een tekst voor een meer systematische benadering van tekstbe grip sluiten we aan bij wesdorp 1978 en looijmans en palm 1979 deze laatsten stellen dat tekstbegrip gedefinieerd kan worden als het doorzien van alle uitspraken in hun onderlinge relaties in een gegeven tekst hacquebord 1989 heeft deze definitie in haar proefschrift geoperationaliseerd in de toetsconstructie 19 voor tekstbegrip in het voortgezet onderwijs allereerst moeten volgens de definitie uitspraken in de tekst doorzien worden een subtoets bij hacquebord bestaat er dan ook uit na te gaan in hoeverre lezers in deze opdracht slagen zij noemt dit het micro niveau van een tekst neuvel cs beperken voor groep 3 hun testwerk tot dit niveau vervolgens moet het gaan om de onderlinge relaties van uitspraken van belang is hier de aard van de relaties de implicaties de infe renties e d hacquebord maakt hier een onderscheid tussen uitspraken die als dicht bij elkaar horend gepresenteerd worden b v naast elkaar tot een alinea behorend en uitspraken die alleen maar tot dezelfde tekst behoren in het eerste geval onder vindt de lezer naast het bij elkaar geplaatst zien van de uitspraken mogelijk ook steun van anafora of van voegwoorden b v omdat en bijwoorden daarom desalniettemin die de relatie expliciteren in het tweede geval ontbreken deze be gripshulpmiddelen veelal of zijn ze veel vager verwoord zoals we al gezien heb ben hierboven de conclusie lijkt gerechtvaardigd alles overziend etc sturing van de interpretatie lijkt hier voor de lezer alleen mogelijk op basis van een globaal tekstbegrip dit vindt volgens kintsch van dijk 1978 plaats op basis van weglating generalisatie en constructie dit soort overwegingen geven hacquebord aanleiding tot het onderscheiden van twee niveaus m b t de relaties tussen uitspraken het meso niveau dat de alinea de lokaal gepresenteerde relaties betreft en het macro niveau dat de tekstuele relaties op basis van de kennis van de samenhang van alle uitspraken aangaat voor alle drie niveaus werden subtoet sen geconstrueerd in het empirische onderzoek dat volgde bleek dat het leesbe grip op de drie verschillende niveaus drie verschillende niet noodzakelijkerwijs samenhangende vaardigheden betrof hierdoor was het mogelijk verschillende lezersprofielen op te stellen die samenvielen met de subgroepen van haar proef personen zoals eerste en tweede taal lezersprofielen wij hebben voor ons onderzoek gebruik gemaakt van de zes gemakkelijkste bel teksten van hacquebord deze komen oorspronkelijk uit leerboeken voor de zgn andere vakken voor groep 8 en de brugklas lbo mavo de lengte van elke tekst is plusminus 200 woorden met een gemiddelde zinslengte van 10 e 12 het aantal abstracte woorden bedraagt plm 5 het aantal concrete bekende frequente woorden minimaal 85 met 12 bijbehorende stellingen per tekst gelijkmatig ver deeld over de drie tekstniveaus micro meso macro wordt het tekstbegrip bevraagd de proefpersonen moeten aangeven of de uitspraak in overeenstemming is met de inhoud van de gelezen tekst doelstelling van de test is te achterhalen of de proefpersonen parafrases van uitspraken en combinaties van uitspraken als wel of niet kloppend met de tekst kunnen identificeren als dit het geval is wordt aangenomen dat de tekst begrepen is hacquebord koos voor parafrases van uitspraken omdat in vooronderzoek gebleken was dat deze vraagwijze een heel natuurlijke is die erg weinig toetservaring vergt men mag hierom en om reden dat geen van de leerlingen in ons onderzoek met deze testwijze vertrouwd was aannemen dat de kans op bevoor of benadeling van een van onze onderzoeks groepen gering is 20 23 instrumentarium en testverloop de tel en bel toetsen werden in de verschillende scholen per klas in drie ge deelten afgenomen 1 klassikale instructie en afname van het eerste bel toetsgedeelte drie teksten met stellingen tijdsduur max vi uur 2 individuele instructie en afname van de tel toets nonsens brus nonsens a vi 1 avi 9b nonsens avi 2 plm 7 min per leerling 3 klassikale afname van het tweede bel toetsgedeelte drie teksten met stellin gen tijdsduur max vi uur de helft van de groep kreeg in de eerste bel deeltoets de teksten 1 2 en 3 en de andere helft de teksten 4 5 en 6 in de tweede bel deeltoets werd dit omge draaid hierdoor konden we nagaan of de prestaties op de tweede bel deeltoets mede bepaald werden door zulke zaken als testvermoeidheid dit bleek niet het geval voor het hier te rapporteren onderzode wordt in de resultaten voor tel alleen gebruik gemaakt van de scores op basis van de nonsens avi 2 dit maakt de presentatiewijze overzichtelijker we menen hiermee te mogen volstaan omdat de uitkomsten op de diverse tel toetsen hogelijk met elkaar bleken te correleren zodat het weinig uitmaakte welke toetsscores gebruikt werden tenslotte gaat het er ons in dit orienterende onderzoek vooral om vast te stellen of de ontwikkelde instrumenten gehanteerd kunnen worden voor de vaststelling of er verschillen bestaan tussen leesprestaties van kinderen hierbij zou je aan twee zaken kunnen denken 1 geven de resultaten aan dat er een verschil in leesprestatie bestaat afhanke lijk van het aantal jaren onderwijs dat de leerling genoten heeft 2 geven de instrumenten zicht op de effecten van de gevolgde leesmethode de eerstgenoemde vraag is hierbij te vertalen tot een harde eis waaraan de instrumenten moeten voldoen om enige geldigheid te bezitten de tweede vraag betreft de onderzoeksvariabele en geeft de mate van effectverschil aan van de leesmethodieken dit verschil is alleen zinvol interpreteerbaar als aan de voorwaarde onder 1 genoemd voldaan is 3 de proefpersonen en proefscholen een volgend punt dat buiten onderzoeksdesign en vraagstelling om enige extra aandacht behoeft betreft de keuze van de onderzoeksscholen en de leerlingenpo pulatie daarbinnen we doen dat om twee redenen ten eerste is het onderzoek van neuvel cs waarop wij aansluiten ons inziens op dit punt te globaal ten tweede komen we in de slotparagraaf op de steekproeftrekking terug daar zal blijken dat een grotere zorgvuldigheid dan in sociaalwetenschappelijk onderzoek gebruikelijk geboden is wil men tot goed interpreteerbare gegevens komen voor dit onderzoek hebben we de volgende eisen t a v de proefpersoonkeuze opgesteld 21 1 er dienen voldoende proefpersonen getoetst te worden om een redelijke indruk te krijgen van de geschiktheid van de instrumenten 2 er moet voldoende spreiding zijn in de beoogde doelgroep van 10 12 jarigen m b t de leesmethodiek traditioneel versus functioneel vernieuwend 3 beide groepen traditioneel t en functioneel vernieuwend f dienen op de overige relevante aspecten goed vergelijkbaar te zijn in verband met punt twee zijn we het onderzoek begonnen met het benaderen van twee jenaplan freinet scholen fa en fb deze staan schoolorganisatorisch en onderwijsdidaktisch nogal veraf van het traditionele onderwijs we hebben bewust voor afstand tussen t en f gekozen dit overigens in tegenstelling tot het onder zoek van neuvel cs waarin een grote spreiding van f methodieken in de onder zoeksopzet is meegenomen zonder differentiatie met betrekking tot de pres tatiemeting hierdoor weten we in dat onderzoek niet goed welke vernieuwingsas pecten voor welke resultaten verantwoordelijk zijn we lieten alleen kinderen meedoen die van meet af aan in de betreffende leesme thodiek zijn onderwezen binnen dit bestek hebben we ons moeten beperken tot de twee jenaplan freinet scholen maar zie slotparagraaf 6 wat de volgende aan tallen leerlingen opleverde tabel 1 tabel 1 aantallen leerlingen in f scholen f school groep 6 7 8 totaal a 7 8 9 24 b 7 7 8 22 totaal 14 15 17 46 volgens de schooldirectie waren de kinderen afkomstig uit een hoog sociaal milieu ouders minimaal vwo hetgeen overigens niet altijd bleek te kloppen zie par 6 op grond van de cpb cijfers lag de indicatie van de directeur alleszins in de rede we besloten tot deze check omdat de schooldirecties buitengewoon terughoudend waren t a v deze achtergrondinformatie overigens wijken we hier nadrukkelijk af van de weikwijze van neuvel cs voor de f scholen volstaan zij als indicatie voor leerlingenvariabele sociaal milieu met de aanduiding in wat voor gebied de scholen liggen zoals provinciestad nieuwbouwwijk e d voor de controle scholen werd dit niet nagegaan om toch enig zicht te krijgen op de vergelijkbaarheid werden algemene intelligentietests gebruikt zoals die voor woordenschat en ruimtelijk inzicht hieruit bleek wel enig verschil tussen de groepen ten voordele van de controlegroepen maar dit werd niet meegenomen in het vergelijkend onderzoek toch zijn deze verschillen met name die in woorden schat en intelligentie niet allemaal onbelangrijk gezien hun samenhang met lezen zie hacquebord 1989 en aamoutse e a 1988 de interpretatie van dergelijke 22 verschillen ligt trouwens ook moeilijk zo weten we niet of de gevonden intelli gentieverschillen aan de herkomst van de leerlingen of aan de schoolse omgeving moeten worden toegeschreven deze problematiek wordt in de bovenbouw van de basisschool des te klemmender bollen 1991 vandaar dat we besloten hebben de milieuvariabele zo goed mogelijk te bepalen op grond van de beschikbare gegevens werd een traditionele controle school t gezocht die op een aantal belangrijke kenmerken identiek was aan fa en fb 1 de t school was zoals de beide f scholen wijkoverstijgend 2 kinderen uit andere wijken kwamen ofwel uit denominatie overwegingen r k van de ouders ofwel vanwege de goede naam van de school op t terecht van de laatste overweging was ook sprake bij fa en fb het r k karakter bij t zou vergeleken kunnen worden met het levensbeschouwelijke karakter van f dat door de ouders als additionele eis aan het onderwijs wordt gesteld 3 ook de t school bestond voornamelijk uit kinderen uit het hoger sociale milieu met de directeur werden uit de kaartenbakken in alfabetische volgorde proefpersonen gelicht waarvan de ouders minimaal een vwo opleiding hadden de medewerking van de directeur was hierbij con amore de proefpersonengroepen zagen er uiteindelijk als volgt uit tabel 2 tabel 2 totale aantallen proefpersonen in f en t f t gr 6 7 8 totaal fa 7 8 9 24 fb 7 7 8 22 ftol 14 15 17 46 t 14 15 17 46 totaal 28 30 34 92 4 onderzoeksopzet en vraagstellingen evenals in neuvel e a 1988 wordt hier gebruik gemaakt van een cross sectioneel onderzoeksmodel deze keuze werd uitsluitend ingegeven door de beschikbare tijd een dergelijke onderzoeksopzet hoeft niet per se afgewezen te worden in ontwikkelingspsychologisch onderzoek mits de onderzoeksvragen vol doende scherp geformuleerd zijn en men de uitspraken op basis van de resultaten tot cohorten beperkt en niet longitudinaal interpreteert van der geest 1990 een onderzoek dat zich in eerste instantie bezighoudt met de vraagstelling of het onderzoeksinstrumentarium bruikbaar is behoeft niet noodzakelijkerwijze een longitudinale opzet wat de evaluatie vraagstelling van dit onderzoek betreft kan 23 gesteld worden dat de meeste grote evaluatie onderzoeken van cross sectionele gegevens uitgaan b v lukesch 1979 de glopper 1988 ppon e d en neuvel e a 1988 natuurlijk in zo n opzet worden prestaties afgezet tegen de kwantiteit en kwaliteit van de afgelegde weg 4 1 toetsontwikkeling en proefonderzoek neuvel e a beperkten hun materiaalverzameling tot de vernieuwingsscholen en vergeleken de gevonden prestaties m b t bel en tel vervolgens met reeds bestaande gegevens uit onderzoek over leesprestaties in het traditionele onderwijs de consequentie van een dergelijke handelwijze is dat men de toetsen uit het traditionele onderwijs als uitgangspunt neemt voor de evaluatie van het vernieu wingsonderwijs zonder zich rekenschap te geven van het feit dat er door deze gedwongen keuze mogelijk een bias in de meting geintroduceerd wordt zie par 2 om hieraan te ontkomen hebben we besloten 1 een aangepast instrumentarium te ontwikkelen dat inhoudelijk eenduidiger en valide de deelaspecten van het lezen meet 2 deze toetsen in een voorstudie op bruikbaarheid door te lichten op beide schooltypen eventueel zullen deze gegevens in het vervolgonderzoek meegenomen kunnen worden voor de beantwoording van de eigenlijke onderzoeksvragen zoals eerder opgemerkt is dit alleen mogelijk als de resultaten geen aanleiding geven tot veranderingen in het instrumentarium 42 keuze van de vernieuwingsscholen neuvel cs accepteerden een nogal grote spreiding m b t het soort vernieuwing van het leesonderwijs jenaplan o a nash achtige aanpak breakthrough to literacy stauffer aanpak freinet de freinet methode in freinet scholen en de geintegreerde taai leesmethode met name ten aanzien van de mate van indivi dualisering en cursorische ondersteuning is er sprake van een grote bandbreedte uit de resultaten bleek bovendien dat er grote verschillen in prestatie aan te wijzen waren neuvel e a 1988 p 184 we besloten op grond hiervan leesmethodespecifieker te werk te gaan en stapsge wijs materiaal te verzamelen op basis van de gebruikte onderwijsmethodiek op deze manier kunnen op het interpretatieve niveau opvallende prestaties gemakke lijker met didactiekkenmerken verbonden worden dit heeft ertoe geleid dat we ons hier uitsluitend bezig zullen houden met het jenaplan onderwijs waar men zich m b t het lezen vooral door freinet heeft laten inspireren 24 4 3 vraagstelling in dit verslag beperken we ons tot een aantal vraagpunten die na neuvel e a 1988 en hun besprekers mommers en van der geest zijn blijven liggen dit geldt ten eerste de vertaling van de onderzoeksvraag in de basisschool na groep 5 en ten tweede een aantal methodische tekortkomingen van neuvel e a zoals die met betrekking tot de steekproeftrekking de homogeniteit van de gevolgde methode en de zuiverheid geschiktheid van de toetsinstrumenten allereerst zoals gezegd houden we ons bezig met de problematiek van de toetsconstuctie voor tel en bel deze toetsen dienen ten eerste theoretisch beter verantwoord te zijn ten tweede geen bias meer met zich mee te dragen en ten derde voor de boven bouw van de basisschool geschikt te zijn in totaal stellen we ons drie vragen 1 zijn de ontwikkelde tests die de decodeervaardigheid zuiverder van tekstbegrip beogen te scheiden in staat de prestaties voldoende te differentieren afhanke lijk van de mate van scholing terwijl de gevolgde leesmethodiek gecontro leerd wordt 2 als vraag 1 positief beantwoord kan worden bestaat er dan een verband tussen onderwijs aanpak en de geleverde bel en tel prestaties 3 hoe moeten de resultaten die vraag 2 oplevert geinterpreteerd worden in het licht van de onderwijsaanpak er zullen aanvullende gegevens uit hacquebord 1989 en jorna 1990 als referentiekader voor de beantwoording van vraag 3 worden gepresenteerd 5 onderzoeksresultaten alvorens tot de onderzoeksvragen over te gaan zijn we nagegaan of de fa en fb leerlingen als een onderzoeksgroep beschouwd mochten worden dit was wenselijk omdat we in beide f scholen over wel heel kleine onderzoeksgroepjes per jaargang beschikten op grond van de onderwijsmethodiek en de gegevens van de proefjpersonen leek het alleszins redelijk deze mogelijkheid te bezien met behulp van de wilcoxon rank correlation test wrct werd per jaargang nagegaan of de leerlingen voor de verschillende onderzoeksvariabelen als een homogene groep samengenomen konden worden tabel 3 geeft hierover uitsluitsel tabel 3 s w waarden en significanties l p 5 05 voor de vergelijking van fa en fb voor de variabelen bel micro meso en macro en tel ps 005 minimale waarde s w voor p s 05 is voor 6 7 en 8 resp 27 30 en 36 fa fb bel mi me ma tel s w s s w s s w s s w s s w s 6 14 13 1 10 1 7 6 15 10 50 10 8 2 6 12 10 4 25 slechts een van de vijftien keer bleek er sprake van een significant verschil tussen fa en fb zodat er gevoeglijk van kan worden uitgegaan dat a en b t a v de onderzoeksvariabelen te beschouwen zijn als een homogene groep f 5 1 de geschiktheid van het onderzoeksinstrumentarium we zullen nu ingaan op de eerste onderzoeksvraag die betrekking heeft op de geschiktheid van de ontwikkelde en gekozen toetsinstrumenten de prestaties van de verschillende jaargroepen van f en t op bel en zijn subaspecten in percentages correcte antwoorden en tel in aantal seconden worden met de bijbehorende standaarddeviaties in tabel 4 weergegeven tabel 4 percentages goede antwoorden met de sd s per school en per jaargroep voor f en t voor verklaring zie tekst f t bel micro meso macro tel sd sd sd sd sec sd f6 82 7 8 83 10 8 84 7 9 78 11 3 139 35 5 f7 84 9 6 86 10 0 84 11 3 81 10 8 158 44 2 f8 91 4 2 91 6 3 91 3 3 89 7 5 98 24 1 t6 87 4 0 86 5 4 96 4 6 84 5 8 131 34 7 t7 87 7 8 88 5 0 88 5 4 83 5 0 100 36 0 t8 93 3 2 94 3 8 94 5 4 91 5 0 116 34 5 op een aantal variabelen lijken met het klimmen der jaargroepen de prestaties hoger te worden met behulp van de wrct is nagegaan waar dit significant is zie hiervoor tabel 5 tabel 5 vergelijking van de jaargroepen binnen de scholen significanties op basis van wrct t f bel micro meso macro tel 6f 7f 6f 8f 01 001 01 01 001 7f 8f 025 05 05 05 001 6t 7t 05 6t 8t 005 005 025 005 7t 8t 005 005 05 005 uit deze tabel blijkt dat de tests een duidelijke cesuur aanbrengen tussen de groepen 6 en 7 aan de ene en groep 8 aan de andere kant m b l de groepen 6 en 26 7 zijn de veranderingen slechts als tendentieel te duiden over het algemeen kan gesteld worden dat de mate van scholing in jaren uitgedrukt redelijk samenhangt met de prestaties op de tests dat dit vooral la v groep 8 geldt zou zijn verkla ring kunnen vinden in het feit dat de gebruikte teksten voor groep 8 en de brug klas bestemd waren mogelijk staan deze nog te ver van de belevingswereld van 10 en 11 jarigen af zoals echter nog zal blijken liggen hun bel prestaties beduidend hoger dan bij oudere lbo mavo leeriingen uit het onderzoek van hacquebord 1988 als we dit bij onze beschouwingen betrekken dan zou nog beter gesteld kunnen worden dat in groep 8 een plotselinge groei in begrijpend lezen optreedt of we zouden te maken moeten hebben met een op alle drie scholen optredend cohort effect voor tel blijkt er ook van groei sprake al valt deze voor de t en f groepen op een verschillend moment de conclusie kan zijn dat de toetsen redelijk in staat zijn tel en bel prestaties vast te stellen in de leeftijdscategorie van 10 tot 12 jaar 5 2 het verband tussen onderwijsaanpak en prestaties nu vraag 1 naar tevredenheid is beantwoord is het mogelijk in te gaan op de vraag of de onderwijsaanpak van invloed is op de prestaties van de leerlingen om een eerste globale indruk hierover te krijgen zien we even af van de leeftijds verschillen zodat over wat grotere groepen uitspraken kunnen worden gedaan dit is toegestaan omdat de jaargroepen van t en f telkens even groot zijn we hebben de 92 scores voor bel en zijn subaspecten en tel in drie groepen gedeeld lage 30 gemiddelde 31 en hoge 31 scores vervolgens zijn we nagegaan hoe deze groepen over de beide scholen verdeeld waren chi kwadraat toetsing laat zien tabel 6 dat er zowel voor bel als voor tel geen significante verschillen zijn aan te wijzen op het 5 procentsniveau tabel 6 verbind tussen toetsprestaties en onderwijsaanpak drempelwaarde significantie s 025 bel micro meso macro tel chi kwadraat 3 31 4 52 11 22 3 88 2 29 significantie 005 er is zelfs geen sprake van een tendens 10 pets niveau toch is er bij bel iets bijzonders aan de hand als we naar de subaspecten kijken het meso aspect verschilt significant ten voordele van t blijkbaar is er op het micro en macro niveau echter voldoende compensatie om dit meso effect in bel weer ongedaan te maken het ligt voor de hand te concluderen dat de prestaties la v bel en tel onafhankelijk zijn van de gevolgde onderwijsmethodiek op grond van tabel 6 kan echter niet geconcludeerd worden dat de prestaties op de diverse momenten 27 identiek zijn zo stellen neuvel e a vast dat een aanvankelijk groot verschil in groep 3 verdwenen is in groep 5 mogelijke verschillen in het traject in dit geval van groep 6 naar groep 8 zijn daarom interessant ze kunnen ons een indicatie geven over de samenhang tussen onderwijsactiviteiten op een bepaald moment enerzijds en onderwijsprestaties anderzijds om op mogelijke verschillen in het onderwijstraject zicht te krijgen is m b t wrct nagegaan of er op groepsniveau sprake is van verschillen m b t de onderzoeksvariabelen zie hiervoor tabel 7 tabel 7 significantieniveaus van prestatieverschillen op wrct van jaargroepen van f en t scholen v t bel micro meso macro tel 6 025 05 05 7 0 0 5 8 01 05 bel met name het meso en macro aspect blijft in groep 6 van de f scholen lo v t achter bij tel is dit niet het geval wat merkwaardig is omdat f juist van functioneel leesbegrip uitgaat en veel minder van de technische aspecten van het lezen gedeeltelijk is dit achterblijven van bel te verklaren uit het feit dat de leerlingen in groep 6 fa onze eerste onderzoeksklas de vragen veelal bleken te beantwoorden op basis van eigen kennis en verwachtingen in plaats van zich op de tekst te baseren dit bemerkende hebben we in de instructie van de andere klassen met meer nadruk op dit punt gewezen m a w de verschillen zijn mogelijk op een gebrekkige toetservaring terug te voeren in het eindstadium van het onderwijs groep 7 en 8 zijn er geen systematische verschillen meer in bel dat f8 het wat minder doet op het meso aspect wordt blijkbaar zoals reeds gesteld voldoende gecompenseerd op het micro en macro niveau dat de t school het op het meso niveau beter doet is mogelijk toe te schrijven aan het gebruik van een totaalmethode taalactief waar de nadruk bij de gestelde vragen bij de teksten wel heel erg sterk op de alinea ligt in tel doen zich ook maar weinig verschillen voor in groep 7 scoort t signifi cant beter in groep 8 daarentegen is dat f in elk geval is duidelijk dat ook de technische aspecten van lezen in een functionele benadering voldoende kans krijgen zich te ontwikkelen als conclusie uit de tabellen 6 en 7 zou kunnen gelden dat voor leerlingen uit een hoger sociaal milieu want daar spreken we hier over het er niet zoveel toe doet welke onderwijsaanpak ze op zich af krijgen zie ook leseman 1990 er zijn weliswaar cross sectionele verschillen mogelijk ook tempo verschillen en of leerlijn verschillen maar uiteindelijk zijn de resultaten onderling zeer goed vergelijkbaar de prestatieprofielen worden slechts marginaal meso t o micro en macro aspecten door de aanpak medebepaald 28 6 conclusies en interpretaties hoe zijn de resultaten te interpreteren als ze mede in het licht van andere onder zoeksgegevens bezien worden vraag 3 het is duidelijk dat de conclusies op grond van het kleine aantal proefpersonen en de cross sectionele opzet heel voorzichtig moeten zijn de negatief geformuleerde conclusie bij vraag 2 is daar een voorbeeld van we hebben niet veel gevonden dat een waarderingsverschil tussen f en t rechtvaardigt ondertussen zijn er wel enkele andere onderzoeksgegevens voor handen die een wat genuanceerder antwoord mogelijk maken het gaat hierbij om drie soorten van gegevens 1 de individuele leerlinggegevens die boven tafel kwamen bij de nabespreking van de resultaten met de individuele leerkrachten en of directeur 2 de scores van hacquebord 1989 3 onderzoeksgegevens uit een sociaal meer gespreide school joma 1990 6 1 aanvullende leerlinggegevens met de scholen was afgesproken om binnen het team de individuele leerling prestaties na te bespreken deze nabespreking bleek voor ons achteraf nogal zinvol omdat ze een beter inzicht gaf in de diverse schoolpopulaties zo bleken in de beide f scholen niet alle ouders over een vwo opleiding te beschikken 10 niet en lag het post vwo traject over het algemeen hoger of op zijn minst anders in de t school arts specialist notaris advocaat rechterlijke macht e d in t tegenover hbo sociaal wetenschappelijke opleiding e d in de f scholen ten tweede bleek er met zo n 35 van de leerlingen in f lo 2 van t iets aan de hand dyslexie mbd riagg kind adoptiekinderen speciaal onderwijsadviezen etc deze kinderen scoorden blijkens de chi kwadraat toetsing significant p 05 lager op bel maar niet op tel als de opgeschoonde gegevens van f en t opnieuw met elkaar geconfronteerd worden gaan de prestaties van de beide scholen nog meer op elkaar lijken van het enige significante verschil het meso aspect p