Het beoordelen van spreekvaardigheid

Publicatie datum: 1994-01-01
Collectie: 12
Volume: 12
Nummer: 3
Pagina’s: 97-108
boekbespreking edith vissers het beoordelen van spreekvaardigheid een bespreking van amos van gelderen de evaluatie van spreekvaardigheid in communicatieve situaties globale beoordeling en gedetailleerde analyse van spreekprestaties van elf en twaalfjarigen amsterdam sco rapport universiteit van amsterdam proefschrift 1992 isbn 90 6813 347 0 1 inleiding in de jaren 60 ontstaat voor het eerst aandacht voor het toetsen van mondeling taalgebruik de eerste mondelinge produktieve taaivaardigheidstoetsen worden afgenomen in een soort van laboratoria in kleine studioachtige ruimten wordt bijvoorbeeld van individuen verwacht dat zij woorden en zinnen herhalen die ze te horen krijgen shohamy 1988 vanaf de jaren 70 begint de kritiek op een dergelijke vorm van het toetsen van spreekvaardigheid er zou bij het toetsen van spreekvaardigheid meer moeten worden uitgegaan van realistische communicatieve situaties canale en swain wijzen er bijvoorbeeld later op dat het toetsen van spreekvaardigheid in een tweede taal zo vormgegeven moet worden dat individuen hun mate van perfor mance kunnen aantonen in betekenisvolle contexten canale en swain 1980 sinds enkele jaren wordt met behulp van een dergelijke toetsvorm in nederland binnen landelijk peilingsonderzoek de zogenaamde periodieke peiling van het onderwijsniveau ppon de spreekvaardigheid van leerlingen in het basis en voortgezet onderwijs geevalueerd het peilingsonderzoek heeft een aantal doelen in de eerste plaats is het bedoeld om informatie te verzamelen over de effectiviteit van het onderwijs in de tweede plaats moet het peilingsonderzoek een empirische basis geven aan de voortdurende discussies over het onderwijsniveau en over de vraag die daaraan verbonden wordt moet het onderwijsniveau verbeterd worden ten derde is het onderzoek er op gericht onderwijsgevenden en onderwijsonderzoekers handreikingen te geven om het onderwijs te verbeteren spiegel 12 1994 nr 3 97 108 2 doel van de studie het doel dat in het proefschrift van van gelderen centraal staat is een schema op te stellen voor het evalueren van spreekvaardigheid waarbij zo optimaal mogelijk tegemoet gekomen wordt aan de drie genoemde doelen van het periodieke peilingsonderzoek meer concreet probeert van gelderen voor de evaluatie van spreekvaardigheid een algemeen beoordelingsschema te ontwikkelen dat het mogelijk maakt om betrouwbare en valide oordelen over verschillende aspecten van de vaardigheid te ontwikkelen en dat tegelijkertijd tegemoet komt aan de eisen die vanuit het oogpunt van efficientie gesteld worden aan grootschalig onderzoek 3 opbouw van de studie de evaluatie van spreekvaardigheid in communicatieve situaties is opgebouwd uit vier delen deel i bevat een algemene inleiding waarin de achtergronden van het onderzoek beschreven worden waarin de probleemstelling wordt uitgelegd en waarin een databeschrijving wordt gegeven in deel ii wordt een theoretische grondslag gegeven voor het ontwikkelen van een beoordelingsschema en er wordt verslag gedaan van enkele kleinschalige experimenten en grootschalige studies die ten doel hebben een beoordelings schema te ontwikkelen voor een betrouwbare valide en efficiente evaluatie van spreekvaardigheid het resultaat van wat beschreven is in deel ii is een verant woording voor de beoordeling van spreekvaardigheid bestaande uit vier dimensies in deel iii wordt verslag gedaan van een empirisch onderzoek om te bepalen in welke mate het oordeel over elke dimensie voorspeld kan worden door de bedoelde aspecten de convergente predictie en daarnaast of deze aspecten dat oordeel beter voorspellen dan de andere niet bedoelde aspecten de divergente predictie deze informatie is van belang om vast te kunnen stellen in hoeverre de beoordeling van de vier dimensies zinvol is voor de evaluatie van spreekvaardig heid in deel iv ten slotte wordt ingegaan op omstandigheden waaronder het onder zoek heeft plaatsgevonden en die de generaliseerbaarheid van de conclusies kunnen beperken bovendien wordt ingegaan op de vraag welke soorten van vervolgonderzoek wenselijk zijn om aan die beperkingen het hoofd te bieden ten slotte worden de toepassingsmogelijkheden van de gerapporteerde studie bespro ken er wordt besproken op welke wijze het beproefde schema functioneel kan zijn in de context van grootschalig peilingsonderzoek bij de beoordeling van spreekvaardigheid en op welke wijze het beoordelingsschema op micro niveau kan worden ingezet om diagnostisch om te gaan met spreekvaardigheid in de klas 98 4 inhoud van de studie in de theoretische onderbouwing van zijn voorgestelde beoordelingsschema gaat van gelderen allereerst in op verschillende vormen van analytische beoordeling voor grootschalig peilingsonderzoek beschouwt van gelderen een dergelijke manier van beoordelen echter niet geschikt omdat het maar de vraag is of in een grootschalig onderzoek de behoefte bestaat aan informatie over allerlei deelaspec ten van de vaardigheid bovendien treedt met een analytisch beoordelingsschema het gevaar op dat de verschillende beoordelingscateorieen meettechnisch niet onderscheidbaar zijn van gelderen onderschrijft hier de mening van wesdorp die opmerkt dat beoordelaars niet in staat zijn meer dan drie of vier onderscheidingen te maken vaak bestaan analytische schema s uit veel subcategorieen die elkaar overlappen niet echt onafhankelijk kunnen worden beoordeeld waardoor een schijnprecisie wordt gesuggereerd bij nadere analyse blijken dan bijvoorbeeld in het gunstigste geval slechts 3 of 4 factoren te onderscheiden waaruit volgt dat waarschijnlijk vaak overbodig werk wordt verricht onder invloed van het halo effect tot stand gebrachte herhalingen van reeds eerder gevelde oorde len wesdorp 1981 bovenstaande overwegingen zijn voor de onderzoeker reden om te zoeken naar mogelijkheden het grote aantal aspecten en criteria uit de analytische schema s samen te vatten in een meer globaal schema van gelderen gaat in eerste instantie uit van het model van becker becker 1962 waarin drie dimensies onderscheiden worden hij komt echter tot de conclusie dat een dergelijke driedeling niet toereikend is voor een theoretisch verantwoorde indeling van beoordelingscriteria van gelderen herformuleert daarom beckers driedeling tot een vierdeling van dimensies hieronder zijn die dimensies met de bijbehorende beoordelingscatego rieen schematisch weergegeven referentie overdracht spreekgemak verstaanbaar heid beoordelings relevantie intonatie zinsbouw articulatie categorieen organisatie spreektrant spreektempo verbanden orientatie woordkeus referentie hiermee wordt de symboolfunctie van taal bedoeld waarnaar verwij zen de uitingen van de spreker wat is de betekenis van hun onderlinge samen hang in onderscheiden delen van de gesproken tekst en welk belang hebben ze voor de luisteraar 99 overdracht de overdrachtsdimensie heeft betrekking op al het taalgebruik en het non verbale gedrag dat bedoeld is om de relaties tussen spreker enerzijds en luisteraar en onderwerp anderzijds uit te drukken spreekgemak van gelderen verstaat hieronder het gebruik van middelen om de continuiteit van spraak te behouden sprekers moeten in het algemeen de indruk vestigen over voldoende beheersing van vocabulaire en syntax van de taal te beschikken om aan het woord te kunnen blijven en aldus hogere functies van referentie en overdracht te kunnen vervullen spreekgemak is niet substantieel met het criterium communicatieve effectiviteit verbonden maar meer voorwaardelijk van gelderen onderscheidt drie functies van spreekgemak vlotheid beheerstheid en vloeiendheid verstaanbaarheid verstaanbaarheid wordt bepaald door de mate waarin de luisteraar de uitingen van de spreker moeiteloos kan herkennen als betekenisvolle lexemen verstaanbaarheid is voorwaardelijk voor de effectiviteit van de commu nicatie een kleinschalig experiment in een eerste kleinschalig experiment gaat de onderzoeker na of uit de vier dimensies zinvolle categorieen voor beoordeling kunnen worden afgeleid die tot een bevredigende overeenstemming tussen beoordelaars leiden de vier taken die van gelderen voor zijn onderzoek gebruikt zijn de volgende taak 1 een verhaal navertellen taak 2 een ongeval melden taak 3 beschrijven hoe een spin zijn web weeft taak 4 een verhaal afmaken uit steekproeven zijn voor iedere taak 40 prestaties geselecteerd de beoorde laars kregen een instructie waarin de taken werden uiteengezet en de beoorde lingscategorieen toegelicht alle categorieen zijn aan de beoordelaars gepresen teerd in de vorm van vijfpuntsschalen de extremen en het midden van deze schalen waren gemarkeerd door korte omschrijvingen de categorie relevantie bijvoorbeeld had als omschrijvingen hoofd en bijzaken zijn goed onderschei den 5 punten vergeet wel wat 3 punten en de grote lijn komt er niet uit 1 punt van gelderen stelt na zijn eerste experiment dat de beoordelaarsovereenstem ming bij de categorieen voor de taken 1 en 4 vrij hoog is voor het merendeel van de categorieen zou men bij het beoordelen van prestaties op de verschillende spreekttaken bij een gewenste betrouwbaarheid van 80 kunnen volstaan met een jury van drie beoordelaars bij de beoordeling van overdracht en spreekgemak bij de taken 2 en 3 zijn de overeenstemmingen over het algemeen lager er zou in die gevallen een grotere jury nodig zijn 100 een grootschalige studie van gelderen doet verslag van twee studies naar het gebruik van het schema voor beoordeling van prestaties op de vier spreektaken het belangrijkste doel van deze studies is te bepalen of en in hoeverre de vier beoordelingsdimensies meettech nisch onderscheiden informatie over de spreekvaardigheid bij elke taak geven uit het kleinschalig experiment is namelijk gebleken dat verschillende categorieen voor dezelfde dimensie niet of nauwelijks van elkaar onderscheiden werden door een jury gebruikmakend van de inzichten die verkregen zijn in de kleinschalige beoorde lingsexperimenten is een jury van drie beoordelaars geinstrueerd deze beoor deelde vervolgens de tweehonderd prestaties uit de landelijke steekproef op de taken 1 2 en 3 studie 1 en de honderd prestaties uit de amsterdamse steekproef op de taken 1 en 4 studie 2 per dimensie werd een categorie beoordeeld geselecteerd uit de categorieen die in de beoordelingsexperimenten uit hoofdstuk 4 gebruikt zijn om indicaties te krijgen over de beoordelaarsstabiliteit is op kleine schaal een herbeoordeling uitgevoerd van prestaties op de taken 1 2 en 3 bij de selectie van de beoordelingscategorieen is rekening gehouden met de resultaten van de beoordelingsexperimenten de verdeling was als volgt referentie overdracht spreekgemak ve rs taan haar h ci d taak x relevantie onder spreektrant le spreektempo wei articulatie scherp scheid hoofd en vendigheid nig hapering be helder bijzaken heerst vlot taak 2 relevantie ver spreektrant ern zinsbouw vlot articulatie scherp meldt voornaamste stigheid helder zaken taak 3 relevantie juiste intonatie geva zinsbouw vlot articulatie scherp aanvullende infor rieerdheid helder matie taak 4 relevantie onder spreektrant le spreektempo wei articulatie scherp scheid hoofd en vendigheid nig hapering be helder bijzaken heerst vlot de correlaties tussen de oordelen zijn geanalyseerd met behulp van lisrel een programma voor de analyse van lineaire structurele relaties per taak is een vier factormodel getoetst de vier factoren corresponderen met de vier dimensies van het beoordelingsschema de resultaten maken duidelijk dat het model redelijk past voor drie van de vier taken voor taak 3 lijkt het model minder goed te passen de geschatte correlaties tussen de beoordelingsdimensies per taak zijn soms tamelijk hoog de correlaties tussen overdracht en spreekgemak blijken in het algemeen het hoogst te zijn die 101 tussen referentie en verstaanbaarheid het laagst in alle gevallen kan volgens de onderzoeker gesteld worden dat de oordelen meettechnisch onderscheiden informatie over spreekvaardigheid geven de predictieve oordeelsvaliditeit van gelderen vindt deze meettechnische verantwoording van zijn beoordelings schema niet voldoende bevredigend in een predictief valideringsonderzoek probeert hij antwoord te krijgen op de vraag in hoeverre de gegeven jury oordelen geprediceerd kunnen worden door meetbare aspecten die aan de oordelen ten grondslag kunnen liggen het antwoord voor elk van de vier dimensies wordt in twee stappen gegeven in de eerste stap wordt nagegaan in hoeverre het jury oordeel geprediceerd wordt door de bedoelde aspecten in de tweede stap wordt bepaald of het jury oordeel over elke dimensie beter geprediceerd wordt door de bedoelde dan door de niet bedoelde aspecten de predictieve validering voor drie van de vier dimensies te weten referentie overdracht en verstaanbaarheid is goed de fonetische en linguistische predicto ren die in de definitie van elk van deze dimensies zijn opgenomen blijken die dimensie beter te verklaren dan een van de andere dimensies voor referentie en overdracht kan bovendien vastgesteld worden dat grote percentages variantie van de jury oordelen verklaard kunnen worden door een relatief klein aantal predictoren de referentieoordelen bij drie verschillende spreektaken zijn sterk gerelateerd aan het aantal genoemde belangrijke inhoudsele menten overdrachtsoordelen bij een narratieve spreektaak hebben een sterk verband met aspecten die aan expressiviteit boeiendheid betrokkenheid en gepastheid van de spreektrant gekoppeld zijn intonatievariatie en adequaatheid van register het verstaanbaarheidsoordeel bij een taak is meer dan de andere oordelen gerelateerd aan het aantal moeilijk verstaanbare uitingen wat betreft spreekgemak zijn de conclusies over de predictieve validering van de oordelen minder positief lang niet alle aspecten die in de definitie van spreekgemaksfuncties zijn opgenomen zijn in het jury oordeel meegewogen in de tweede plaats blijkt een groot gedeelte van de variantie van het spreekgemak soordeel verklaard te kunnen worden door predictoren voor overdracht de bruikbaarheid van het beoordelingsschema in het laatste deel van zijn proefschrift beschrijft van gelderen de bruikbaarheid van het beoordelingsschema in twee verschillende contexten in grootschalig peilingsonderzoek en in diagnostische evaluatie in de onderwijspraktijk van gelderen ziet twee belangrijke voordelen van het voorgestelde beoordelings schema voor grootschalig peilingsonderzoek 102 er zijn relatief veel validiteitsgegevens over de oordeelsdimensies bekend zodat nauwkeuriger kan worden aangegeven wat precies bij elke dimensie relevant is voor de beoordeling het instrument kenmerkt zich door een relatieve eenvoud het is voldoende om per spreekprestatie vier oordelen te geven vanuit het oogpunt van efficientie een duidelijk voordeel van gelderen gaat ten slotte in op de diagnostische functie die het beoordelings schema kan hebben in de onderwijspraktijk hij merkt op dat het beoordelings schema met name bruikbaar is voor de beoordeling van monologische beurten met een zekere interne samenhang en een duidelijk begin en eind gericht op een definieerbaar communicatief doel denk bijvoorbeeld aan het vertellen van verhalen het geven van een referaat of voordracht voor de klas het geven van een instructie of uiteenzetting het feit dat in het spreekvaardigheidscurriculum voor basis en voortgezet onderwijs dit soort taken een prominente plaats inne men beschouwt van gelderen als een argument voor de relevantie van zijn beoordelingsschema andere argumenten die hij noemt als voordeel voor de onderwijspraktijk zijn bij een afzonderlijke beoordeling van de dimensies blijft de informatie over de onderscheiden aspecten van de vaardigheid behouden zodat gericht gewerkt kan worden aan verbetering van die aspecten een afzonderlijke beoordeling vereist een veel explicietere definitie van de beoordelingscriteria dan een globale beoordeling het zal voor de leraar moge lijk worden het oordeel concreet te onderbouwen waardoor de leerlingen meer informatie krijgen over de specifieke moeilijkheden verbonden aan een bepaalde spreeksituatie de beoordelingscriteria die afgeleid kunnen worden uit het beoordelingsschema kunnen van taak tot taak verschillen een verdere bewustwording van deze specificiteit zal er volgens van gelderen toe leiden dat in het leerplan meer aandacht besteed wordt aan een gemotiveerde selectie van spreektaken voor systematisch spreekonderwijs het is mogelijk de oordeelscategorieen niet alleen door de leraar maar ook door de leerlingen zelf te laten toepassen 5 enkele kritische kantekeningen hoewel ik veel waardering heb voor de studie waarvan van gelderen verslag doet in zijn proefschrift wil ik toch enkele kritische kanttekeningen maken domein voor het peilen van spreekvaardigheid in zijn proefschrift merkt van gelderen in het eerste hoofdstuk op dat bij de peiling van taalvaardigheid het domein bepaald wordt door realistische communi 103 catieve situaties waarin verschillende componenten van bedoelde vaardigheden op een geintegreerde wijze getoetst worden het probleem waarvoor van gelderen zich gesteld ziet is hoe uit alle mogelijke taalgebruikssituaties een selectie kan worden gemaakt op grond waarvan een gegronde uitspraak kan worden gedaan over het taalvaardigheidsniveau van leerlingen in zijn onderzoek gaat van gelderen uit van vier taken waarop de spreekvaar digheid en daarmee het beoordelingsschema worden getoetst in hoofdstuk 2 van het proefschrift wordt beschreven op welke wijze deze vier taken voor het onderzoek zijn geselecteerd uit een lijst van 129 soorten taken hebben respon denten ouders leerkrachten en specialisten aangegeven hoe wenselijk en haalbaar zij deze taken als doelstelling van het onderwijs beschouwden voor een eerste steekproef in het kader van een voorstudie zijn de volgende zes taken geselecteerd iets vertellen om iemand te amuseren het navertellen van een gehoord verhaal rapporteren over gebeurtenissen het snel melden van een ongeval aan de politie uitleggen aan leeftijdgenoten hoe een concreet proces zich voltrekt hoe een spin zijn web weeft beschrijven van een concrete zaak nauwkeurig een huis beschrijven om een medeleerling te helpen het te vinden verzoeken om informatie over procedures vragen om reisinformatie bij de ns uitleg geven aan leeftijdgenoten over een concrete zaak hoe je een nieuw spel moet spelen vanuit budgettaire overwegingen zag van gelderen zich genoodzaakt uit deze zes taken een selectie te maken voor zijn onderzoek selecteerde hij daarom de eerste drie taken wanneer peilingsonderzoek er op is gericht om vast te stellen in hoeverre het onderwijs zijn doelen bereikt dan vraag ik mij af of er sprake is van een optimale keuze van taken van gelderen is er met deze selectie niet in geslaagd om voor de beoordeling van spreekvaardigheid zoveel mogelijk uit te gaan van realistische communicatieve situaties iets vertellen om iemand te amuseren bijvoorbeeld is een taak die niet alleen een beroep doet op iemands spreekvaardigheid maar zeker ook op de mate waarin iemand in staat is per definitie amusant te zijn een aspect dat hopelijk geen doelstelling van het spreekonderwijs zal zijn het verzoeken om informatie over procedures en het beschrijven van een concrete zaak zouden in het spreekvaardigheidsonderwijs belangrijker onderwijs doelen moeten zijn dan iets vertellen om iemand te amuseren een ander probleem waarvoor van gelderen zich geplaatst zag was dat hij van mening was dat de genoemde zes taken met elkaar gemeen hadden dat zij aan de spreker inhoudelijk weinig vrijheid boden de taken waren zo gestructureerd dat de sprekers verplicht waren een aantal concrete inhoudselementen aan de luiste raar mee te delen of te vragen omdat in realistische communicatieve situaties de 104 spreker in de gelegenheid is de inhoud van de tekst zelf te genereren en te structureren bedacht hij een taak waarin de spreker een dergelijke vrijheid wel kreeg de kandidaat moet bij deze taak een fictief verhaal dat hij op band te horen krijgt afmaken het streven om bij het toetsen van spreekvaardigheid een zo groot mogelijke thematische vrijheid voor de spreker te creeren is zeker van groot belang bovenstaande taak waarmee van gelderen daaraan meent tegemoet te komen voldoet mijns inziens echter niet vanuit het oogpunt van het zoveel mogelijk gebruik maken van realistische communicatieve situaties is de taak namelijk slecht gekozen de taak is weinig realistisch en bovendien is het afmaken van een fictief verhaal niet erg communicatief de mate van fantasie en creativiteit zullen hier interfereren bij de opmerking van van gelderen dat hij vindt dat er voldoende variatie aan taken is voor de beproeving van een algemeen beoordelingsschema kunnen dan ook vraagtekens geplaatst worden beschrijving van de dimensies van gelderen vindt in zijn onderzoek meettechnisch onvoldoende onderscheid in de vier dimensies die hij heeft gedefinieerd gezien de definities die hij zelf geeft in hoofdstuk 3 kan dat niet echt verwonderlijk genoemd worden bij de beschrijving van de dimensie referentie merkt van gelderen onder andere op op het locale niveau gaat het vooral om het gebruik van qua betekenis duidelijke woorden en verwijzingen tussen zinnen aspecten als inhoud structuur zinsbouw en woordkeus zijn relevant voor de beoordeling van referen tie bij de definiering van de dimensie overdracht zegt van gelderen vele gedragsaspecten blijken voor de beoordeling van overdracht relevant niet alleen stijl spraaktechnische en non verbale aspecten maar ook woordkeus zinsbouw en inhoudelijke aspecten van gelderen noemt voor de beoordeling van deze twee dimensies dezelfde aspecten inhoud woordkeus en zinsbouw hoewel van gelderen aangeeft dat deze aspecten bij de verschillende dimensies op een ander niveau beoordeeld worden vraag ik me af of het onderscheid aan beoordelaars gemakkelijk is duidelijk te maken aan de instructie voor de beoordelaars zal zeer veel aandacht besteed moeten worden zeker wanneer het gaat om grootschalig peilingsonder zoek zal nader bekeken moeten worden of het beoordelingsschema van van gelderen op een goede manier overgedragen kan worden aan een groot aantal beoordelaars lengte van de beoordelingsschalen van gelderen hanteert voor iedere taak en voor iedere beoordelingscategorie dezelfde lengte voor de beoordelingsschaal een 5 puntsschaal gezien de twijfels die er zijn over de mogelijkheid om bij kortdurende prestaties zoals bij de taken 105 2 en 3 nauwkeurig verschillende categorieen simultaan te beoordelen lijkt het van gelderen verstandig het aantal te beoordelen categorieen tot een minimum te beperken het zou voor de hand liggen om de lengte van de beoordelingsschaal aan te passen aan de lengte van het te verwachten spreekprodukt status van de dimensies in zijn definitie van de verschillende dimensies noemt van gelderen de dimensies referentie en overdracht substantieel en de dimensies spreekgemak en verstaan baarheid voorwaardelijk het is mijns inziens logisch om aan die dimensies die een substantiele bijdrage leveren aan het oordeel over de spreekvaardigheid een groter gewicht toe te kennen dan aan de voorwaardelijke dimensies een mogelijk heid om dat te doen zou zijn om de lengte van de schalen voor de voorwaardelij ke dimensies korter te laten zijn dan de lengte van de schalen voor de substantiele dimensies een homogeen jury oordeel om onderscheid vast te stellen in het eerste kleinschalige experiment gaat van gelderen na of hij een onder scheid kan vinden in de verschillende beoordelingscategorieen hij merkt daarbij op dat het vinden van onderscheid tussen beoordelingscategorieen is gediend met een zo homogeen mogelijk jury oordeel een beoordelaar die afwijkende criteria hanteert vermindert de kans op het vinden van jury oordelen die meettechnisch onderscheiden zijn daarom heeft van gelderen er in zijn eerste experiment voor gekozen om de scores van een beoordelaar niet mee te laten tellen gezien het geringe aantal beoordelaars vijf voor het beoordelen van prestaties op de taken 1 2 en 3 en vier voor het beoordelen van prestaties op taak 4 lijkt mij dit een onverantwoorde beslissing het is immers goed mogelijk dat de beoordelaar afwijkende criteria hanteert omdat het onderscheid tussen de verschil lende beoordelingscategorieen niet duidelijk was voor deze beoordelaar door uitschakeling van deze beoordelaar kan daarmee voorbij gegaan worden aan het doel van deze studie spreekgemak een bijzondere dimensie de dimensie spreekgemak blijkt uit de resultaten van het onderzoek een bijzonde re positie in te nemen niet alleen meettechnisch is deze dimensie moeilijk te onderscheiden van de andere maar ook in het predictieve validiteitsonderzoek blijkt dat bedoelde aspecten voor deze dimensie in het jury oordeel nauwelijks worden meegewogen van gelderen zou hieruit hebben moeten concluderen dat deze dimensie het niet verdient om in een analytisch beoordelingsschema als aparte dimensie te worden opgenomen van gelderen handhaaft echter zonder verdere argumentatie zijn vierdeling 106 de diagnostische functie die een analytisch schema voor de onderwijspraktijk kan hebben is niet relevant voor deze dimensie wanneer blijkt dat een leerling niet over voldoende spreekgemak beschikt dan zal dat naar alle waarschijnlijkheid meer te maken hebben met de persoon zelf dan met het spreekvaardigheidsonder wijs dat deze leerling heeft gehad remedierend onderwijs om spreekgemak te verbeteren zal dan ook weinig effect hebben beoordeling globaal of analytisch van gelderen noemt de resultaten van zijn studie tamelijk bemoedigend voor gebruik van het geteste beoordelingsschema gezien de resultaten van zijn experimenten en die van het predictieve valideringsonderzoek echter zou hij hebben moeten concluderen dat voor de beoordeling van spreekvaardigheid een meer globaal beoordelingsschema zeker een nader onderzoek zou verdienen meettechnisch immers geeft hij zelf al aan dat het onderscheid tussen zijn voorgestelde dimensies niet in bevredigende mate onderscheidbaar is er moet volgens van gelderen zelfs getwijfeld worden of de jury oordelen over verschil lende categorieen uberhaupt verschillende informatie verschaffen in zijn predictie ve validiteitsonderzoek vindt van gelderen het onderscheid tussen de verschillen de dimensies voldoende als de aspecten die hij voor die dimensies definieert de bedoelde dimensie beter voorspellen dan een van de andere dimensies voor het handhaven van de verschillende dimensies in het beoordelingsschema vind ik dit een zwak geformuleerde norm ondanks deze kritische kanttekeningen ben ik van mening dat de studie van van gelderen een zinvolle kan zijn ik denk dan met name aan de diagnostische functie die het beoordelingsschema voor de onderwijspraktijk kan hebben spreekvaardigheid in de klas zoals van gelderen zelf ook opmerkt in een eerder verschenen artikel van gelderen en oostdam 1992 kan een analytische benadering zoals van gelderen die in zijn studie voorstelt bij het ontwikkelen van leerplannen en leermiddelen voor spreekvaardigheidsonderwijs een goed uitgangspunt zijn bibliografie becker s l the rating of speeches scale independence speech monographs 29 1962 38 44 canale m m swain theoretical bases of communicative approaches to second language teaching and testing applied linguistics 1 1980 1 47 gelderen a van r oostdam het gebruik van beoordelingsschema s voor spreekvaardigheid in de lessen nederlands levende talen 469 1992 124 132 107 shohamy e a proposed framework for testing the oral language of second for eign language learners studies in second language acquisition 10 1988 165 179 wesdorp h evaluatietechnieken voor het moedertaalonderwijs den haag staatsuitgeverij ritp svo 1981 manuscript binnengekomen 20 oktober 1994 manuscript aanvaard 3 november 1994 108