Czasopismo
Tytuł artykułu
Warianty tytułu
Results of the 2002–2010 lower secondary school leaving exams on a common scale
Języki publikacji
Abstrakty
W artykule prezentowane są metodologia oraz rezultaty badania nad zrównaniem wyników egzaminu gimnazjalnego dla lat 2002–2010 przeprowadzonych przez Pracownię Analiz Osiągnięć Uczniów w Instytucie Badań Edukacyjnych. Do badania zrównującego wylosowano ponad 10 tys. uczniów i wykorzystano informacje o ponad 500 zadaniach. Do zrównania wyników egzaminu wykorzystano modele IRT, wyniki przedstawiono na skali zmiennej ukrytej oraz na skali wyników obserwowanych. Dzięki zastosowanej procedurze udało się wyizolować losowe wahania trudności między arkuszami egzaminacyjnymi w poszczególnych latach i przedstawić zmiany w poziomie umiejętności uczniów zdających egzamin gimnazjalny. Na podstawie rezultatów badania można stwierdzić, że poziom umiejętności humanistycznych gimnazjalistów jest stabilny, natomiast poziom umiejętności matematyczno-przyrodniczych wykazał trend spadkowy. W analizie dokonano walidacji zrównywania, porównując przedstawione wyniki z wynikami badania międzynarodowego, porównywalnego w kolejnych cyklach badania PISA. Wyniki dla części humanistycznej wykazują wysoką zbieżność z wynikami PISA dla czytania ze zrozumieniem. W przypadku części matematyczno-przyrodniczej egzaminu, która porównywana była z matematyką w badaniu PISA, zaobserwowano większe różnice pomiędzy rezultatami obydwu badań.
The article presents the methodology and results of a survey on equating the lower secondary school examinations from 2002–2010. The survey was carried out by the Student Performance Analysis Unit at the Educational Research Institute. More than 10 000 students were selected for the equating study and information about more than 500 items was used. IRT models were used for equating exams, the results were presented on a latent variable scale and the observed score scale. Using this procedure, it was possible to isolate random difficulty variation between exam papers from specific years and present changes in ability level of students taking the exam. Based on the results, the level of humanities abilities of lower secondary school leavers was stable, whilst maths and science demonstrated a downward trend. Equating was validated by comparison with the results of the international PISA survey. Results for the arts and humanities were consistent with the PISA results for reading literacy. Maths and science, as compared with the PISA survey maths section demonstrated greater divergence.
Słowa kluczowe
Wydawca
Czasopismo
Rocznik
Numer
Strony
9-30
Opis fizyczny
Daty
wydano
2012-09-30
Twórcy
autor
- Instytut Badań Edukacyjnych
autor
- Instytut Badań Edukacyjnych
autor
- Instytut Badań Edukacyjnych
autor
- Instytut Badań Edukacyjnych
autor
- Instytut Badań Edukacyjnych
Bibliografia
- Glas C. A. (2010). Preliminary manual of the software program Multidimensional Item Response Theory (MIRT). Enschede: University of Twente.
- Glas C. A. W. i Béguin A. A. (1996). Appropriateness of IRT observed-score equating. Research Report 1996–2. Enschede: University of Twente.
- Kolen, M. J. i Brennan R. L. (2004). Test equating, scaling, and linking: Method and practice (2nd ed.). New York, New York: Springer–Verlag.
- Patz R. J. i Junker B. W. (1999). A straightforward approach to Markov ChainMonte Carlo methods for Item Response Models. Journal of Educational and Behavioural Statistics, 24(2), 146–178.
- OECD (2003). Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA. Wyniki badania 2003 w POLSCE [Niepublikowany maszynopis0.
- OECD (2006). Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA. Wyniki badania 2006 w POLSCE (http://www.ifispan.waw.pl/pliki/pisa_raport_2006.pdf).
- OECD (2009). Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA. Wyniki badania 2009 w POLSCE (http://www.ifispan.waw.pl/pliki/pisa_2009.pdf).
- Torre, J. de la (2009). Improving the quality of ability estimates through multidimensional scoring and incorporation of ancillary variables. Applied Psychological Measurement 33(6), doi: 10.1177/0146621608329890
- Wu. M. (2005). The role of plausible values in large-scale surveys. Elsevier: Studies in Educational Evaluation 31, 114–128.
Uwagi
http://www.edukacja.ibe.edu.pl/images/numery/2012/3-1-szaleniec-i-in-wyniki-egzaminu-gimnazjalnego.pdf
Typ dokumentu
Bibliografia
Identyfikatory
ISSN
0239-6858
Identyfikator YADDA
bwmeta1.element.desklight-5b3e7fff-ecb1-4322-9118-1abdd859de3e