•  
  •  
 

Jurnal Penelitian dan Evaluasi Pendidikan

Authors

Kartono Kartono

Keywords

penyetaraan tes, model dikotomus, politomus, anchor, kategori

Document Type

Article

Abstract

Penelitian ini bertujuan untuk mengungkapkan signifikansi dan kualifikasi: (1) level pada faktor banyaknya butir anchor, banyaknya kategori butir politomus, ukuran sampel, dan metode transformasi yang digunakan; dan (2) kombinasi level antar-faktor yang mempengaruhi hasil penyetaraan tes model campuran 3PL/GPCM. Penelitian ini merupakan penelitian simulasi. Data dibangkitkan berdasarkan data empirik dari tes bentuk campuran yang terdiri atas 30 butir pilihan ganda dan 5 butir uraian. Data bangkitan adalah butir politomus 5 kategori, ukuran sampel 1000, 2000, dan 3000, dan 25 replikasi. Analisis meliputi: analisis butir, konstanta penyetaraan, kriteria evaluasi dengan RMSD, uji signifikansi faktor, uji signifikansi perbedaan level, dan kualifikasi kombinasi level. Hasil penelitian adalah sebagai berikut. (1) Banyaknya butir anchor berpengaruh pada hasil penyetaraan tes, yaitu 40% pada level pertama dan 20% pada level kedua. (2) Banyaknya kategori butir politomus berpengaruh pada hasil penyetaraan tes pada dua level, yaitu 5 kategori pada level pertama, 4 atau 3 kategori pada level kedua. (3) Ukuran sampel berpengaruh pada hasil penyetaraan tes, yaitu 3000 pada level pertama, 2000 pada level kedua, dan 1000 pada level ketiga. (4) Metode transformasi berpengaruh pada hasil penyetaran tes, yaitu metode HA atau SL pada level pertama, RR pada level kedua, dan RS pada level ketiga. Kata kunci: penyetaraan tes, model dikotomus, politomus, anchor, kategori

First Page

302

Last Page

320

Issue

2

Volume

12

Digital Object Identifier (DOI)

10.21831/pep.v12i2.1433

References

Arif Pratisto. (2004). Cara mudah mengatasi masalah statistic dan rancangan percobaan dengan SPSS 12. Jakarta: PT Elex Media Komputindo.

Bastari. (1998). Comparison of IRT models that handle dichotomous and polytomous response data simultaneously.Makalah, tidak diterbitkan, University of Massachusetts, Amherst.Depdiknas. (2007). Peraturan Menteri Pendidikan Nasional Republik Indonesia no. 20 Tahun 2007, tentang StandarPenilaian Pendidikan.

Hambleton, R. K., & Swaminathan, H. (1985).Item responsetheory. Boston:Kluwer Inc.

Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991) Fundamental of item response theory. Newbury Park: Sage Publication Inc.

Han, K.T., & Hambleton, R.K. (2007). User’s manual for wingen: Windows software that generates IRT model parameters and item responses. Center for Educational Assessment Research Report. University of Massachusetts. Diambil pada tanggal 14 April 2007 dari http:// www.umass.edu/remp/software/wingen

Hieronymus, A. N., Lindquistet, E. F., Hoover, H. D., et al. (1980). Iowa test of basic for levels 7 & 8. Iowa: The Riverside Publishing Company.

Jahja Umar. (1995). Berbagai permasalahan penggunaan bentuk soal uraian dan pilihan ganda dalam ujian. Buletin Pengujian dan Penilaian, 6-10.

Kim, S-H., & Cohen, A. S. (2002). A comparison of linking and concurrent calibration under the grade response model. Applied Psychological Measurement, 26, 25-41.Kim, S., & Kolen, M. J. (2004). STUIRT A computer program for scale transformation under unidimensional item response theory models. Version 1.0 Iowa Testing Program. The University of Iowa. On line 8 Agustus 2006. http://www.uiowa.edu/Casma.

Kolen, M. J., & Brennan, R. L. (2004). Test equating, scaling, and linking methodsand practices (2nd ed.). New York: Springer-Verlag.

Mohandas, R. (2004). Test equating. Diambil pada tanggal 08 Januari 2007, dari http://www.Info worldbank. org/handout-equating.

Montgomery, D.C. (1984). Design and analysis ofexperiments (2nd.ed.). New York: John Wiley & Sons.

Muraki, E., & Bock, R. D. (1993). PARSCALE: IRT item analysis and test scoring for rating-scale data.Chicago: Scientific Software International.

Nana Suarna. (2005). Pedoman panduan praktikum microsoft office EXCEL 2003. Bandung: CV YRAMA WIDYA.

Ogasawara, H. (2001). Least squares estimation of item response theory linking coefficients. Applied Psychological Measurement, 25, 373-383.

Sykes, R. C., & Yen, W. M. (2000). The scaling of mixed-item format test with the one-parameter and two-parameter partial credit model. Journal of Educational Measurement, 37, 221-224.

Share

COinS