Tuesday, 10 December 2013

VALIDITAS dan RELIABILITAS TES


PENDAHULUAN

A.    Latar Belakang
Evaluasi memiliki arti penting dalam kegiatan belajar mengajar yang dilaksanakan oleh seorang guru. Diantara tujuan dari evaluasi adalah untuk menilai ketercapaian tujuan pendidikan oleh anak didik, sarana untuk mengetahui apa yang telah anak didik ketahui dalam kegiatan belajar mengajar, dan memotivasi anak didik. Untuk mengevaluasi hasil belajar dan proses belajar siswa, seorang guru menggunakan berbagai macam alat atau instrumen evaluasi seperti tes tertulis, tes lisan, ceklis-observasi, angket-wawancara, dan dokumentasi.
Keberhasilan mengungkap hasil dan proses belajar ini sebagaimana adanya (objektivitas hasil penilaian) sangat bergantung pada kualitas alat penilainya, di samping itu juga yang tidak kalah pentingnya tergantung pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yaitu validitas (ketepatan) dan reliabilitas (ketetapan atau keajegan) alat tes terjamin kualitasnya. Alat tes yang bagaimana dan seperti apa yang dikatakan memiliki validitas dan reliabilias ini, selanjutnya akan kita bahas dalam makalah ini berjudul “Validitas dan Reliabilitas Tes Hasil Belajar” ini.
B.     Rumusan Masalah
1.      Apa itu Validitas Tes?
2.      Apa itu Reliabilitas Tes?
3.      Validitas dan Reliabilitas pada Penelitian Kuantitatif dan Kualitatif
PEMBAHASAN

1.      Validitas
a.      Pengertian Validitas
Dalam istilah bahasa Indonesia valid dikenal dengan istilah sahih atau tepat benar. Valid menurut Gronlund dapat diartikan sebagai ketepatan interpretasi yang dihasilkan dari skor tes atau instrumen evaluasi. Suatu instrumen tes dikatakan valid, seperti dikatakan oleh Gay dan Johnson apabila instrumen yang digunakan dapat mengukur apa yang hendak diukur.
Contoh yang dapat menggambarkan validitas misalnya guru olahraga yang akan menilai kemampuan dan pemahaman siswa mengenai lari estafet maka seharusnya guru tersebut menggunakan jenis tes praktek agar diperoleh hasil tes sesuai tujuan. Perlu ditekankan disini bahwa suatu tes yang valid untuk menilai suatu kelompok belum tentu tes tersebutjuga valid bila digunakan pada kelompok lain karena perbedaan pada setiap anggota kelompok tersebut.[1]
Ruang lingkup bahasan dari validitas tes meliputi: macam validitas, cara menentukan validitas tes, validitas butir, aplikasi penerapan rumus-rumus para ahli dalam menentukan validitas suatu tes. Fungsi validitas instrumen adalah untuk menentukan kesahihan instrumen sehingga jika instrumen tersebut digunakan untuk mengumpulkan data atau digunakan untuk mengukur kemampuan seseorangtidak diragukan lagi hasil yang diperoleh oleh instrumen tersebut.[2]
Dalam operasionalannya terdapat empat langkah validitas yaitu, triangulasi yang mencakup keragaman sumber, data, metode, dan teori konstruk validitas dalam pemahaman pengakuan terhadap konstruk yang ada dan bukan memaksakan implementasi konstruk atau teori terhadap informan atau konteks; validitas permukaan yang segera mengenal apayang terjadi secara spontan berseru “ya, tentu saja” terhadap situasi yang sedang terjadi; dan validitas penyebab yang mendorong partisipan untuk mengetahui kenyataan yang menyebabkan transformasi. Menurut Richadson bahwa ada validitas tradisonal yang sangat kaku dan hanya berdimensi dua. Ia menginginkan citra kristal sentral yang secara simetris mengkombinasikan substansi dan pendekatan-pendekatan.[3]

b.      Makna Validitas
Validitas suatu instrumen evaluasi mempunyai beberapa makna penting diantaranya adalah sebagai berikut:
1)      Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi untuk grup individual dan bukan instrumen itu sendiri.
2)      Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori yang bisa mencakup kategori rendah, menengah, dan tinggi.
3)      Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan saja.[4]

c.       Unsur Validitas
Ada dua unsur penting dalam validitas tes. Unsur tersebut adalah sebagai berikut:
1)      Validitas suatu tes harus menunjukkan suatu derajat tertentu, ada yang sempurna, ada yang sedang, dan ada pula yang rendah.
2)      Validitas selalu dihubungkan dengan suatu putusan atau tujuan spesifik. Sebagaimana pendapat R. L Thorndike dan H. P Hagen bahwa “validiti is always in relation to a specific decision or use”.[5]
d.      Faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi valid. Beberapa faktor tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes, faktor eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan.
1)      Faktor yang berasal dari dalam tes
Beberapa sumber yang pada umumnya berasal dari faktor internal tes evaluasi diantaranya sebagai berikut:
a)      Arahan tes yang disusun dengan makna yang jelas sehingga dapat menambah validitas tes.
b)      Kata-kata yang dugunakan dalam struktur instrumen evaluasi harus mudah.
c)      Item-item dikonstruksikan dengan baik.
d)     Tingkat kesulitan soal harus disesuaiakan dengan materi pembelajaran yang diterima oleh siswa.
e)      Jumlah item dan waktu evaluasi harus disesuaikan dengan pelajaran yang diterima siswa.
2)      Faktor yang berasal dari administrasi dan skor
Faktor yang berasal dari administrasi dan skor yang dibuat oleh guru. Berikut beberapa faktor yang bersumber dari administrasi dan skor antara lain:
1)      Waktu mengerjakan harus sesuai dengan jumlah soal yang diberikan pada siswa, agar siswa tidak tergesa-gesa menjawab soal tersebut.
2)      Pemberian petunjuk dari pengawas yang harus bisa dilakukan oleh semua siswa.
3)      Teknik pemberian skor harus konsisten.


3)      Faktor-faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi valid karena dipengaruhi oleh jawaban siswa bukan instrumen evaluasi lagi. Misalnya saja siswa senang mengikuti suatu ujian karena guru mata pelajaran mereka baik, ramah dan mudah dimengerti ketika menerangkan, atau ketika siswa harus tampil dalam evaluasi keterampilan suasana ketika tampil nyaman dan tenang, hal inilah yang dapat meningkatkan kualitas validitas suatu tes.[6]

e.       Teknik Uji Validitas
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
1)      Validitas logis mengandung kata logis yang berasal dari kata logika, yang berarti penalaran. Validitas logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Validitas logis dapat dicapai apabila insterumen disusun mengikuti ketentuan yang ada. Degan demikian dapat disimpulkan bahwa, validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.
2)      Validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorng dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktkan melalui pengalaman.
Telah dikatakan sebelumnya bahwa validitas suatu tes evaluasi bukanlah merupakan ciri yang absolut atau mutlak. Suatu tes evaluasi dapat mempunyai validitas yang bertingkat-tingkat seperti tinggi, sedang, dan rendah tergantung pada tujuan yang diinginkan. Sehubungan dengan itu ada beberapa jenis validitas yaitu:
1)      Validitas isi (content validity)
Suatu tes dikatakan memiliki validitas isi jika scope dan isi tes itu sesuai dengan scope dan isi kurikulum yang sudah diajarkan. Isi tes sesuai atau mewakili sampel-sampel belajar yang seharusnya dicapai menurut tujuan kurikulum. Validitas isi juga mempunyai peran yang sangat penting untuk tes pencapaian hasil belajar.
Validitas isi biasanya ditentukan oleh para ahli. Walaupun tidak ada formula matematika khusus untuk menghitung dan tidak ada cara secara pasti akan tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi dengan validitas tes para ahli memberikan beberapa opsi yaitu dengan mengamatinya secara langsung pada tes dan item tes secara seksama sehingga diperoleh cara perbaikan jika ada kesalahan.
Upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dari hasil tes belajar adalah dengan jalan menyelenggarakan iskusi panel. Dalam forum diskusi tersebut, para pakar ayng yag dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, dimintapendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi tes hasil belajar tersebut.[7]
2)      Validitas kostruk (construct validity)
Untuk menentukan adanya validitas konstruk, suatu tes dikorelasikan dengan suatu konsepsi atau teori. Item dalam tes tersebut harus sesuai dengan ciri-ciri yang disebutkan dalam konsepsi tadi. Dengan kata lain, hasil-hasil tes tersebut disesuaiakan dengan tujuan atau ciri-ciri tingkah laku yang hendak diukur.
Seperti halnya pada penganalisisan validitas isi, maka penganalisisan validitas konstruksi dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan.[8]
3)      Validitas prediksi (predictive validity)
Suatu tes dikatakan memiliki validitas prediksi jika hasil korelasi tes itu dapat meramalkan dengan tepat keberhasilan seseorang pada masa mendatang di dalam lapangan tertentu. Tepat-tidaknya ramalan tersebut dapat dilihat dari korelasi koefisien antara hasil tes itu dengan hasil alat ukur lain pada masa mendatang.
Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.[9]
Berdasarkan uraian di atas dapatlah dipahami, bahwa untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang memiliki validitas ramalan atau belum, dapat ditempuh dengan cara: mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya, denga kriterium yang ada. Jika di antara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya itu, dapat dinyatakan sebagi tes hasil belajar yang telah memiliki daya ramal yang tepat, artinya: apa yang telah diramalkan, betul-betul telah terjadi secara nyata dalam praktek.[10]


4)      Validitas konkuren (concurrent validity)
Jika hasil suatu tes mempunyai korelasi yang tinggi dengan hasil suatu hasil alat ukur lain terhadap bidang yang sana dan waktu yang sama pula, maka dikatakan tes itu memiliki validitas konkuren dalam persamaan waktu.[11]
Untuk mengetahui ada/tidaknya hubungan yang searah antara tes pertama dengan tes berikutnya, dapat digunakan teknik analisis korelasional product moment dari Karl Pearson. Jika korelasi antara variabel X (tes pertama) denga variabel Y (tes berikutnya) adalah positif dan signifikan, maka tes tersebut dapat dinyatakan sebagai tes yang memiliki validitas bandingan.
Pengujian hipotesis dilakukan dengan mencari angka korelasi “r” product moment (rxy), dengan derajat kebebasan (N-2), pada taraf signifikansi 1%, dengan ketentuan bahwa jika rxy atau r0 sama atau tidak lebih besar daripada rtabel atau rt maka hipotessis nihil; berarti di antara kedua variabel tersebut terdapat korelasi positif yang signifikan, sehingga tes formatif tersebut dapat diyantakan valid, dalam arti telah memiliki validitas bandingan yang mantap atau meyakinkan. Rumus yang digunakan:
     rxy        = [12]

2.      Reliabilitas
a.      Pengertian Reliabilitas
Reliabilitas adalah karakter lain dari hasil evaluasi. Reliabilitas juga dapat diartikan sama dengan konsistensi atau keajegan. Suatu instrumen evaluasi, dikatakan mempunyai nilai reliabilitas yang tinggi apabila tes yang dibuat mempunyai hasil yang konsisten dalam mengukur yang hendak diukur. Ini berarti semakin reliabel suatu tes, semakin yakin kita dapat menyatakan bahwa dalam hasil suatu  tes mempunyai hasil yang sama dan bisa dipakai di suatu tempat sekolah, ketika dilakukan tes tersebut.
Reliabilitas soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu tes soal. Untuk mengukur tingkat keajegan soal ini digunakan perhitungan Alpha Cronbach. Rumus yang digunakan dinyatakan dengan:
R11 =
Keterangan:
n    =banyaknya butir soal
i= jumlah varians tiap skor
St2  = varians skor total
Rumus untuk mencari varians adalah:
Si2  =
Interpretasi nilai r11 mengacu pada pendapat Guilford (Ruseffendi, 1991b: 191):
rii ­   < 0,20                          reliabilitas sangat rendah
0,20 < rii­ 0,40                    reliabilitas rendah
0,420 < rii­ 0,70                  reliabilitas sedang
0,70 < rii­ 0,90                    reliabilitas tinggi
0,90 < rii­ 1,00                    reliabilitas sangat tinggi.[13]

b.      Teknik Analisis Reliabilitas
Analisis abilitas suatu tes dan atau alat ukur lainnya, termasuk nontes, pada hakikatnya menguji keajegan pertanyaan tes apabila diberikaan berulang kali pada objek yang sama. Suatu tes dikatakan reliabel atau ajeg apabila beberapa kali pengujian menunjukkan hasil yang relatif sama. Pengujian suatu tes bisa dilakukan terhadap objek yang sama pada waktu yang berlainan dengan selang waktu yang tidak terlalu lama dan juga terlalu singkat, bisa juga dilakukan dengan membandingkan hasil pengujian dari tes yang setara.[14]
1)      Single test-single trial
Pendekatan single test-single trial adalah merupakan pendekatan serba single atau pendekatan serba satu, yaitu satu kelompok subjek, satu jenis alat ukur, dan satu kali pengukuran, atau satu kelompok testee, satu jenis tes, dan satu kali testing. Single test-single trial bisa dilakukan dengan menggunakan formula:
a)      Pendekatan Single Test-Single Trial dengan Menggunakan Formula Spearman Brown
rtt   =
di mana:   
r tt : koefisien reabilitas tes secara total (tt=total tes)
rhh : koefisien korelasi product moment antara separoh (bagian pertama) tes, dengan separoh (bagian tes kedua) dari tes tersebut (hh= half-half)
1&2 : bilangan konstan
b)      Pendekatan Single Test-Single Trial dengan Menggunakan Formula Flanagan
r11        = 2 (
Di mana:
R11         : koefiisien reliabilitas tes secara totalitas
2 dan 1            : bilangan konstan
S12        : jumlah kuadrat deviasi (=varian) dari skor-skor hasil tes yang termasuk pada belahan I; S12 =
S22        : jumlah kuadrat deviasi (=varian) dari skor-skor hasil tes yang termasuk pada belahan II; S22 =
St2        : jumlah kuadrat deviasi (=varian total) dari skor-skor hasil tes yang termasuk pada belahan I dan II;S12 =
c)      Pendekatan Single Test-Single Trial dengan Menggunakan Formula Rulon
Rumus yang dikemukakan oleh Rulon untuk mencari Koefisien Reliabilitas Tes (r11) adalah sebagai berikut:
r11 = 1-
dimana: 
r11  = koefisien reliabilitas tes
1                     = bilangan konstan
 = varian perbedaan antarskor yang dicapai oleh testee pada belahan I dengan skor yang dicapai oleh testee pada belahan II.
   = varian total
d)   Pendekatan Single Test-Single Trial dengan Menggunakan Formula Kuder Richadson
Adapun formula yang diajukan oleh Kuder Richadson ada dua buah yang masing-masing diberi kode: KR20 dan KR21, yaitu:
·         Rumus KR20:
r11=  
dimana
r11           = koefisien reliabilitas tes
n          = banyaknya butir item
1          = bilangan konstan
        = varian total
pi         = proporsi testee yang menjawab betul butir item yang bersangkutan
qi          = proporsi testee yang jawabannya salah
  = jumlah dari hasil perkalian pi dan qi
·         Rumus KR21:
r11=  
dimana
r11           = koefisien reliabilitas tes
n          = banyaknya butir item
1          = bilangan konstan
Mt        = mean total (rata-rata hitung dari skor total)
        = varian total
e)      Pendekatan Single Tes-Single Trial dengan Menggunakan Formula C. Hoyt
Dengan menggunakan teknik analisis varian, maka koefisien reliabilitas tes dapat diperoleh dengan menggunakan rumus:
r11= 1-  
dimana
r11           = koefisien reliabilitas tes
1                     = bilangan konstan
MKe     = mean kuadrat interaksi antara testee dan item
MKs     = mean kuadrat antar subjek[15]
2)      Test-retest
Reliabilitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan melakukan tes retes tersebut seorang guru akan mengetahui seberapa jauh konsistensi suatu tes apa yang ingin diukur.
Reliabilitas tes retes ini penting, khususnya ketika digunakan untuk menentukan prediktor misalnya tes kemampuan. Tes kemampuan tidak akan bermanfaat, jika ternyata menunjukkan hasil yang selalu berubah ubah secara signifikan saat diberikan kepada responden.
Reliabilitas tes retes dapat dilakukan dengan cara seperti berikut:
-       Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana
-       Setelah selang waktu tertentu, misalnya 1 minggu atau 2 minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
-       Korelasikan kedua tes tersebut.[16]
Untuk mencari korelasi natara skor-skor hasil tes pertama dengan skor-skor hasil tes kedua, dapaat dipergunakan teknik korelasi rank-order (teknik korelasi tata-jenjang) dari Spearman, dengan menggunakan rumus:
      = 1-
Di mana           :
 (dibaca rho): koefisien korelasi antara variabel 1 (skor-sjor hasil tes pertama) dengan variabel II (skor-skpr hasil tes kedua)
D                 : Difference (beda antara rank variabel I dengan variabel II), atau D= R1-R2
6        dan 1     : bilangan konstan
N                 : banyaknya subjek (testee)[17]
3) Alternate Form
Dalam pelaksanaan pengujian reabilitas tes dengan menggunakan pendekatan alternate form atau bentuk paralel ini, skor-skor yang diperoleh dari kedua seri tes tadi dicari korelasinya. Apbila terdapat korelasi positif yang signifikan maka dapat dikatakan bahwa tes hasil belajar tersebut dapat dikatakan reliabel. Teknik korelasi yang dipergunakan bisa dipilih antara teknik korelasi product moment dari Pearson atau teknik korelasi rank order dari Spearman (khusus untuk N kurang dari 30).
Rumus prodect moment Pearson:[18]
rxy        =

c.       Faktor yang Mempengaruhi Reliabilitas
Koefisien reliabilitas dapat dipengaruhi diantaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu jauh ataupun yang terlalu dekat akan mempengaruhi koefisien reliabilitas. Faktor lain yang juga mempengaruhi reliabilitas instrumen evaluasi diantaranya sebagai berikur:
1)      Panjang tes, semakin panjang suatu tes evaluasi semakin banyak jumlah item materi pembelajran yang diukur. Hal ini menunjukkan dua kemungkinan yaitu tes semakin mendekati kebenaran dan dalam tes semakin kecil siswa untuk menebak jawaban, hal ini berarti semakin tinggi nilai koefisien reliabilitas.
2)      Penyebaran skor, semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas. Hal ini terjadi karena posisi skor siswa secara individual mempunyai kedudukan sama pada tes retes lain sebagai acuan.
3)      Kesulitan tes, tes normatif yang sangat sulit bagi siswa cenderung menghasilkan skor reliabilitas yang rendah.
4)      Objektifitas, yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi mmiliki objektifitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik penskoran.[19]




3.      Validitas dan Reabilitas pada Penelitian Kuantitatif dan Kulitatif
a.      Penelitian Kuantitatif
Dalam penelitian kuantitatif, untuk mendapatkan data yang valid dan reliabel, maka penelitian dilakukan dengan menggunakan instrumen yang valid dan reliabel, dilakukan pada sampel yang mendekati jumlah populasi dan pengumpulan serta analisis data yang dilakukan secara benar. Dalam penelitian kuantitatif, untuk mendapatkan data yang valid dan reliabel yang diuji validitas dan reliabilitasnya adalah instrumen penelitiannya. Oleh karena itu penelitian kuantitatif lebih menekankan aspek reliabilitas daripada aspek validitasnya karena yang diuji adalah instrumennya.

b.      Penelitian Kualitatif
Dalam penelitian kualitatif, temuan atau data dapat dinyatakan valid apabila tidak ada perbedaan antara apa yang dilaporkan oleh peneliti dengan keadaan objek yang terjadi di lapangan penelitian. Dalam penelitian kualitatif yang diuji kevalidan dan reliabannya adalah datanya bukan instrumennya sehingga dalampenelitian kualitatif ini lebih menekankan pada aspek validitas daripada realibilitasnya.[20]
DAFTAR PUSTAKA

Arifin, Zainal. Evaluasi Pembelajaran. Bandung: Remaja Rosdakarya. 2011.
Arikunto, Suharsimi. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.2009.
Jihad, Asep dan Abdul Haris. Evaluasi Pembelajaran. Yogyakarta: Multi Pressindo. 2008.
Purwanto, Ngalim. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya. 1997.
Sudijono, Anas. Pengantar  Evaluasi Pendidikan. Jakarta: Raja Grafindo Persada. 2009.
Sudjana, Nana. Penilaian Hasil Belajar Mengajar. Bandung: Remaja Rosdakarya. 2009.
Sugiyono. Metode Penelitian Pendidikan Pendekatan Kualitatif, Kuantitatif, dan R&D. Bandung: Alfabeta. 2009.
Sukardi. Evaluasi pendidikan Prinsip dan Operasionalnya. Jakarta: Bumi Aksara. 2009.
Uno, Hamzah B. Perencanaan Pembelajaran. Jakarta: Bumi Aksara. 2011.
Wiriaatmadja, Rochiati. Metode Penelitian Tindakan Kelas. Bandung: Remaja Rosdakarya. 2008.



[1] Sukardi, Evaluasi pendidikan Prinsip dan Operasionalnya, (Jakarta: Bumi Aksara, 2009), 30.
[2] Hamzah B. Uno, Perencanaan Pembelajaran, (Jakarta: Bumi Aksara, 2011), 103-104.
[3] Rochiati Wiriaatmadja, Metode Penelitian Tindakan Kelas, (Bandung: Remaja Rosdakarya, 2008), 162-163.
[4] Sukardi, Evaluasi pendidikan Prinsip dan Operasionalnya, 31.
[5] Zainal Arifin, Evaluasi Pembelajaran, (Bandung: Remaja Rosdakarya, 2011), 245.
[6] Sukardi, Evaluasi pendidikan Prinsip dan Operasionalnya, 38-39.
[7] Anas Sudijono, Pengantar  Evaluasi Pendidikan (Jakarta: Raja Grafindo Persada, 2009), 165.
[8] Ibid., 167.
[9] Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara), 67-69.
[10] Anas Sudijono, 170.
[11] Ngalim Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (Bandung: Remaja Rosdakarya, 1997), 138-139.
[12] Anas Sudijono 180-181.
[13] Asep Jihad dan Abdul Haris, Evaluasi Pembelajaran (Yogyakarta: Multi Pressindo, 2008), 180-181.
9 Nana Sudjana, Penilaian Hasil Belajar Mengajar (Bandung: Remaja Rosdakarya, 2009), 148-149.
[15] Anas Sudijono, 260.
[16] Sukardi, hlm. 45.
[17] Anas Sudijono, hlm. 269.
[18] Ibid., hlm. 275.
[19] Sukardi, Evaluasi pendidikan Prinsip dan Operasionalnya, 51-52.
[20] Sugiyono, Metode Penelitian Pendidikan Pendekatan Kualitatif, Kuantitatif, dan R&D, (Bandung: Alfabeta, 2009), 365.