SlideShare a Scribd company logo
การวิเคราะหแบบทดสอบ
ดวยโปรแกรม TAP (Test Analysis Program)
Step by Step
ประเสริฐ สุภิรักษ
กลุมงานวัดและประเมินผลการศึกษา
สพท.นครสวรรค 1
คํานํา
การวิเคราะหแบบทดสอบ ดวยโปรแกรม TAP : Test Analysis Program (Step by Step)
เลมนี้ ผูเขียนมีความตั้งใจที่ตองการใหผูศึกษาสามารถนําขั้นตอนในการวิเคราะห TAP ไปใชในงาน
พัฒนาการเรียนการสอนในชั้นเรียน เพื่อวิเคราะหการทดสอบของนักเรียนและการวิเคราะหหาคุณภาพ
แบบทดสอบในการแกไขปรับปรุงใหมีประสิทธิภาพมากขึ้น จากการที่ผูเขียนรับผิดชอบงานวัดและ
ประเมินผลการศึกษาของเขตพื้นที่การศึกษา ทําใหทราบปญหาของครูผูสอนในการสรางและพัฒนา
เครื่องมือวัดจะมีความยากในขั้นตอนวิเคราะหขอมูล ซึ่งอาจจะตองพึ่งพาผูวิเคราะหขอมูลให และมัก
จะพบวาขอมูลที่วิเคราะหนั้นวิเคราะหถูกตองหรือไมเพียงไร ตําราเลมนี้จะชวยใหสามารถวิเคราะห
ไดดวยตนเองอยางถูตองแมนยํายิ่งขึ้น เทากับเปนการแกไขปญหาดังกลาวไดเปนอยางดีในระดับหนึ่ง
ผูเขียนขอขอบคุณ นางสาวฌนุษกุล สุภิรักษ ที่ไดชวยแปลเอกสารบางสวน จากการคันควาของผูเขียน
สุดทายผูเขียนหวังเปนอยางยิ่งวา การนําเอกสารเลมนี้ไปใชคงอํานวยประโยชนตอผูใช
พอสมควร หากมีขอบกพรองประการใดขอนอมรับคําแนะนําเพื่อการแกไขปรับปรุงโอกาสตอไป
ประเสริฐ สุภิรักษ
e-mail : supirak5@hotmail.com
สารบัญ
บทที่ 1 บทนํา 1
ความรูเบื้องตนเกี่ยวกับ TAP 1
การแสดงผลการวิเคราะหแบบทดสอบ ( TAP output provides) 1
บทที่ 2 การติดตั้งโปรแกรม 3
การเขาสูโปรแกรม TAP 3
ขั้นตอนการปอนขอมูล 4
ในกรอบหนาตาง INPUT ใหเลือก 4
หนาตาง Data Editor ปอนขอมูลรายการตางๆ ลงในชวงวาง 5
บทที่ 3 ขั้นตอนการวิเคราะหขอมูล 6
ผลการวิเคราะหขอมูล 6
บทที่ 4 ผลลัพธที่ไดจากการวิเคราะห 9
สวนที่ 1. ผลการวิเคราะหผูสอบ (Examinee Analysis) 9
สวนที่ 2 ผลการวิเคราะหขอสอบรายขอและทั้งฉบับ 11
(Item and Test Analysis)
สวนที่ 3 ผลการวิเคราะหรายตัวเลือก (Options Analysis) 14
สวนที่ 4 การแสดงดวยแผนภาพ ( Graph : Bar Chart and Histogram ) 14
บทที่ 5 การเลือกใช เมนู Option 16
การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades ) 16
การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา(Set Percentages of 18
ltem Discrimination)
บทที่ 6 การเลือกใช เมนู Analysis 19
การกําหนดจํานวนขอสอบเพิ่มเติมตามคาความเชื่อมั่นที่ตองการ 19
ผลการวิเคราะห 21
บทที่ 7 การตรวจสอบคุณภาพเครื่องมือวัดผลการศึกษา 22
การพิจารณาคาความยาก(p) และอํานาจจําแนก( r, D) แบบทดสอบ 35
บทที่ 1
บทนํา
1.1 ความรูเบื้องตนเกี่ยวกับ TAP
โปรแกรม TAP (Test Analysis Program) ถูกออกแบบมาอยางมีประสิทธิภาพ งายตอการใช และเปน
โปรแกรม Freeware สามารถดาวนโหลดไดจากเว็ปไซด http://oak.cats.ohio.edu/~brooksg/tap.htm
พัฒนาโดย บรูก (Brooks,Gordon P.) เปนชุดโปรแกรมใหใชฟรี เพื่อวิเคราะหการทดสอบสําหรับครูผูสอนใน
ระดับโรงเรียนตลอดจนในระดับมหาวิทยาลัย จุดเดนเปนลักษณะของ Software เครื่องมือที่อัจฉริยะสําหรับ
ทดสอบออกแบบหลักสูตร ผูใชสามารถปอนขอมูลคะแนนทดสอบในรูปแบบตัวอักษร หรือขอมูลการ
ทดสอบโดยตรง ในการวิเคราะหสถิติของผูสอบ ประกอบดวยเปอรเซ็นตในการตอบถูก การตัดเกรด ชวง
ความเชื่อมั่นของนักเรียนแตละคน สถิติพื้นฐานของกลุมผูสอบ จํานวนขอที่ตอบถูกแตละคน และจํานวนขอที่
ตอบผิด วิเคราะหสถิติของขอสอบและแบบทดสอบ ประกอบดวย การวิเคราะหความยาก อํานาจจําแนก
พอยทไบซีเรียล ตลอดจนวิเคราะหคุณภาพเปนรายตัวเลือก และสามารถแบงกลุมสูงและกลุมต่ําไดตาม
กําหนด
1.2 การแสดงผลการวิเคราะหแบบทดสอบ ( TAP output provides) 2 สวน
1. ผลการวิเคราะหผูทดสอบ (Examinee Analysis ) ประกอบดวย รอยละความถูกตอง
(Percentage Correct) เกรด ชวงความเชื่อมั่น สําหรับนักเรียนแตละคน และผลรวมคะแนน สถิติเชิงพรรณนา
สําหรับกลุมผูสอบ TAP จะสรางรายการคะแนนและคําตอบที่ผิดของนักเรียน (คําตอบที่นักเรียนตอบผิด)ดวย
เชน รายงานนักเรียนเปนรายบุคคล บงชี้คะแนนตอบสนองตอขอสอบที่ถูกตองไปจนถึงสิ่งที่ผิดพลาด
2. ผลการวิเคราะหขอสอบและการทดสอบ (Item and Test Analysis) ประกอบดวย ความ
ยาก ดัชนีคาอํานาจจําแนก (Discrimination index) รายขอรายตัวเลือก และ สถิติความแปรปรวน KR-20 ,
KR-21 คาเฉลี่ย คาความเบี่ยงเบน ถาขอสอบถูกลบออก TAP สามารถคํานวณจํานวนขอสอบเพิ่มเติมตาม
ความตองการที่เพิ่มคาความเชื่อมั่นได
การวิเคราะหตัวเลือก (Option Analysis) ประกอบดวย กลุมสูง และกลุมต่ํา ความยากของ
ขอสอบ เพื่อตรวจคําตอบ(คําตอบที่ถูกตอง) และตัวลวง
ในเอกสารคูมือการใช TAP เลมนี้ จะนําเสนอขั้นตอนการใชโปรแกรม TAP Version 6.65 ซึ่งได
ปรับปรุงพัฒนาตั้งแต Version 4.xx ถึง Version 6.65 ดังนี้
2
Version 6.6X :
- แกขอบกพรองหลัก ดวยรายงานเกรดสวนบุคคล ( ที่เคยเปนปญหาการจําแนกสําหรับการ
ตอบสนอง / คําตอบขอสอบแตละบุคคล )
- เพิ่มความสามารถเพื่อใหผูใชงานระบุ Criteria ดวยตนเองสําหรับขอสอบที่มีปญหา
- เพิ่มความสามารถในการจําแนกผลการวิเคราะห Quick ltem โดยการปรับ Point Bisorial.
Version 6.4X :
- ความสามารถในการปอนขอมูลตัวอักษร( A,B,C,D )ดังเชน ขอมูลตัวเลข (1,2 ,3, 4 ) สําหรับ
เฉลย และคําตอบของนักเรียน
Version 6.XX :
- การนําเขา input files ที่ดีกวาทุก version
- HELP เพื่อชวยในเรื่องของการนําเขาขอมูล SPSS ดวยคําสั่งใน Sytax ที่ใชใน SPSS
- ความสามารถในการซอน และไมซอน( HIDE หรือ UNHIDE) ชื่อจาก Output (defult เปน
hide,ดวย sasy button เปน unhide )
- ปุมการใชงานงายสําหรับคําสั่งการ Saveไฟล Output ทั่วไปทุกชนิด
- การวิเคราะหอยางรวดเร็วสําหรับ ตัวเลือก / ตัวลวง
- Output ที่ถูกเพิ่มเติม ( เชน class statistics, hard item annotations ) ไปสู Individual Grade
Reports.
- HELP ในหนาตางแกไขขอมูลสําหรับ OHOI UWIVERSITY FOUKS ที่ยอมใหนําเขา
ขอมูลscanned TESTSCORE ที่งายกวา
- HELP ในหนาตางแกไขขอมูล นับจํานวน / ines (บรรทัด) ในหนาตางขอมูล
Version 5.XX :
- เครดิตบางสวน ( Partial crdit ) สามารถเพิ่มคะแนน ( แตไมวิเคราะห )
- ขอสอบแบบหลายตัวเลือก สามารถมีคามากกวา 1 คะแนน ( แตยังคงวิเคราะหที่ 1 คะแนน )
- User Grading Categories ปรับเปลี่ยนใชมากกวาเดิม และปรับเปลี่ยนใชไดตามตองการ
Version 4.XX :
- จํานวนผูถูกทดสอบ เพิ่มเปน 9999
- Histrograns และ กราฟแทงสามารถปรับ,Save และ Print
- จํานวนขอสอบเพิ่มเปน 100
- Histrograms และ bar charts แบบใหม สามารถสรางไดจาก Full Results (ผลลัพธ
ทั้งหมด)
- ตาราง ความถี่ (ดวย PR) เพิ่มใน Full Results.
- Split – Half Reliability เพิ่มใน Full Results.
3
บทที่ 2
การติดตั้งโปรแกรม
2.1 การติดตั้งโปรแกรม TAP
ดาวนโหลดไฟร tap.exe จากเว็ปไซด http://oak.cats.ohio.edu/~brooksg/tap.htm หรือ Copy
ไฟร tap.exe จาก CD ที่ใหมาพรอมกับเอกสารนี้ ลงใน My Documents หรือ Copy มาวาง หนา Desktop
เปนไอคอน ดังภาพประกอบ 1
ภาพประกอบ 1
2.2 การเขาสูโปรแกรม TAP
ขั้นตอนการเรียกใชโปรแกรม TAP (Test Analysis Program) for Windows สามารถทําไดโดย
ภาพประกอบ 2
เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65)
ภาพประกอบ 3
ดับเบิ้ลคลิก
4
2.3 ขั้นตอนการปอนขอมูล
2.3.1 ในกรอบหนาตาง INPUT ใหเลือก
ภาพประกอบ 4
1. เลือก Enter New Data การสราง/ปอนขอมูลใหม
2. หรือ เลือก Open TAP file จากนั้น คลิกที่ปุม GO To Data Editor ในกรณี เปดขอมูลเกาที่
สรางจากโปรแกรม TAP
3. คลิกที่ปุม GO To Data Editor
5
2.3 .2 หนาตาง Data Editor ปอนขอมูลรายการตางๆ ลงในชวงวาง ดังนี้
ภาพประกอบ 5
1. Title ปอนหัวขอของแบบทดสอบ หรือวิชาที่จัดสอบ จํานวนตัวอักษรสูงสุด 70 ตัวอักษณ
2. Comments ปอนหมายเหตุ หรืออาจระบุวาแบบทดสอบนี้วัดอะไร จํานวนตัวอักษรสูงสุด
70 ตัวอักษร
3. Key ปอนเฉลยของขอสอบ
4. Options ปอนจํานวนตัวเลือกในขอสอบแตละขอ
5. Include ระบุวาขอใดที่ตองการวิเคราะหและขอใดไมนําเขาวิเคราะห โดยพิมพ Y คือนําขอสอบ
ขอนั้นเขาวิเคราะห หรือพิมพ N เมื่อไมนําขอสอบนั้นเขามาวิเคราะห
6. #Students ปอนจํานวนนักเรียนหรือผูสอบทั้งหมด
7. # Test ltems ปอนจํานวนขอสอบทั้งหมด
8. Length of Examinee Names /IDs (# character) ระบุจํานวนสดมภที่ตองการปอนรหัสประจําตัว
ผูสอบหรือชื่อผูสอบ
9. DATA สําหรับปอนขอมูลทั้งหมดของผูสอบ โดยปอนรหัสประจําตัวผูสอบตามจํานวนสดมภ
ที่กําหนด และปอนตัวเลือกแตละขอของผูสอบแตละคน ตามจํานวนที่ระบุ
10. เมื่อปอนขอมูลเสร็จสิ้น ใหบันทึกขอมูลโดยคลิกที่ปุม Save File
6
บทที่ 3
ขั้นตอนการวิเคราะหขอมูล
ขั้นตอนการวิเคราะหขอมูล3.
3.1 คลิกที่ปุม ในหนาตาง Data Editer ภาพประกอบ 5 โปรแกรมจะ
วิเคราะหขอมูล
3.2 ผลการวิเคราะหขอมูล จะแสดงใน 2 หนาตางคือหนาตาง ดังภาพประกอบ 6
ภาพประกอบ 6
1. หนาตาง QUICK EXAMINEE RESULTS แสดงคาสถิติสําหรับผูสอบ และ
2. หนาตาง QUICK ITEM ANALYSIS แสดงคาสถิติสําหรับขอสอบ
7
3.3 เมื่อตองการบันทึกผลการวิเคราะหทั้งสองหนาตางลงไปไฟล ใหไปที่ชองOUTPUT โดยพิมพชื่อ
ไฟลที่ตองการเก็บผลลัพธในชอง Result File Name โดยผลลัพธจะเก็บไวในนามสกุล .Txt และ
ภาพประกอบ 7
1. คลิก Save Quick Examinee Results โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File
Name แตนามสกุลตางกัน คือ .exm
2. คลิก Save Quick ltem Analysis โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File Name
แตนามสกุลตางกัน คือ .itm
3. คลิก Save Quick Option Analysis โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File
Name แตนามสกุลตางกัน คือ .opt
3.4 การวิเคราะหผลอยางยอ และตอเนื่องดวยการกําหนด Option ใหม
ภาพประกอบ 8
1. ปุม Analyze (F9) เปนปุมวิเคราะหขอมูลโดยจะแสดงผลอยางยอและเมื่อคลิก Option เพื่อ
กําหนด Option เพิ่มเติมใหม เชน การตัดเกรด หรือรอยละของกลุมสูง- กลุมต่ํา สามารถ
วิเคราะหอยางตอเนื่องได ปุมAnalyze(F9) จะเปลี่ยนเปนดังภาพประกอบ 9
ภาพประกอบ 9
8
2. ปุม View Full Results Graphs (F2) เปนปุมวิเคราะหขอมูลโดยละเอียด จะใหผล
การวิเคราะหผูสอบและขอสอบที่มากกวา นอกจากนี้ยังแสดงแผนภูมิแทงและฮีสแกรม
ของคะแนนสอบไดอีกดวย
3. ปุม Save Results Selected Output (F3) เปนปุมบันทึกผลการวิเคราะหโดย
ละเอียดและเลือกการบันทึกไฟรผลลัพธ
4.ปุม View/Print Quick Examinee Full Screen (F5) ) เปนปุมแสดงเฉพาะผลการวิเคราะห
คาสถิติของนักเรียนหรือผูสอบรายบุคคล ทุกรายการ
5.ปุม View/Print Item Analysis Full Screen (F6) เปนปุมแสดงผลการวิเคราะหคาสถิติ
ของแบบทดสอบรายขอ และคุณภาพ ตลอดจนคาความเชื่อมั่น(KR-20,KR-21) ของ
แบบทดสอบทั้งฉบับ ทุกรายการ
6.ปุม View/Print Quick Option Analysis (F7) เปนปุมแสดงผลเฉพาะการวิเคราะหคาสถิติ
คุณภาพของแบบทดสอบรายขอ และตัวเลือกตัวลวง (คา p ,r (D) ตาม Option ที่กําหนด
9
บทที่ 4
ผลลัพธที่ไดจากการวิเคราะห
4 . ผลลัพธที่ไดจากการวิเคราะหโดยละเอียด
ผลลัพธที่ไดจากการวิเคราะหจะแบงออกเปน 4 สวนดังนี้
สวนที่ 1. ผลการวิเคราะหผูสอบ (Examinee Analysis) ใหผลดังนี้
สวนที่ 1
ภาพประกอบ 10
ID คือรหัสประจําตัวของผูสอบแตละคน
Score คือคะแนนที่ไดของผูสอบแตละคน
Percent คือสัดสวนระหวางคะแนนที่ไดกับคะแนนเต็ม
Ltr Grade คือผลการตัดเกรด ซึ่งผูวิเคราะหสามารถกําหนดไดวาจะใหตัดกี่เกรด และ
เกณฑผานคือเทาไร
68% C.I. คือประมาณคาคะแนนจริงของผูสอบแตละคน จากสูตร X ± SEM ที่ระดับความ
เชื่อมั่น 68%
95% C.I. คือประมาณคาคะแนนจริงของผูสอบแตละคน จากสูตร X ± (1.96)SEM ที่ระดับ
ความเชื่อมั่น 95%
10
สวนที่ 1(ตอ)
ภาพประกอบ 11
Number of Examinees คือจํานวนผูสอบทั้งหมด
Minimum Score คือคะแนนต่ําสุดที่ผูสอบในกลุมทําได
Maximum Score คือคะแนนสูงสุดที่ผูสอบในกลุมทําได
Median Score คือคะแนนมัธยฐาน
Mean Score คือคะแนนเฉลี่ย
Standard Deviation คือคะแนนเบี่ยงเบนมาตรฐาน
Variance คือความแปรปรวน
Skewness คือความเบ
Kurtosis คือความโดง
Frequency Table คือ การแสดงแจกแจงความถี่ของคะแนนสอบ
Bar Graph คือแสดงการแจกแจงความถี่ของคะแนนดวยแผนภูมิแทง
Stem-and-Leaf Display คือแสดงการแจกแจงของคะแนนในรูปของแผนภาพตนใบ
Bar Graph คือแสดงการแจกแจงความถี่ของแตละระดับเกรด
11
สวนที่ 2 ผลการวิเคราะหขอสอบรายขอและทั้งฉบับ (Item and Test Analysis) ใหผลดังนี้
ภาพประกอบ 12
Item คือขอสอบแตละขอ
Number Correct คือจํานวนผูสอบที่ตอบถูกในขอนั้น
Item Diff. คือคาความยากของขอสอบ
Disc. Index คือดัชนีอํานาจจําแนกขนองขอสอบ
#Correct in High Grp คือจํานวนผูสอบในกลุมสูงที่ตอบขอสอบขอนั้นถูก
#Correct in Low Grp คือจํานวนผูสอบในกลุมต่ําที่ตอบขอสอบขอนั้นถูก
Point Biserial คือคาอํานาจจําแนกที่คํานวณจากสูตรสหสัมพันธพอยทไบซีเรียล
Adjusted Pt. Bis. คือคาอํานาจจําแนกที่คํานวณจากสูตรสหสัมพันธไบซีเรียล
ภาพประกอบ 13
Number of ltems คือจํานวนขอสอบทั้งหมด
Mean ltem Difficulty คือคาเฉลี่ยของคาความยาก
สวนที่ 2
สวนที่ 2 (ตอ)
12
Mean ltem Discrimination คือคาเฉลี่ยของดัชนีอํานาจจําแนก
Mean Point Biserial คือคาเฉลี่ยของสหสัมพันธพอยทไบซีเรียล
KR20 (Alpha) คือคาความเชื่อมั่นที่คํานวณดวยสูตร KR-20
KR21 คือคาความเชื่อมั่นที่คํานวณดวยสูตร KR-21
SEM (from KR20 ) คือคาความคลาดเคลื่อนมาตรฐานของการวัด
High Grp Min Score (n=18) คือคะแนนต่ําสุดของกลุมสูง
LOW Grp Max Score (n=19) คือคะแนนสูงสุดของกลุมต่ํา
Minimum ltem Diff. คือคาต่ําสุดของคาความยากของขอสอบ
Maximum ltem Diff. คือคาสูงสุดของคาความยากของขอสอบ
Minimum Disc. lndex คือคาต่ําสุดของดัชนีอํานาจจําแนกของขอสอบ
Maximum Disc. lndex คือคาสูงสุดของดัชนีอํานาจจําแนกของขอสอบ
Minimum Pt. Biserial คือคาต่ําสุดของของสหสัมพันธพอยทไบซีเรียล
Miximum Pt. Biserial คือคาสูงสุดของของสหสัมพันธพอยทไบซีเรียล
ภาพประกอบ 14
Additional ltem Analysis คือผลการวิเคราะหขอสอบเพิ่มเติม
Item คือ ขอสอบแตละขอ
Scale Mean if ltem Deleted คือคาเฉลี่ยของขอสอบทั้งฉบับเมื่อไมรวมขอสอบขอนั้น
Scale SD if ltem Deleted คือคะแนนเบี่ยงเบนมาตรฐานของขอสอบทั้งฉบับเมื่อไมรวม
ขอสอบขอนั้น
KR-20 if ltem Deleted คือคาความเชื่อมั่นสูตร KR-20 ของแบบทดสอบทั้งฉบับเมื่อไม
รวมขอสอบขอนั้น
SEM if ltem Deleted คือความคลาดเคลื่อนมาตรฐานของการวัดของแบบทดสอยทั้งฉบับ
เมื่อไมรวมขอสอบขอนั้น
สวนที่ 2 (ตอ)
13
Biserial Correl. คือคาสหสัมพันธไบซีเรียล
Mean Biserial Corr. คือคาเฉลี่ยของสหสัมพันธไบซีเรียล
Minimum Biserial Corr.คือคาต่ําสุดของสหสัมพันธไบซีเรียล
คือคาสูงสุดของสหสัมพันธไบซีเรียลMaximum Biserial Corr.
ภาพประกอบ 15
Answer Key Analysis คือการวิเคราะหตัวเลือกทั้งหมด
Bar Chart for Correct Answer Usage คือแผนภาพแสดงความถี่ของตัวเลือกที่เปน
เฉลยขอสอบ
Bar Chart for Number of Options Usage คือแผนภาพแสดงความถี่ของตัวเลือกที่ใช
ในขอสอบแตละขอ
ภาพประกอบ 16
Ltem lncluded, Answer Keu, Additional Correct Options คือแสดงขอสอบที่รวมเขา
วิเคราะห (ITEMS INCLUDED) ขอสอบที่ไมรวมเขาวิเคราะห (ITEMS EXCLUDED:) เฉลย
ขอสอบ และเฉลยขอสอบ (CORRECTANSWERS (ltem#-Key)
สวนที่ 2 (ตอ)
สวนที่ 2 (ตอ)
14
สวนที่ 3 ผลการวิเคราะหรายตัวเลือก (Options Analysis) ใหผลดังนี้
ภาพประกอบ 17
ตัวเลขที่อยูนอกวงเล็บคือความถี่ของผูสอบที่เลือกตอบตัวเลือกนั้นในแตละกลุม สวนตัวเลขในวงเล็บ
คือสัดสวนของความถี่นั้นตอจํานวนผูสอบในกลุม นั้นคือในแถว Total ของตัวเลือกที่ 1 (Option 1) มีผูสอบ
ทั้งหมดเลือกตัวเลือก 1 จํานวน 15 คน คิดเปนสัดสวน 0.300 ซึ่งสัดสวนนี้ก็คือคาความยาก ( คา p = 0.30 )
ของตัวเลือกที่ 1 สวนผลตางของกลุมสูงและกลุมต่ํา (Diff) คือ 3 คิดเปนสัดสวนในวงเล็บ 0.265 ซึ่งสัดสวน
นี้ก็คือดัชนีอํานาจจําแนก (คา r / D = 0.256 ) ของตักเลือกที่ 1 สังเกตวาโปรแกรมจะคํานวณ Diff โดยใช
ความถี่ของกลุมสูงลบดวยกลุมต่ํา ดังนั้นตัวลวงที่จําแนกไดอยางมีประสิทธิภาพ นั้นคือกลุมสูงควรเลือกตอบ
ตัวลวงนอยกวากลุมต่ํานั่นเอง สวนขอ 1 นี้ตัวเฉลยคือตัวเลือกที่ 1 ซึ่งมีเครื่องหมายดอกจันอยู มีคาความยาก
(p) 0.30 อํานาจจําแนก(r/D) 0.265 ซึ่งถือวาเปนขอสอบที่คอนขางยาก และมีคาอํานาจจําแนกที่ใชได จึงเปน
ขอสอบที่ใชได ถาเครื่องหมาย # ก็คือตัวเลือกนั้นมีอํานาจจําแนกสูงกวาตัวเฉลย
สวนที่ 4 การแสดงดวยแผนภาพ ( Graph : Bar Chart and Histogram )โดยดานลางของหนาตาง
แสดงผลลัพธโดยละเอียดจะปรากฏ 3 ปุมคือ Bar Chart for Grades แสดงแผนภูมิแทงแจกแจงความถี่แตละ
ระดับเกรด Bar Chart for Scores แสดงแผนภูมิแทงแจกแจงความถี่แตละระดับคะแนน และ Histogram
for Scores แสดงฮีสโทแกรมแจกแจงความถี่ละระดับคะแนน ดังภาพประกอบ 19
ภาพประกอบ 18
สวนที่ 3
สวนที่ 4
15
ภาพประกอบ 19
16
บทที่ 5
การเลือกใช เมนู Option
เมนู Options ผูวิเคราะหสามารถกําหนดคาตางในการวิเคราะหได ที่สําคัญดังนี้
1. การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades )
2. การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา (Set Percentages of ltem Discrimination)
ภาพประกอบ 20
1. การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades )
Set Percentages lf Grades ผูวิเคราะหสามารถเลือกใหผลเกรดแกผูสอบได โดยเลือกได 2 เกรด คือ
ผานกับไมผาน เลือกได 5 เกรดคือ A, B, C, D และ F เลือกได 12 เกรดคือ A, A-, B+,B, B-, C+,C, C-,
D+,D, D- และ F และไมแสดงผลเกรด โดยแตละระดับเกรดสามารถเลือกเปอรเซ็นตต่ําสุดที่ผูสอบควรได
ดังภาพประกอบ 21
1.1 คลิก Option ที่เมนูบาร
1.2 เลือกคลิก Set Percentages lf Grades …
1.3 เลือกกําหนดคา
17
ภาพประกอบ 21
การเลือกกําหนดคา
คลิกเลือก 2 Categories (Pass, Fail) = เกรด 2 ระดับ ผาน และไมผาน กําหนด ตัวเลขใน
ชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (70%)
คลิกเลือก 5 Categories (A,B,C,D,F) = เกรด 5 ระดับ A,B,C,D และF กําหนด ตัวเลข ใน
ชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (90,80,70,60 ตามลําดับ)
คลิกเลือก 12 Categories (A,A-,B+,B,B-,C+,C,C-,D+,D,D-,F) = เกรด 12 กําหนด ตัวเลข
ในชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (94,91,88,84,81,78,74,71,68,64,61 ตามลําดับ)
คลิกเลือก User Defined = ผูใชกําหนดระดับเกรดไดเอง
คลิกเลือก No Grading Categories = ไมกําหนดเกรด
18
เมื่อเลือกกําหนดคาแลว คลิก OK เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65)
ปุม Analyze(F9) จะเปลี่ยนเปน แลวคลิก เพื่อวิเคราะหผลใหม
สดมภ Ltr Grade จะแสดงผลเกรดที่กําหนด ดังภาพประกอบ 22
ภาพประกอบ 22
2. การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา(Set Percentages of ltem Discrimination)
Set Percentages of ltem Discrimination ผูวิเคราะหสามารถเลือกแบงกลุมสูงกลุมต่ํากลุมละกี่
เปอรเซ็นตก็ไดโดยระบุคาเปอรเซ็นตที่ตองการ ดังภาพประกอบ 23
2.1 คลิก Option ที่เมนูบาร
2.2 เลือกคลิก Set Percentages of ltem Discrimination
ภาพประกอบ 23
การกําหนดจํานวนเปอรเซ็นตเพื่อแบงกลุมสูงกลุมต่ํา ในชอง Top หรือ Bottom เปน 33 หรือ
50 ตามความตองการได หรือเลือกคา Defaults ของโปรแกรม (27%)
เมื่อเลือกกําหนดคาแลว คลิก OK เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65)
ปุม Analyze(F9) จะเปลี่ยนเปน แลวคลิก เพื่อวิเคราะหผลใหม
19
บทที่ 6
การเลือกใช เมนู Analysis
การเลือกใช เมนู Analysis
การกําหนดจํานวนขอสอบเพิ่มเติมตามคาความเชื่อมั่นที่ตองการ
เมนู Analysis ประกอบไปดวยเมนูรอง Run Analysis ซึ่งสามารถคลิกเลือกไดจากปุมอยูแลว แตเมนู
รองที่สําคัญก็คือ Speaman-Bown Prophecy เปนการทํานายจํานวนขอที่ควรเพิ่มเขาไปในแบบทดสอบเพื่อให
ไดคาความเชื่อมั่นตามที่กําหนด ดังภาพประกอบ 23
ภาพประกอบ 23
1. คลิก Analysis ที่เมนูบาร
2. เลือกคลิก Speaman-Bown Prophecy แสดงหนาจอ Speaman-Bown Prophecy ดัง
ภาพประกอบ 24
3. แสดงคุณภาพแบบทดสอบฉบับนี้มีขอสอบอยู 20 ขอ มีความเชื่อมั่นอยู 0.577
20
ภาพประกอบ 24
จากภาพประกอบ 24 แสดงคุณภาพแบบทดสอบฉบับนี้มีขอสอบอยู 20 ขอ มีความเชื่อมั่นอยูเดิม
0.577 ถาตองการแบบทดสอบที่มีความเชื่อมั่นเพิ่มขึ้นควรจะเพิ่มขอสอบอีกจํานวนเทาใด
1. กําหนดตัวเลขคาความเชื่อมั่นเพิ่มใน To achieve a desired of reliability of …
2. คลิกการคํานวณ Calculate
แสดงหนาจอจํานวนขอสอบเพิ่มเติม ดังภาพประกอบ 25
21
ภาพประกอบ 25
ผลการวิเคราะห
คาความเชื่อมั่นของแบบทดสอบเดิมทั้งฉบับ ( The reliability of the test analyzed was….)= 0.577
ตองการผลคาความเชื่อมั่นเพิ่มเติม (To Achieve a desired of reliability of …) = 0.800
จํานวนขอสอบที่ตองเพิ่ม (you need….) = 39 ขอ
ขอสอบฉบับนี้เพิ่มมากขึ้น ( item. This is because the test must be….) = 2.94 เทาของขอสอบเดิม
จํานวนขอสอบรวมทั้งหมด ( item. For a TOTAL of …) 59 ขอ
นั่นคือแบบทดสอบฉบับนี้มีขอสอบอยูเดิม 20 ขอ มีความเชื่อมั่นอยูเดิม 0.577 ถาตองการ
แบบทดสอบที่มีความเชื่อมั่น 0.800 ควรจะตองเพิ่มขอสอบอีกจํานวนเทาใด ผลการวิเคราะหก็คือ ตองเพิ่ม
อีก 39 ขอหรือ 2.94 เทาของขอสอบเดิม จึงจะไดคาความเชื่อมั่น 0.800 ขอสอบในแบบทดสอบควรจะมี
จํานวน 59 ขอ ซึ่งเปนผลการทํานายถาขอสอบที่เพิ่มเติมมีคุณภาพเทากับขอสอบเดิมหรือใกลเคียงกัน
22
บทที่ 7
การตรวจสอบคุณภาพเครื่องมือวัดผลการศึกษา
เครื่องมือวัดที่นําไปใชในการวัดผลการเรียนรูของผูเรียน ควรเปนเครื่องมือที่ดีมีคุณภาพ เพื่อทําให
สามารถวัดผลการเรียนรูที่แทจริงของผูเรียนได เครื่องมือวัดผลที่มีคุณภาพ มีลักษณะสําคัญดังนี้
1. ความตรงหรือความเที่ยงตรง (Validity)
2. ความยากหรือความยากงาย (Difficulty)
3. อํานาจจําแนก (Discrimination Power)
4. ความเที่ยงหรือความเชื่อมั่น (Reliability)
5.ความเปนปรนัย (Objectivity)
6. ความสามารถในการนําไปใช (Usability)
1. ความตรงหรือความเที่ยงตรง (Validity) ความหมายของความตรงแบงไดเปน 2 แนวคิด
ตามแนวคิดเดิม ความตรง หมายถึง ความสามารถของเครื่องมือที่วัดไดตรงกับสิ่งที่ตองการวัด สวนแนวคิด
ปจจุบัน ความตรง หมายถึง ความสามารถของหลักฐานที่อธิบายผลการวัดไดตรงกับสิ่งที่ตองการวัด ความ
ตรงของผลการวัด อาจไดมาจาก การรวบรวมหลักฐานจากหลายวิธี การตรวจสอบหลักฐานที่แสดงถึงความ
ตรงจึงมีหลายชนิด ซึ่งจําแนกตามหลักฐานได 3 ชนิด คือ หลักฐานความตรงเชิงเนื้อหา หลักฐานความตรงเชิง
เกณฑ และหลักฐานความตรงเชิงโครงสราง
2. ความยากหรือความยากงาย (Difficulty) หมายถึงความยากในเชิงเนื้อหาของเครื่องมือประเภท
แบบทดสอบ ซึ่งมีคําตอบถูกผิดตามหลักวิชา หรือหลักการอื่นๆ ความยากพิจารณาจากสัดสวนหรือรอยละ
ของผูที่ตอบคําถามขอนั้นๆ ไมถูกตอง เครื่องมือวัดผลที่ดี ควรมีความยากพอเหมาะกับกลุมผูสอบ สําหรับ
เครื่องมือประเภทที่ไมมีคําตอบถูกผิด จะไมมีความยากในเชิงเนื้อหา การสรางเครื่องมือตองใชภาษาที่
เหมาะสมกับกลุมสอบ
3. อํานาจจําแนก (Discrimination Power) หมายถึง ความสามารถของเครื่องมือที่วัดไดตรงกับ
ความสามารถของผูถูกวัด เปนความสัมพันธระหวางความสามารถของผูตอบกับการตอบถูก กลาวคือ คนที่มี
ความสามารถในสิ่งที่วัดมากควรตอบถูกมาก และในทํานองเดียวกันคนที่มีความสามารถต่ํา จะตอบถูกนอย
เครื่องมือวัดที่มีอํานาจจําแนกสามารถจําแนกผูที่มีความสามารถแตกตางกัน ออกจากกันตามระดับ
ความสามารถ เชน จําแนกคนที่รอบรู ออกจากที่ไมรอบรู จําแนกคนที่มีคุณธรรมสูง ออกจากคนที่มีคุณธรรม
ต่ํา เปนตน
4. ความเที่ยงหรือความเชื่อมั่น (Reliability) หมายถึง ความคงที่ หรือความคงเสนคงวา
(Consistency) ของผลที่ไดจากการวัดสิ่งเดียวกันดวยเครื่องมือเดียวกันในชวงเวลาที่ตางกัน
23
2 ครั้งขึ้นไป หรือความสอดคลองของผลการวัดสิ่งเดียวกันดวยเครื่องมือหรือวิธีการที่แตกตางกันมากกวาหนึ่ง
อยางขึ้นไป การตรวจสอบความเที่ยงทําไดหลายวิธี เชน วิธีวัดซ้ํา(test-retest) วิธีใชเครื่องมือที่สมมูลกัน
(equivalent forms) วิธีหาความสอดคลองภายใน เปนตน
5. ความเปนปรนัย (Objectivity) หมายถึง ความชัดเจนของเครื่องมือทั้งคําถามและคําตอบ คําถามที่
เปนปรนัยตองมีความชัดเจน ผูอานเขาใจตรงกันวาถามอะไร สวนตําตอบที่เปนปรนัยตองมีคําตอบถูกชัดเจน
มีวิธีการตรวจและเกณฑการใหคะแนน รวมทั้งการแปลความหมายที่ผูตรวจสามารถใหคะแนนไดตรงกัน
6. ความสามารถในการนําไปใช (Usability) ลักษณะของเครื่องมือที่ควรพิจารณาอีกอยางหนึ่ง คือ
ความสามารถนําไปใชไดสะดวก เนื่องจากครูผูสอนหรือผูใชเครื่องมือไมใชผูที่ไดรับการฝกอบรมดานการ
วัดผลมาโดยเฉพาะ ดังนั้นเครื่องมือจึงควรมีลักษณะที่สามารถนําไปใชไดสะดวก ดังนี้
6.1 งายในการดําเนินการสอบ เครื่องมือควรมีคําชี้แจงสําหรับการสอบที่งายและชัดเจน
6.2 ใชเวลาในการสอบเหมาะสม เครื่องมือที่มีประสิทธิภาพเปนเครื่องมือที่วัดไดตรง โดยใชคําถาม
จํานวนนอยขอ และใชเวลานอยที่สุด เครื่องมือที่วัดไดตรงตองครอบคลุมและเปนตัวแทนสิ่งที่วัด การใช
คําถามนอยขออาจไมครอบคลุมสิ่งที่จะวัด การใชคําถามมากขออาจทําใหครอบคลุมสิ่งที่ตองการวัดแตก็ตอง
ใหเวลาการตอบเพียงพอ การใชเวลานอยเกินไป อาจทําใหผูตอบทําไมทันซึ่งอาจตอบโดยการเดา ในทาง
ตรงกันขามการใหเวลามากเกินไปอาจทําใหผูตอบตอบถูกเกือบทั้งหมด ซึ่งมีผลตอคาอํานาจจําแนกของ
เครื่องมือ และสงผลใหเครื่องมือมีความเที่ยงต่ํา
6.3 งายในการตรวจใหคะแนน เครื่องมือที่ดีควรมีวิธีการตรวจใหคะแนนที่สะดวก ถูกตองไม
ซับซอน และใชเวลาไมมากนัก
6.4 งายในการแปลผลและการนําผลไปใช เครื่องมือที่ดีควรมีคูมือการแปลผลและการนําผลไปใช
ใหเปนประโยชนตอผูเกี่ยวของ
เครื่องมือที่มีคุณภาพมีลักษณะสําคัญ หลายประการดังกลาวแลว ในการสรางเครื่องมือควรมีการ
ตรวจสอบเครื่องมือที่สรางขึ้นวามีคุณภาพหรือไม เครื่องมือที่จะนําไปใชในการวัดและประเมินผลการศึกษา
ควรเปนเครื่องมือที่มีคุณภาพ ตัวชี้วัดคุณภาพของเครื่องมือ ไดแก
1. ตัวชี้วัดคุณภาพของเครื่องมือวัดผลเปนรายขอ ประกอบดวย
ความยาก
อํานาจจําแนก
2. ตัวชี้วัดคุณภาพของเครื่องมือวัดผลทั้งฉบับ ประกอบดวย
ความตรง
ความเที่ยง
24
1. การตรวจสอบความตรงเครื่องมือวัด
สถิติที่ใชหาความตรง ในที่นี้จะกลาวถึงการหาความตรงเชิงเนื้อหา 2 วิธี คือ
1. IOC : Index of Item – Objective Congruence
2. CVR : Content Validity Ratio
แบบทดสอบวัดผลสัมฤทธิ์ทางการเรียน : จะตรวจสอบความตรงเชิงเนื้อหาของแบบทดสอบ
ความสอดคลองของขอสอบกับวัดถุประสงคที่วัด
และความครอบคลุมของเนื้อหาที่วัด
แบบสอบถามหรือแบบประเมินตางๆ : จะตรวจสอบความสอดคลองและครอบคลุมของ
คําถาม(Items) กับเนื้อหา(Content) คุณลักษณะ
(Trait)หรือองคประกอบของสิ่งที่ตองการวัด
1.1 การหาคา IOC พิจารณาจากคะแนนของผูเชี่ยวชาญ
โดยการใหตรวจผลการพิจารณาของผูเชี่ยวชาญตอขอคําถามรายขอ 3 ประเด็น คือ
ให +1 ถาแนใจวา ขอคําถามหรือขอความสอดคลองกับวัตถุประสงคที่ตองการวัด
ให 0 ถาไมแนใจวา ขอคําถามหรือขอความสอดคลองกับวัตถุประสงคที่ตองการวัด
ให -1 ถาแนใจวา ขอคําถามหรือขอความไมสอดคลองกับวัตถุประสงคที่ตองการวัด
นําคะแนนของผูเชี่ยวชาญทุกคนที่ประเมินมากรอกลงในแบบวิเคราะหความสอดคลองของขอคําถาม
กับจุดประสงคเพื่อหาคาเฉลี่ย สําหรับขอคําถามแตละขอใชสูตร ดังนี้
IOC =
N
R∑
IOC คือ คาดัชนีความสอดคลองระหวางขอสอบกับจุดประสงค
(Index of Item – Objective Congruence)
∑R คือ ผลรวมของคะแนนความคิดเห็นของผูเชี่ยวชาญ
N คือ จํานวนผูเชี่ยวชาญ
การแปลความหมายดัชนีความสอดคลองใชเกณฑ
ถา IOC ≥ 0.5 แสดงวา ขอคําถามหรือขอความวัดไดตรงตามเนื้อหาและ
สอดคลองกับวัตถุประสงค
IOC < 0.5 แสดงวา ขอคําถามหรือขอความวัดไมตรงตามเนื้อหาและ
ไมสอดคลองกับวัตถุประสงค
25
ตัวอยางแบบตรวจสอบความสอดคลองของขอสอบกับจุดประสงค (รายบุคคล)
คําชี้แจง โปรดพิจารณาขอสอบแตละขอที่แนบมาใหวา วัดไดตรงกับจุดประสงคหรือไม
ใหกาเครื่องหมาย ลงในชอง +1 ถาวัดไดตรงกับจุดประสงค
ในชอง 0 ถาไมแนใจหรือตัดสินไมได
ในชอง -1 ถาวัดไดไมตรงกับจุดประสงค
พรอมทั้งความคิดเห็นและขอเสนอแนะ
ความคิดเห็นของผูเชี่ยวชาญขอสอบ ความคิดเห็น/
จุดประสงค
ขอที่ +1 0 -1 ขอเสนอแนะ
แบบฝกการคํานวณหาคาดัชนีความสอดคลองระหวางขอสอบแตละขอกับจุดประสงค
(Index of Item Objective Congruence : IOC)
กิจกรรม 1.1 เมื่อนําขอสอบ จํานวน 5 ขอ ซึ่งวัดจุดประสงคขอ 1 ไปใหผูเชี่ยวชาญ
เนื้อหาวิชาพิจารณาลงความเห็นวาขอสอบแตละขอ วัดพฤติกรรมตามที่ระบุ
ไวในจุดประสงคขอ 1 หรือไม โดยใชแบบตรวจสอบความสอดคลองของ
ขอสอบกับจุดประสงค ดังนี้
คะแนนความคิดเห็นของผูเชี่ยวชาญจุดประสงค
ขอที่
ขอสอบ
ขอที่ คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5
∑R IOC
1 1
2
3
4
5
+1
+1
-1
0
+1
+1
+1
-1
0
+1
+1
0
0
0
+1
+1
+1
-1
0
+1
0
0
-1
0
+1
........
........
........
........
........
..........
........
........
........
........
สรุปผลการพิจารณาตรวจสอบ ……………………………………………………….....
……………………………………………………………………………………………………….
26
กิจกรรม 1.2 ผูเชี่ยวชาญ 5 คน พิจารณาแบบประเมินทักษะการทํางาน โดยมีรายการ
ประเมิน 6 รายการ ผลการประเมินแสดงดังตาราง จงหาดัชนีความสอดคลอง
ของรายการแตละรายการ และสรุปผลการพิจารณาแบบประเมินของผูเชี่ยวชาญ
ความคิดเห็นของผูเชี่ยวชาญ
รายการ
+ 1 0 - 1
1.ดานการวางแผนการทํางาน
1.1 การวิเคราะหงาน............................ 5 0 0
1.2 กําหนดเปาหมายในการทํางาน…………….. 4 0 1
1.3 กําหนดขั้นตอน กิจกรรมทํางาน 5 0 0
1.4 กําหนดวิธีการควบคุมผลการปฏิบัติงาน 4 1 0
1.5 บอกแหลงขอมูลสารสนเทศตางๆ ที่ใชประกอบการ
ตัดสินใจในการทํางาน……………………..
3 1 1
1.6 3 1 1การประมาณการใชงบประมาณ เวลา แรงงาน และ
วัสดุอุปกรณในการทํางาน…………………..
จากสูตร IOC =
N
R∑
คาดัชนีความสอดคลอง ขอ 1.1 ………………
คาดัชนีความสอดคลอง ขอ 1.2 ………………
คาดัชนีความสอดคลอง ขอ 1.3 ………………
คาดัชนีความสอดคลอง ขอ 1.4 ………………
คาดัชนีความสอดคลอง ขอ 1.5 ………………
คาดัชนีความสอดคลอง ขอ 1.6 ………………
สรุปผลการพิจารณาตรวจสอบ ……………………………………………………….....
……………………………………………………………………………………………………….
……………………………………………………………………………………………………….
………………………………………………………………………………………………………
27
1.2 การคํานวณหาคา CVR : Content Validity Ratio
จะมีตารางกําหนดมาให และใชสูตรคํานวณ นําคาไปเปรียบเทียบกับตาราง รายละเอียดดังนี้
ตาราง คาอัตราสวนความตรงเชิงเนื้อหาต่ําสุดที่ผานเกณฑของลอรชี
คา CVR ต่ําสุด คา CVR ต่ําสุด
จํานวนผูเชี่ยวชาญ จํานวนผูเชี่ยวชาญ
ที่มีนัยสําคัญ ที่มีนัยสําคัญ
5
6
7
8
9
10
11
12
0.99
0.99
0.95
0.75
0.78
0.62
0.59
0.56
13
14
15
20
25
30
35
40
0.54
0.51
0.49
0.42
0.37
0.33
0.31
0.29
ที่มา (Lawshe, 1975, p.568)
สูตรการคํานวณ
CVR =
N/2
Ne – N/2
เมื่อ Ne = ผูเชี่ยวชาญที่เห็นดวยหรือเห็นวาเหมาะสม
N/2 = ครึ่งหนึ่งของผูเชี่ยวชาญทั้งหมด
ตัวอยาง ถาขอคําถามขอหนึ่งมีผูเชี่ยวชาญ 14 คน เห็นดวย 11 คน คํานวณได ดังนี้
11 - 7
7
CVR =
= 0.57
นําคาที่คํานวณไดไปเปรียบเทียบกับคาในตารางที่จํานวนผูเชี่ยวชาญ 14 คือ 0.51
คาที่คํานวณได 0.57 ซึ่งสูงกวาจึงผานเกณฑ
28
2. การการวิเคราะหความยาก
ความยากของขอสอบรายขอ เปนดัชนีที่ชี้สัดสวนของผูสอบที่ตอบขอสอบขอนั้นๆ ถูก ความยากของ
ขอสอบรายขอ(p) คํานวณไดจากสูตร
จํานวนผูสอบทั้งหมด
จํานวนผูสอบที่ตอบขอสอบถูก
P =
ตัวอยาง จากผูเขาสอบทั้งหมด 40 คน มีผูตอบขอสอบขอที่ 1 ถูก 30 คน จงคํานวณคา
ความยากของขอสอบขอที่ 1
30P =
40
= .75
ความยากมีคาอยูระหวาง 0 ถึง 1
ขอสอบขอที่ไมมีผูใดตอบถูกเลย จะมีคาความยาก เทากับ 0
ขอสอบขอที่มีผูตอบถูกครึ่งหนึ่งของผูตอบทั้งหมด จะมีคาความยาก เทากับ .50 และ
ขอสอบขอที่มีผูตอบถูกทั้งหมดจะมีคาความยาก เทากับ 1
การแปลความหมายคาความยาก ใชเกณฑการพิจารณา ดังนี้
0.81 – 1.00 ขอสอบงายเกินไป
0.61 – 0.80 ขอสอบคอนขางงาย
0.41 – 0.60 ขอสอบยากปานกลง
0.21 – 0.40 ขอสอบคอนขางยาก
0. – 0.21 ขอสอบยากเกินไป
กิจกรรม 2.1 จากตัวอยาง จงคํานวณคาความยากของขอสอบและแปลความหมายคาความ
ยากขอที่ 1-5
ความยากขอสอบขอที่ จํานวนผูตอบถูก จํานวนผูตอบทั้งหมด ความหมาย
1 7 10
2 30 30
3 20 40
4 0 28
5 10 50
29
สรุปคุณภาพขอสอบ
.............................................................................................................................................................................
.................................................................................................................
ในกรณีที่มีผูเขาสอบจํานวนมาก(มากกวา 40 คน) การวิเคราะหความยากของขอสอบรายขอ อาจใช
วิธีแบงกลุมผูสอบตามคะแนนรวม แลวน้ําผลการตอบของผูสอบที่ไดคะแนนรวมสูง รอยละ 27 และกลุม
ผูสอบที่ไดคะแนนรวมต่ํา รอยละ 27 (เทคนิค 27%) มาวิเคราะห โดยใชสูตรการคํานวณ คาความยากรายขอ
ดังนี้
H + L
P =
H + L
NH + NL
H แทน จํานวนผูตอบถูกในกลุมสูง NH แทน จํานวนผูตอบทั้งหมดในกลุมสูง
L แทน จํานวนผูตอบถูกในกลุมต่ํา NL แทน จํานวนผูตอบทั้งหมดในกลุมต่ํา
กิจกรรมที่ 2.2 จากผูเขาสอบทั้งหมด 100 คน แบงเปนผูสอบที่ไดคะแนนรวมสูง 27 คน และ
ผูสอบที่ไดคะแนนรวมต่ํา 27 คน เมื่อแจงนับจํานวนผูตอบขอสอบขอที่ 2
ปรากฏวาผูสอบในกลุมสูงตอบถูก 25 คน และผูสอบในกลุมต่ําตอบขอสอบ
ถูก 15 คน จงคํานวณคาความยากของขอสอบขอที่ 2
จากโจทย H = …..... L = …… NH = ……. NL= ………..
จากสูตร P =
NH + NL
=
= …………
ดังนั้น ความยากของขอสอบขอที่ 2 เทากับ …………..
การวิเคราะหขอสอบแบบอัตนัย
ขอสอบแบบอัตนัย (Essay) เปนขอสอบที่ใหผูสอบเขียนตอบตามความคิดของตนเอง เปนเครื่องมือที่
จําเปนในการวัดผลโดยเฉพาะในการวัดเกี่ยวกับความคิดเห็น เจตคติ ความสามารถในการคิดวิเคราะห
(Synthesis) ความสามารถในการอธิบายใหคนอื่นเขาใจ ความสามารถในการบูรณาการความรู การตอบ
ขอสอบชนิดนี้ไดตองอาศัยความรอบรู ประสบการณ และความสามารถในการบูรณาการความรู
30
วิธีการวิเคราะหขอสอบแบบอัตนัย
1. ตรวจใหคะแนนขอสอบแตละขอ แลวรวมคะแนนทุกขอ
2. เรียงกระดาษคําตอบจากคะแนนสูงสุดมาหาต่ําสุด นําจํานวนผูตอบจากคะแนนสูงสุดลงมา 25%
เปนกลุมสูง และจํานวนผูตอบจากคะแนนต่ําสุด 25% เปนกลุมค่ํา ในการวิเคราะหใชเฉพาะผล
การสอบของกลุมสูงและกลุมต่ํา ที่เหลือกลุมกลาง 50% ไมนํามาวิเคราะห
3. บันทึกคะแนนของแตละคนในแตละขอ ลงในตาราง โดยแยกตามกลุม รวมคะแนนของแตละขอ
ของแตละกลุม
4. วิเคราะหหาคาความยากและอํานาจจําแนก โดยใชสูตรดังนี้
ผลรวมของคะแนนกลุมสูง + ผลรวมของคะแนนกลุมต่ํา
คาความยาก =
จํานวนคนทั้งสองกลุม x คะแนนเต็ม
2NM
ผลรวมของคะแนนกลุมสูง - ผลรวมของคะแนนกลุมต่ํา
จํานวนคนในแตละกลุม x คะแนนเต็ม
ΣH - ΣL
NM
หรือ
P =
ΣH + ΣL
คาอํานาจจําแนก =
หรือ D =
3. การการวิเคราะหคาอํานาจจําแนก
3.1 ารวิเคราะหอํานาจจําแนกของแบบทดสอบแบบอิงกลุม
สูตร
D = PH - PL
เมื่อ D แทน อํานาจจําแนกของขอสอบรายขอ
PH แทน สัดสวนของผูตอบขอสอบถูกในกลุมสูง
PL แทน สัดสวนของผูตอบขอสอบถูกในกลุมต่ํา
หรือ
D = r =
NH หรือ NL
H - L
31
เมื่อ D แทน อํานาจจําแนกของขอสอบรายขอ
H แทน จํานวนผูตอบถูกในกลุมสูง
L แทน จํานวนผูตอบถูกในกลุมต่ํา
NH แทน จํานวนผูตอบทั้งหมดในกลุมสูง
NL แทน จํานวนผูตอบทั้งหมดในกลุมต่ํา
ตัวอยาง จากผูเขาสอบทั้งหมด 100 คน แบงเปน 3 กลุม กลุมที่ไดคะแนนรวมสูง 27 คน
กลุมผูสอนที่ไดคะแนนกลางๆ 46 คน และกลุมผูสอบที่ไดคะแนนรวมต่ํา 27 คน
เมื่อแจงนับจํานวนผูตอบขอสอบขอที่ 5 ปรากฏวา ผูสอบในกลุมสูงตอบถูก
25 คน และผูสอบในกลุมกลุม ตอบขอสอบถูก 15 คน จงคํานวณหาคาอํานาจ
จําแนกของขอสอบขอที่ 5
27
27
…………
จากโจทย PH = = 0.93
25
PL = = 0.5615
จากสูตร D = PH - PL
= 0.93 - 0.56 = 0.37
ดังนั้น คาอํานาจจําแนกของขอสอบขอที่ 5 เทากับ 0,37
กิจกรรมที่ 3.1 จากโจทยตัวอยาง จงคํานวณคาอํานาจจําแนก ขอที่ 5
H = ………., L = …………, NH = NL = ……………
จากสูตร
r =
H - L
=
NH หรือ NL
………..
=
สรุปผลการวิเคราะหคํานวณคาอาจจําแนก
..........................................................................................................................................................
32
3.2 การวิเคราะหอํานาจจําแนกของแบบทดสอบแบบอิงเกณฑ
สูตร
D = Ppost - Ppre
D แทน อํานาจจําแนกของขอสอบรายขอ
Ppost แทน สัดสวนของผูตอบขอสอบหลังเรียนถูก
Ppre แทน สัดสวนของผูตอบขอสอบกอนเรียนถูก
( จากสูตร Cox and Vargs, 1966 cited in Wiersma and Jurs, 1990: 244-245)
กิจกรรมที่ 3.2 ผูเขาสอบ 8 จาก 25 คน ตอบขอสอบกอนเรียนขอที่ 4 ไดถูกตอง และเมื่อสอน
เสร็จ ผูสอนใหผูเรียนกลุมเดิมตอบแบบทดสอบฉบับเดิมอีกครั้งหนึ่ง ปรากฏวา
ผูเรียนตอบขอสอบขอที่ 4 ถูกตอง 20 คน จงหาคาอํานาจจําแนกของขอสอบขอที่ 4
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………
3. 3 การแปลความหมายคาอํานาจจําแนกของขอสอบ
อีเบลและฟริสไบ (Ebel and Frisbi, 1986 : 234) เสนอเกณฑในการพิจารณาคาอํานาจจําแนก ดังนี้
อํานาจจําแนก ผลการประเมินขอสอบ
.40 ขึ้นไป เปนขอสอบที่จําแนกไดดีมาก
.30 - .39 เปนขอสอบที่จําแนกไดคอนขางดี แตถาเปนไปไดควรปรับปรุง
.20 - .29 เปนขอสอบที่จําแนกไดบาง แตควรปรับปรุงแกไข
ต่ํากวา .19 เปนขอสอบที่จําแนกไดนอย ควรตัดออกหรือปรับปรุงใหม
33
4. การวิเคราะหความเที่ยงหรือความเชื่อมั่น (Reliability)
4.1 การหาคาความเที่ยงดวยวิธีของคูเดอร- ริชารดสัน (Kuder – Richardson)
เปนวิธีที่นิยมใชกันมากเนื่องจากทดสอบกับกลุมตัวอยางเพียงครั้งเดียว แบงยอยเปน 2 สูตร KR-20
และ KR-21 โดยมีขอตกลงวาแบบทดสอบฉบับนั้นจะตองวัดลักษณะเดียวกันหรือวัดองคประกอบรวมกัน
และมีระบบการใหคะแนนเปน Dichotomous คือ ตอบถูกให 1 คะแนน ตอบผิดให 0 คะแนน KR-21 ใชใน
กรณีเครื่องมือหรือแบบทดสอบมีความยากเทากันซึ่งในทางปฏิบัติเปนไปไมไดยาก จึงตองใชมีวิธีการคํานวณ
จากสูตร KR – 20 ดังนี้
สูตร
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
−
−
=−
∑
2
1
1
20
S
pq
k
k
KR
เมื่อ
k แทน จํานวนขอสอบ
S2
แทน ความแปรปรวนของคะแนนรวมทั้งฉบับ
p แทน สัดสวนของคนทําถูกในแตละขอ
q แทน สัดสวนของคนทําผิดในแตละขอ (q = 1-p)
ตัวอยาง ผลการสอบของนักเรียน 6 คน ขอสอบ 6 ขอ ดังตาราง
ขอสอบ รวมคะแนน
นักเรียน
1 2 3 4 5 6 X X2
1
2
3
4
5
6
1
1
0
0
1
1
1
1
1
0
1
0
1
1
1
1
0
0
1
1
1
1
0
0
1
1
1
1
0
0
1
1
1
1
0
0
6
6
5
4
2
1
36
36
25
16
4
1
P
Q
pq
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
ΣX = 24 Σ X2
= 118
Σpq = 1.33 S2
= 4.4
⎥⎦
⎤
⎢⎣
⎡
−=−
...........
.........
1
.......
......
20KR
= ……………………..
34
4.2 การหาความเที่ยงดวยวิธีของครอนบัค(Cronbach)
การหาความเที่ยงหรือความเชื่อมั่นของแบบสอบถาม นิยมใชวิธีของครอนบาค ใชกับ
แบบสอบถามที่ใหคะแนนแบบเรียงอันดับ หรือเปนมาตราสวนประมาณคา (rating scale) วิธีนี้เรียกวา การหา
คาสัมประสิทธิ์แอลฟา (α -Coefficient) ซึ่งดัดแปลงมาจากสูตร KR – 20 ดังนี้
α = ⎥
⎦
⎤
⎢
⎣
⎡ ∑
−
− 2
t
2
i
S
S
1
1n
n
เมื่อ α = สัมประสิทธิ์ความเที่ยง (สัมประสิทธิ์แอลฟา)
n = จํานวนคําถาม
∑ =2
iS ผลรวมของความแปรปรวนของคะแนนในแตละขอ
=2
tS ความแปรปรวนของคะแนนรวมทั้งฉบับ
ตัวอยาง จากแบบสอบถาม แบบประมาณคา 5 ระดับ จํานวน 6 ขอ ผูตอบ 6 คน
ขอสอบ รวมคะแนน
นักเรียน
1 2 3 4 5 6 X X2
1
2
3
4
5
6
4
4
3
3
4
2
4
4
3
3
3
1
4
3
2
4
3
1
3
3
4
2
1
2
4
3
3
2
2
1
3
4
3
2
2
1
22
21
18
16
15
8
484
441
324
256
225
64
∑ i
∑ 2
i
2
tS
20
70
.67
18
60
1.19
17
55
1.37
15
43
1.10
15
43
1.10
15
43
1.10
ΣX = 100 Σ X2
= 1,794
∑
2
iS = 6.53 2
tS = 25.47
⎥⎦
⎤
⎢⎣
⎡
−=
...........
.........
1
.......
......
α
= ……………………..
35
การพิจารณาคาความยาก(p) และอํานาจจําแนก( r, D) แบบทดสอบ
ตารางเกณฑการพิจารณาคาความยากงาย(p) ของตัวเลือกถูก
คา p รอยละ คา p สัดสวน แปลความหมาย ตีความหมาย ผลการพิจารณา
100 1.00 ตอบถูกทุกคน งายมาก ไมควร
80 .80 ตอบถูก 80% คอนขางงาย ถามากกวานี้ไมควรใช
50 .50 ตอบถูกครึ่งหนึ่ง ยากปานกลาง คุณภาพดีมาก
20 .20 ตอบถูก 20% คอนขางยาก ถานอยกวานี้ไมควรใช
00 .00 ไมมีคนตอบถูก ยากมาก ไมควรใช
ตารางเกณฑการพิจารณาคาอํานาจจําแนก (r,D) ของตัวเลือกถูก
คา r (D) แปลความหมาย ตีความหมาย ผลการพิจารณา
100 กลุมสูงถูกหมด กลุมต่ําผิดหมด จําแนกไดสูงมาก เปนขอสอบที่มีคุณภาพ
.50 กลุมสูงตอบถูกมากกวากลุมต่ํา จําแนกไดคอนขางสูง คุณภาพดี
.20 กลุมสูงตอบถูกมากกวากลุมต่ําเล็กนอย จําแนกไดพอใช คุณภาพดีมาก
.00 กลุมสูงและกลุมต่ําทําถูกเทากัน จําแนกไมได ถานอยกวานี้ไมควรใช
-1.00 กลุมต่ําทําถูกหมดกลุมสูงทําผิดหมด จําแนกทางตรงขาม(ทาง
ลบ)ไดอยางสมบูรณ
ไมควรใช
ตารางเกณฑการพิจารณาคา p, r (D) ตัวลวง
คา p คุณภาพ ผลการพิจารณา คา r (D) คุณภาพ ผลการพิจารณา
.00 - .04 ใชไมได ไมมีคุณภาพ คาติดลบ
.00 - .04
ใชไมได
ใชไมได
ไมมีคุณภาพ
.05 - .09
.01 - .30
.31 - .50
พอใช
ใชได
พอใช
มีคุณภาพ
.05 - .09
.10 - .30
.31 - .50
พอใช
ใชได
พอใช
คุณภาพดี
.51 - 1.00 ใชไมได ไมมีคุณภาพ .50 - 1.00 ใชไมได ไมมีคุณภาพ

More Related Content

PDF
กิจกรรมลดเวลาเรียน เพิ่มเวลารู้ ป.1 ป.3
PDF
เฉลยแบบฝึกหัดหน่วยที่ 4
PDF
การประเมินการปฏิบัติ
 
PDF
บทอาขยาน ภาษาไทย ม.๓
PDF
9 การกรอกแบบฟอร์ม(263-287)
PPT
วิธีการทางประวัติศาสตร์ ม.3
PDF
อจท. แผน 1 1 สุขศึกษาฯ ป.5
PDF
ทักษะการอ่าน
กิจกรรมลดเวลาเรียน เพิ่มเวลารู้ ป.1 ป.3
เฉลยแบบฝึกหัดหน่วยที่ 4
การประเมินการปฏิบัติ
 
บทอาขยาน ภาษาไทย ม.๓
9 การกรอกแบบฟอร์ม(263-287)
วิธีการทางประวัติศาสตร์ ม.3
อจท. แผน 1 1 สุขศึกษาฯ ป.5
ทักษะการอ่าน

What's hot (20)

PDF
แบบฝึกทักษะการเขียนเรียงความ
PDF
แผนวันสำคัญทางพระพุทธศาสนา
PPTX
โรงเรียนและชุมชน
PDF
แบบระบายสีดอกไม้ประจำชาติอาเซียน
PDF
กระดาษเส้น
PDF
เรียงความ Is1
PDF
การทำผ้ามัดย้อมจากสีของดอกไม้ (Natural Tie Dye Clothes Fabric Making)
PDF
หลักสูตร51 vs หลักสูตร 60
PDF
คำกล่าวเปิดค่ายจริยธรรม
PPTX
หน่วยการเรียนรู้ที่ 1 : เปิดโลกอาชีพ
PDF
หน่วย 1
PDF
ใบงาน อเมริกาเหนือ
PDF
สารคดีท่องเที่ยว แอ่วเหนือเมื่อหน้าหนาว
PDF
IS1 การศึกษาค้นคว้าและสร้างองค์ความรู้ กลุ่ม1
PDF
พืชใบเลี้ยงเดี่ยวและพืชใบเลี้ยงคู่
DOC
แบบสอบถาม โครงการบันทึกรักการอ่าน2013
PDF
แบบทดสอบ การอ่าน(นักเรียน) ป.3
PDF
5.ชุดที่ 2 โครงสร้างของเซลล์
PDF
การศึกษารายกรณี ครูธัญญา ซื่อตรง
PDF
การตรวจสอบคุณภาพข้อสอบอัตนัย
 
แบบฝึกทักษะการเขียนเรียงความ
แผนวันสำคัญทางพระพุทธศาสนา
โรงเรียนและชุมชน
แบบระบายสีดอกไม้ประจำชาติอาเซียน
กระดาษเส้น
เรียงความ Is1
การทำผ้ามัดย้อมจากสีของดอกไม้ (Natural Tie Dye Clothes Fabric Making)
หลักสูตร51 vs หลักสูตร 60
คำกล่าวเปิดค่ายจริยธรรม
หน่วยการเรียนรู้ที่ 1 : เปิดโลกอาชีพ
หน่วย 1
ใบงาน อเมริกาเหนือ
สารคดีท่องเที่ยว แอ่วเหนือเมื่อหน้าหนาว
IS1 การศึกษาค้นคว้าและสร้างองค์ความรู้ กลุ่ม1
พืชใบเลี้ยงเดี่ยวและพืชใบเลี้ยงคู่
แบบสอบถาม โครงการบันทึกรักการอ่าน2013
แบบทดสอบ การอ่าน(นักเรียน) ป.3
5.ชุดที่ 2 โครงสร้างของเซลล์
การศึกษารายกรณี ครูธัญญา ซื่อตรง
การตรวจสอบคุณภาพข้อสอบอัตนัย
 
Ad

Similar to TAP: Test Analysis Program (20)

PDF
เอกสารประกอบการอบรม Analysis
PPT
Testข้อสอบอัตนัย
PDF
ตัวอย่างทำคะแนน.นร.excel.pdf
PPT
Spss
PPT
Spssเริ่มต้น
PPT
Spss
PPTX
How to run SPSS for Quantitative Analysis
PPT
Spss jan2010
PPT
Spss jan2010
PDF
การใช้โปรแกรม Spss
PDF
Spss sriprapai
PPT
PDF
คู่มือการใช้งานSpss
PPT
สอนSpss
PPT
สอนSpss
PPT
สอนSpss
PPT
สอนSpss
PPT
สอนSpss
เอกสารประกอบการอบรม Analysis
Testข้อสอบอัตนัย
ตัวอย่างทำคะแนน.นร.excel.pdf
Spss
Spssเริ่มต้น
Spss
How to run SPSS for Quantitative Analysis
Spss jan2010
Spss jan2010
การใช้โปรแกรม Spss
Spss sriprapai
คู่มือการใช้งานSpss
สอนSpss
สอนSpss
สอนSpss
สอนSpss
สอนSpss
Ad

More from benjalakpitayaschool (14)

PDF
ปฏิญญาสากลว่าด้วยสิทธิมนุษยชน
PDF
คำสั่งมาตรา 44 ที่ 11/2559
PDF
การหาค่าจำนวนแบบซ้ำซ้อน
PDF
ข้อสอบ pre o-net ชุดที่ 5
PDF
ข้อสอบ pre o-net ชุดที่ 4
PDF
ข้อสอบ pre o-net ชุดที่ 3
PDF
ข้อสอบ pre o-net ชุดที่ 2
PDF
PDF
PDF
DOCX
PDF
หลักสูตรคณิตศาสตร์ 51
DOCX
ความสัมพันธ์เชิงฟังก์ชันระหว่างข้อมูล
ปฏิญญาสากลว่าด้วยสิทธิมนุษยชน
คำสั่งมาตรา 44 ที่ 11/2559
การหาค่าจำนวนแบบซ้ำซ้อน
ข้อสอบ pre o-net ชุดที่ 5
ข้อสอบ pre o-net ชุดที่ 4
ข้อสอบ pre o-net ชุดที่ 3
ข้อสอบ pre o-net ชุดที่ 2
หลักสูตรคณิตศาสตร์ 51
ความสัมพันธ์เชิงฟังก์ชันระหว่างข้อมูล

TAP: Test Analysis Program

  • 1. การวิเคราะหแบบทดสอบ ดวยโปรแกรม TAP (Test Analysis Program) Step by Step ประเสริฐ สุภิรักษ กลุมงานวัดและประเมินผลการศึกษา สพท.นครสวรรค 1
  • 2. คํานํา การวิเคราะหแบบทดสอบ ดวยโปรแกรม TAP : Test Analysis Program (Step by Step) เลมนี้ ผูเขียนมีความตั้งใจที่ตองการใหผูศึกษาสามารถนําขั้นตอนในการวิเคราะห TAP ไปใชในงาน พัฒนาการเรียนการสอนในชั้นเรียน เพื่อวิเคราะหการทดสอบของนักเรียนและการวิเคราะหหาคุณภาพ แบบทดสอบในการแกไขปรับปรุงใหมีประสิทธิภาพมากขึ้น จากการที่ผูเขียนรับผิดชอบงานวัดและ ประเมินผลการศึกษาของเขตพื้นที่การศึกษา ทําใหทราบปญหาของครูผูสอนในการสรางและพัฒนา เครื่องมือวัดจะมีความยากในขั้นตอนวิเคราะหขอมูล ซึ่งอาจจะตองพึ่งพาผูวิเคราะหขอมูลให และมัก จะพบวาขอมูลที่วิเคราะหนั้นวิเคราะหถูกตองหรือไมเพียงไร ตําราเลมนี้จะชวยใหสามารถวิเคราะห ไดดวยตนเองอยางถูตองแมนยํายิ่งขึ้น เทากับเปนการแกไขปญหาดังกลาวไดเปนอยางดีในระดับหนึ่ง ผูเขียนขอขอบคุณ นางสาวฌนุษกุล สุภิรักษ ที่ไดชวยแปลเอกสารบางสวน จากการคันควาของผูเขียน สุดทายผูเขียนหวังเปนอยางยิ่งวา การนําเอกสารเลมนี้ไปใชคงอํานวยประโยชนตอผูใช พอสมควร หากมีขอบกพรองประการใดขอนอมรับคําแนะนําเพื่อการแกไขปรับปรุงโอกาสตอไป ประเสริฐ สุภิรักษ e-mail : supirak5@hotmail.com
  • 3. สารบัญ บทที่ 1 บทนํา 1 ความรูเบื้องตนเกี่ยวกับ TAP 1 การแสดงผลการวิเคราะหแบบทดสอบ ( TAP output provides) 1 บทที่ 2 การติดตั้งโปรแกรม 3 การเขาสูโปรแกรม TAP 3 ขั้นตอนการปอนขอมูล 4 ในกรอบหนาตาง INPUT ใหเลือก 4 หนาตาง Data Editor ปอนขอมูลรายการตางๆ ลงในชวงวาง 5 บทที่ 3 ขั้นตอนการวิเคราะหขอมูล 6 ผลการวิเคราะหขอมูล 6 บทที่ 4 ผลลัพธที่ไดจากการวิเคราะห 9 สวนที่ 1. ผลการวิเคราะหผูสอบ (Examinee Analysis) 9 สวนที่ 2 ผลการวิเคราะหขอสอบรายขอและทั้งฉบับ 11 (Item and Test Analysis) สวนที่ 3 ผลการวิเคราะหรายตัวเลือก (Options Analysis) 14 สวนที่ 4 การแสดงดวยแผนภาพ ( Graph : Bar Chart and Histogram ) 14 บทที่ 5 การเลือกใช เมนู Option 16 การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades ) 16 การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา(Set Percentages of 18 ltem Discrimination) บทที่ 6 การเลือกใช เมนู Analysis 19 การกําหนดจํานวนขอสอบเพิ่มเติมตามคาความเชื่อมั่นที่ตองการ 19 ผลการวิเคราะห 21 บทที่ 7 การตรวจสอบคุณภาพเครื่องมือวัดผลการศึกษา 22 การพิจารณาคาความยาก(p) และอํานาจจําแนก( r, D) แบบทดสอบ 35
  • 4. บทที่ 1 บทนํา 1.1 ความรูเบื้องตนเกี่ยวกับ TAP โปรแกรม TAP (Test Analysis Program) ถูกออกแบบมาอยางมีประสิทธิภาพ งายตอการใช และเปน โปรแกรม Freeware สามารถดาวนโหลดไดจากเว็ปไซด http://oak.cats.ohio.edu/~brooksg/tap.htm พัฒนาโดย บรูก (Brooks,Gordon P.) เปนชุดโปรแกรมใหใชฟรี เพื่อวิเคราะหการทดสอบสําหรับครูผูสอนใน ระดับโรงเรียนตลอดจนในระดับมหาวิทยาลัย จุดเดนเปนลักษณะของ Software เครื่องมือที่อัจฉริยะสําหรับ ทดสอบออกแบบหลักสูตร ผูใชสามารถปอนขอมูลคะแนนทดสอบในรูปแบบตัวอักษร หรือขอมูลการ ทดสอบโดยตรง ในการวิเคราะหสถิติของผูสอบ ประกอบดวยเปอรเซ็นตในการตอบถูก การตัดเกรด ชวง ความเชื่อมั่นของนักเรียนแตละคน สถิติพื้นฐานของกลุมผูสอบ จํานวนขอที่ตอบถูกแตละคน และจํานวนขอที่ ตอบผิด วิเคราะหสถิติของขอสอบและแบบทดสอบ ประกอบดวย การวิเคราะหความยาก อํานาจจําแนก พอยทไบซีเรียล ตลอดจนวิเคราะหคุณภาพเปนรายตัวเลือก และสามารถแบงกลุมสูงและกลุมต่ําไดตาม กําหนด 1.2 การแสดงผลการวิเคราะหแบบทดสอบ ( TAP output provides) 2 สวน 1. ผลการวิเคราะหผูทดสอบ (Examinee Analysis ) ประกอบดวย รอยละความถูกตอง (Percentage Correct) เกรด ชวงความเชื่อมั่น สําหรับนักเรียนแตละคน และผลรวมคะแนน สถิติเชิงพรรณนา สําหรับกลุมผูสอบ TAP จะสรางรายการคะแนนและคําตอบที่ผิดของนักเรียน (คําตอบที่นักเรียนตอบผิด)ดวย เชน รายงานนักเรียนเปนรายบุคคล บงชี้คะแนนตอบสนองตอขอสอบที่ถูกตองไปจนถึงสิ่งที่ผิดพลาด 2. ผลการวิเคราะหขอสอบและการทดสอบ (Item and Test Analysis) ประกอบดวย ความ ยาก ดัชนีคาอํานาจจําแนก (Discrimination index) รายขอรายตัวเลือก และ สถิติความแปรปรวน KR-20 , KR-21 คาเฉลี่ย คาความเบี่ยงเบน ถาขอสอบถูกลบออก TAP สามารถคํานวณจํานวนขอสอบเพิ่มเติมตาม ความตองการที่เพิ่มคาความเชื่อมั่นได การวิเคราะหตัวเลือก (Option Analysis) ประกอบดวย กลุมสูง และกลุมต่ํา ความยากของ ขอสอบ เพื่อตรวจคําตอบ(คําตอบที่ถูกตอง) และตัวลวง ในเอกสารคูมือการใช TAP เลมนี้ จะนําเสนอขั้นตอนการใชโปรแกรม TAP Version 6.65 ซึ่งได ปรับปรุงพัฒนาตั้งแต Version 4.xx ถึง Version 6.65 ดังนี้
  • 5. 2 Version 6.6X : - แกขอบกพรองหลัก ดวยรายงานเกรดสวนบุคคล ( ที่เคยเปนปญหาการจําแนกสําหรับการ ตอบสนอง / คําตอบขอสอบแตละบุคคล ) - เพิ่มความสามารถเพื่อใหผูใชงานระบุ Criteria ดวยตนเองสําหรับขอสอบที่มีปญหา - เพิ่มความสามารถในการจําแนกผลการวิเคราะห Quick ltem โดยการปรับ Point Bisorial. Version 6.4X : - ความสามารถในการปอนขอมูลตัวอักษร( A,B,C,D )ดังเชน ขอมูลตัวเลข (1,2 ,3, 4 ) สําหรับ เฉลย และคําตอบของนักเรียน Version 6.XX : - การนําเขา input files ที่ดีกวาทุก version - HELP เพื่อชวยในเรื่องของการนําเขาขอมูล SPSS ดวยคําสั่งใน Sytax ที่ใชใน SPSS - ความสามารถในการซอน และไมซอน( HIDE หรือ UNHIDE) ชื่อจาก Output (defult เปน hide,ดวย sasy button เปน unhide ) - ปุมการใชงานงายสําหรับคําสั่งการ Saveไฟล Output ทั่วไปทุกชนิด - การวิเคราะหอยางรวดเร็วสําหรับ ตัวเลือก / ตัวลวง - Output ที่ถูกเพิ่มเติม ( เชน class statistics, hard item annotations ) ไปสู Individual Grade Reports. - HELP ในหนาตางแกไขขอมูลสําหรับ OHOI UWIVERSITY FOUKS ที่ยอมใหนําเขา ขอมูลscanned TESTSCORE ที่งายกวา - HELP ในหนาตางแกไขขอมูล นับจํานวน / ines (บรรทัด) ในหนาตางขอมูล Version 5.XX : - เครดิตบางสวน ( Partial crdit ) สามารถเพิ่มคะแนน ( แตไมวิเคราะห ) - ขอสอบแบบหลายตัวเลือก สามารถมีคามากกวา 1 คะแนน ( แตยังคงวิเคราะหที่ 1 คะแนน ) - User Grading Categories ปรับเปลี่ยนใชมากกวาเดิม และปรับเปลี่ยนใชไดตามตองการ Version 4.XX : - จํานวนผูถูกทดสอบ เพิ่มเปน 9999 - Histrograns และ กราฟแทงสามารถปรับ,Save และ Print - จํานวนขอสอบเพิ่มเปน 100 - Histrograms และ bar charts แบบใหม สามารถสรางไดจาก Full Results (ผลลัพธ ทั้งหมด) - ตาราง ความถี่ (ดวย PR) เพิ่มใน Full Results. - Split – Half Reliability เพิ่มใน Full Results.
  • 6. 3 บทที่ 2 การติดตั้งโปรแกรม 2.1 การติดตั้งโปรแกรม TAP ดาวนโหลดไฟร tap.exe จากเว็ปไซด http://oak.cats.ohio.edu/~brooksg/tap.htm หรือ Copy ไฟร tap.exe จาก CD ที่ใหมาพรอมกับเอกสารนี้ ลงใน My Documents หรือ Copy มาวาง หนา Desktop เปนไอคอน ดังภาพประกอบ 1 ภาพประกอบ 1 2.2 การเขาสูโปรแกรม TAP ขั้นตอนการเรียกใชโปรแกรม TAP (Test Analysis Program) for Windows สามารถทําไดโดย ภาพประกอบ 2 เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65) ภาพประกอบ 3 ดับเบิ้ลคลิก
  • 7. 4 2.3 ขั้นตอนการปอนขอมูล 2.3.1 ในกรอบหนาตาง INPUT ใหเลือก ภาพประกอบ 4 1. เลือก Enter New Data การสราง/ปอนขอมูลใหม 2. หรือ เลือก Open TAP file จากนั้น คลิกที่ปุม GO To Data Editor ในกรณี เปดขอมูลเกาที่ สรางจากโปรแกรม TAP 3. คลิกที่ปุม GO To Data Editor
  • 8. 5 2.3 .2 หนาตาง Data Editor ปอนขอมูลรายการตางๆ ลงในชวงวาง ดังนี้ ภาพประกอบ 5 1. Title ปอนหัวขอของแบบทดสอบ หรือวิชาที่จัดสอบ จํานวนตัวอักษรสูงสุด 70 ตัวอักษณ 2. Comments ปอนหมายเหตุ หรืออาจระบุวาแบบทดสอบนี้วัดอะไร จํานวนตัวอักษรสูงสุด 70 ตัวอักษร 3. Key ปอนเฉลยของขอสอบ 4. Options ปอนจํานวนตัวเลือกในขอสอบแตละขอ 5. Include ระบุวาขอใดที่ตองการวิเคราะหและขอใดไมนําเขาวิเคราะห โดยพิมพ Y คือนําขอสอบ ขอนั้นเขาวิเคราะห หรือพิมพ N เมื่อไมนําขอสอบนั้นเขามาวิเคราะห 6. #Students ปอนจํานวนนักเรียนหรือผูสอบทั้งหมด 7. # Test ltems ปอนจํานวนขอสอบทั้งหมด 8. Length of Examinee Names /IDs (# character) ระบุจํานวนสดมภที่ตองการปอนรหัสประจําตัว ผูสอบหรือชื่อผูสอบ 9. DATA สําหรับปอนขอมูลทั้งหมดของผูสอบ โดยปอนรหัสประจําตัวผูสอบตามจํานวนสดมภ ที่กําหนด และปอนตัวเลือกแตละขอของผูสอบแตละคน ตามจํานวนที่ระบุ 10. เมื่อปอนขอมูลเสร็จสิ้น ใหบันทึกขอมูลโดยคลิกที่ปุม Save File
  • 9. 6 บทที่ 3 ขั้นตอนการวิเคราะหขอมูล ขั้นตอนการวิเคราะหขอมูล3. 3.1 คลิกที่ปุม ในหนาตาง Data Editer ภาพประกอบ 5 โปรแกรมจะ วิเคราะหขอมูล 3.2 ผลการวิเคราะหขอมูล จะแสดงใน 2 หนาตางคือหนาตาง ดังภาพประกอบ 6 ภาพประกอบ 6 1. หนาตาง QUICK EXAMINEE RESULTS แสดงคาสถิติสําหรับผูสอบ และ 2. หนาตาง QUICK ITEM ANALYSIS แสดงคาสถิติสําหรับขอสอบ
  • 10. 7 3.3 เมื่อตองการบันทึกผลการวิเคราะหทั้งสองหนาตางลงไปไฟล ใหไปที่ชองOUTPUT โดยพิมพชื่อ ไฟลที่ตองการเก็บผลลัพธในชอง Result File Name โดยผลลัพธจะเก็บไวในนามสกุล .Txt และ ภาพประกอบ 7 1. คลิก Save Quick Examinee Results โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File Name แตนามสกุลตางกัน คือ .exm 2. คลิก Save Quick ltem Analysis โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File Name แตนามสกุลตางกัน คือ .itm 3. คลิก Save Quick Option Analysis โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File Name แตนามสกุลตางกัน คือ .opt 3.4 การวิเคราะหผลอยางยอ และตอเนื่องดวยการกําหนด Option ใหม ภาพประกอบ 8 1. ปุม Analyze (F9) เปนปุมวิเคราะหขอมูลโดยจะแสดงผลอยางยอและเมื่อคลิก Option เพื่อ กําหนด Option เพิ่มเติมใหม เชน การตัดเกรด หรือรอยละของกลุมสูง- กลุมต่ํา สามารถ วิเคราะหอยางตอเนื่องได ปุมAnalyze(F9) จะเปลี่ยนเปนดังภาพประกอบ 9 ภาพประกอบ 9
  • 11. 8 2. ปุม View Full Results Graphs (F2) เปนปุมวิเคราะหขอมูลโดยละเอียด จะใหผล การวิเคราะหผูสอบและขอสอบที่มากกวา นอกจากนี้ยังแสดงแผนภูมิแทงและฮีสแกรม ของคะแนนสอบไดอีกดวย 3. ปุม Save Results Selected Output (F3) เปนปุมบันทึกผลการวิเคราะหโดย ละเอียดและเลือกการบันทึกไฟรผลลัพธ 4.ปุม View/Print Quick Examinee Full Screen (F5) ) เปนปุมแสดงเฉพาะผลการวิเคราะห คาสถิติของนักเรียนหรือผูสอบรายบุคคล ทุกรายการ 5.ปุม View/Print Item Analysis Full Screen (F6) เปนปุมแสดงผลการวิเคราะหคาสถิติ ของแบบทดสอบรายขอ และคุณภาพ ตลอดจนคาความเชื่อมั่น(KR-20,KR-21) ของ แบบทดสอบทั้งฉบับ ทุกรายการ 6.ปุม View/Print Quick Option Analysis (F7) เปนปุมแสดงผลเฉพาะการวิเคราะหคาสถิติ คุณภาพของแบบทดสอบรายขอ และตัวเลือกตัวลวง (คา p ,r (D) ตาม Option ที่กําหนด
  • 12. 9 บทที่ 4 ผลลัพธที่ไดจากการวิเคราะห 4 . ผลลัพธที่ไดจากการวิเคราะหโดยละเอียด ผลลัพธที่ไดจากการวิเคราะหจะแบงออกเปน 4 สวนดังนี้ สวนที่ 1. ผลการวิเคราะหผูสอบ (Examinee Analysis) ใหผลดังนี้ สวนที่ 1 ภาพประกอบ 10 ID คือรหัสประจําตัวของผูสอบแตละคน Score คือคะแนนที่ไดของผูสอบแตละคน Percent คือสัดสวนระหวางคะแนนที่ไดกับคะแนนเต็ม Ltr Grade คือผลการตัดเกรด ซึ่งผูวิเคราะหสามารถกําหนดไดวาจะใหตัดกี่เกรด และ เกณฑผานคือเทาไร 68% C.I. คือประมาณคาคะแนนจริงของผูสอบแตละคน จากสูตร X ± SEM ที่ระดับความ เชื่อมั่น 68% 95% C.I. คือประมาณคาคะแนนจริงของผูสอบแตละคน จากสูตร X ± (1.96)SEM ที่ระดับ ความเชื่อมั่น 95%
  • 13. 10 สวนที่ 1(ตอ) ภาพประกอบ 11 Number of Examinees คือจํานวนผูสอบทั้งหมด Minimum Score คือคะแนนต่ําสุดที่ผูสอบในกลุมทําได Maximum Score คือคะแนนสูงสุดที่ผูสอบในกลุมทําได Median Score คือคะแนนมัธยฐาน Mean Score คือคะแนนเฉลี่ย Standard Deviation คือคะแนนเบี่ยงเบนมาตรฐาน Variance คือความแปรปรวน Skewness คือความเบ Kurtosis คือความโดง Frequency Table คือ การแสดงแจกแจงความถี่ของคะแนนสอบ Bar Graph คือแสดงการแจกแจงความถี่ของคะแนนดวยแผนภูมิแทง Stem-and-Leaf Display คือแสดงการแจกแจงของคะแนนในรูปของแผนภาพตนใบ Bar Graph คือแสดงการแจกแจงความถี่ของแตละระดับเกรด
  • 14. 11 สวนที่ 2 ผลการวิเคราะหขอสอบรายขอและทั้งฉบับ (Item and Test Analysis) ใหผลดังนี้ ภาพประกอบ 12 Item คือขอสอบแตละขอ Number Correct คือจํานวนผูสอบที่ตอบถูกในขอนั้น Item Diff. คือคาความยากของขอสอบ Disc. Index คือดัชนีอํานาจจําแนกขนองขอสอบ #Correct in High Grp คือจํานวนผูสอบในกลุมสูงที่ตอบขอสอบขอนั้นถูก #Correct in Low Grp คือจํานวนผูสอบในกลุมต่ําที่ตอบขอสอบขอนั้นถูก Point Biserial คือคาอํานาจจําแนกที่คํานวณจากสูตรสหสัมพันธพอยทไบซีเรียล Adjusted Pt. Bis. คือคาอํานาจจําแนกที่คํานวณจากสูตรสหสัมพันธไบซีเรียล ภาพประกอบ 13 Number of ltems คือจํานวนขอสอบทั้งหมด Mean ltem Difficulty คือคาเฉลี่ยของคาความยาก สวนที่ 2 สวนที่ 2 (ตอ)
  • 15. 12 Mean ltem Discrimination คือคาเฉลี่ยของดัชนีอํานาจจําแนก Mean Point Biserial คือคาเฉลี่ยของสหสัมพันธพอยทไบซีเรียล KR20 (Alpha) คือคาความเชื่อมั่นที่คํานวณดวยสูตร KR-20 KR21 คือคาความเชื่อมั่นที่คํานวณดวยสูตร KR-21 SEM (from KR20 ) คือคาความคลาดเคลื่อนมาตรฐานของการวัด High Grp Min Score (n=18) คือคะแนนต่ําสุดของกลุมสูง LOW Grp Max Score (n=19) คือคะแนนสูงสุดของกลุมต่ํา Minimum ltem Diff. คือคาต่ําสุดของคาความยากของขอสอบ Maximum ltem Diff. คือคาสูงสุดของคาความยากของขอสอบ Minimum Disc. lndex คือคาต่ําสุดของดัชนีอํานาจจําแนกของขอสอบ Maximum Disc. lndex คือคาสูงสุดของดัชนีอํานาจจําแนกของขอสอบ Minimum Pt. Biserial คือคาต่ําสุดของของสหสัมพันธพอยทไบซีเรียล Miximum Pt. Biserial คือคาสูงสุดของของสหสัมพันธพอยทไบซีเรียล ภาพประกอบ 14 Additional ltem Analysis คือผลการวิเคราะหขอสอบเพิ่มเติม Item คือ ขอสอบแตละขอ Scale Mean if ltem Deleted คือคาเฉลี่ยของขอสอบทั้งฉบับเมื่อไมรวมขอสอบขอนั้น Scale SD if ltem Deleted คือคะแนนเบี่ยงเบนมาตรฐานของขอสอบทั้งฉบับเมื่อไมรวม ขอสอบขอนั้น KR-20 if ltem Deleted คือคาความเชื่อมั่นสูตร KR-20 ของแบบทดสอบทั้งฉบับเมื่อไม รวมขอสอบขอนั้น SEM if ltem Deleted คือความคลาดเคลื่อนมาตรฐานของการวัดของแบบทดสอยทั้งฉบับ เมื่อไมรวมขอสอบขอนั้น สวนที่ 2 (ตอ)
  • 16. 13 Biserial Correl. คือคาสหสัมพันธไบซีเรียล Mean Biserial Corr. คือคาเฉลี่ยของสหสัมพันธไบซีเรียล Minimum Biserial Corr.คือคาต่ําสุดของสหสัมพันธไบซีเรียล คือคาสูงสุดของสหสัมพันธไบซีเรียลMaximum Biserial Corr. ภาพประกอบ 15 Answer Key Analysis คือการวิเคราะหตัวเลือกทั้งหมด Bar Chart for Correct Answer Usage คือแผนภาพแสดงความถี่ของตัวเลือกที่เปน เฉลยขอสอบ Bar Chart for Number of Options Usage คือแผนภาพแสดงความถี่ของตัวเลือกที่ใช ในขอสอบแตละขอ ภาพประกอบ 16 Ltem lncluded, Answer Keu, Additional Correct Options คือแสดงขอสอบที่รวมเขา วิเคราะห (ITEMS INCLUDED) ขอสอบที่ไมรวมเขาวิเคราะห (ITEMS EXCLUDED:) เฉลย ขอสอบ และเฉลยขอสอบ (CORRECTANSWERS (ltem#-Key) สวนที่ 2 (ตอ) สวนที่ 2 (ตอ)
  • 17. 14 สวนที่ 3 ผลการวิเคราะหรายตัวเลือก (Options Analysis) ใหผลดังนี้ ภาพประกอบ 17 ตัวเลขที่อยูนอกวงเล็บคือความถี่ของผูสอบที่เลือกตอบตัวเลือกนั้นในแตละกลุม สวนตัวเลขในวงเล็บ คือสัดสวนของความถี่นั้นตอจํานวนผูสอบในกลุม นั้นคือในแถว Total ของตัวเลือกที่ 1 (Option 1) มีผูสอบ ทั้งหมดเลือกตัวเลือก 1 จํานวน 15 คน คิดเปนสัดสวน 0.300 ซึ่งสัดสวนนี้ก็คือคาความยาก ( คา p = 0.30 ) ของตัวเลือกที่ 1 สวนผลตางของกลุมสูงและกลุมต่ํา (Diff) คือ 3 คิดเปนสัดสวนในวงเล็บ 0.265 ซึ่งสัดสวน นี้ก็คือดัชนีอํานาจจําแนก (คา r / D = 0.256 ) ของตักเลือกที่ 1 สังเกตวาโปรแกรมจะคํานวณ Diff โดยใช ความถี่ของกลุมสูงลบดวยกลุมต่ํา ดังนั้นตัวลวงที่จําแนกไดอยางมีประสิทธิภาพ นั้นคือกลุมสูงควรเลือกตอบ ตัวลวงนอยกวากลุมต่ํานั่นเอง สวนขอ 1 นี้ตัวเฉลยคือตัวเลือกที่ 1 ซึ่งมีเครื่องหมายดอกจันอยู มีคาความยาก (p) 0.30 อํานาจจําแนก(r/D) 0.265 ซึ่งถือวาเปนขอสอบที่คอนขางยาก และมีคาอํานาจจําแนกที่ใชได จึงเปน ขอสอบที่ใชได ถาเครื่องหมาย # ก็คือตัวเลือกนั้นมีอํานาจจําแนกสูงกวาตัวเฉลย สวนที่ 4 การแสดงดวยแผนภาพ ( Graph : Bar Chart and Histogram )โดยดานลางของหนาตาง แสดงผลลัพธโดยละเอียดจะปรากฏ 3 ปุมคือ Bar Chart for Grades แสดงแผนภูมิแทงแจกแจงความถี่แตละ ระดับเกรด Bar Chart for Scores แสดงแผนภูมิแทงแจกแจงความถี่แตละระดับคะแนน และ Histogram for Scores แสดงฮีสโทแกรมแจกแจงความถี่ละระดับคะแนน ดังภาพประกอบ 19 ภาพประกอบ 18 สวนที่ 3 สวนที่ 4
  • 19. 16 บทที่ 5 การเลือกใช เมนู Option เมนู Options ผูวิเคราะหสามารถกําหนดคาตางในการวิเคราะหได ที่สําคัญดังนี้ 1. การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades ) 2. การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา (Set Percentages of ltem Discrimination) ภาพประกอบ 20 1. การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades ) Set Percentages lf Grades ผูวิเคราะหสามารถเลือกใหผลเกรดแกผูสอบได โดยเลือกได 2 เกรด คือ ผานกับไมผาน เลือกได 5 เกรดคือ A, B, C, D และ F เลือกได 12 เกรดคือ A, A-, B+,B, B-, C+,C, C-, D+,D, D- และ F และไมแสดงผลเกรด โดยแตละระดับเกรดสามารถเลือกเปอรเซ็นตต่ําสุดที่ผูสอบควรได ดังภาพประกอบ 21 1.1 คลิก Option ที่เมนูบาร 1.2 เลือกคลิก Set Percentages lf Grades … 1.3 เลือกกําหนดคา
  • 20. 17 ภาพประกอบ 21 การเลือกกําหนดคา คลิกเลือก 2 Categories (Pass, Fail) = เกรด 2 ระดับ ผาน และไมผาน กําหนด ตัวเลขใน ชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (70%) คลิกเลือก 5 Categories (A,B,C,D,F) = เกรด 5 ระดับ A,B,C,D และF กําหนด ตัวเลข ใน ชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (90,80,70,60 ตามลําดับ) คลิกเลือก 12 Categories (A,A-,B+,B,B-,C+,C,C-,D+,D,D-,F) = เกรด 12 กําหนด ตัวเลข ในชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (94,91,88,84,81,78,74,71,68,64,61 ตามลําดับ) คลิกเลือก User Defined = ผูใชกําหนดระดับเกรดไดเอง คลิกเลือก No Grading Categories = ไมกําหนดเกรด
  • 21. 18 เมื่อเลือกกําหนดคาแลว คลิก OK เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65) ปุม Analyze(F9) จะเปลี่ยนเปน แลวคลิก เพื่อวิเคราะหผลใหม สดมภ Ltr Grade จะแสดงผลเกรดที่กําหนด ดังภาพประกอบ 22 ภาพประกอบ 22 2. การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา(Set Percentages of ltem Discrimination) Set Percentages of ltem Discrimination ผูวิเคราะหสามารถเลือกแบงกลุมสูงกลุมต่ํากลุมละกี่ เปอรเซ็นตก็ไดโดยระบุคาเปอรเซ็นตที่ตองการ ดังภาพประกอบ 23 2.1 คลิก Option ที่เมนูบาร 2.2 เลือกคลิก Set Percentages of ltem Discrimination ภาพประกอบ 23 การกําหนดจํานวนเปอรเซ็นตเพื่อแบงกลุมสูงกลุมต่ํา ในชอง Top หรือ Bottom เปน 33 หรือ 50 ตามความตองการได หรือเลือกคา Defaults ของโปรแกรม (27%) เมื่อเลือกกําหนดคาแลว คลิก OK เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65) ปุม Analyze(F9) จะเปลี่ยนเปน แลวคลิก เพื่อวิเคราะหผลใหม
  • 22. 19 บทที่ 6 การเลือกใช เมนู Analysis การเลือกใช เมนู Analysis การกําหนดจํานวนขอสอบเพิ่มเติมตามคาความเชื่อมั่นที่ตองการ เมนู Analysis ประกอบไปดวยเมนูรอง Run Analysis ซึ่งสามารถคลิกเลือกไดจากปุมอยูแลว แตเมนู รองที่สําคัญก็คือ Speaman-Bown Prophecy เปนการทํานายจํานวนขอที่ควรเพิ่มเขาไปในแบบทดสอบเพื่อให ไดคาความเชื่อมั่นตามที่กําหนด ดังภาพประกอบ 23 ภาพประกอบ 23 1. คลิก Analysis ที่เมนูบาร 2. เลือกคลิก Speaman-Bown Prophecy แสดงหนาจอ Speaman-Bown Prophecy ดัง ภาพประกอบ 24 3. แสดงคุณภาพแบบทดสอบฉบับนี้มีขอสอบอยู 20 ขอ มีความเชื่อมั่นอยู 0.577
  • 23. 20 ภาพประกอบ 24 จากภาพประกอบ 24 แสดงคุณภาพแบบทดสอบฉบับนี้มีขอสอบอยู 20 ขอ มีความเชื่อมั่นอยูเดิม 0.577 ถาตองการแบบทดสอบที่มีความเชื่อมั่นเพิ่มขึ้นควรจะเพิ่มขอสอบอีกจํานวนเทาใด 1. กําหนดตัวเลขคาความเชื่อมั่นเพิ่มใน To achieve a desired of reliability of … 2. คลิกการคํานวณ Calculate แสดงหนาจอจํานวนขอสอบเพิ่มเติม ดังภาพประกอบ 25
  • 24. 21 ภาพประกอบ 25 ผลการวิเคราะห คาความเชื่อมั่นของแบบทดสอบเดิมทั้งฉบับ ( The reliability of the test analyzed was….)= 0.577 ตองการผลคาความเชื่อมั่นเพิ่มเติม (To Achieve a desired of reliability of …) = 0.800 จํานวนขอสอบที่ตองเพิ่ม (you need….) = 39 ขอ ขอสอบฉบับนี้เพิ่มมากขึ้น ( item. This is because the test must be….) = 2.94 เทาของขอสอบเดิม จํานวนขอสอบรวมทั้งหมด ( item. For a TOTAL of …) 59 ขอ นั่นคือแบบทดสอบฉบับนี้มีขอสอบอยูเดิม 20 ขอ มีความเชื่อมั่นอยูเดิม 0.577 ถาตองการ แบบทดสอบที่มีความเชื่อมั่น 0.800 ควรจะตองเพิ่มขอสอบอีกจํานวนเทาใด ผลการวิเคราะหก็คือ ตองเพิ่ม อีก 39 ขอหรือ 2.94 เทาของขอสอบเดิม จึงจะไดคาความเชื่อมั่น 0.800 ขอสอบในแบบทดสอบควรจะมี จํานวน 59 ขอ ซึ่งเปนผลการทํานายถาขอสอบที่เพิ่มเติมมีคุณภาพเทากับขอสอบเดิมหรือใกลเคียงกัน
  • 25. 22 บทที่ 7 การตรวจสอบคุณภาพเครื่องมือวัดผลการศึกษา เครื่องมือวัดที่นําไปใชในการวัดผลการเรียนรูของผูเรียน ควรเปนเครื่องมือที่ดีมีคุณภาพ เพื่อทําให สามารถวัดผลการเรียนรูที่แทจริงของผูเรียนได เครื่องมือวัดผลที่มีคุณภาพ มีลักษณะสําคัญดังนี้ 1. ความตรงหรือความเที่ยงตรง (Validity) 2. ความยากหรือความยากงาย (Difficulty) 3. อํานาจจําแนก (Discrimination Power) 4. ความเที่ยงหรือความเชื่อมั่น (Reliability) 5.ความเปนปรนัย (Objectivity) 6. ความสามารถในการนําไปใช (Usability) 1. ความตรงหรือความเที่ยงตรง (Validity) ความหมายของความตรงแบงไดเปน 2 แนวคิด ตามแนวคิดเดิม ความตรง หมายถึง ความสามารถของเครื่องมือที่วัดไดตรงกับสิ่งที่ตองการวัด สวนแนวคิด ปจจุบัน ความตรง หมายถึง ความสามารถของหลักฐานที่อธิบายผลการวัดไดตรงกับสิ่งที่ตองการวัด ความ ตรงของผลการวัด อาจไดมาจาก การรวบรวมหลักฐานจากหลายวิธี การตรวจสอบหลักฐานที่แสดงถึงความ ตรงจึงมีหลายชนิด ซึ่งจําแนกตามหลักฐานได 3 ชนิด คือ หลักฐานความตรงเชิงเนื้อหา หลักฐานความตรงเชิง เกณฑ และหลักฐานความตรงเชิงโครงสราง 2. ความยากหรือความยากงาย (Difficulty) หมายถึงความยากในเชิงเนื้อหาของเครื่องมือประเภท แบบทดสอบ ซึ่งมีคําตอบถูกผิดตามหลักวิชา หรือหลักการอื่นๆ ความยากพิจารณาจากสัดสวนหรือรอยละ ของผูที่ตอบคําถามขอนั้นๆ ไมถูกตอง เครื่องมือวัดผลที่ดี ควรมีความยากพอเหมาะกับกลุมผูสอบ สําหรับ เครื่องมือประเภทที่ไมมีคําตอบถูกผิด จะไมมีความยากในเชิงเนื้อหา การสรางเครื่องมือตองใชภาษาที่ เหมาะสมกับกลุมสอบ 3. อํานาจจําแนก (Discrimination Power) หมายถึง ความสามารถของเครื่องมือที่วัดไดตรงกับ ความสามารถของผูถูกวัด เปนความสัมพันธระหวางความสามารถของผูตอบกับการตอบถูก กลาวคือ คนที่มี ความสามารถในสิ่งที่วัดมากควรตอบถูกมาก และในทํานองเดียวกันคนที่มีความสามารถต่ํา จะตอบถูกนอย เครื่องมือวัดที่มีอํานาจจําแนกสามารถจําแนกผูที่มีความสามารถแตกตางกัน ออกจากกันตามระดับ ความสามารถ เชน จําแนกคนที่รอบรู ออกจากที่ไมรอบรู จําแนกคนที่มีคุณธรรมสูง ออกจากคนที่มีคุณธรรม ต่ํา เปนตน 4. ความเที่ยงหรือความเชื่อมั่น (Reliability) หมายถึง ความคงที่ หรือความคงเสนคงวา (Consistency) ของผลที่ไดจากการวัดสิ่งเดียวกันดวยเครื่องมือเดียวกันในชวงเวลาที่ตางกัน
  • 26. 23 2 ครั้งขึ้นไป หรือความสอดคลองของผลการวัดสิ่งเดียวกันดวยเครื่องมือหรือวิธีการที่แตกตางกันมากกวาหนึ่ง อยางขึ้นไป การตรวจสอบความเที่ยงทําไดหลายวิธี เชน วิธีวัดซ้ํา(test-retest) วิธีใชเครื่องมือที่สมมูลกัน (equivalent forms) วิธีหาความสอดคลองภายใน เปนตน 5. ความเปนปรนัย (Objectivity) หมายถึง ความชัดเจนของเครื่องมือทั้งคําถามและคําตอบ คําถามที่ เปนปรนัยตองมีความชัดเจน ผูอานเขาใจตรงกันวาถามอะไร สวนตําตอบที่เปนปรนัยตองมีคําตอบถูกชัดเจน มีวิธีการตรวจและเกณฑการใหคะแนน รวมทั้งการแปลความหมายที่ผูตรวจสามารถใหคะแนนไดตรงกัน 6. ความสามารถในการนําไปใช (Usability) ลักษณะของเครื่องมือที่ควรพิจารณาอีกอยางหนึ่ง คือ ความสามารถนําไปใชไดสะดวก เนื่องจากครูผูสอนหรือผูใชเครื่องมือไมใชผูที่ไดรับการฝกอบรมดานการ วัดผลมาโดยเฉพาะ ดังนั้นเครื่องมือจึงควรมีลักษณะที่สามารถนําไปใชไดสะดวก ดังนี้ 6.1 งายในการดําเนินการสอบ เครื่องมือควรมีคําชี้แจงสําหรับการสอบที่งายและชัดเจน 6.2 ใชเวลาในการสอบเหมาะสม เครื่องมือที่มีประสิทธิภาพเปนเครื่องมือที่วัดไดตรง โดยใชคําถาม จํานวนนอยขอ และใชเวลานอยที่สุด เครื่องมือที่วัดไดตรงตองครอบคลุมและเปนตัวแทนสิ่งที่วัด การใช คําถามนอยขออาจไมครอบคลุมสิ่งที่จะวัด การใชคําถามมากขออาจทําใหครอบคลุมสิ่งที่ตองการวัดแตก็ตอง ใหเวลาการตอบเพียงพอ การใชเวลานอยเกินไป อาจทําใหผูตอบทําไมทันซึ่งอาจตอบโดยการเดา ในทาง ตรงกันขามการใหเวลามากเกินไปอาจทําใหผูตอบตอบถูกเกือบทั้งหมด ซึ่งมีผลตอคาอํานาจจําแนกของ เครื่องมือ และสงผลใหเครื่องมือมีความเที่ยงต่ํา 6.3 งายในการตรวจใหคะแนน เครื่องมือที่ดีควรมีวิธีการตรวจใหคะแนนที่สะดวก ถูกตองไม ซับซอน และใชเวลาไมมากนัก 6.4 งายในการแปลผลและการนําผลไปใช เครื่องมือที่ดีควรมีคูมือการแปลผลและการนําผลไปใช ใหเปนประโยชนตอผูเกี่ยวของ เครื่องมือที่มีคุณภาพมีลักษณะสําคัญ หลายประการดังกลาวแลว ในการสรางเครื่องมือควรมีการ ตรวจสอบเครื่องมือที่สรางขึ้นวามีคุณภาพหรือไม เครื่องมือที่จะนําไปใชในการวัดและประเมินผลการศึกษา ควรเปนเครื่องมือที่มีคุณภาพ ตัวชี้วัดคุณภาพของเครื่องมือ ไดแก 1. ตัวชี้วัดคุณภาพของเครื่องมือวัดผลเปนรายขอ ประกอบดวย ความยาก อํานาจจําแนก 2. ตัวชี้วัดคุณภาพของเครื่องมือวัดผลทั้งฉบับ ประกอบดวย ความตรง ความเที่ยง
  • 27. 24 1. การตรวจสอบความตรงเครื่องมือวัด สถิติที่ใชหาความตรง ในที่นี้จะกลาวถึงการหาความตรงเชิงเนื้อหา 2 วิธี คือ 1. IOC : Index of Item – Objective Congruence 2. CVR : Content Validity Ratio แบบทดสอบวัดผลสัมฤทธิ์ทางการเรียน : จะตรวจสอบความตรงเชิงเนื้อหาของแบบทดสอบ ความสอดคลองของขอสอบกับวัดถุประสงคที่วัด และความครอบคลุมของเนื้อหาที่วัด แบบสอบถามหรือแบบประเมินตางๆ : จะตรวจสอบความสอดคลองและครอบคลุมของ คําถาม(Items) กับเนื้อหา(Content) คุณลักษณะ (Trait)หรือองคประกอบของสิ่งที่ตองการวัด 1.1 การหาคา IOC พิจารณาจากคะแนนของผูเชี่ยวชาญ โดยการใหตรวจผลการพิจารณาของผูเชี่ยวชาญตอขอคําถามรายขอ 3 ประเด็น คือ ให +1 ถาแนใจวา ขอคําถามหรือขอความสอดคลองกับวัตถุประสงคที่ตองการวัด ให 0 ถาไมแนใจวา ขอคําถามหรือขอความสอดคลองกับวัตถุประสงคที่ตองการวัด ให -1 ถาแนใจวา ขอคําถามหรือขอความไมสอดคลองกับวัตถุประสงคที่ตองการวัด นําคะแนนของผูเชี่ยวชาญทุกคนที่ประเมินมากรอกลงในแบบวิเคราะหความสอดคลองของขอคําถาม กับจุดประสงคเพื่อหาคาเฉลี่ย สําหรับขอคําถามแตละขอใชสูตร ดังนี้ IOC = N R∑ IOC คือ คาดัชนีความสอดคลองระหวางขอสอบกับจุดประสงค (Index of Item – Objective Congruence) ∑R คือ ผลรวมของคะแนนความคิดเห็นของผูเชี่ยวชาญ N คือ จํานวนผูเชี่ยวชาญ การแปลความหมายดัชนีความสอดคลองใชเกณฑ ถา IOC ≥ 0.5 แสดงวา ขอคําถามหรือขอความวัดไดตรงตามเนื้อหาและ สอดคลองกับวัตถุประสงค IOC < 0.5 แสดงวา ขอคําถามหรือขอความวัดไมตรงตามเนื้อหาและ ไมสอดคลองกับวัตถุประสงค
  • 28. 25 ตัวอยางแบบตรวจสอบความสอดคลองของขอสอบกับจุดประสงค (รายบุคคล) คําชี้แจง โปรดพิจารณาขอสอบแตละขอที่แนบมาใหวา วัดไดตรงกับจุดประสงคหรือไม ใหกาเครื่องหมาย ลงในชอง +1 ถาวัดไดตรงกับจุดประสงค ในชอง 0 ถาไมแนใจหรือตัดสินไมได ในชอง -1 ถาวัดไดไมตรงกับจุดประสงค พรอมทั้งความคิดเห็นและขอเสนอแนะ ความคิดเห็นของผูเชี่ยวชาญขอสอบ ความคิดเห็น/ จุดประสงค ขอที่ +1 0 -1 ขอเสนอแนะ แบบฝกการคํานวณหาคาดัชนีความสอดคลองระหวางขอสอบแตละขอกับจุดประสงค (Index of Item Objective Congruence : IOC) กิจกรรม 1.1 เมื่อนําขอสอบ จํานวน 5 ขอ ซึ่งวัดจุดประสงคขอ 1 ไปใหผูเชี่ยวชาญ เนื้อหาวิชาพิจารณาลงความเห็นวาขอสอบแตละขอ วัดพฤติกรรมตามที่ระบุ ไวในจุดประสงคขอ 1 หรือไม โดยใชแบบตรวจสอบความสอดคลองของ ขอสอบกับจุดประสงค ดังนี้ คะแนนความคิดเห็นของผูเชี่ยวชาญจุดประสงค ขอที่ ขอสอบ ขอที่ คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5 ∑R IOC 1 1 2 3 4 5 +1 +1 -1 0 +1 +1 +1 -1 0 +1 +1 0 0 0 +1 +1 +1 -1 0 +1 0 0 -1 0 +1 ........ ........ ........ ........ ........ .......... ........ ........ ........ ........ สรุปผลการพิจารณาตรวจสอบ ………………………………………………………..... ……………………………………………………………………………………………………….
  • 29. 26 กิจกรรม 1.2 ผูเชี่ยวชาญ 5 คน พิจารณาแบบประเมินทักษะการทํางาน โดยมีรายการ ประเมิน 6 รายการ ผลการประเมินแสดงดังตาราง จงหาดัชนีความสอดคลอง ของรายการแตละรายการ และสรุปผลการพิจารณาแบบประเมินของผูเชี่ยวชาญ ความคิดเห็นของผูเชี่ยวชาญ รายการ + 1 0 - 1 1.ดานการวางแผนการทํางาน 1.1 การวิเคราะหงาน............................ 5 0 0 1.2 กําหนดเปาหมายในการทํางาน…………….. 4 0 1 1.3 กําหนดขั้นตอน กิจกรรมทํางาน 5 0 0 1.4 กําหนดวิธีการควบคุมผลการปฏิบัติงาน 4 1 0 1.5 บอกแหลงขอมูลสารสนเทศตางๆ ที่ใชประกอบการ ตัดสินใจในการทํางาน…………………….. 3 1 1 1.6 3 1 1การประมาณการใชงบประมาณ เวลา แรงงาน และ วัสดุอุปกรณในการทํางาน………………….. จากสูตร IOC = N R∑ คาดัชนีความสอดคลอง ขอ 1.1 ……………… คาดัชนีความสอดคลอง ขอ 1.2 ……………… คาดัชนีความสอดคลอง ขอ 1.3 ……………… คาดัชนีความสอดคลอง ขอ 1.4 ……………… คาดัชนีความสอดคลอง ขอ 1.5 ……………… คาดัชนีความสอดคลอง ขอ 1.6 ……………… สรุปผลการพิจารณาตรวจสอบ ………………………………………………………..... ………………………………………………………………………………………………………. ………………………………………………………………………………………………………. ………………………………………………………………………………………………………
  • 30. 27 1.2 การคํานวณหาคา CVR : Content Validity Ratio จะมีตารางกําหนดมาให และใชสูตรคํานวณ นําคาไปเปรียบเทียบกับตาราง รายละเอียดดังนี้ ตาราง คาอัตราสวนความตรงเชิงเนื้อหาต่ําสุดที่ผานเกณฑของลอรชี คา CVR ต่ําสุด คา CVR ต่ําสุด จํานวนผูเชี่ยวชาญ จํานวนผูเชี่ยวชาญ ที่มีนัยสําคัญ ที่มีนัยสําคัญ 5 6 7 8 9 10 11 12 0.99 0.99 0.95 0.75 0.78 0.62 0.59 0.56 13 14 15 20 25 30 35 40 0.54 0.51 0.49 0.42 0.37 0.33 0.31 0.29 ที่มา (Lawshe, 1975, p.568) สูตรการคํานวณ CVR = N/2 Ne – N/2 เมื่อ Ne = ผูเชี่ยวชาญที่เห็นดวยหรือเห็นวาเหมาะสม N/2 = ครึ่งหนึ่งของผูเชี่ยวชาญทั้งหมด ตัวอยาง ถาขอคําถามขอหนึ่งมีผูเชี่ยวชาญ 14 คน เห็นดวย 11 คน คํานวณได ดังนี้ 11 - 7 7 CVR = = 0.57 นําคาที่คํานวณไดไปเปรียบเทียบกับคาในตารางที่จํานวนผูเชี่ยวชาญ 14 คือ 0.51 คาที่คํานวณได 0.57 ซึ่งสูงกวาจึงผานเกณฑ
  • 31. 28 2. การการวิเคราะหความยาก ความยากของขอสอบรายขอ เปนดัชนีที่ชี้สัดสวนของผูสอบที่ตอบขอสอบขอนั้นๆ ถูก ความยากของ ขอสอบรายขอ(p) คํานวณไดจากสูตร จํานวนผูสอบทั้งหมด จํานวนผูสอบที่ตอบขอสอบถูก P = ตัวอยาง จากผูเขาสอบทั้งหมด 40 คน มีผูตอบขอสอบขอที่ 1 ถูก 30 คน จงคํานวณคา ความยากของขอสอบขอที่ 1 30P = 40 = .75 ความยากมีคาอยูระหวาง 0 ถึง 1 ขอสอบขอที่ไมมีผูใดตอบถูกเลย จะมีคาความยาก เทากับ 0 ขอสอบขอที่มีผูตอบถูกครึ่งหนึ่งของผูตอบทั้งหมด จะมีคาความยาก เทากับ .50 และ ขอสอบขอที่มีผูตอบถูกทั้งหมดจะมีคาความยาก เทากับ 1 การแปลความหมายคาความยาก ใชเกณฑการพิจารณา ดังนี้ 0.81 – 1.00 ขอสอบงายเกินไป 0.61 – 0.80 ขอสอบคอนขางงาย 0.41 – 0.60 ขอสอบยากปานกลง 0.21 – 0.40 ขอสอบคอนขางยาก 0. – 0.21 ขอสอบยากเกินไป กิจกรรม 2.1 จากตัวอยาง จงคํานวณคาความยากของขอสอบและแปลความหมายคาความ ยากขอที่ 1-5 ความยากขอสอบขอที่ จํานวนผูตอบถูก จํานวนผูตอบทั้งหมด ความหมาย 1 7 10 2 30 30 3 20 40 4 0 28 5 10 50
  • 32. 29 สรุปคุณภาพขอสอบ ............................................................................................................................................................................. ................................................................................................................. ในกรณีที่มีผูเขาสอบจํานวนมาก(มากกวา 40 คน) การวิเคราะหความยากของขอสอบรายขอ อาจใช วิธีแบงกลุมผูสอบตามคะแนนรวม แลวน้ําผลการตอบของผูสอบที่ไดคะแนนรวมสูง รอยละ 27 และกลุม ผูสอบที่ไดคะแนนรวมต่ํา รอยละ 27 (เทคนิค 27%) มาวิเคราะห โดยใชสูตรการคํานวณ คาความยากรายขอ ดังนี้ H + L P = H + L NH + NL H แทน จํานวนผูตอบถูกในกลุมสูง NH แทน จํานวนผูตอบทั้งหมดในกลุมสูง L แทน จํานวนผูตอบถูกในกลุมต่ํา NL แทน จํานวนผูตอบทั้งหมดในกลุมต่ํา กิจกรรมที่ 2.2 จากผูเขาสอบทั้งหมด 100 คน แบงเปนผูสอบที่ไดคะแนนรวมสูง 27 คน และ ผูสอบที่ไดคะแนนรวมต่ํา 27 คน เมื่อแจงนับจํานวนผูตอบขอสอบขอที่ 2 ปรากฏวาผูสอบในกลุมสูงตอบถูก 25 คน และผูสอบในกลุมต่ําตอบขอสอบ ถูก 15 คน จงคํานวณคาความยากของขอสอบขอที่ 2 จากโจทย H = …..... L = …… NH = ……. NL= ……….. จากสูตร P = NH + NL = = ………… ดังนั้น ความยากของขอสอบขอที่ 2 เทากับ ………….. การวิเคราะหขอสอบแบบอัตนัย ขอสอบแบบอัตนัย (Essay) เปนขอสอบที่ใหผูสอบเขียนตอบตามความคิดของตนเอง เปนเครื่องมือที่ จําเปนในการวัดผลโดยเฉพาะในการวัดเกี่ยวกับความคิดเห็น เจตคติ ความสามารถในการคิดวิเคราะห (Synthesis) ความสามารถในการอธิบายใหคนอื่นเขาใจ ความสามารถในการบูรณาการความรู การตอบ ขอสอบชนิดนี้ไดตองอาศัยความรอบรู ประสบการณ และความสามารถในการบูรณาการความรู
  • 33. 30 วิธีการวิเคราะหขอสอบแบบอัตนัย 1. ตรวจใหคะแนนขอสอบแตละขอ แลวรวมคะแนนทุกขอ 2. เรียงกระดาษคําตอบจากคะแนนสูงสุดมาหาต่ําสุด นําจํานวนผูตอบจากคะแนนสูงสุดลงมา 25% เปนกลุมสูง และจํานวนผูตอบจากคะแนนต่ําสุด 25% เปนกลุมค่ํา ในการวิเคราะหใชเฉพาะผล การสอบของกลุมสูงและกลุมต่ํา ที่เหลือกลุมกลาง 50% ไมนํามาวิเคราะห 3. บันทึกคะแนนของแตละคนในแตละขอ ลงในตาราง โดยแยกตามกลุม รวมคะแนนของแตละขอ ของแตละกลุม 4. วิเคราะหหาคาความยากและอํานาจจําแนก โดยใชสูตรดังนี้ ผลรวมของคะแนนกลุมสูง + ผลรวมของคะแนนกลุมต่ํา คาความยาก = จํานวนคนทั้งสองกลุม x คะแนนเต็ม 2NM ผลรวมของคะแนนกลุมสูง - ผลรวมของคะแนนกลุมต่ํา จํานวนคนในแตละกลุม x คะแนนเต็ม ΣH - ΣL NM หรือ P = ΣH + ΣL คาอํานาจจําแนก = หรือ D = 3. การการวิเคราะหคาอํานาจจําแนก 3.1 ารวิเคราะหอํานาจจําแนกของแบบทดสอบแบบอิงกลุม สูตร D = PH - PL เมื่อ D แทน อํานาจจําแนกของขอสอบรายขอ PH แทน สัดสวนของผูตอบขอสอบถูกในกลุมสูง PL แทน สัดสวนของผูตอบขอสอบถูกในกลุมต่ํา หรือ D = r = NH หรือ NL H - L
  • 34. 31 เมื่อ D แทน อํานาจจําแนกของขอสอบรายขอ H แทน จํานวนผูตอบถูกในกลุมสูง L แทน จํานวนผูตอบถูกในกลุมต่ํา NH แทน จํานวนผูตอบทั้งหมดในกลุมสูง NL แทน จํานวนผูตอบทั้งหมดในกลุมต่ํา ตัวอยาง จากผูเขาสอบทั้งหมด 100 คน แบงเปน 3 กลุม กลุมที่ไดคะแนนรวมสูง 27 คน กลุมผูสอนที่ไดคะแนนกลางๆ 46 คน และกลุมผูสอบที่ไดคะแนนรวมต่ํา 27 คน เมื่อแจงนับจํานวนผูตอบขอสอบขอที่ 5 ปรากฏวา ผูสอบในกลุมสูงตอบถูก 25 คน และผูสอบในกลุมกลุม ตอบขอสอบถูก 15 คน จงคํานวณหาคาอํานาจ จําแนกของขอสอบขอที่ 5 27 27 ………… จากโจทย PH = = 0.93 25 PL = = 0.5615 จากสูตร D = PH - PL = 0.93 - 0.56 = 0.37 ดังนั้น คาอํานาจจําแนกของขอสอบขอที่ 5 เทากับ 0,37 กิจกรรมที่ 3.1 จากโจทยตัวอยาง จงคํานวณคาอํานาจจําแนก ขอที่ 5 H = ………., L = …………, NH = NL = …………… จากสูตร r = H - L = NH หรือ NL ……….. = สรุปผลการวิเคราะหคํานวณคาอาจจําแนก ..........................................................................................................................................................
  • 35. 32 3.2 การวิเคราะหอํานาจจําแนกของแบบทดสอบแบบอิงเกณฑ สูตร D = Ppost - Ppre D แทน อํานาจจําแนกของขอสอบรายขอ Ppost แทน สัดสวนของผูตอบขอสอบหลังเรียนถูก Ppre แทน สัดสวนของผูตอบขอสอบกอนเรียนถูก ( จากสูตร Cox and Vargs, 1966 cited in Wiersma and Jurs, 1990: 244-245) กิจกรรมที่ 3.2 ผูเขาสอบ 8 จาก 25 คน ตอบขอสอบกอนเรียนขอที่ 4 ไดถูกตอง และเมื่อสอน เสร็จ ผูสอนใหผูเรียนกลุมเดิมตอบแบบทดสอบฉบับเดิมอีกครั้งหนึ่ง ปรากฏวา ผูเรียนตอบขอสอบขอที่ 4 ถูกตอง 20 คน จงหาคาอํานาจจําแนกของขอสอบขอที่ 4 ………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………… ………………………………………………………………… 3. 3 การแปลความหมายคาอํานาจจําแนกของขอสอบ อีเบลและฟริสไบ (Ebel and Frisbi, 1986 : 234) เสนอเกณฑในการพิจารณาคาอํานาจจําแนก ดังนี้ อํานาจจําแนก ผลการประเมินขอสอบ .40 ขึ้นไป เปนขอสอบที่จําแนกไดดีมาก .30 - .39 เปนขอสอบที่จําแนกไดคอนขางดี แตถาเปนไปไดควรปรับปรุง .20 - .29 เปนขอสอบที่จําแนกไดบาง แตควรปรับปรุงแกไข ต่ํากวา .19 เปนขอสอบที่จําแนกไดนอย ควรตัดออกหรือปรับปรุงใหม
  • 36. 33 4. การวิเคราะหความเที่ยงหรือความเชื่อมั่น (Reliability) 4.1 การหาคาความเที่ยงดวยวิธีของคูเดอร- ริชารดสัน (Kuder – Richardson) เปนวิธีที่นิยมใชกันมากเนื่องจากทดสอบกับกลุมตัวอยางเพียงครั้งเดียว แบงยอยเปน 2 สูตร KR-20 และ KR-21 โดยมีขอตกลงวาแบบทดสอบฉบับนั้นจะตองวัดลักษณะเดียวกันหรือวัดองคประกอบรวมกัน และมีระบบการใหคะแนนเปน Dichotomous คือ ตอบถูกให 1 คะแนน ตอบผิดให 0 คะแนน KR-21 ใชใน กรณีเครื่องมือหรือแบบทดสอบมีความยากเทากันซึ่งในทางปฏิบัติเปนไปไมไดยาก จึงตองใชมีวิธีการคํานวณ จากสูตร KR – 20 ดังนี้ สูตร ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − − =− ∑ 2 1 1 20 S pq k k KR เมื่อ k แทน จํานวนขอสอบ S2 แทน ความแปรปรวนของคะแนนรวมทั้งฉบับ p แทน สัดสวนของคนทําถูกในแตละขอ q แทน สัดสวนของคนทําผิดในแตละขอ (q = 1-p) ตัวอยาง ผลการสอบของนักเรียน 6 คน ขอสอบ 6 ขอ ดังตาราง ขอสอบ รวมคะแนน นักเรียน 1 2 3 4 5 6 X X2 1 2 3 4 5 6 1 1 0 0 1 1 1 1 1 0 1 0 1 1 1 1 0 0 1 1 1 1 0 0 1 1 1 1 0 0 1 1 1 1 0 0 6 6 5 4 2 1 36 36 25 16 4 1 P Q pq 4/6 2/6 8/36 4/6 2/6 8/36 4/6 2/6 8/36 4/6 2/6 8/36 4/6 2/6 8/36 4/6 2/6 8/36 ΣX = 24 Σ X2 = 118 Σpq = 1.33 S2 = 4.4 ⎥⎦ ⎤ ⎢⎣ ⎡ −=− ........... ......... 1 ....... ...... 20KR = ……………………..
  • 37. 34 4.2 การหาความเที่ยงดวยวิธีของครอนบัค(Cronbach) การหาความเที่ยงหรือความเชื่อมั่นของแบบสอบถาม นิยมใชวิธีของครอนบาค ใชกับ แบบสอบถามที่ใหคะแนนแบบเรียงอันดับ หรือเปนมาตราสวนประมาณคา (rating scale) วิธีนี้เรียกวา การหา คาสัมประสิทธิ์แอลฟา (α -Coefficient) ซึ่งดัดแปลงมาจากสูตร KR – 20 ดังนี้ α = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ∑ − − 2 t 2 i S S 1 1n n เมื่อ α = สัมประสิทธิ์ความเที่ยง (สัมประสิทธิ์แอลฟา) n = จํานวนคําถาม ∑ =2 iS ผลรวมของความแปรปรวนของคะแนนในแตละขอ =2 tS ความแปรปรวนของคะแนนรวมทั้งฉบับ ตัวอยาง จากแบบสอบถาม แบบประมาณคา 5 ระดับ จํานวน 6 ขอ ผูตอบ 6 คน ขอสอบ รวมคะแนน นักเรียน 1 2 3 4 5 6 X X2 1 2 3 4 5 6 4 4 3 3 4 2 4 4 3 3 3 1 4 3 2 4 3 1 3 3 4 2 1 2 4 3 3 2 2 1 3 4 3 2 2 1 22 21 18 16 15 8 484 441 324 256 225 64 ∑ i ∑ 2 i 2 tS 20 70 .67 18 60 1.19 17 55 1.37 15 43 1.10 15 43 1.10 15 43 1.10 ΣX = 100 Σ X2 = 1,794 ∑ 2 iS = 6.53 2 tS = 25.47 ⎥⎦ ⎤ ⎢⎣ ⎡ −= ........... ......... 1 ....... ...... α = ……………………..
  • 38. 35 การพิจารณาคาความยาก(p) และอํานาจจําแนก( r, D) แบบทดสอบ ตารางเกณฑการพิจารณาคาความยากงาย(p) ของตัวเลือกถูก คา p รอยละ คา p สัดสวน แปลความหมาย ตีความหมาย ผลการพิจารณา 100 1.00 ตอบถูกทุกคน งายมาก ไมควร 80 .80 ตอบถูก 80% คอนขางงาย ถามากกวานี้ไมควรใช 50 .50 ตอบถูกครึ่งหนึ่ง ยากปานกลาง คุณภาพดีมาก 20 .20 ตอบถูก 20% คอนขางยาก ถานอยกวานี้ไมควรใช 00 .00 ไมมีคนตอบถูก ยากมาก ไมควรใช ตารางเกณฑการพิจารณาคาอํานาจจําแนก (r,D) ของตัวเลือกถูก คา r (D) แปลความหมาย ตีความหมาย ผลการพิจารณา 100 กลุมสูงถูกหมด กลุมต่ําผิดหมด จําแนกไดสูงมาก เปนขอสอบที่มีคุณภาพ .50 กลุมสูงตอบถูกมากกวากลุมต่ํา จําแนกไดคอนขางสูง คุณภาพดี .20 กลุมสูงตอบถูกมากกวากลุมต่ําเล็กนอย จําแนกไดพอใช คุณภาพดีมาก .00 กลุมสูงและกลุมต่ําทําถูกเทากัน จําแนกไมได ถานอยกวานี้ไมควรใช -1.00 กลุมต่ําทําถูกหมดกลุมสูงทําผิดหมด จําแนกทางตรงขาม(ทาง ลบ)ไดอยางสมบูรณ ไมควรใช ตารางเกณฑการพิจารณาคา p, r (D) ตัวลวง คา p คุณภาพ ผลการพิจารณา คา r (D) คุณภาพ ผลการพิจารณา .00 - .04 ใชไมได ไมมีคุณภาพ คาติดลบ .00 - .04 ใชไมได ใชไมได ไมมีคุณภาพ .05 - .09 .01 - .30 .31 - .50 พอใช ใชได พอใช มีคุณภาพ .05 - .09 .10 - .30 .31 - .50 พอใช ใชได พอใช คุณภาพดี .51 - 1.00 ใชไมได ไมมีคุณภาพ .50 - 1.00 ใชไมได ไมมีคุณภาพ