TAP: Test Analysis Program

การวิเคราะหแบบทดสอบ
ดวยโปรแกรม TAP (Test Analysis Program)
Step by Step
ประเสริฐ สุภิรักษ
กลุมงานวัดและประเมินผลการศึกษา
สพท.นครสวรรค 1

คํานํา
การวิเคราะหแบบทดสอบ ดวยโปรแกรม TAP : Test Analysis Program (Step by Step)
เลมนี้ ผูเขียนมีความตั้งใจที่ตองการใหผูศึกษาสามารถนําขั้นตอนในการวิเคราะห TAP ไปใชในงาน
พัฒนาการเรียนการสอนในชั้นเรียน เพื่อวิเคราะหการทดสอบของนักเรียนและการวิเคราะหหาคุณภาพ
แบบทดสอบในการแกไขปรับปรุงใหมีประสิทธิภาพมากขึ้น จากการที่ผูเขียนรับผิดชอบงานวัดและ
ประเมินผลการศึกษาของเขตพื้นที่การศึกษา ทําใหทราบปญหาของครูผูสอนในการสรางและพัฒนา
เครื่องมือวัดจะมีความยากในขั้นตอนวิเคราะหขอมูล ซึ่งอาจจะตองพึ่งพาผูวิเคราะหขอมูลให และมัก
จะพบวาขอมูลที่วิเคราะหนั้นวิเคราะหถูกตองหรือไมเพียงไร ตําราเลมนี้จะชวยใหสามารถวิเคราะห
ไดดวยตนเองอยางถูตองแมนยํายิ่งขึ้น เทากับเปนการแกไขปญหาดังกลาวไดเปนอยางดีในระดับหนึ่ง
ผูเขียนขอขอบคุณ นางสาวฌนุษกุล สุภิรักษ ที่ไดชวยแปลเอกสารบางสวน จากการคันควาของผูเขียน
สุดทายผูเขียนหวังเปนอยางยิ่งวา การนําเอกสารเลมนี้ไปใชคงอํานวยประโยชนตอผูใช
พอสมควร หากมีขอบกพรองประการใดขอนอมรับคําแนะนําเพื่อการแกไขปรับปรุงโอกาสตอไป
ประเสริฐ สุภิรักษ
e-mail : supirak5@hotmail.com

สารบัญ
บทที่ 1 บทนํา 1
ความรูเบื้องตนเกี่ยวกับ TAP 1
การแสดงผลการวิเคราะหแบบทดสอบ ( TAP output provides) 1
บทที่ 2 การติดตั้งโปรแกรม 3
การเขาสูโปรแกรม TAP 3
ขั้นตอนการปอนขอมูล 4
ในกรอบหนาตาง INPUT ใหเลือก 4
หนาตาง Data Editor ปอนขอมูลรายการตางๆ ลงในชวงวาง 5
บทที่ 3 ขั้นตอนการวิเคราะหขอมูล 6
ผลการวิเคราะหขอมูล 6
บทที่ 4 ผลลัพธที่ไดจากการวิเคราะห 9
สวนที่ 1. ผลการวิเคราะหผูสอบ (Examinee Analysis) 9
สวนที่ 2 ผลการวิเคราะหขอสอบรายขอและทั้งฉบับ 11
(Item and Test Analysis)
สวนที่ 3 ผลการวิเคราะหรายตัวเลือก (Options Analysis) 14
สวนที่ 4 การแสดงดวยแผนภาพ ( Graph : Bar Chart and Histogram ) 14
บทที่ 5 การเลือกใช เมนู Option 16
การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades ) 16
การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา(Set Percentages of 18
ltem Discrimination)
บทที่ 6 การเลือกใช เมนู Analysis 19
การกําหนดจํานวนขอสอบเพิ่มเติมตามคาความเชื่อมั่นที่ตองการ 19
ผลการวิเคราะห 21
บทที่ 7 การตรวจสอบคุณภาพเครื่องมือวัดผลการศึกษา 22
การพิจารณาคาความยาก(p) และอํานาจจําแนก( r, D) แบบทดสอบ 35

บทที่ 1
บทนํา
1.1 ความรูเบื้องตนเกี่ยวกับ TAP
โปรแกรม TAP (Test Analysis Program) ถูกออกแบบมาอยางมีประสิทธิภาพ งายตอการใช และเปน
โปรแกรม Freeware สามารถดาวนโหลดไดจากเว็ปไซด http://oak.cats.ohio.edu/~brooksg/tap.htm
พัฒนาโดย บรูก (Brooks,Gordon P.) เปนชุดโปรแกรมใหใชฟรี เพื่อวิเคราะหการทดสอบสําหรับครูผูสอนใน
ระดับโรงเรียนตลอดจนในระดับมหาวิทยาลัย จุดเดนเปนลักษณะของ Software เครื่องมือที่อัจฉริยะสําหรับ
ทดสอบออกแบบหลักสูตร ผูใชสามารถปอนขอมูลคะแนนทดสอบในรูปแบบตัวอักษร หรือขอมูลการ
ทดสอบโดยตรง ในการวิเคราะหสถิติของผูสอบ ประกอบดวยเปอรเซ็นตในการตอบถูก การตัดเกรด ชวง
ความเชื่อมั่นของนักเรียนแตละคน สถิติพื้นฐานของกลุมผูสอบ จํานวนขอที่ตอบถูกแตละคน และจํานวนขอที่
ตอบผิด วิเคราะหสถิติของขอสอบและแบบทดสอบ ประกอบดวย การวิเคราะหความยาก อํานาจจําแนก
พอยทไบซีเรียล ตลอดจนวิเคราะหคุณภาพเปนรายตัวเลือก และสามารถแบงกลุมสูงและกลุมต่ําไดตาม
กําหนด
1.2 การแสดงผลการวิเคราะหแบบทดสอบ ( TAP output provides) 2 สวน
1. ผลการวิเคราะหผูทดสอบ (Examinee Analysis ) ประกอบดวย รอยละความถูกตอง
(Percentage Correct) เกรด ชวงความเชื่อมั่น สําหรับนักเรียนแตละคน และผลรวมคะแนน สถิติเชิงพรรณนา
สําหรับกลุมผูสอบ TAP จะสรางรายการคะแนนและคําตอบที่ผิดของนักเรียน (คําตอบที่นักเรียนตอบผิด)ดวย
เชน รายงานนักเรียนเปนรายบุคคล บงชี้คะแนนตอบสนองตอขอสอบที่ถูกตองไปจนถึงสิ่งที่ผิดพลาด
2. ผลการวิเคราะหขอสอบและการทดสอบ (Item and Test Analysis) ประกอบดวย ความ
ยาก ดัชนีคาอํานาจจําแนก (Discrimination index) รายขอรายตัวเลือก และ สถิติความแปรปรวน KR-20 ,
KR-21 คาเฉลี่ย คาความเบี่ยงเบน ถาขอสอบถูกลบออก TAP สามารถคํานวณจํานวนขอสอบเพิ่มเติมตาม
ความตองการที่เพิ่มคาความเชื่อมั่นได
การวิเคราะหตัวเลือก (Option Analysis) ประกอบดวย กลุมสูง และกลุมต่ํา ความยากของ
ขอสอบ เพื่อตรวจคําตอบ(คําตอบที่ถูกตอง) และตัวลวง
ในเอกสารคูมือการใช TAP เลมนี้ จะนําเสนอขั้นตอนการใชโปรแกรม TAP Version 6.65 ซึ่งได
ปรับปรุงพัฒนาตั้งแต Version 4.xx ถึง Version 6.65 ดังนี้

2
Version 6.6X :
- แกขอบกพรองหลัก ดวยรายงานเกรดสวนบุคคล ( ที่เคยเปนปญหาการจําแนกสําหรับการ
ตอบสนอง / คําตอบขอสอบแตละบุคคล )
- เพิ่มความสามารถเพื่อใหผูใชงานระบุ Criteria ดวยตนเองสําหรับขอสอบที่มีปญหา
- เพิ่มความสามารถในการจําแนกผลการวิเคราะห Quick ltem โดยการปรับ Point Bisorial.
Version 6.4X :
- ความสามารถในการปอนขอมูลตัวอักษร( A,B,C,D )ดังเชน ขอมูลตัวเลข (1,2 ,3, 4 ) สําหรับ
เฉลย และคําตอบของนักเรียน
Version 6.XX :
- การนําเขา input files ที่ดีกวาทุก version
- HELP เพื่อชวยในเรื่องของการนําเขาขอมูล SPSS ดวยคําสั่งใน Sytax ที่ใชใน SPSS
- ความสามารถในการซอน และไมซอน( HIDE หรือ UNHIDE) ชื่อจาก Output (defult เปน
hide,ดวย sasy button เปน unhide )
- ปุมการใชงานงายสําหรับคําสั่งการ Saveไฟล Output ทั่วไปทุกชนิด
- การวิเคราะหอยางรวดเร็วสําหรับ ตัวเลือก / ตัวลวง
- Output ที่ถูกเพิ่มเติม ( เชน class statistics, hard item annotations ) ไปสู Individual Grade
Reports.
- HELP ในหนาตางแกไขขอมูลสําหรับ OHOI UWIVERSITY FOUKS ที่ยอมใหนําเขา
ขอมูลscanned TESTSCORE ที่งายกวา
- HELP ในหนาตางแกไขขอมูล นับจํานวน / ines (บรรทัด) ในหนาตางขอมูล
Version 5.XX :
- เครดิตบางสวน ( Partial crdit ) สามารถเพิ่มคะแนน ( แตไมวิเคราะห )
- ขอสอบแบบหลายตัวเลือก สามารถมีคามากกวา 1 คะแนน ( แตยังคงวิเคราะหที่ 1 คะแนน )
- User Grading Categories ปรับเปลี่ยนใชมากกวาเดิม และปรับเปลี่ยนใชไดตามตองการ
Version 4.XX :
- จํานวนผูถูกทดสอบ เพิ่มเปน 9999
- Histrograns และ กราฟแทงสามารถปรับ,Save และ Print
- จํานวนขอสอบเพิ่มเปน 100
- Histrograms และ bar charts แบบใหม สามารถสรางไดจาก Full Results (ผลลัพธ
ทั้งหมด)
- ตาราง ความถี่ (ดวย PR) เพิ่มใน Full Results.
- Split – Half Reliability เพิ่มใน Full Results.

3
บทที่ 2
การติดตั้งโปรแกรม
2.1 การติดตั้งโปรแกรม TAP
ดาวนโหลดไฟร tap.exe จากเว็ปไซด http://oak.cats.ohio.edu/~brooksg/tap.htm หรือ Copy
ไฟร tap.exe จาก CD ที่ใหมาพรอมกับเอกสารนี้ ลงใน My Documents หรือ Copy มาวาง หนา Desktop
เปนไอคอน ดังภาพประกอบ 1
ภาพประกอบ 1
2.2 การเขาสูโปรแกรม TAP
ขั้นตอนการเรียกใชโปรแกรม TAP (Test Analysis Program) for Windows สามารถทําไดโดย
เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65)
ดับเบิ้ลคลิก

4
2.3 ขั้นตอนการปอนขอมูล
2.3.1 ในกรอบหนาตาง INPUT ใหเลือก
1. เลือก Enter New Data การสราง/ปอนขอมูลใหม
2. หรือ เลือก Open TAP file จากนั้น คลิกที่ปุม GO To Data Editor ในกรณี เปดขอมูลเกาที่
สรางจากโปรแกรม TAP
3. คลิกที่ปุม GO To Data Editor

5
2.3 .2 หนาตาง Data Editor ปอนขอมูลรายการตางๆ ลงในชวงวาง ดังนี้
1. Title ปอนหัวขอของแบบทดสอบ หรือวิชาที่จัดสอบ จํานวนตัวอักษรสูงสุด 70 ตัวอักษณ
2. Comments ปอนหมายเหตุ หรืออาจระบุวาแบบทดสอบนี้วัดอะไร จํานวนตัวอักษรสูงสุด
70 ตัวอักษร
3. Key ปอนเฉลยของขอสอบ
4. Options ปอนจํานวนตัวเลือกในขอสอบแตละขอ
5. Include ระบุวาขอใดที่ตองการวิเคราะหและขอใดไมนําเขาวิเคราะห โดยพิมพ Y คือนําขอสอบ
ขอนั้นเขาวิเคราะห หรือพิมพ N เมื่อไมนําขอสอบนั้นเขามาวิเคราะห
6. #Students ปอนจํานวนนักเรียนหรือผูสอบทั้งหมด
7. # Test ltems ปอนจํานวนขอสอบทั้งหมด
8. Length of Examinee Names /IDs (# character) ระบุจํานวนสดมภที่ตองการปอนรหัสประจําตัว
ผูสอบหรือชื่อผูสอบ
9. DATA สําหรับปอนขอมูลทั้งหมดของผูสอบ โดยปอนรหัสประจําตัวผูสอบตามจํานวนสดมภ
ที่กําหนด และปอนตัวเลือกแตละขอของผูสอบแตละคน ตามจํานวนที่ระบุ
10. เมื่อปอนขอมูลเสร็จสิ้น ใหบันทึกขอมูลโดยคลิกที่ปุม Save File

6
บทที่ 3
ขั้นตอนการวิเคราะหขอมูล
ขั้นตอนการวิเคราะหขอมูล3.
3.1 คลิกที่ปุม ในหนาตาง Data Editer ภาพประกอบ 5 โปรแกรมจะ
วิเคราะหขอมูล
3.2 ผลการวิเคราะหขอมูล จะแสดงใน 2 หนาตางคือหนาตาง ดังภาพประกอบ 6
1. หนาตาง QUICK EXAMINEE RESULTS แสดงคาสถิติสําหรับผูสอบ และ
2. หนาตาง QUICK ITEM ANALYSIS แสดงคาสถิติสําหรับขอสอบ

7
3.3 เมื่อตองการบันทึกผลการวิเคราะหทั้งสองหนาตางลงไปไฟล ใหไปที่ชองOUTPUT โดยพิมพชื่อ
ไฟลที่ตองการเก็บผลลัพธในชอง Result File Name โดยผลลัพธจะเก็บไวในนามสกุล .Txt และ
1. คลิก Save Quick Examinee Results โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File
Name แตนามสกุลตางกัน คือ .exm
2. คลิก Save Quick ltem Analysis โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File Name
แตนามสกุลตางกัน คือ .itm
3. คลิก Save Quick Option Analysis โปรแกรมจะบันทึกไวในชื่อเดียวกับResult File
Name แตนามสกุลตางกัน คือ .opt
3.4 การวิเคราะหผลอยางยอ และตอเนื่องดวยการกําหนด Option ใหม
1. ปุม Analyze (F9) เปนปุมวิเคราะหขอมูลโดยจะแสดงผลอยางยอและเมื่อคลิก Option เพื่อ
กําหนด Option เพิ่มเติมใหม เชน การตัดเกรด หรือรอยละของกลุมสูง- กลุมต่ํา สามารถ
วิเคราะหอยางตอเนื่องได ปุมAnalyze(F9) จะเปลี่ยนเปนดังภาพประกอบ 9

8
2. ปุม View Full Results Graphs (F2) เปนปุมวิเคราะหขอมูลโดยละเอียด จะใหผล
การวิเคราะหผูสอบและขอสอบที่มากกวา นอกจากนี้ยังแสดงแผนภูมิแทงและฮีสแกรม
ของคะแนนสอบไดอีกดวย
3. ปุม Save Results Selected Output (F3) เปนปุมบันทึกผลการวิเคราะหโดย
ละเอียดและเลือกการบันทึกไฟรผลลัพธ
4.ปุม View/Print Quick Examinee Full Screen (F5) ) เปนปุมแสดงเฉพาะผลการวิเคราะห
คาสถิติของนักเรียนหรือผูสอบรายบุคคล ทุกรายการ
5.ปุม View/Print Item Analysis Full Screen (F6) เปนปุมแสดงผลการวิเคราะหคาสถิติ
ของแบบทดสอบรายขอ และคุณภาพ ตลอดจนคาความเชื่อมั่น(KR-20,KR-21) ของ
แบบทดสอบทั้งฉบับ ทุกรายการ
6.ปุม View/Print Quick Option Analysis (F7) เปนปุมแสดงผลเฉพาะการวิเคราะหคาสถิติ
คุณภาพของแบบทดสอบรายขอ และตัวเลือกตัวลวง (คา p ,r (D) ตาม Option ที่กําหนด

9
บทที่ 4
ผลลัพธที่ไดจากการวิเคราะห
4 . ผลลัพธที่ไดจากการวิเคราะหโดยละเอียด
ผลลัพธที่ไดจากการวิเคราะหจะแบงออกเปน 4 สวนดังนี้
สวนที่ 1. ผลการวิเคราะหผูสอบ (Examinee Analysis) ใหผลดังนี้
สวนที่ 1
ID คือรหัสประจําตัวของผูสอบแตละคน
Score คือคะแนนที่ไดของผูสอบแตละคน
Percent คือสัดสวนระหวางคะแนนที่ไดกับคะแนนเต็ม
Ltr Grade คือผลการตัดเกรด ซึ่งผูวิเคราะหสามารถกําหนดไดวาจะใหตัดกี่เกรด และ
เกณฑผานคือเทาไร
68% C.I. คือประมาณคาคะแนนจริงของผูสอบแตละคน จากสูตร X ± SEM ที่ระดับความ
เชื่อมั่น 68%
95% C.I. คือประมาณคาคะแนนจริงของผูสอบแตละคน จากสูตร X ± (1.96)SEM ที่ระดับ
ความเชื่อมั่น 95%

10
สวนที่ 1(ตอ)
Number of Examinees คือจํานวนผูสอบทั้งหมด
Minimum Score คือคะแนนต่ําสุดที่ผูสอบในกลุมทําได
Maximum Score คือคะแนนสูงสุดที่ผูสอบในกลุมทําได
Median Score คือคะแนนมัธยฐาน
Mean Score คือคะแนนเฉลี่ย
Standard Deviation คือคะแนนเบี่ยงเบนมาตรฐาน
Variance คือความแปรปรวน
Skewness คือความเบ
Kurtosis คือความโดง
Frequency Table คือ การแสดงแจกแจงความถี่ของคะแนนสอบ
Bar Graph คือแสดงการแจกแจงความถี่ของคะแนนดวยแผนภูมิแทง
Stem-and-Leaf Display คือแสดงการแจกแจงของคะแนนในรูปของแผนภาพตนใบ
Bar Graph คือแสดงการแจกแจงความถี่ของแตละระดับเกรด

11
สวนที่ 2 ผลการวิเคราะหขอสอบรายขอและทั้งฉบับ (Item and Test Analysis) ใหผลดังนี้
Item คือขอสอบแตละขอ
Number Correct คือจํานวนผูสอบที่ตอบถูกในขอนั้น
Item Diff. คือคาความยากของขอสอบ
Disc. Index คือดัชนีอํานาจจําแนกขนองขอสอบ
#Correct in High Grp คือจํานวนผูสอบในกลุมสูงที่ตอบขอสอบขอนั้นถูก
#Correct in Low Grp คือจํานวนผูสอบในกลุมต่ําที่ตอบขอสอบขอนั้นถูก
Point Biserial คือคาอํานาจจําแนกที่คํานวณจากสูตรสหสัมพันธพอยทไบซีเรียล
Adjusted Pt. Bis. คือคาอํานาจจําแนกที่คํานวณจากสูตรสหสัมพันธไบซีเรียล
Number of ltems คือจํานวนขอสอบทั้งหมด
Mean ltem Difficulty คือคาเฉลี่ยของคาความยาก
สวนที่ 2 (ตอ)

12
Mean ltem Discrimination คือคาเฉลี่ยของดัชนีอํานาจจําแนก
Mean Point Biserial คือคาเฉลี่ยของสหสัมพันธพอยทไบซีเรียล
KR20 (Alpha) คือคาความเชื่อมั่นที่คํานวณดวยสูตร KR-20
KR21 คือคาความเชื่อมั่นที่คํานวณดวยสูตร KR-21
SEM (from KR20 ) คือคาความคลาดเคลื่อนมาตรฐานของการวัด
High Grp Min Score (n=18) คือคะแนนต่ําสุดของกลุมสูง
LOW Grp Max Score (n=19) คือคะแนนสูงสุดของกลุมต่ํา
Minimum ltem Diff. คือคาต่ําสุดของคาความยากของขอสอบ
Maximum ltem Diff. คือคาสูงสุดของคาความยากของขอสอบ
Minimum Disc. lndex คือคาต่ําสุดของดัชนีอํานาจจําแนกของขอสอบ
Maximum Disc. lndex คือคาสูงสุดของดัชนีอํานาจจําแนกของขอสอบ
Minimum Pt. Biserial คือคาต่ําสุดของของสหสัมพันธพอยทไบซีเรียล
Miximum Pt. Biserial คือคาสูงสุดของของสหสัมพันธพอยทไบซีเรียล
Additional ltem Analysis คือผลการวิเคราะหขอสอบเพิ่มเติม
Item คือ ขอสอบแตละขอ
Scale Mean if ltem Deleted คือคาเฉลี่ยของขอสอบทั้งฉบับเมื่อไมรวมขอสอบขอนั้น
Scale SD if ltem Deleted คือคะแนนเบี่ยงเบนมาตรฐานของขอสอบทั้งฉบับเมื่อไมรวม
ขอสอบขอนั้น
KR-20 if ltem Deleted คือคาความเชื่อมั่นสูตร KR-20 ของแบบทดสอบทั้งฉบับเมื่อไม
รวมขอสอบขอนั้น
SEM if ltem Deleted คือความคลาดเคลื่อนมาตรฐานของการวัดของแบบทดสอยทั้งฉบับ
เมื่อไมรวมขอสอบขอนั้น

13
Biserial Correl. คือคาสหสัมพันธไบซีเรียล
Mean Biserial Corr. คือคาเฉลี่ยของสหสัมพันธไบซีเรียล
Minimum Biserial Corr.คือคาต่ําสุดของสหสัมพันธไบซีเรียล
คือคาสูงสุดของสหสัมพันธไบซีเรียลMaximum Biserial Corr.
Answer Key Analysis คือการวิเคราะหตัวเลือกทั้งหมด
Bar Chart for Correct Answer Usage คือแผนภาพแสดงความถี่ของตัวเลือกที่เปน
เฉลยขอสอบ
Bar Chart for Number of Options Usage คือแผนภาพแสดงความถี่ของตัวเลือกที่ใช
ในขอสอบแตละขอ
Ltem lncluded, Answer Keu, Additional Correct Options คือแสดงขอสอบที่รวมเขา
วิเคราะห (ITEMS INCLUDED) ขอสอบที่ไมรวมเขาวิเคราะห (ITEMS EXCLUDED:) เฉลย
ขอสอบ และเฉลยขอสอบ (CORRECTANSWERS (ltem#-Key)

14
สวนที่ 3 ผลการวิเคราะหรายตัวเลือก (Options Analysis) ใหผลดังนี้
ตัวเลขที่อยูนอกวงเล็บคือความถี่ของผูสอบที่เลือกตอบตัวเลือกนั้นในแตละกลุม สวนตัวเลขในวงเล็บ
คือสัดสวนของความถี่นั้นตอจํานวนผูสอบในกลุม นั้นคือในแถว Total ของตัวเลือกที่ 1 (Option 1) มีผูสอบ
ทั้งหมดเลือกตัวเลือก 1 จํานวน 15 คน คิดเปนสัดสวน 0.300 ซึ่งสัดสวนนี้ก็คือคาความยาก ( คา p = 0.30 )
ของตัวเลือกที่ 1 สวนผลตางของกลุมสูงและกลุมต่ํา (Diff) คือ 3 คิดเปนสัดสวนในวงเล็บ 0.265 ซึ่งสัดสวน
นี้ก็คือดัชนีอํานาจจําแนก (คา r / D = 0.256 ) ของตักเลือกที่ 1 สังเกตวาโปรแกรมจะคํานวณ Diff โดยใช
ความถี่ของกลุมสูงลบดวยกลุมต่ํา ดังนั้นตัวลวงที่จําแนกไดอยางมีประสิทธิภาพ นั้นคือกลุมสูงควรเลือกตอบ
ตัวลวงนอยกวากลุมต่ํานั่นเอง สวนขอ 1 นี้ตัวเฉลยคือตัวเลือกที่ 1 ซึ่งมีเครื่องหมายดอกจันอยู มีคาความยาก
(p) 0.30 อํานาจจําแนก(r/D) 0.265 ซึ่งถือวาเปนขอสอบที่คอนขางยาก และมีคาอํานาจจําแนกที่ใชได จึงเปน
ขอสอบที่ใชได ถาเครื่องหมาย # ก็คือตัวเลือกนั้นมีอํานาจจําแนกสูงกวาตัวเฉลย
สวนที่ 4 การแสดงดวยแผนภาพ ( Graph : Bar Chart and Histogram )โดยดานลางของหนาตาง
แสดงผลลัพธโดยละเอียดจะปรากฏ 3 ปุมคือ Bar Chart for Grades แสดงแผนภูมิแทงแจกแจงความถี่แตละ
ระดับเกรด Bar Chart for Scores แสดงแผนภูมิแทงแจกแจงความถี่แตละระดับคะแนน และ Histogram
for Scores แสดงฮีสโทแกรมแจกแจงความถี่ละระดับคะแนน ดังภาพประกอบ 19

15

16
บทที่ 5
การเลือกใช เมนู Option
เมนู Options ผูวิเคราะหสามารถกําหนดคาตางในการวิเคราะหได ที่สําคัญดังนี้
1. การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades )
2. การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา (Set Percentages of ltem Discrimination)
1. การกําหนดคาเปอรเซ็นตของเกรด (Set Percentages lf Grades )
Set Percentages lf Grades ผูวิเคราะหสามารถเลือกใหผลเกรดแกผูสอบได โดยเลือกได 2 เกรด คือ
ผานกับไมผาน เลือกได 5 เกรดคือ A, B, C, D และ F เลือกได 12 เกรดคือ A, A-, B+,B, B-, C+,C, C-,
D+,D, D- และ F และไมแสดงผลเกรด โดยแตละระดับเกรดสามารถเลือกเปอรเซ็นตต่ําสุดที่ผูสอบควรได
ดังภาพประกอบ 21
1.1 คลิก Option ที่เมนูบาร
1.2 เลือกคลิก Set Percentages lf Grades …
1.3 เลือกกําหนดคา

17
การเลือกกําหนดคา
คลิกเลือก 2 Categories (Pass, Fail) = เกรด 2 ระดับ ผาน และไมผาน กําหนด ตัวเลขใน
ชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (70%)
คลิกเลือก 5 Categories (A,B,C,D,F) = เกรด 5 ระดับ A,B,C,D และF กําหนด ตัวเลข ใน
ชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (90,80,70,60 ตามลําดับ)
คลิกเลือก 12 Categories (A,A-,B+,B,B-,C+,C,C-,D+,D,D-,F) = เกรด 12 กําหนด ตัวเลข
ในชอง Grade % หรือเลือกคา Defaults ของโปรแกรม (94,91,88,84,81,78,74,71,68,64,61 ตามลําดับ)
คลิกเลือก User Defined = ผูใชกําหนดระดับเกรดไดเอง
คลิกเลือก No Grading Categories = ไมกําหนดเกรด

18
เมื่อเลือกกําหนดคาแลว คลิก OK เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65)
ปุม Analyze(F9) จะเปลี่ยนเปน แลวคลิก เพื่อวิเคราะหผลใหม
สดมภ Ltr Grade จะแสดงผลเกรดที่กําหนด ดังภาพประกอบ 22
2. การกําหนดคาเปอรเซ็นตแบงกลุมสูงกลุมคา(Set Percentages of ltem Discrimination)
Set Percentages of ltem Discrimination ผูวิเคราะหสามารถเลือกแบงกลุมสูงกลุมต่ํากลุมละกี่
เปอรเซ็นตก็ไดโดยระบุคาเปอรเซ็นตที่ตองการ ดังภาพประกอบ 23
2.1 คลิก Option ที่เมนูบาร
2.2 เลือกคลิก Set Percentages of ltem Discrimination
การกําหนดจํานวนเปอรเซ็นตเพื่อแบงกลุมสูงกลุมต่ํา ในชอง Top หรือ Bottom เปน 33 หรือ
50 ตามความตองการได หรือเลือกคา Defaults ของโปรแกรม (27%)
เมื่อเลือกกําหนดคาแลว คลิก OK เขาสูหนาจอ TAP : Test Analysis Program (Version 6.65)
ปุม Analyze(F9) จะเปลี่ยนเปน แลวคลิก เพื่อวิเคราะหผลใหม

19
บทที่ 6
การเลือกใช เมนู Analysis
การเลือกใช เมนู Analysis
การกําหนดจํานวนขอสอบเพิ่มเติมตามคาความเชื่อมั่นที่ตองการ
เมนู Analysis ประกอบไปดวยเมนูรอง Run Analysis ซึ่งสามารถคลิกเลือกไดจากปุมอยูแลว แตเมนู
รองที่สําคัญก็คือ Speaman-Bown Prophecy เปนการทํานายจํานวนขอที่ควรเพิ่มเขาไปในแบบทดสอบเพื่อให
ไดคาความเชื่อมั่นตามที่กําหนด ดังภาพประกอบ 23
1. คลิก Analysis ที่เมนูบาร
2. เลือกคลิก Speaman-Bown Prophecy แสดงหนาจอ Speaman-Bown Prophecy ดัง
3. แสดงคุณภาพแบบทดสอบฉบับนี้มีขอสอบอยู 20 ขอ มีความเชื่อมั่นอยู 0.577

20
จากภาพประกอบ 24 แสดงคุณภาพแบบทดสอบฉบับนี้มีขอสอบอยู 20 ขอ มีความเชื่อมั่นอยูเดิม
0.577 ถาตองการแบบทดสอบที่มีความเชื่อมั่นเพิ่มขึ้นควรจะเพิ่มขอสอบอีกจํานวนเทาใด
1. กําหนดตัวเลขคาความเชื่อมั่นเพิ่มใน To achieve a desired of reliability of …
2. คลิกการคํานวณ Calculate
แสดงหนาจอจํานวนขอสอบเพิ่มเติม ดังภาพประกอบ 25

21
ผลการวิเคราะห
คาความเชื่อมั่นของแบบทดสอบเดิมทั้งฉบับ ( The reliability of the test analyzed was….)= 0.577
ตองการผลคาความเชื่อมั่นเพิ่มเติม (To Achieve a desired of reliability of …) = 0.800
จํานวนขอสอบที่ตองเพิ่ม (you need….) = 39 ขอ
ขอสอบฉบับนี้เพิ่มมากขึ้น ( item. This is because the test must be….) = 2.94 เทาของขอสอบเดิม
จํานวนขอสอบรวมทั้งหมด ( item. For a TOTAL of …) 59 ขอ
นั่นคือแบบทดสอบฉบับนี้มีขอสอบอยูเดิม 20 ขอ มีความเชื่อมั่นอยูเดิม 0.577 ถาตองการ
แบบทดสอบที่มีความเชื่อมั่น 0.800 ควรจะตองเพิ่มขอสอบอีกจํานวนเทาใด ผลการวิเคราะหก็คือ ตองเพิ่ม
อีก 39 ขอหรือ 2.94 เทาของขอสอบเดิม จึงจะไดคาความเชื่อมั่น 0.800 ขอสอบในแบบทดสอบควรจะมี
จํานวน 59 ขอ ซึ่งเปนผลการทํานายถาขอสอบที่เพิ่มเติมมีคุณภาพเทากับขอสอบเดิมหรือใกลเคียงกัน

22
บทที่ 7
การตรวจสอบคุณภาพเครื่องมือวัดผลการศึกษา
เครื่องมือวัดที่นําไปใชในการวัดผลการเรียนรูของผูเรียน ควรเปนเครื่องมือที่ดีมีคุณภาพ เพื่อทําให
สามารถวัดผลการเรียนรูที่แทจริงของผูเรียนได เครื่องมือวัดผลที่มีคุณภาพ มีลักษณะสําคัญดังนี้
1. ความตรงหรือความเที่ยงตรง (Validity)
2. ความยากหรือความยากงาย (Difficulty)
3. อํานาจจําแนก (Discrimination Power)
4. ความเที่ยงหรือความเชื่อมั่น (Reliability)
5.ความเปนปรนัย (Objectivity)
6. ความสามารถในการนําไปใช (Usability)
1. ความตรงหรือความเที่ยงตรง (Validity) ความหมายของความตรงแบงไดเปน 2 แนวคิด
ตามแนวคิดเดิม ความตรง หมายถึง ความสามารถของเครื่องมือที่วัดไดตรงกับสิ่งที่ตองการวัด สวนแนวคิด
ปจจุบัน ความตรง หมายถึง ความสามารถของหลักฐานที่อธิบายผลการวัดไดตรงกับสิ่งที่ตองการวัด ความ
ตรงของผลการวัด อาจไดมาจาก การรวบรวมหลักฐานจากหลายวิธี การตรวจสอบหลักฐานที่แสดงถึงความ
ตรงจึงมีหลายชนิด ซึ่งจําแนกตามหลักฐานได 3 ชนิด คือ หลักฐานความตรงเชิงเนื้อหา หลักฐานความตรงเชิง
เกณฑ และหลักฐานความตรงเชิงโครงสราง
2. ความยากหรือความยากงาย (Difficulty) หมายถึงความยากในเชิงเนื้อหาของเครื่องมือประเภท
แบบทดสอบ ซึ่งมีคําตอบถูกผิดตามหลักวิชา หรือหลักการอื่นๆ ความยากพิจารณาจากสัดสวนหรือรอยละ
ของผูที่ตอบคําถามขอนั้นๆ ไมถูกตอง เครื่องมือวัดผลที่ดี ควรมีความยากพอเหมาะกับกลุมผูสอบ สําหรับ
เครื่องมือประเภทที่ไมมีคําตอบถูกผิด จะไมมีความยากในเชิงเนื้อหา การสรางเครื่องมือตองใชภาษาที่
เหมาะสมกับกลุมสอบ
3. อํานาจจําแนก (Discrimination Power) หมายถึง ความสามารถของเครื่องมือที่วัดไดตรงกับ
ความสามารถของผูถูกวัด เปนความสัมพันธระหวางความสามารถของผูตอบกับการตอบถูก กลาวคือ คนที่มี
ความสามารถในสิ่งที่วัดมากควรตอบถูกมาก และในทํานองเดียวกันคนที่มีความสามารถต่ํา จะตอบถูกนอย
เครื่องมือวัดที่มีอํานาจจําแนกสามารถจําแนกผูที่มีความสามารถแตกตางกัน ออกจากกันตามระดับ
ความสามารถ เชน จําแนกคนที่รอบรู ออกจากที่ไมรอบรู จําแนกคนที่มีคุณธรรมสูง ออกจากคนที่มีคุณธรรม
ต่ํา เปนตน
4. ความเที่ยงหรือความเชื่อมั่น (Reliability) หมายถึง ความคงที่ หรือความคงเสนคงวา
(Consistency) ของผลที่ไดจากการวัดสิ่งเดียวกันดวยเครื่องมือเดียวกันในชวงเวลาที่ตางกัน

23
2 ครั้งขึ้นไป หรือความสอดคลองของผลการวัดสิ่งเดียวกันดวยเครื่องมือหรือวิธีการที่แตกตางกันมากกวาหนึ่ง
อยางขึ้นไป การตรวจสอบความเที่ยงทําไดหลายวิธี เชน วิธีวัดซ้ํา(test-retest) วิธีใชเครื่องมือที่สมมูลกัน
(equivalent forms) วิธีหาความสอดคลองภายใน เปนตน
5. ความเปนปรนัย (Objectivity) หมายถึง ความชัดเจนของเครื่องมือทั้งคําถามและคําตอบ คําถามที่
เปนปรนัยตองมีความชัดเจน ผูอานเขาใจตรงกันวาถามอะไร สวนตําตอบที่เปนปรนัยตองมีคําตอบถูกชัดเจน
มีวิธีการตรวจและเกณฑการใหคะแนน รวมทั้งการแปลความหมายที่ผูตรวจสามารถใหคะแนนไดตรงกัน
6. ความสามารถในการนําไปใช (Usability) ลักษณะของเครื่องมือที่ควรพิจารณาอีกอยางหนึ่ง คือ
ความสามารถนําไปใชไดสะดวก เนื่องจากครูผูสอนหรือผูใชเครื่องมือไมใชผูที่ไดรับการฝกอบรมดานการ
วัดผลมาโดยเฉพาะ ดังนั้นเครื่องมือจึงควรมีลักษณะที่สามารถนําไปใชไดสะดวก ดังนี้
6.1 งายในการดําเนินการสอบ เครื่องมือควรมีคําชี้แจงสําหรับการสอบที่งายและชัดเจน
6.2 ใชเวลาในการสอบเหมาะสม เครื่องมือที่มีประสิทธิภาพเปนเครื่องมือที่วัดไดตรง โดยใชคําถาม
จํานวนนอยขอ และใชเวลานอยที่สุด เครื่องมือที่วัดไดตรงตองครอบคลุมและเปนตัวแทนสิ่งที่วัด การใช
คําถามนอยขออาจไมครอบคลุมสิ่งที่จะวัด การใชคําถามมากขออาจทําใหครอบคลุมสิ่งที่ตองการวัดแตก็ตอง
ใหเวลาการตอบเพียงพอ การใชเวลานอยเกินไป อาจทําใหผูตอบทําไมทันซึ่งอาจตอบโดยการเดา ในทาง
ตรงกันขามการใหเวลามากเกินไปอาจทําใหผูตอบตอบถูกเกือบทั้งหมด ซึ่งมีผลตอคาอํานาจจําแนกของ
เครื่องมือ และสงผลใหเครื่องมือมีความเที่ยงต่ํา
6.3 งายในการตรวจใหคะแนน เครื่องมือที่ดีควรมีวิธีการตรวจใหคะแนนที่สะดวก ถูกตองไม
ซับซอน และใชเวลาไมมากนัก
6.4 งายในการแปลผลและการนําผลไปใช เครื่องมือที่ดีควรมีคูมือการแปลผลและการนําผลไปใช
ใหเปนประโยชนตอผูเกี่ยวของ
เครื่องมือที่มีคุณภาพมีลักษณะสําคัญ หลายประการดังกลาวแลว ในการสรางเครื่องมือควรมีการ
ตรวจสอบเครื่องมือที่สรางขึ้นวามีคุณภาพหรือไม เครื่องมือที่จะนําไปใชในการวัดและประเมินผลการศึกษา
ควรเปนเครื่องมือที่มีคุณภาพ ตัวชี้วัดคุณภาพของเครื่องมือ ไดแก
1. ตัวชี้วัดคุณภาพของเครื่องมือวัดผลเปนรายขอ ประกอบดวย
ความยาก
อํานาจจําแนก
2. ตัวชี้วัดคุณภาพของเครื่องมือวัดผลทั้งฉบับ ประกอบดวย
ความตรง
ความเที่ยง

24
1. การตรวจสอบความตรงเครื่องมือวัด
สถิติที่ใชหาความตรง ในที่นี้จะกลาวถึงการหาความตรงเชิงเนื้อหา 2 วิธี คือ
1. IOC : Index of Item – Objective Congruence
2. CVR : Content Validity Ratio
แบบทดสอบวัดผลสัมฤทธิ์ทางการเรียน : จะตรวจสอบความตรงเชิงเนื้อหาของแบบทดสอบ
ความสอดคลองของขอสอบกับวัดถุประสงคที่วัด
และความครอบคลุมของเนื้อหาที่วัด
แบบสอบถามหรือแบบประเมินตางๆ : จะตรวจสอบความสอดคลองและครอบคลุมของ
คําถาม(Items) กับเนื้อหา(Content) คุณลักษณะ
(Trait)หรือองคประกอบของสิ่งที่ตองการวัด
1.1 การหาคา IOC พิจารณาจากคะแนนของผูเชี่ยวชาญ
โดยการใหตรวจผลการพิจารณาของผูเชี่ยวชาญตอขอคําถามรายขอ 3 ประเด็น คือ
ให +1 ถาแนใจวา ขอคําถามหรือขอความสอดคลองกับวัตถุประสงคที่ตองการวัด
ให 0 ถาไมแนใจวา ขอคําถามหรือขอความสอดคลองกับวัตถุประสงคที่ตองการวัด
ให -1 ถาแนใจวา ขอคําถามหรือขอความไมสอดคลองกับวัตถุประสงคที่ตองการวัด
นําคะแนนของผูเชี่ยวชาญทุกคนที่ประเมินมากรอกลงในแบบวิเคราะหความสอดคลองของขอคําถาม
กับจุดประสงคเพื่อหาคาเฉลี่ย สําหรับขอคําถามแตละขอใชสูตร ดังนี้
IOC =
N
R∑
IOC คือ คาดัชนีความสอดคลองระหวางขอสอบกับจุดประสงค
(Index of Item – Objective Congruence)
∑R คือ ผลรวมของคะแนนความคิดเห็นของผูเชี่ยวชาญ
N คือ จํานวนผูเชี่ยวชาญ
การแปลความหมายดัชนีความสอดคลองใชเกณฑ
ถา IOC ≥ 0.5 แสดงวา ขอคําถามหรือขอความวัดไดตรงตามเนื้อหาและ
สอดคลองกับวัตถุประสงค
IOC < 0.5 แสดงวา ขอคําถามหรือขอความวัดไมตรงตามเนื้อหาและ
ไมสอดคลองกับวัตถุประสงค

25
ตัวอยางแบบตรวจสอบความสอดคลองของขอสอบกับจุดประสงค (รายบุคคล)
คําชี้แจง โปรดพิจารณาขอสอบแตละขอที่แนบมาใหวา วัดไดตรงกับจุดประสงคหรือไม
ใหกาเครื่องหมาย ลงในชอง +1 ถาวัดไดตรงกับจุดประสงค
ในชอง 0 ถาไมแนใจหรือตัดสินไมได
ในชอง -1 ถาวัดไดไมตรงกับจุดประสงค
พรอมทั้งความคิดเห็นและขอเสนอแนะ
ความคิดเห็นของผูเชี่ยวชาญขอสอบ ความคิดเห็น/
จุดประสงค
ขอที่ +1 0 -1 ขอเสนอแนะ
แบบฝกการคํานวณหาคาดัชนีความสอดคลองระหวางขอสอบแตละขอกับจุดประสงค
(Index of Item Objective Congruence : IOC)
กิจกรรม 1.1 เมื่อนําขอสอบ จํานวน 5 ขอ ซึ่งวัดจุดประสงคขอ 1 ไปใหผูเชี่ยวชาญ
เนื้อหาวิชาพิจารณาลงความเห็นวาขอสอบแตละขอ วัดพฤติกรรมตามที่ระบุ
ไวในจุดประสงคขอ 1 หรือไม โดยใชแบบตรวจสอบความสอดคลองของ
ขอสอบกับจุดประสงค ดังนี้
คะแนนความคิดเห็นของผูเชี่ยวชาญจุดประสงค
ขอที่
ขอสอบ
ขอที่ คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5
∑R IOC
1 1
2
3
4
5
+1
+1
-1
0
+1
+1
+1
-1
0
+1
+1
0
0
0
+1
+1
+1
-1
0
+1
0
0
-1
0
+1
........
........
........
........
........
..........
........
........
........
........
สรุปผลการพิจารณาตรวจสอบ ……………………………………………………….....
……………………………………………………………………………………………………….

26
กิจกรรม 1.2 ผูเชี่ยวชาญ 5 คน พิจารณาแบบประเมินทักษะการทํางาน โดยมีรายการ
ประเมิน 6 รายการ ผลการประเมินแสดงดังตาราง จงหาดัชนีความสอดคลอง
ของรายการแตละรายการ และสรุปผลการพิจารณาแบบประเมินของผูเชี่ยวชาญ
ความคิดเห็นของผูเชี่ยวชาญ
รายการ
+ 1 0 - 1
1.ดานการวางแผนการทํางาน
1.1 การวิเคราะหงาน............................ 5 0 0
1.2 กําหนดเปาหมายในการทํางาน…………….. 4 0 1
1.3 กําหนดขั้นตอน กิจกรรมทํางาน 5 0 0
1.4 กําหนดวิธีการควบคุมผลการปฏิบัติงาน 4 1 0
1.5 บอกแหลงขอมูลสารสนเทศตางๆ ที่ใชประกอบการ
ตัดสินใจในการทํางาน……………………..
3 1 1
1.6 3 1 1การประมาณการใชงบประมาณ เวลา แรงงาน และ
วัสดุอุปกรณในการทํางาน…………………..
จากสูตร IOC =
N
R∑
คาดัชนีความสอดคลอง ขอ 1.1 ………………
สรุปผลการพิจารณาตรวจสอบ ……………………………………………………….....
……………………………………………………………………………………………………….
……………………………………………………………………………………………………….
………………………………………………………………………………………………………

27
1.2 การคํานวณหาคา CVR : Content Validity Ratio
จะมีตารางกําหนดมาให และใชสูตรคํานวณ นําคาไปเปรียบเทียบกับตาราง รายละเอียดดังนี้
ตาราง คาอัตราสวนความตรงเชิงเนื้อหาต่ําสุดที่ผานเกณฑของลอรชี
คา CVR ต่ําสุด คา CVR ต่ําสุด
จํานวนผูเชี่ยวชาญ จํานวนผูเชี่ยวชาญ
ที่มีนัยสําคัญ ที่มีนัยสําคัญ
5
6
7
8
9
10
11
12
0.99
0.99
0.95
0.75
0.78
0.62
0.59
0.56
13
14
15
20
25
30
35
40
0.54
0.51
0.49
0.42
0.37
0.33
0.31
0.29
ที่มา (Lawshe, 1975, p.568)
สูตรการคํานวณ
CVR =
N/2
Ne – N/2
เมื่อ Ne = ผูเชี่ยวชาญที่เห็นดวยหรือเห็นวาเหมาะสม
N/2 = ครึ่งหนึ่งของผูเชี่ยวชาญทั้งหมด
ตัวอยาง ถาขอคําถามขอหนึ่งมีผูเชี่ยวชาญ 14 คน เห็นดวย 11 คน คํานวณได ดังนี้
11 - 7
7
CVR =
= 0.57
นําคาที่คํานวณไดไปเปรียบเทียบกับคาในตารางที่จํานวนผูเชี่ยวชาญ 14 คือ 0.51
คาที่คํานวณได 0.57 ซึ่งสูงกวาจึงผานเกณฑ

28
2. การการวิเคราะหความยาก
ความยากของขอสอบรายขอ เปนดัชนีที่ชี้สัดสวนของผูสอบที่ตอบขอสอบขอนั้นๆ ถูก ความยากของ
ขอสอบรายขอ(p) คํานวณไดจากสูตร
จํานวนผูสอบทั้งหมด
จํานวนผูสอบที่ตอบขอสอบถูก
P =
ตัวอยาง จากผูเขาสอบทั้งหมด 40 คน มีผูตอบขอสอบขอที่ 1 ถูก 30 คน จงคํานวณคา
ความยากของขอสอบขอที่ 1
30P =
40
= .75
ความยากมีคาอยูระหวาง 0 ถึง 1
ขอสอบขอที่ไมมีผูใดตอบถูกเลย จะมีคาความยาก เทากับ 0
ขอสอบขอที่มีผูตอบถูกครึ่งหนึ่งของผูตอบทั้งหมด จะมีคาความยาก เทากับ .50 และ
ขอสอบขอที่มีผูตอบถูกทั้งหมดจะมีคาความยาก เทากับ 1
การแปลความหมายคาความยาก ใชเกณฑการพิจารณา ดังนี้
0.81 – 1.00 ขอสอบงายเกินไป
0.61 – 0.80 ขอสอบคอนขางงาย
0.41 – 0.60 ขอสอบยากปานกลง
0.21 – 0.40 ขอสอบคอนขางยาก
0. – 0.21 ขอสอบยากเกินไป
กิจกรรม 2.1 จากตัวอยาง จงคํานวณคาความยากของขอสอบและแปลความหมายคาความ
ยากขอที่ 1-5
ความยากขอสอบขอที่ จํานวนผูตอบถูก จํานวนผูตอบทั้งหมด ความหมาย
1 7 10
2 30 30
3 20 40
4 0 28
5 10 50

29
สรุปคุณภาพขอสอบ
.............................................................................................................................................................................
.................................................................................................................
ในกรณีที่มีผูเขาสอบจํานวนมาก(มากกวา 40 คน) การวิเคราะหความยากของขอสอบรายขอ อาจใช
วิธีแบงกลุมผูสอบตามคะแนนรวม แลวน้ําผลการตอบของผูสอบที่ไดคะแนนรวมสูง รอยละ 27 และกลุม
ผูสอบที่ไดคะแนนรวมต่ํา รอยละ 27 (เทคนิค 27%) มาวิเคราะห โดยใชสูตรการคํานวณ คาความยากรายขอ
ดังนี้
H + L
P =
H + L
NH + NL
H แทน จํานวนผูตอบถูกในกลุมสูง NH แทน จํานวนผูตอบทั้งหมดในกลุมสูง
L แทน จํานวนผูตอบถูกในกลุมต่ํา NL แทน จํานวนผูตอบทั้งหมดในกลุมต่ํา
กิจกรรมที่ 2.2 จากผูเขาสอบทั้งหมด 100 คน แบงเปนผูสอบที่ไดคะแนนรวมสูง 27 คน และ
ผูสอบที่ไดคะแนนรวมต่ํา 27 คน เมื่อแจงนับจํานวนผูตอบขอสอบขอที่ 2
ปรากฏวาผูสอบในกลุมสูงตอบถูก 25 คน และผูสอบในกลุมต่ําตอบขอสอบ
ถูก 15 คน จงคํานวณคาความยากของขอสอบขอที่ 2
จากโจทย H = …..... L = …… NH = ……. NL= ………..
จากสูตร P =
NH + NL
=
= …………
ดังนั้น ความยากของขอสอบขอที่ 2 เทากับ …………..
การวิเคราะหขอสอบแบบอัตนัย
ขอสอบแบบอัตนัย (Essay) เปนขอสอบที่ใหผูสอบเขียนตอบตามความคิดของตนเอง เปนเครื่องมือที่
จําเปนในการวัดผลโดยเฉพาะในการวัดเกี่ยวกับความคิดเห็น เจตคติ ความสามารถในการคิดวิเคราะห
(Synthesis) ความสามารถในการอธิบายใหคนอื่นเขาใจ ความสามารถในการบูรณาการความรู การตอบ
ขอสอบชนิดนี้ไดตองอาศัยความรอบรู ประสบการณ และความสามารถในการบูรณาการความรู

30
วิธีการวิเคราะหขอสอบแบบอัตนัย
1. ตรวจใหคะแนนขอสอบแตละขอ แลวรวมคะแนนทุกขอ
2. เรียงกระดาษคําตอบจากคะแนนสูงสุดมาหาต่ําสุด นําจํานวนผูตอบจากคะแนนสูงสุดลงมา 25%
เปนกลุมสูง และจํานวนผูตอบจากคะแนนต่ําสุด 25% เปนกลุมค่ํา ในการวิเคราะหใชเฉพาะผล
การสอบของกลุมสูงและกลุมต่ํา ที่เหลือกลุมกลาง 50% ไมนํามาวิเคราะห
3. บันทึกคะแนนของแตละคนในแตละขอ ลงในตาราง โดยแยกตามกลุม รวมคะแนนของแตละขอ
ของแตละกลุม
4. วิเคราะหหาคาความยากและอํานาจจําแนก โดยใชสูตรดังนี้
ผลรวมของคะแนนกลุมสูง + ผลรวมของคะแนนกลุมต่ํา
คาความยาก =
จํานวนคนทั้งสองกลุม x คะแนนเต็ม
2NM
ผลรวมของคะแนนกลุมสูง - ผลรวมของคะแนนกลุมต่ํา
จํานวนคนในแตละกลุม x คะแนนเต็ม
ΣH - ΣL
NM
หรือ
P =
ΣH + ΣL
คาอํานาจจําแนก =
หรือ D =
3. การการวิเคราะหคาอํานาจจําแนก
3.1 ารวิเคราะหอํานาจจําแนกของแบบทดสอบแบบอิงกลุม
สูตร
D = PH - PL
เมื่อ D แทน อํานาจจําแนกของขอสอบรายขอ
PH แทน สัดสวนของผูตอบขอสอบถูกในกลุมสูง
PL แทน สัดสวนของผูตอบขอสอบถูกในกลุมต่ํา
หรือ
D = r =
NH หรือ NL
H - L

31
เมื่อ D แทน อํานาจจําแนกของขอสอบรายขอ
H แทน จํานวนผูตอบถูกในกลุมสูง
L แทน จํานวนผูตอบถูกในกลุมต่ํา
NH แทน จํานวนผูตอบทั้งหมดในกลุมสูง
NL แทน จํานวนผูตอบทั้งหมดในกลุมต่ํา
ตัวอยาง จากผูเขาสอบทั้งหมด 100 คน แบงเปน 3 กลุม กลุมที่ไดคะแนนรวมสูง 27 คน
กลุมผูสอนที่ไดคะแนนกลางๆ 46 คน และกลุมผูสอบที่ไดคะแนนรวมต่ํา 27 คน
เมื่อแจงนับจํานวนผูตอบขอสอบขอที่ 5 ปรากฏวา ผูสอบในกลุมสูงตอบถูก
25 คน และผูสอบในกลุมกลุม ตอบขอสอบถูก 15 คน จงคํานวณหาคาอํานาจ
จําแนกของขอสอบขอที่ 5
27
27
…………
จากโจทย PH = = 0.93
25
PL = = 0.5615
จากสูตร D = PH - PL
= 0.93 - 0.56 = 0.37
ดังนั้น คาอํานาจจําแนกของขอสอบขอที่ 5 เทากับ 0,37
กิจกรรมที่ 3.1 จากโจทยตัวอยาง จงคํานวณคาอํานาจจําแนก ขอที่ 5
H = ………., L = …………, NH = NL = ……………
จากสูตร
r =
H - L
=
NH หรือ NL
………..
=
สรุปผลการวิเคราะหคํานวณคาอาจจําแนก
..........................................................................................................................................................

32
3.2 การวิเคราะหอํานาจจําแนกของแบบทดสอบแบบอิงเกณฑ
สูตร
D = Ppost - Ppre
D แทน อํานาจจําแนกของขอสอบรายขอ
Ppost แทน สัดสวนของผูตอบขอสอบหลังเรียนถูก
Ppre แทน สัดสวนของผูตอบขอสอบกอนเรียนถูก
( จากสูตร Cox and Vargs, 1966 cited in Wiersma and Jurs, 1990: 244-245)
กิจกรรมที่ 3.2 ผูเขาสอบ 8 จาก 25 คน ตอบขอสอบกอนเรียนขอที่ 4 ไดถูกตอง และเมื่อสอน
เสร็จ ผูสอนใหผูเรียนกลุมเดิมตอบแบบทดสอบฉบับเดิมอีกครั้งหนึ่ง ปรากฏวา
ผูเรียนตอบขอสอบขอที่ 4 ถูกตอง 20 คน จงหาคาอํานาจจําแนกของขอสอบขอที่ 4
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………
3. 3 การแปลความหมายคาอํานาจจําแนกของขอสอบ
อีเบลและฟริสไบ (Ebel and Frisbi, 1986 : 234) เสนอเกณฑในการพิจารณาคาอํานาจจําแนก ดังนี้
อํานาจจําแนก ผลการประเมินขอสอบ
.40 ขึ้นไป เปนขอสอบที่จําแนกไดดีมาก
.30 - .39 เปนขอสอบที่จําแนกไดคอนขางดี แตถาเปนไปไดควรปรับปรุง
.20 - .29 เปนขอสอบที่จําแนกไดบาง แตควรปรับปรุงแกไข
ต่ํากวา .19 เปนขอสอบที่จําแนกไดนอย ควรตัดออกหรือปรับปรุงใหม

33
4. การวิเคราะหความเที่ยงหรือความเชื่อมั่น (Reliability)
4.1 การหาคาความเที่ยงดวยวิธีของคูเดอร- ริชารดสัน (Kuder – Richardson)
เปนวิธีที่นิยมใชกันมากเนื่องจากทดสอบกับกลุมตัวอยางเพียงครั้งเดียว แบงยอยเปน 2 สูตร KR-20
และ KR-21 โดยมีขอตกลงวาแบบทดสอบฉบับนั้นจะตองวัดลักษณะเดียวกันหรือวัดองคประกอบรวมกัน
และมีระบบการใหคะแนนเปน Dichotomous คือ ตอบถูกให 1 คะแนน ตอบผิดให 0 คะแนน KR-21 ใชใน
กรณีเครื่องมือหรือแบบทดสอบมีความยากเทากันซึ่งในทางปฏิบัติเปนไปไมไดยาก จึงตองใชมีวิธีการคํานวณ
จากสูตร KR – 20 ดังนี้
สูตร
⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
−
−
=−
∑
2
1
1
20
S
pq
k
k
KR
เมื่อ
k แทน จํานวนขอสอบ
S2
แทน ความแปรปรวนของคะแนนรวมทั้งฉบับ
p แทน สัดสวนของคนทําถูกในแตละขอ
q แทน สัดสวนของคนทําผิดในแตละขอ (q = 1-p)
ตัวอยาง ผลการสอบของนักเรียน 6 คน ขอสอบ 6 ขอ ดังตาราง
ขอสอบ รวมคะแนน
นักเรียน
1 2 3 4 5 6 X X2
1
2
3
4
5
6
1
1
0
0
1
1
1
1
1
0
1
0
1
1
1
1
0
0
1
1
1
1
0
0
1
1
1
1
0
0
1
1
1
1
0
0
6
6
5
4
2
1
36
36
25
16
4
1
P
Q
pq
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
4/6
2/6
8/36
ΣX = 24 Σ X2
= 118
Σpq = 1.33 S2
= 4.4
⎥⎦
⎤
⎢⎣
⎡
−=−
...........
.........
1
.......
......
20KR
= ……………………..

34
4.2 การหาความเที่ยงดวยวิธีของครอนบัค(Cronbach)
การหาความเที่ยงหรือความเชื่อมั่นของแบบสอบถาม นิยมใชวิธีของครอนบาค ใชกับ
แบบสอบถามที่ใหคะแนนแบบเรียงอันดับ หรือเปนมาตราสวนประมาณคา (rating scale) วิธีนี้เรียกวา การหา
คาสัมประสิทธิ์แอลฟา (α -Coefficient) ซึ่งดัดแปลงมาจากสูตร KR – 20 ดังนี้
α = ⎥
⎦
⎤
⎢
⎣
⎡ ∑
−
− 2
t
2
i
S
S
1
1n
n
เมื่อ α = สัมประสิทธิ์ความเที่ยง (สัมประสิทธิ์แอลฟา)
n = จํานวนคําถาม
∑ =2
iS ผลรวมของความแปรปรวนของคะแนนในแตละขอ
=2
tS ความแปรปรวนของคะแนนรวมทั้งฉบับ
ตัวอยาง จากแบบสอบถาม แบบประมาณคา 5 ระดับ จํานวน 6 ขอ ผูตอบ 6 คน
ขอสอบ รวมคะแนน
นักเรียน
1 2 3 4 5 6 X X2
1
2
3
4
5
6
4
4
3
3
4
2
4
4
3
3
3
1
4
3
2
4
3
1
3
3
4
2
1
2
4
3
3
2
2
1
3
4
3
2
2
1
22
21
18
16
15
8
484
441
324
256
225
64
∑ i
∑ 2
i
2
tS
20
70
.67
18
60
1.19
17
55
1.37
15
43
1.10
15
43
1.10
15
43
1.10
ΣX = 100 Σ X2
= 1,794
∑
2
iS = 6.53 2
tS = 25.47
⎥⎦
⎤
⎢⎣
⎡
−=
...........
.........
1
.......
......
α
= ……………………..

35
การพิจารณาคาความยาก(p) และอํานาจจําแนก( r, D) แบบทดสอบ
ตารางเกณฑการพิจารณาคาความยากงาย(p) ของตัวเลือกถูก
คา p รอยละ คา p สัดสวน แปลความหมาย ตีความหมาย ผลการพิจารณา
100 1.00 ตอบถูกทุกคน งายมาก ไมควร
80 .80 ตอบถูก 80% คอนขางงาย ถามากกวานี้ไมควรใช
50 .50 ตอบถูกครึ่งหนึ่ง ยากปานกลาง คุณภาพดีมาก
20 .20 ตอบถูก 20% คอนขางยาก ถานอยกวานี้ไมควรใช
00 .00 ไมมีคนตอบถูก ยากมาก ไมควรใช
ตารางเกณฑการพิจารณาคาอํานาจจําแนก (r,D) ของตัวเลือกถูก
คา r (D) แปลความหมาย ตีความหมาย ผลการพิจารณา
100 กลุมสูงถูกหมด กลุมต่ําผิดหมด จําแนกไดสูงมาก เปนขอสอบที่มีคุณภาพ
.50 กลุมสูงตอบถูกมากกวากลุมต่ํา จําแนกไดคอนขางสูง คุณภาพดี
.20 กลุมสูงตอบถูกมากกวากลุมต่ําเล็กนอย จําแนกไดพอใช คุณภาพดีมาก
.00 กลุมสูงและกลุมต่ําทําถูกเทากัน จําแนกไมได ถานอยกวานี้ไมควรใช
-1.00 กลุมต่ําทําถูกหมดกลุมสูงทําผิดหมด จําแนกทางตรงขาม(ทาง
ลบ)ไดอยางสมบูรณ
ไมควรใช
ตารางเกณฑการพิจารณาคา p, r (D) ตัวลวง
คา p คุณภาพ ผลการพิจารณา คา r (D) คุณภาพ ผลการพิจารณา
.00 - .04 ใชไมได ไมมีคุณภาพ คาติดลบ
.00 - .04
ใชไมได
ใชไมได
ไมมีคุณภาพ
.05 - .09
.01 - .30
.31 - .50
พอใช
ใชได
พอใช
มีคุณภาพ
.05 - .09
.10 - .30
.31 - .50
พอใช
ใชได
พอใช
คุณภาพดี
.51 - 1.00 ใชไมได ไมมีคุณภาพ .50 - 1.00 ใชไมได ไมมีคุณภาพ

TAP: Test Analysis Program

More Related Content

What's hot (20)

Similar to TAP: Test Analysis Program (20)

More from benjalakpitayaschool (14)

TAP: Test Analysis Program