SlideShare a Scribd company logo
บทที่ 1
การวิเคราะหขอมูลเบื้องตน
(40 ชั่วโมง)
ผลการเรียนรูที่คาดหวัง
1. เลือกวิธีวิเคราะหขอมูลเบื้องตนและอธิบายผลการวิเคราะหขอมูลไดถูกตอง
2. นําความรูเรื่องการวิเคราะหขอมูลไปใชได
ขอเสนอแนะ
1. ผูสอนควรทบทวนระดับของการวิเคราะหขอมูลที่กลาวไวในหนังสือเรียนสาระการเรียนรู
พื้นฐาน คณิตศาสตรเลม 2 ชั้นมัธยมศึกษาปที่ 5 กอนในหัวขอ 1.2 ความหมายของสถิติ ที่แบงออกเปน
สองสวน คือ การวิเคราะหขั้นตนที่มุงวิเคราะหเพื่ออธิบายลักษณะกวางๆ ของขอมูลชุดนั้น (สถิติเชิง
พรรณนา) และการวิเคราะหขอมูลที่เก็บรวบรวมไดจากตัวแทนหรือตัวอยางเพื่ออางอิงไปถึงขอมูล
ทั้งหมดหรือประชากร (สถิติเชิงอนุมาน) เนื่องจากในบทที่ 1 นี้จะกลาวถึงวิธีการคํานวณสถิติตาง ๆ
โดยแยกวาเปนการคํานวณเพื่อใชในสถิติเชิงพรรณนาหรือการคํานวณเพื่อใชในสถิติเชิงอนุมาน
2. ในบทที่ 1 ไดกลาวถึงการวัดคากลางของขอมูล (คาเฉลี่ยเลขคณิต มัธยฐานและ ฐานนิยม)
การวัดตําแหนงที่ (ควอรไทล เดไซล และเปอรเซ็นไทล) และ การวัดการกระจายของขอมูล (การวัด
การกระจายสัมบูรณ และ การวัดการกระจายสัมพัทธ) โดยมีจุดมุงหมายเพื่อใหเลือกวิธีการวิเคราะห
ขอมูลดังกลาวไดอยางเหมาะสม
ผูสอนควรเนนผูเรียนวาวิธีการวิเคราะหขอมูลในบทที่ 1 นั้นเนนเฉพาะขอมูลเชิงปริมาณ
และกลาวถึงเฉพาะวิธีการที่ใชสรุปขอมูลในรูปของตัวเลข ซึ่ง การสรุปขอมูลนี้มีความจําเปนโดย
เฉพาะอยางยิ่งในกรณีที่ขอมูลมีจํานวนมากเพื่อผูใชจะไดเห็นภาพรวมๆ ของขอมูลชุดนั้นหรือเพื่อ
ใหไดจํานวนจํานวนหนึ่งที่สามารถเก็บสารสนเทศของขอมูลทั้งหมดนั้นได นอกจากนั้นการวิเคราะห
ขอมูลในบทที่ 1 นี้จะเนนการใชสถิติในสวนของสถิติเชิงพรรณนา แตมีการกลาวถึงการคํานวณคา
สถิติในกรณีที่ใชกับสถิติเชิงอนุมานควบคูไปดวย เพื่อเปนแนวทางสําหรับนักเรียนในการศึกษาตอในระดับ
ที่สูงขึ้นและการใชสถิติในระดับที่สูงขึ้นจะเกี่ยวของกับสถิติเชิงอนุมานเปนสวนใหญ ดังนั้นผูเรียน
จะเห็นการคํานวณสถิติตัวเดียวกันแตใชสูตรที่แตกตางกันบางขึ้นอยูกับวาเปนการคํานวณเพื่อใชใน
ของสถิติเชิงพรรณนาหรือสถิติเชิงอนุมาน
2
การเลือกใชวิธีการสรุปขอมูลในบทที่ 1 นี้ โดยทั่วไปแลวขึ้นอยูกับ
(1) ลักษณะของขอมูลวาเปนขอมูลเชิงปริมาณหรือขอมูลเชิงคุณภาพ หรือระดับการ
วัดของขอมูล แมวาในบทที่ 1 จะเนนการวิเคราะหขอมูลเชิงปริมาณก็ตาม แตไดกลาวถึงการใชฐาน
นิยมเพื่อสรุปขอมูลเชิงคุณภาพไวดวย เนื่องจากคากลางชนิดอื่นนั้นไมสื่อความหมายหรือคํานวณไมไดหาก
นํามาใชกับขอมูลเชิงคุณภาพ
(2) ลักษณะการแจกแจงของขอมูล วามีลักษณะสมมาตรหรือใกลเคียงแบบสมมาตร
หรือมีลักษณะเบเนื่องจากมีคาที่สูงกวาปกติหรือมีคาที่ต่ํากวาปกติอยูจํานวนหนึ่ง ผูใชจึงควรสรุปขอมูล
ดวยกราฟกอนเพื่อใหเห็นลักษณะการแจกแจงของขอมูลชุดนั้นๆ
(3) ระดับของการวิเคราะหขอมูลวาเปนการวิเคราะหขอมูลเบื้องตนในสถิติเชิงพรรณนา
หรือการวิเคราะหขอมูลเพื่อใชในสถิติเชิงอนุมาน เพื่อใหเลือกใชสูตรการคํานวณหรือเลือกฟงกชันที่มีใน
เครื่องคํานวณไดอยางถูกตอง
อนึ่งสําหรับการวิเคราะหขอมูลโดยทั่วไปยังขึ้นอยูกับวัตถุประสงคของการศึกษาในเรื่อง
นั้นๆ ดวย เชนตองการพรรณนาขอมูล ตองการเปรียบเทียบคากลางของขอมูลสองชุด หรือตองการ
ศึกษาความสัมพันธระหวางตัวแปรสองตัว เปนตน
3. การคํานวณสถิติในบทที่ 1 จะเห็นวาแบงออกเปนสองลักษณะไดแก การคํานวณสถิติ
เมื่อทราบขอมูลดิบหรือทราบคาของขอมูลแตละคาอยางแนนอน และการคํานวณสถิติเมื่อไดมีการสรุป
ขอมูลชุดนั้นในรูปของตารางแจกแจงความถี่ (มีการแบงออกเปนอันตรภาคชั้น) ซึ่งในกรณีที่สองนี้
อาจเกิดจากผูใชไดขอมูลจากแหลงทุติยภูมิที่นําเสนอขอมูลในรูปของตารางแจกแจงความถี่ ใหผูสอน
เนนกับผูเรียนวาในทางปฏิบัติถาทําการเก็บขอมูลจากแหลงปฐมภูมิและไดขอมูลดิบใหคํานวณสถิติจาก
ขอมูลดิบที่ทราบคาของขอมูลแตละคาโดยใชเครื่องคอมพิวเตอรประมวลผลดังนั้นเราจะหันมาเลือกใชวิธี
การคํานวณหรือสูตรที่ใชสําหรับขอมูลที่มีการแจกแจงความถี่ไวแลวเฉพาะในกรณีที่ไมทราบคาของ
ขอมูลแตละตัวเทานั้น
สําหรับขอมูลที่แจกแจงความถี่ในรูปของตารางแจกแจงความถี่ที่มีการใชอันตภาคชั้น ใหผูสอน
เนนผูเรียนวา คาสถิติใดๆ ที่คํานวณจากตารางแจกแจงความถี่นี้เปนคาโดยประมาณเทานั้น ไมใช
คาที่แนนอนเหมือนในกรณีที่ทราบขอมูลจริงของคาสังเกตแตละคา เชน เปนคาเฉลี่ยเลขคณิตโดย
ประมาณ คามัธยฐานโดยประมาณ เปนตน ดังนั้นผูสอนจึงไมควรเนนในเรื่องของสูตรที่ยุงยาก และ
การคํานวณตางๆ หากผูเรียนสามารถคาดเดาไดวาคาที่ตองการควรจะอยูในชวงใด มีคาระหวางคา
ใด และหมายถึงอะไรนําไปใชไดอยางไรเพียงเทานี้นาจะเปนการเพียงพอแลว
4. การพิจารณาขอมูลที่มีคาสูงผิดปกติหรือขอมูลที่มีคาต่ําผิดปกติ มีวิธีพิจารณาหลายวิธี
วิธีหนึ่งไดแก การคํานวณควอรไทลที่สาม (Q3) และควอรไทลที่หนึ่ง (Q1) จากนั้นหาผลตางระหวาง
ควอรไทลที่สาม(Q3)และควอรไทลที่หนึ่ง(Q1)(InterquartileRange หรือ IQR)ซึ่งคือ Q3 – Q1
เราจะเรียกคาสังเกตนั้นวา คานอกกลุม(outlier) ถาคาสังเกตอยูในตําแหนงที่สูงกวาควอรไทลที่สาม
ไปเปนระยะทาง 1.5 เทาของ IQR (หรือมีคามากกวา Q3 + (1.5 × (IQR))) หรืออยูในตําแหนงที่
3
*
ต่ํากวาควอรไทลที่หนึ่งไปเปนระยะทาง 1.5 เทาของ IQR (หรือมีคานอยกวา Q1 – (1.5 × (IQR)))
ตัวอยางเชน ผูจําหนายเครื่องใชไฟฟาบริษัทหนึ่งทําการเก็บขอมูลระยะเวลา (หนวยเปนวัน)
ที่ลูกคาใชในการชําระเงินนับตั้งแตไดรับใบสงของ เปนดังนี้
13 13 13 20 26 27 31 34 34 34
35 35 36 37 38 41 41 41 45 47
47 47 50 51 53 54 56 62 67 82
จากขอมูลนี้ Q1 = 33.25 และ Q3 = 50.25 ดังนั้น IQR = 50.25 – 33.25 = 17
นั่นคือ Q1 – 1.5 (17) = 7.75 และ Q3 + 1.5(17) = 75.75
เมื่อตรวจสอบขอมูลชุดนี้ ไมมีคาสังเกตใดที่ต่ํากวา 7.75 แตมีคาสังเกต 1 คาที่มากกวา 75.75
ไดแก 82 จึงถือวาระยะเวลาจํานวน 82 วันนี้ เปนคานอกกลุมที่มีคาสูงผิดปกติ
สวนใหญในการสรางแผนภาพกลอง นิยมแสดงคานอกกลุมดวยเครื่องหมาย ดอกจัน (*) ดังนี้
(แผนภาพจากการใชโปรแกรมสําเร็จรูปทางสถิติ MINITAB)
5. ผูสอนควรบอกใหผูเรียนเขาใจตรงกันวาคําวาคาเฉลี่ยประชากร นั้นเปนคาคงที่สําหรับ
ประชากรหนึ่ง ๆ สวนคําวาคาเฉลี่ยตัวอยางที่ใชสําหรับคาดเดาหรือประมาณคาเฉลี่ยประชากรนั้นจะมี
คาแตกตางกันไปในแตละครั้งของการเลือกตัวอยางซึ่งเปนการกระทําซ้ํา ๆ กันดวยขนาดตัวอยางเทาเดิมจาก
ประชากรเดียวกัน แมวาแตละครั้งนั้นจะใชคาเฉลี่ยที่ไดจากตัวอยางซึ่งมีคาไมเทากันในการเลือกตัวอยาง
แตละครั้ง เพื่อประมาณคาเฉลี่ยประชากร (ซึ่งมีเพียงคาเดียว) ก็ตาม ในทางปฏิบัติจะเลือกตัวอยาง
เพียงชุดเดียว ดังนั้นมักจะไมทราบวาคาเฉลี่ยตัวอยางที่คํานวณจากขอมูลแตละชุดใหคาที่แตกตางกัน
หรือไม และแตกตางกันอยางไร
4
ตัวอยางเชน บริษัทแหงหนึ่งมีพนักงานทั้งสิ้น40คน ขอมูลตอไปนี้แสดงจํานวนป(ปดเศษขึ้น
ถาจํานวนเดือนมากกวาหกเดือน และปดเศษลงถาจํานวนเดือนนอยกวาหกเดือน) ที่พนักงานทํางาน
หรือประสบการณการทํางานของพนักงานแตละคนในบริษัทนี้
11 4 18 2 1 2 0 2 2 4
3 4 1 2 2 3 3 19 8 3
7 1 0 2 7 0 4 5 1 14
16 8 9 1 1 2 5 10 2 3
ถาขอมูลขางตน (คาสังเกตจากพนักงานทั้งหมด 40 คา) ประกอบกันเปนประชากรที่สนใจ
ศึกษาจะไดจํานวนปโดยเฉลี่ยในการทํางานของพนักงานคือ 11 4 18 ... 2 3
40
+ + + + +
µ = = 4.80 ป เมื่อ
เจาของบริษัทตองการจัดตั้งคณะกรรมการจํานวน 5 คนเพื่อหาขอมูลเกี่ยวกับการประกันสุขภาพที่
จะทําใหกับพนักงานทั้งหมด ดวยการเลือกคณะกรรมการโดยสุมจํานวน 5 คน หลายๆ ครั้งเพื่อ
พิจารณาวาประสบการณการทํางานโดยเฉลี่ยของคณะกรรมการจะแตกตางจากประสบการณการ
ทํางานโดยเฉลี่ยของพนักงานทั้งหมดหรือไม ตัวอยางขนาด 5 คน ในแตละครั้งและคาเฉลี่ยตัวอยาง
แสดงดังนี้
ตัวอยางกลุมที่ ขอมูลจากตัวอยาง คาเฉลี่ยตัวอยาง (X )
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1 9 0 19 14
7 4 4 1 3
8 19 8 2 1
4 18 2 0 11
4 2 4 7 18
1 2 0 3 2
2 3 2 0 2
11 2 9 2 4
9 0 4 2 7
1 1 1 11 1
2 0 0 10 2
0 2 3 2 16
2 3 1 1 1
3 7 3 4 3
1 2 3 1 4
8.6
3.8
7.6
7.0
7.0
1.6
1.8
5.6
4.4
3.0
2.8
4.6
1.6
4.0
2.2
5
ใหสังเกตวาในทางปฏิบัติไมสามารถทราบขอมูลทั้งหมดของประชากร(จํานวนประชากรไมไดมี
ขนาด 40 คนเหมือนตัวอยางนี้) ถาอาจทําการเลือกตัวอยางจํานวนหนึ่ง (เชน 5 คนจากตัวอยางนี้) แลว
ใชคาจากตัวอยางซึ่งในที่นี้ไดแกคาเฉลี่ยตัวอยางจากตัวอยางเพียงชุดเดียว เพื่อเปนคาประมาณของ
คาเฉลี่ยประชากร ทั้งนี้คาเฉลี่ยตัวอยางที่ใชประมาณคาเฉลี่ยประชากรไมจําเปนตองเทากับคา
เฉลี่ยประชากรหรือพารามิเตอรเสมอไป(ในตัวอยางขางตนไมมีตัวอยางชุดใดที่ใหคาเฉลี่ยเทากับ µ
หรือ 4.8 ป) เพียงแตเราคาดหวังวาถามีการเลือกตัวอยางหลายๆ ชุด คาเฉลี่ยของคาเฉลี่ยตัวอยางจาก
ทุกๆ ชุดจะมีคาใกลเคียงคาพารามิเตอร หรือคาเฉลี่ยประชากร (4.8 ป)
6. ใหผูสอนตระหนักวา สัญลักษณ ∑ เปนอักษรกรีกเรียกวา Capital Sigma หรือ “ซิกมา
ตัวอักษรตัวใหญ” เมื่อใชรวมกับตัวหอย(subscript) i จะเปนเครื่องหมายที่แทนการบวกสวนสัญลักษณ σ
เปนอักษรกรีกเรียกวา Sigma หรือ “ซิกมา” ทางสถิติจะใชสัญลักษณนี้แทนสวนเบี่ยงเบนมาตรฐาน
ของประชากร การใชสัญลักษณ Capital Sigma แทนการบวก เชน ∑=
n
i
iX
1
ในภาษาอังกฤษจะอานวา
“Summation(ซัมเมชัน) iX โดยที่ i เทากับ1 ถึง n” ไมไดอานวา “Sigma (ซิกมา) iX โดยที่ i เทากับ
1 ถึง n”
7. เนื่องจากสูตรการคํานวณทั้งในกรณีที่ขอมูลไมไดแจกแจงความถี่ หรือในกรณีที่ทราบขอมูลดิบ
แตละตัวและในกรณีที่มีการแจกแจงในรูปของตารางแจกแจงความถี่ที่แบงเปน k ชั้น ใชสัญลักษณ
iX แทนคาของขอมูลเหมือนกันทั้งสองสูตร ดังนั้นจึงควรมีความระมัดระวังดังตอไปนี้
(1) สําหรับในกรณีที่ทราบคาของขอมูลจริงๆ ทุกตัว iX จะแทนคาจริงของขอมูลแตละตัว
และตัวหอย i จะเริ่มตั้งแต 1 ถึง n หรือ N (จํานวนคาสังเกตทั้งหมด)
(2) ในกรณีที่ขอมูลอยูในรูปตารางแจกแจงความถี่และมีอันตรภาคชั้น iX จะแทนคา
ที่ใชเปนตัวแทนของบรรดาขอมูลในอันตรภาคชั้นนั้น หรือจุดกึ่งกลางของชั้นนั่นเองและตัวหอย i
จะเริ่มตั้งแต 1 ถึง k (จํานวนอันตรภาคชั้น)
8. การหาคาเฉลี่ยเลขคณิตรวม ใหผูสอนเนนกับผูเรียนวาตองเปนการหาคาเฉลี่ยของ
ขอมูลเดียวกันหรือตัวแปรเดียวกัน และสัญลักษณ k ในที่นี้ใชแทนจํานวนชุดขอมูลทั้งหมด ถาเปนขอมูล
คนละตัวแปรกัน เชน ราคาซื้อและราคาขาย รายไดและรายจาย คะแนนสอบวิชาคณิตศาสตร
คะแนนสอบวิชาฟสิกสและคะแนนสอบวิชาเคมี นํามาเฉลี่ยรวมกันผลลัพธที่ไดจะไมสื่อความหมาย
อยางไรก็ตาม แมวาในบางครั้งจะเปนตัวแปรเดียวกัน เชน อายุ กลาวคือ คาเฉลี่ยเลขคณิต
ของอายุนักเรียนชั้นมัธยมศึกษาปที่ 3, 4, และ 5 คือ 15 ป, 17 ป และ 18 ป ตามลําดับ โดยโรงเรียน
แหงนี้มีนักเรียนในแตละชั้นเปน 60, 50, และ 40 คน ตามลําดับ เชนนี้ การหาคาเฉลี่ยเลขคณิตของ
อายุนักเรียนสามชั้นรวมกันอาจไมเหมาะสม เนื่องจากเปนนักเรียนคนละกลุมกัน ถานักเรียนเรียน
ตามเกณฑ ก็จะทราบดีอยูแลววา แตละชั้นนั้นมีอายุหางกันประมาณ 1 ป ไมสมควรจะมาหาคาเฉลี่ยของ
อายุ แตถาเปนเรื่องคะแนนสอบวิชาคณิตศาสตรของชั้นมัธยมศึกษาปที่ 3 โดยใชขอสอบชุดเดียวกัน
6
และทราบวา ม.3/1 ไดคะแนนเฉลี่ย 80 คะแนน หอง ม.3/2 ไดคะแนนเฉลี่ย 60 คะแนน และหอง ม.3/3
ไดคะแนนเฉลี่ย 75 คะแนน การหาคาเฉลี่ยรวมของคะแนนสอบวิชาคณิตศาสตรของนักเรียนชั้น ม.3
สามหองรวมกันจะมีความหมายมากกวาตัวอยางขางตน
9. สําหรับสูตรการหาคามัธยฐานสําหรับขอมูลที่แจกแจงความถี่ ไมควรเนนใหทองจําหรือ
ทําการวัดผลจากสูตรนั้น เนื่องจากเปนการประมาณคามัธยฐานของขอมูลชุดนั้นที่ไมทราบคาที่แทจริง
ของคาสังเกตแตละตัว ดังนั้นการที่ผูเรียนทราบหรือสามารถกะประมาณไดวามัธยฐานควรมีคาเทาไร
ในชวงใดหรือคํานวณไดแบบหยาบๆ ก็เพียงพอแลว
10. ฐานนิยมจะสื่อความหมายไดเมื่อใชสรุปขอมูลที่เปนขอมูลเชิงคุณภาพ เชน เพศ อาชีพ
ภูมิลําเนา เบอรหรือขนาดเสื้อ ความคิดเห็น ความชอบ หรือความเครียด เปนตน ไมควรเนนการ
หาฐานนิยมสําหรับขอมูลเชิงปริมาณ และใหผูสอนเนนกับผูเรียนวาฐานนิยม คือคาสังเกตที่มี
ความถี่สูงสุด แตไมใชคาความถี่ของคาสังเกตนั้น เชน การวัดความคิดเห็น ถาขอมูลที่สํารวจมาพบ
วา มีผูเห็นดวยอยางยิ่งจํานวน 22 คน มีผูเห็นดวยจํานวน 20 คน มีผูไมมีความเห็นจํานวน 5คนมีผูไม
เห็นดวย จํานวน 14 คน มีผูไมเห็นดวยอยางยิ่งจํานวน11คน ในที่นี้ฐานนิยมคือ เห็นดวยอยางยิ่งสวน
คา22 ไมใชฐานนิยม แตเปนความถี่ของผูที่ตอบวาเห็นดวยอยางยิ่ง
11. ขอนารูเพิ่มเติมเกี่ยวกับคาเฉลี่ยเรขาคณิต คาเฉลี่ยเรขาคณิตมีประโยชนอยางยิ่ง
ในการหาคากลางหรือคาเฉลี่ยของขอมูลที่อยูในรูปของรอยละ อัตราสวน ดัชนี หรืออัตราการเจริญเติบโต
(growth rate) ซึ่งใชอยางกวางขวางในทางธุรกิจ เศรษฐศาสตร และชีววิทยา เนื่องจากมีความสนใจ
ที่จะหารอยละของการเปลี่ยนแปลงราคาขาย เงินเดือน หรือเครื่องชี้ภาวะของเศรษฐกิจ ประชากร เชน
ผลผลิตมวลรวมของชาติ (Gross National Product) ที่สรางจากตัวแปรหลายๆ ตัวประกอบกัน
ขอจํากัดของการหาคาเฉลี่ยเรขาคณิตคือคาที่จะนํามาหาคาเฉลี่ยเรขาคณิตแตละคาตองมีคา
มากกวาศูนย คาเฉลี่ยเรขาคณิตจะนอยกวาหรือเทากับคาเฉลี่ยเลขคณิตเสมอ ตัวอยางของการตีความหมาย
คาเฉลี่ยเรขาคณิตจะเห็นไดดังตอไปนี้ สมมุติวา นาย ก ไดรับเงินเดือนเพิ่มขึ้นรอยละ 5 ในปที่ 1
และไดรับเงินเดือนเพิ่มขึ้นรอยละ 15 ในปที่ 2 ถาคํานวณคาเฉลี่ยเลขคณิตของการเพิ่มขึ้นของเงินเดือน
คือ รอยละ 10 (หรือคํานวณจาก (5+15)/2) แตจริงๆ แลวรอยละโดยเฉลี่ยของเงินเดือนที่เพิ่มขึ้นคือ
รอยละ 9.886 ไมใช รอยละ 10 ซึ่งคานี้ไดจากการหาคาเฉลี่ยเรขาคณิตของ 5 และ 15 เนื่องจาก
ถามีเงินเดือน 100 บาท เงินเดือนเพิ่มรอยละ 5 คือไดเงินเดือน 105 บาทหรือ 1.05 ตอเงิน 1 บาท
และเงินเดือนเพิ่มรอยละ 15 คือ 115 บาทหรือ 1.15 ตอเงิน 1 บาท นั่นคือคาเฉลี่ยเรขาคณิตตอเงิน
1 บาท เทากับ (1.05)(1.15) 1.09886≈ หรือรอยละ 9.886
การตรวจสอบความสมเหตุสมผลของการใชคาเฉลี่ยเรขาคณิตทําไดโดยสมมุติวา เงินเดือนในปที่ 1
กอนที่จะขึ้นเงินเดือนรอยละ 5 ของนาย ก คือ 30,000 บาท ปที่ 1 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 5
หรือคิดเปนเงิน30,000(.05) = 1,500 บาท ปที่ 2 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 5 ของเงินเดือนในปแรก
หรือคิดเปนเงิน 31,500(.15)=4,725บาท รวมเงินดือนเพิ่มขึ้นสองป 6,225 บาท เงินเดือนที่เพิ่มขึ้น
7
รวมสองป 6,225 บาท เทากับการใชคาเฉลี่ยเรขาคณิตแทนในการคํานวณรอยละที่เพิ่มขึ้นในแตละปดังนี้
ปที่ 1 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 9.886 หรือคิดเปนเงิน 30,000(.09886) = 2,965.8 บาท
ปที่ 2 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 9.886 ของเงินเดือนในปแรก
หรือคิดเปนเงิน 32,965.8(.09886) = 3,259.0 บาท
รวมเงินเดือนเพิ่มขึ้นสองป 6,224.8 บาท
ซึ่งใกลเคียงหรือเทากันหากมีการปดเศษ กับการใชรอยละ 5 และรอยละ 15 ในการคํานวณเงินที่ได
รับเพิ่มในปที่ 1 และ ปที่ 2 ตามลําดับ
ตัวอยางที่ 1 ถาบริษัทแหงหนึ่งลงทุนในปที่ 1 ไดกําไร รอยละ 10 ในปที่สองไดกําไรรอยละ 50
และในปที่ สามไดกําไรรอยละ 30 อัตราผลตอบแทนหรือกําไรโดยเฉลี่ยควรเปนเทาไร
อัตราผลตอบแทนโดยเฉลี่ยคือ 3 )30.1)(50.1)(10.1( ≈ 1.2897 หรือรอยละ 28.97
จะเห็นวาในการคํานวณเงินทุนในปแรกตองคูณดวย 1.10 และในปที่สองตองคูณ
ดวย 1.50 และในปที่สามตองคูณดวย 1.30 ดังนั้นหากตองการคาคงที่ที่จะไปคูณในเงิน
ลงทุนแตละปโดยที่ไมตองใชคา 1.10, 1.50, และ 1.30 คูณในปที่ 1, 2, และ 3 ตามลําดับ
คานั้นไดแกคาเฉลี่ยเรขาคณิต 1.2897 นั่นเอง
สมมุติวามีคาสังเกต5คา บวกกันไดผลรวมจํานวนหนึ่ง สมมุติเปน100 คาเฉลี่ยเลขคณิต
ของคาสังเกต 5 คานั้น คือคาคงที่คาหนึ่งซึ่งเมื่อบวกกัน 5 ครั้งแลวจะไดผลรวมเปน 100 เทาเดิม
ในทํานองเดียวกัน ถาเรามีคาสังเกต 5 คาคูณกันได ผลคูณจํานวนหนึ่งสมมุติวาเปน 550
คาเฉลี่ยเรขาคณิตของ คาสังเกต 5 คานี้คือคาคงที่คาหนึ่งซึ่งเมื่อนํามาคูณกัน 5 ครั้งแลวจะได
ผลคูณเปน 550 เทาเดิม จากตัวอยางที่ 1 จะเห็นวา (1.10)(1.50)(1.30) ≈ 2.145 และ
(1.2897)(1.2897)(1.2897) ≈ 2.145 เชนกัน
ตัวอยางที่ 2 ถาเริ่มลงทุนดวยเงินทุน 1,000 บาท ในแตละปไดผลตอบแทน 13%, 22%, 12%,
-5%, และ -13% ตารางตอไปนี้แสดงเงินรวมที่ไดจากการลงทุนเมื่อสิ้นสุดของแตละป
ปที่ ผลตอบแทนตอป เงินรวม
1 13% 1,000(1.13) ≈1,130 บาท
2 22% 1,130(1.22) ≈ 1,379 บาท
3 12% 1,379(1.12) ≈1,544 บาท
4 -5% 1,544(0.95) ≈1,467 บาท
5 -13% 1,467(0.87) ≈1,276 บาท
8
ถาตองการหาอัตราผลตอบแทนตอป จะตองหาคาเฉลี่ยเรขาคณิตของผลตอบแทนแตละป
แทนที่จะใชรอยละผลตอบแทนในการคํานวณ จะใชตัวคูณที่แสดงถึงคาของเงินเมื่อสิ้นสุดของแตละป
นั่นคือ ผลตอบแทน 13% จะแทนดวยตัวคูณ 1.13 และผลตอบแทน –5% หรือการขาดทุน จะแทนดวย
ตัวคูณ 0.95 คาเฉลี่ยเรขาคณิตของตัวคูณ 1.13, 1.22, 1.12, 0.95, และ 0.87 คือ
5 (1.13)(1.22)(1.12)(0.95)(0.87) = 1.0499 หรือ 1.05 นั่นคืออัตราผลตอบแทนโดยเฉลี่ยตอป
คือ 5% ตารางตอไปนี้แสดงเงินรวมเมื่อสิ้นสุดในแตละปเมื่อใชอัตราผลตอบแทนเฉลี่ย 5% ซึ่งจะ
เห็นวาเมื่อสิ้นสุดปที่ 5 จะไดเงินรวมในปสุดทายเทากับการลงทุนที่มีผลตอบแทนในแตละปคือ
13%, 22%, 12%, -5%, และ -13% ดังตารางขางตน
ปที่ ผลตอบแทนตอป เงินรวม
1 5% 1,000(1.05) ≈ 1,050 บาท
2 5% 1,050(1.05) ≈1,103 บาท
3 5% 1,103(1.05) ≈1,158 บาท
4 5% 1,158(1.05) ≈1,216 บาท
5 5% 1,216(1.05) ≈1,276 บาท
ตัวอยางที่3 บริษัทรับเหมากอสรางแหงหนึ่งไดรับกําไรจากโครงการ4โครงการที่ผานมาคือรอยละ3
รอยละ 2 รอยละ 4 และรอยละ 6 คาเฉลี่ยเรขาคณิตของกําไรคิดเปนรอยละเทาใด
คาเฉลี่ยเรขาคณิตคือ 4 )6)(4)(2)(3( = 4
144 ≈ 3.46
นั่นคือ คาเฉลี่ยเรขาคณิตของกําไรคือ รอยละ 3.46 แตถาคํานวณคาเฉลี่ยเลขคณิตจะไดวา
คาเฉลี่ยเลขคณิตเทากับ (3+2+4+6)/4 หรือ รอยละ 3.75 ใหสังเกตวาถึงแม คา 6 จะมีคา
ไมสูงมากก็ตามแตมีผลทําใหคาเฉลี่ยเลขคณิตสูงขึ้นตามไปดวยในขณะที่คาเฉลี่ยเรขาคณิต
รอยละ 3.46 ไมมีผลกระทบจากคา 6 ที่มากกวาคาอื่นๆ นี้ โดยทั่วไปคาเฉลี่ยเรขาคณิตจะ
ไมมากกวาคาเฉลี่ยเลขคณิต ตัวอยางการประยุกตใชคาเฉลี่ยเรขาคณิตอีกอยางหนึ่งไดแก
การหารอยละที่เพิ่มขึ้นโดยเฉลี่ยในชวงระยะเวลาหนึ่ง ตัวอยางเชนถานาย ขมีรายไดสุทธิ
ในป พ.ศ. 2537 เปน 30,000 บาท และมีรายไดสุทธิในป พ.ศ. 2547 เปน 50,000 บาท
อัตรการเพิ่มขึ้นของรายไดสุทธิตอปในชวง 10 ปนี้คํานวณจากสูตรดังตอไปนี้
รอยละโดยเฉลี่ยที่เพิ่มขึ้นในชวง 10 ป คือ 1
30000
5000010 − ≈ 0.0524 หรืออัตราการเพิ่ม
ขึ้นของรายไดสุทธิตอปโดยเฉลี่ยประมาณรอยละ 5.24
9
สําหรับขอมูลทางชีววิทยาหรือทางเคมี เชน การแจกแจงของจํานวนแบคทีเรีย จุลินทรีย
สวนใหญมักมีการแจกแจงที่เบขวาหรือหางยาวทางขวาหรือมีคาสังเกตสวนใหญที่มีคาต่ําและมีคาสังเกต
จํานวนนอยที่มีคาสูง ซึ่งสวนใหญแลวในการวิเคราะหทางสถิติมักมีขอตกลงวาการแจกแจงของ
ขอมูลตองมีลักษณะสมมาตร เชน มีการแจกแจงแบบปกติ เปนตน ดังนั้นมักทําการแปลงขอมูลที่เบ
ใหมีลักษณะสมมาตรขึ้นหรือใหคลายกับการแจกแจงแบบปกติ ในกรณีที่ขอมูลมีลักษณะเบขวา
การแปลงขอมูลโดยใชลอการิทึมแทนคาขอมูลเดิมจะชวยใหขอมูลมีลักษณะสมมาตรขึ้น ถาขอมูลเดิม
มีการแจกแจงแบบเบขวา เมื่อแปลงขอมูลแตละตัวโดยใชคาลอการิทึมแลวทําใหการแจกแจงใหมนี้มีการแจกแจง
ที่ประมาณไดวาเปนแบบปกติจะเรียกขอมูลเดิมวามีการแจกแจงแบบลอกนอรมอล (log-normal)ซึ่งคาที่ดีที่สุด
ที่ใชวัดคากลางของการแจกแจงแบบลอกนอรมอลก็คือคาเฉลี่ยเรขาคณิตนั่นเอง ความจริงขอนี้ให
พิจารณาจากเหตุผลตอไปนี้
ถาให X แทนขอมูลเดิม และให Y แทนขอมูลที่ไดจากการแปลงโดยใชลอการิทึม
กลาวคือ 1 1Y ln(X )= , 2 2Y ln(X )= , …, และ n nY ln(X )= คากลางของขอมูลที่แปลงแลวซึ่ง
มีลักษณะการแจกแจงสมมาตรขึ้นคือ คาเฉลี่ยเลขคณิตของ Y หรือ Y เมื่อไดคา Y แลว สามารถ
ตีความกลับไปยังขอมูลเดิมไดดังนี้
เนื่องจาก Y = ln(X) ดังนั้นความสัมพันธระหวางขอมูลเดิมและขอมูลที่แปลงแลวคือ
Y
X e= ทําใหไดวา
คากลางของขอมูลเดิมจึงควรเปน Y
e =
n
i
i 1
1
Y
n
e =
∑
=
n
i
i 1
1
ln(X )
n
e =
∑
= 1 2 n
1
ln(X X ...X )
n
e = 1 2 n
1
ln(X X ...X ) ne
=
1
n
1 2 n(X X ...X ) = n
1 2 nX X ...X
หรือเทากับคาเฉลี่ยเรขาคณิตของขอมูลเดิมที่มีลักษณะเบขวานั่นเอง นั่นคือ ขอมูลที่มีลักษณะเบขวา
คากลางที่ใชควรเปนคาเฉลี่ยเรขาคณิต
12. ขอนารูเพิ่มเติมเกี่ยวกับคาเฉลี่ยฮารมอนิก
คาเฉลี่ยฮารมอนิก (H.M.) ของจํานวน n จํานวน ( 1 2 3 nX ,X ,X ,...,X ) นิยามโดย
n
i 1 i
1 1 1
H.M. n X=
= ∑ หรือ n
i 1 i
n
H.M.
1
X=
=
∑
กรณีที่ n = 2 จะไดวา 1 2 1 2
1 2
1 2
X X 2X X
H.M.
1 X X(X X )
2
= =
++
10
กรณีที่ n = 3 จะไดวา
1 2 3 1 2 3
1 2 1 3 2 3
1 2 1 3 2 3
X X X 3X X X
H.M.
1 X X X X X X(X X X X X X )
3
= =
+ ++ +
ถาให 1 2 3 nw ,w ,w ,...,w คือน้ําหนักของ 1 2 3 nX ,X ,X ,...,X ตามลําดับคาเฉลี่ยฮารมอนิก
ถวงน้ําหนักนิยามโดย
n
i
i 1
n
i
i 1 i
w
H.M.
w
X
=
=
=
∑
∑
คาเฉลี่ยฮารมอนิก นิยมใชสําหรับการหาอัตราเฉลี่ยหรือใชสําหรับเฉลี่ยขอมูล เชน ระยะทาง
ตอชั่วโมง (กิโลเมตรตอชั่วโมง) งานตอหนวยเวลา เปนตน ซึ่งความเปนมาของคาเฉลี่ยฮารมอนิกอาจ
พิจารณางายๆ ดังนี้
ตัวอยางที่ 1 นาย ก ทํางานหนึ่งหนวยแลวเสร็จในเวลา 4 นาที นาย ข นาย ค นาย ง และ
นายจ ทํางานหนวยเดียวกันนี้เสร็จในเวลา 5, 6, 10, และ 12 นาทีตามลําดับ ถาตองการ
หาคาเฉลี่ยของอัตราการทํางานของคนทั้งหาคนนี้สามารถทําไดดังนี้
เนื่องจากนายกทํางาน1หนวยใชเวลา 4 นาที ดังนั้นใน1นาทีนายกทํางานได 1
4
หนวย
นาย ข ทํางาน 1 หนวย ใชเวลา 5 นาที ดังนั้น ใน 1 นาที นาย ข ทํางานได 1
5
หนวย
นาย ค ทํางาน 1 หนวย ใชเวลา 6 นาที ดังนั้น ใน 1 นาที นาย ค ทํางานได 1
6
หนวย
นาย ง ทํางาน 1 หนวย ใชเวลา 10 นาที ดังนั้น ใน 1 นาที นาย ง ทํางานได 1
10
หนวย
นาย จ ทํางาน 1 หนวย ใชเวลา 12 นาที ดังนั้น ใน 1 นาที นาย จ ทํางานได 1
12
หนวย
นั่นคือ ใน 1 นาที ทั้งหาคนทํางานรวมกันได 1
4
1
5
+
1 1 1
6 10 12
+ + + หนวย
หรือเฉลี่ยแลวไดงาน
1 1 1 1 1
4 5 6 10 12
5
+ + + +
หนวยตอนาที
นั่นคือ งาน
1 1 1 1 1
4 5 6 10 12
5
+ + + +
หนวย ใชเวลา 1 นาที
ดังนั้น งาน 1 หนวยใชเวลา
12
1
10
1
6
1
5
1
4
1
5
++++
นาที
หรือมีคาเทากับ
12
1
10
1
6
1
5
1
4
1
5
++++
ซึ่งคือคาเฉลี่ยฮารมอนิกนั่นเอง
11
ตัวอยางขาง ตนนักเรียนสามารถหาคาเฉลี่ยที่เหมาะสมไดโดยไมจําเปนตองจําสูตร
คาเฉลี่ยฮารมอนิก
ตัวอยางที่ 2 สมมุติวาแบงระยะทาง40กิโลเมตรเปนสี่ระยะเทาๆกันโดยระยะทาง10กิโลเมตรแรก
ใชอัตราเร็วในการขับรถ 100 กิโลเมตรตอชั่วโมง ระยะทาง 10 กิโลเมตรตอๆ ไปใช
อัตราเร็ว 110, 90, และ 120 กิโลเมตรตอชั่วโมงตามลําดับ ตองการหาอัตราเร็วโดยเฉลี่ย
ในการขับรถสําหรับระยะทาง 40 กิโลเมตรนี้
เนื่องจากอัตราเร็วคือระยะทาง/เวลา ดังนั้นตองหาเวลารวมที่ใชในการขับรถในระยะทาง
40 กิโลเมตรกอนขับรถ10กิโลเมตรแรก ใชเวลาเทากับ10/100 ชั่วโมง ขับรถ10กิโลเมตร
ที่สองใชเวลาเทากับ 10
110
ชั่วโมงขับรถ10กิโลเมตรที่สามใชเวลาเทากับ10/90 ชั่วโมง
ขับรถ 10 กิโลเมตรสุดทายใชเวลาเทากับ 10
120
ชั่วโมง รวมเวลาที่ใชทั้งสิ้น
10 10 10 10
100 110 90 120
+ + + ชั่วโมง
ดังนั้นอัตราเร็วเฉลี่ยในระยะเวลา 40 กิโลเมตร คือ 40
10 10 10 10
100 110 90 120
+ + +
กิโลเมตรตอชั่วโมง หรือเทากับ
120
10
90
10
110
10
100
10
40
+++
=
120
1
90
1
110
1
100
1
4
+++
ซึ่งก็คือคาเฉลี่ยฮารมอนิกนั่นเอง
อยางไรก็ตามใหระวังคําถามในลักษณะเดียวกัน ซึ่งถาไมพิจารณาใหรอบคอบจะทําให
เกิดความผิดพลาดได ดังตัวอยางตอไปนี้
ตัวอยางที่3 นายกขับรถในชั่วโมงแรกใชอัตราเร็ว80กิโลเมตรตอชั่วโมง จากนั้นในชั่วโมงที่สอง
ไดเพิ่มอัตราเร็วเปน100กิโลเมตรตอชั่วโมง อัตราเร็วเฉลี่ยในการขับรถในชวงระยะทางที่วิ่งได
สองชั่วโมงนี้คือ
(80 100)
2
+
เทากับ 90กิโลเมตรตอชั่วโมง หรือคือคาเฉลี่ยเลขคณิตนั่นเอง
เนื่องจากระยะทางที่วิ่งไดทั้งหมดคือ 80 + 100 กิโลเมตร และเวลาทั้งสิ้นคือ 2 ชั่วโมง
แตถากําหนดวา ในระยะทางครึ่งแรกของการเดินทางขับรถดวยอัตราเร็ว 80 กิโลเมตรตอ
ชั่วโมง สวนระยะทางครึ่งหลังใชอัตราเร็ว 100 กิโลเมตรตอชั่วโมง อัตราเร็วเฉลี่ยของ
การขับรถในชวงที่วิ่งไดคือ 2
1 1
80 100
+
กิโลเมตรตอชั่วโมงหรือคือคาเฉลี่ยฮารมอนิก
เนื่องจากถาสมมุติวาระยะทางที่วิ่งไดในครึ่งแรกคือd กิโลเมตรเวลาที่ใชในครึ่งแรกคือ
d
8 0
ชั่วโมง สวนระยะทางที่วิ่งไดในครึ่งหลังคือdกิโเมตรเชนกันและเวลาที่ใชในครึ่งหลัง
12
คือ d
100
ชั่วโมงนั่นคืออัตราเร็วเฉลี่ยไดแก 2d
d d
( )
80 100
+
เทากับ 2
1 1
( )
80 100
+
≈ 88.89
กิโลเมตรตอชั่วโมง
13. ใหระวังวา การหาตําแหนงของขอมูล เชน ควอรไทล นั้นแบงขอมูลออกเปนสี่สวน
เทาๆ กัน ตามความถี่หรือจํานวนขอมูล ไมใชแบงตามระยะหางของขอมูล หรือระยะระหวางคา
นอยสุดกับคามากสุด แตตองพิจารณาจํานวนขอมูลในแตละสวนใหมีจํานวนเทาๆ กัน
14. การวัดการกระจายของขอมูลวัดหยาบๆไดโดยใชพิสัยแตถาตองการใหละเอียดขึ้นใหใชสวน
เบี่ยงเบนมาตรฐานหรือความแปรปรวน สวนการเปรียบเทียบการกระจายใหใชสัมประสิทธิ์ของความ
แปรผันนั่นคือการนําเขาสูเนื้อหาควรเปนลักษณะนี้ไมควรนําเขาสูเนื้อหาวาการวัดการกระจาย มีสอง
แบบ คือแบบสัมบูรณและแบบสัมพัทธ เนื่องจากการวัดการกระจายมีแบบเดียวแลวแตวาจะวัด
หยาบๆ หรือใหละเอียด สวนการเปรียบเทียบการกระจายของขอมูลสองชุดขึ้นไปก็มีเครื่องมือวัด
อีกเชนกัน การจัดการเรียนการสอนในหัวขอนี้ใหเนนแคพิสัย สวนเบี่ยงเบนมาตรฐาน และ
สัมประสิทธิ์ของความแปรผันก็พอ
15. หนวยของสวนเบี่ยงเบนมาตรฐานจะเปนหนวยเดียวกับขอมูลที่นํามาวิเคราะห สวนหนวย
ของความแปรปรวน มีหนวยเชนเดียวกับขอมูลที่นํามาวิเคราะหยกกําลังสอง เชน ขอมูลแทนความยาวมี
หนวยเปนเมตร สวนเบี่ยงเบนมาตรฐานจะมีหนวยเปนเมตร แตความแปรปรวนจะมีหนวยเปน เมตร2
16. ความแปรปรวนรวม ที่คํานวณจากขอมูลระดับประชากรหลายๆ กลุมนั้นไมคอยจะมี
ประโยชนในการนําไปใชเทาไรนัก เชน
ขอมูลประชากรกลุมที่ 1
1N
2 2
1 i
i 11
1
(X )
N =
σ = −µ∑
ขอมูลประชากรกลุมที่ 2
2N
2 2
2 i
i 12
1
(X )
N =
σ = −µ∑
ขอมูลประชากรกลุมที่ 3
3N
2 2
3 i
i 13
1
(X )
N =
σ = −µ∑
ดังนั้น ความแปรปรวนรวม
2 2 2
2 1 1 2 2 3 3
1 2 3
N N N
N N N
σ + σ + σ
σ =
+ +
ใหสังเกตวาขอมูลแตละกลุมมีคาเฉลี่ยประชากรµ เทากัน สําหรับขอมูลตัวอยางหลายชุด
ที่สุมจากประชากรเดียวกัน ซึ่งแตละชุดสามารถคํานวณความแปรปรวนตัวอยาง ดังนี้
ขอมูลตัวอยางกลุมที่ 1
1n
2 2
1 i 1
i 11
1
s (X X )
n 1 =
= −
−
∑
ขอมูลตัวอยางกลุมที่ 2
2n
2 2
2 i 2
i 12
1
s (X X )
n 1 =
= −
−
∑
ขอมูลตัวอยางกลุมที่ 3
3n
2 2
3 i 3
i 13
1
s (X X )
n 1 =
= −
−
∑
13
เมื่อใชคาความแปรปรวนที่ไดจากตัวอยางทุกชุดที่มาจากประชากรเดียวกันเพื่อประมาณคาความ
แปรปรวนประชากร 2
σ ไดโดยความแปรปรวนรวม
2 2 2
2 1 1 2 2 3 3
1 2 3
(n 1)s (n 1)s (n 1)s
s
(n 1) (n 1) (n 1)
− + − + −
=
− + − + −
ความแปรปรวนรวมนี้มีประโยชนและมีความหมายในทางสถิติ กลาวคือเปนการประมาณคา
ความแปรปรวนประชากร 2
σ โดยใชขอมูลจากตัวอยางหลายๆ ชุดที่ไดมาจากประชากรนั้น เพื่อใหได
คาประมาณที่ดีขึ้น
17. เครื่องคิดเลขบางชนิดอาจมีการคํานวณ สวนเบี่ยงเบนมาตรฐานโดยไมไดสนใจวา
เปนขอมูลประชากรหรือตัวอยาง ควรตรวจสอบสูตรในการคํานวณสําหรับเครื่องแตละเครื่อง กลาวคือ
อาจคํานวณสวนเบี่ยงเบนมาตรฐานโดยใชตัวหารคือ N หรือ N-1 ก็ได ทั้งนี้เครื่องบางเครื่องอาจใช
สัญลักษณ nσ หมายถึง สวนเบี่ยงเบนมาตรฐานของขอมูลระดับประชากร (σ ) และ n 1−σ หมาย
ถึงสวนเบี่ยงเบนมาตรฐานของขอมูลตัวอยาง (s) แมวาจะใชสัญลักษณที่ไมถูกตองก็ตาม
กิจกรรมเสนอแนะ
กิจกรรมที่ 1 การใช Microsoft Excel ชวยในการวิเคราะหขอมูล
เนื่องจากการวิเคราะหขอมูลในปจจุบันใชโปรแกรมสําเร็จรูปทางสถิติหรือโปรแกรมชวย
คํานวณในรูปแบบอื่น ๆ ดังนั้นควรใหผูเรียนไดทราบถึงการวิเคราะหขอมูลดวยเครื่องคอมพิวเตอร
โดยเฉพาะโปรแกรมที่ไดติดตั้งมากับเครื่องคอมพิวเตอร เชน Microsoft Excel เปนตน
การวิเคราะหขอมูลโดยใช Microsoft Excel นั้นอาจใชฟงกชันในการคํานวณของโปรแกรมเอง
หรือทําการเพิ่มเครื่องมือที่เรียกวา Analysis ToolPak ใหกับ Excel ก็ได ในที่นี้จะเสนอตัวอยางการ
คํานวณสถิติพรรณนาโดยใช Analysis ToolPak ดังนี้
หลังจากปอนขอมูลในแผนทํางานของExcelแลวใหไปที่เมนูเครื่องมือ โปรแกรมเพิ่ม…
14
เมื่อหนาจอปรากฏ กลองขอความใหเลือก ดังนี้ ใหคลิก เครื่องหมายถูกดวยเมาส เลือก
Analysis ToolPak และ Analysis ToolPak –VBA แลว คลิกที่ ตกลง
คลิกที่เครื่องมืออีกทีจะเห็นเมนู Data Analysis เพิ่มขึ้นมา ใหเลือกเมนู Data Analysis …นี้
15
เลือกเมนู Descriptive Statistics จากกลองขอความที่ปรากฏขึ้นมาหลังจากที่ไดเลือกเมนู Data
Analysis…จากนั้นคลิกที่ OK
คลิกที่ ลูกศรสีแดงในชอง แรกที่เขียนวา Input Range เพื่อระบุที่อยูของขอมูลที่ตองการวิเคราะห
16
สรางสดมภที่ตองการวิเคราะหขอมูล (ปริมาณไขไก) ตั้งแต B1 ถึง B21 คลิกที่ลูกศรสีแดงอีกที
คลิกเครื่องหมายถูก เลือก Labels in First Row เนื่องจากในการกําหนดที่อยูของขอมูล
ไดรวมปายชื่อหรือชื่อสดมภ (ที่เขียนวา “ปริมาณไขไก”) ในบรรทัดแรกของขอมูลเขาไวดวย ในกรณีที่
ไมไดเลือกชื่อสดมภเขามา ก็ไมตองคลิกที่ ชอง Labels in First Row นี้ จากนั้นคลิกเลือก
Summary Statistics แลวคลิกที่ OK
17
หลังจากนั้นจะไดผลลัพธที่แสดงคาสถิติพรรณนาในแผนงานอีกแผนหนึ่ง
จากผลลัพธที่ได ปริมาณการบริโภคไขไกตอเดือนจากครอบครัว 20 ครอบครัวนี้ รวมได
989ฟองตอเดือน ปริมาณการบริโภคนอยสุดคือ32ฟองตอเดือน ปริมาณการบริโภคมากสุดคือ65ฟองตอเดือน
นั่นคือมีความแตกตางกันหรือพิสัย33ฟองตอเดือน
ปริมาณการบริโภคเฉลี่ยคือ49.45ฟองตอเดือนโดยมีสวนเบี่ยงเบนมาตรฐาน8.73ฟองตอเดือน
มัธยฐานของปริมาณการบริโภคไขไกเทากับ 48 ฟองตอเดือน ครอบครัวที่จะบริโภคไขไก
60ฟองตอเดือนมีจํานวนมากที่สุด(ควรระบุดวยวามีกี่ครอบครัว)
หมายเหตุ การคํานวณสวนเบี่ยงเบนมาตรฐานและความแปรปรวนในสถิติพรรณนาของ
โปรแกรม Microsoft Excel นี้เปนการคํานวณของตัวอยาง ใหสังเกตคําวา Sample Variance
18
กิจกรรมที่ 2 การเก็บขอมูลจากแหลงปฐมภูมิและทุติยภูมิ
เมื่อผูเรียนสามารถทําการวิเคราะหขอมูลดวยคอมพิวเตอรไดแลว ใหแบงกลุมผูเรียนเพื่อศึกษา
และวางแผนเก็บรวบรวมขอมูลในเรื่องที่ผูเรียนสนใจ โดยใหสมมุติวาขอมูลที่ไดมาเปนตัวอยางหรือ
ตัวแทนที่ดีจากประชากร ขอมูลที่รวบรวมมานี้อาจมาจากแหลงปฐมภูมิโดยการสอบถาม สัมภาษณ
หรือจากแหลงขอมูลทุติยภูมิ เชน หนังสือพิมพ อินเทอรเน็ต เปนตน ขอมูลอาจประกอบดวยตัวแปร
หลายตัว มีทั้งตัวแปรเชิงคุณภาพ เชน เพศ ระดับการศึกษา การอยูในเขตเทศบาลหรือไม และตัวแปร
เชิงปริมาณ เชน ระดับคะแนนเฉลี่ยสะสม จํานวนชั่วโมงในการอานหนังสือโดยเฉลี่ยตอวัน คาใชจาย
ในการซื้ออาหารกลางวัน สวนสูง น้ําหนัก เปนตน จากนั้นใหผูเรียนใชโปรแกรม Microsoft Excel ใน
การสรุปขอมูล แยกตามตัวแปรที่สนใจ เชน แยกเพศ แยกระดับการศึกษา โดยตัวแปรเชิงปริมาณควร
หาสถิติพรรณนาตางๆ ตามแบบที่เสนอในกิจกรรมที่ 1
กิจกรรมที่3 คาเฉลี่ยและความแปรปรวนของ ตัวแปรสองตัวที่มีความสัมพันธเชิงเสนตรง
ให C เปนตัวแปรแทนอุณหภูมิที่มีหนวยเปนองศาเซลเซียส
และ F เปนตัวแปรแทนอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮต
จากความสัมพันธในหนังสือเรียนสาระการเรียนรูพื้นฐาน คณิตศาสตร เลม 2 ชั้นมัธยมศึกษา
ปที่5 เราทราบวา 9
F C 32
5
= +
ใหสมมุติขอมูลประมาณ 10 ตัวเพื่อแทนอุณหภูมิหนวยเปนองศาเซลเซียส จากนั้นแปลง
ขอมูลแตละตัวใหเปนอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮต จากนั้นคํานวณคาเฉลี่ย ความแปรปรวน
โดยใชสูตรของความแปรปรวนที่ใชกับขอมูลประชากร (อาจใชโปรแกรม Microsoft Excel ชวยใน
การคํานวณแตตองแปลงคาความแปรปรวนจากตัวอยางใหเปนความแปรปรวนของประชากร)
ตรวจสอบวาคาเฉลี่ยของอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮตและที่มีหนวยเปนองศาเซลเซียส
สัมพันธกันในรูปแบบ 9
F C 32
5
= + หรือไม นอกจากนี้ความแปรปรวนประชากรของอุณหภูมิ
ที่มีหนวยเปนองศาฟาเรนไฮตและที่มีหนวยเปนองศาเซลเซียสสัมพันธกันในรูปแบบใด (ยกเวนความ
ผิดพลาดจากการปดเศษ จะไดวา
2
2 2
F C
9
5
⎛ ⎞
σ = σ⎜ ⎟
⎝ ⎠
เมื่อ 2
Fσ และ 2
Cσ แทนความแปรปรวนประชากร
ของอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮตและอุณหภูมิที่มีหนวยเปนองศาเซลเซียสตามลําดับ)
โดยสรุป ถา Y สัมพันธกับ X ในรูปฟงกชันเสนตรง Y = aX + b เมื่อ a และ b เปนคาคง
ตัวใดๆ แลว
(1) bXaY +=
(2) 222
XY a σσ =
19
กิจกรรมที่ 4 คาเฉลี่ยเลขคณิตและมัธยฐานกอนและหลังการเพิ่มคาผิดปกติ
ใหเก็บขอมูลอายุของนักเรียนในชั้นเรียนแลวคํานวณคาเฉลี่ยเลขคณิตและมัธยฐาน
ดวยตนเอง และโดยการใชเครื่องคิดเลขหรือโปรแกรม Microsoft Excel ใหสังเกตวาคาที่ไดไมนา
จะแตกตางกันเนื่องจากอายุของนักเรียนในชั้นเรียนเดียวกันไมนาจะแตกตางกันมากนัก
จากนั้นใหนําอายุของอาจารยประจําชั้นเพิ่มเขาไปอีก 1 คา (สมมุติวาอาจารยประจําชั้นมีอายุ
ตางจากนักเรียนมากพอสมควร) ขอมูลอายุของอาจารยประจําชั้นนี้สมมุติวาเปนขอมูลที่มีคาผิดปกติ กลาว
คือมีคาสูงกวาปกติ (อาจเกิดจากการบันทึกผิด การเขาใจผิด หรือเหตุอื่นๆ ที่ไมทราบทําใหเขาใจวาเปน
ขอมูลของนักเรียนชั้นนี้)
ใหคํานวณคาเฉลี่ยเลขคณิต และมัธยฐานของขอมูลที่มีคาสูงผิดปกตินี้รวมอยูดวย สังเกต
ความแตกตางของคาที่คํานวณทั้งสองครั้ง คาเฉลี่ยเลขคณิตจะมีคาตางกันในแตละครั้ง แตมัธยฐานมีคา
ไมเปลี่ยนแปลงมากนักดังนั้นขอมูลที่มีคาสูงหรือต่ําผิดปกติอยูดวยหรือมีลักษณะเบมากๆ ควรนําเสนอ
คากลางดวยมัธยฐานไมใชคาเฉลี่ยเลขคณิต
การประเมินผล
เนื่องจากในการเรียนการสอนเรื่อง การวิเคราะหขอมูลเบื้องตน ใหความสําคัญกับการเลือกวิธี
การวิเคราะหขอมูลเบื้องตน และการอธิบายผลการวิเคราะหขอมูลใหถูกตอง พรอมกับการนําความรู
เรื่องการวิเคราะหขอมูลไปใชได ดังนั้นในการประเมินผลผูสอนอาจประเมินจากแบบฝกหัด ขอสอบที่
เนนการเลือกใชวิธีการวิเคราะหขอมูล และการอธิบายผลการวิเคราะหขอมูลตามประเภทของขอมูล
(เชิงปริมาณหรือเชิงคุณภาพ) ลักษณะการแจกแจงของขอมูล (สมมาตร หรือเบ มีคาผิดปกติหรือไม)
ระดับของการวิเคราะหขอมูล (สถิติเชิงพรรณนาหรือสถิติเชิงอนุมาน) และจุดมุงหมายในการสรุปผล
(ตองการวัดคากลาง การกระจายหรือวัดตําแหนงของขอมูล) ไมควรเนนสูตรในการคํานวณโดย
เฉพาะสูตรที่ใชกับขอมูลที่แจกแจงความถี่แลวซึ่งเปนสูตรที่ซับซอนและไมไดแสดงวิธีซึ่งเปนที่มา
ของสูตรดังกลาว โดยคาที่ไดก็เปนคาโดยประมาณเทานั้น
นอกจากนั้นอาจประเมินผลโดยพิจารณาจากผลงานที่ผูเรียนแตละกลุมทํากิจกรรมโดย
พิจารณาจากวัตถุประสงค การเก็บรวบรวมขอมูล ความถูกตองนาเชื่อถือของขอมูล การนําเสนองาน การ
สรุปผลและการสื่อสารใหเปนที่เขาใจงายตอผูฟงทั่วไป
20
ตัวอยางแบบทดสอบประจําบท
1. ขอมูลตอไปนี้แสดงอายุโดยประมาณเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรกของนายกรัฐมนตรีไทย
(ขอมูลบางสวนจากhttp://www.cabinet.thaigov.go.th/bb_main21.htm)
ลําดับ นายกรัฐมนตรี อายุเมื่อไดรับตําแหนง (ป)
1 พระยามโนปกรณนิติธาดา (กอน หุตะสิงห) 48
2 พันเอก พระยาพหลพลพยุหเสนา (พจน พหลโยธิน) 46
3 จอมพล แปลก พิบูลสงคราม (แปลก ขีตตะสังคะ) 41
4 พันตรี ควง อภัยวงศ 42
5 นาย ทวี บุญยเกตุ 41
6 หมอมราชวงศ เสนีย ปราโมช 40
7 นาย ปรีดี พนมยงศ (หลวงประดิษฐมนูธรรม) 46
8 พลเรือตรี ถวัลย ธํารงนาวาสวัสดิ์ (หลวงธํารงนาวาสวัสดิ์) 45
9 นาย พจน สารสิน 52
10 จอมพล ถนอม กิตติขจร 46
11 จอมพล สฤษดิ์ ธนะรัชต 51
12 นาย สัญญา ธรรมศักดิ์ 67
13 พลตรี หมอมราชวงศ คึกฤทธิ์ ปราโมช 64
14 นาย ธานินทร กรัยวิเชียร 50
15 พลเอก เกรียงศักดิ์ ชมะนันท 60
16 พลเอก เปรม ติณสูลานนท 60
17 พลเอก ชาติชาย ชุณหะวัณ 68
18 นาย อานันท ปนยารชุน 59
19 พลเอก สุจินดา คราประยูร 59
20 นาย ชวน หลีกภัย 54
21 นาย บรรหาร ศิลปอาชา 63
22 พลเอก ชวลิต ยงใจยุทธ 65
23 พันตํารวจโท ทักษิณ ชินวัตร 52
1.1 นายกรัฐมนตรีของไทยทานใดที่มีอายุนอยที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก
1.2 นายกรัฐมนตรีของไทยทานใดที่มีอายุมากที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก
1.3 โดยเฉลี่ยแลวนายกรัฐมนตรีของไทยรับตําแหนงนายกรัฐมนตรีครั้งแรกเมื่ออายุเทาใด
21
1.4 เมื่อเทียบกับนายกรัฐมนตรีของไทยในอดีต นายกรัฐมนตรีคนปจจุบันมีอายุเมื่อรับ
ตําแหนงนายกรัฐมนตรีครั้งแรกนอยเกินไปหรือมากเกินไป
1.5 นายสัญญา ธรรมศักดิ์ รับตําแหนงนายกรัฐมนตรีคนที่ 12 ของไทยเมื่อวันที่ 14 ตุลาคม
2516 ตามพระบรมราชโองการ ซึ่งดูเหมือนวาตั้งแตนั้นมานายกรัฐมนตรีคนตอๆ ไปนั้น
จะมีอายุเมื่อรับตําแหนงครั้งแรกมากขึ้นกวานายกรัฐมนตรีสมัยกอนๆ จงแสดงความ
คิดเห็นและใหขอมูลสนับสนุน
2. ขอมูลตอไปนี้ (จาก http://www.fueleconomy.gov/feg/byclass/Midsize_Cars2005.shtml) เปน
จํานวนไมลที่วิ่งไดตอน้ํามัน 1 แกลลอน (MPG) ของรถยนตขนาดกลางรุนที่ผลิตในป พ.ศ. 2548
เมื่อวิ่งในเมืองและวิ่งบนทางหลวงจําแนกตามประเภทของรถ
ประเภทรถ ในเมือง ทางหลวง
1 Acura RL 6 cyl, 3.5 L, Auto(S5), Premium 18 26
2 Acura TL 6 cyl, 3.2 L, Manual (6 speed), Premium 20 29
3 Audi A6 Quattro 6 cyl, 3.1 L, Auto(S6), Premium 19 26
4 Audi A8 8 cyl, 4.2 L, Auto(S6), Premium 18 24
5 BMW 525I 6 cyl, 2.5 L, Manual (6 speed), Premium 19 28
6 BMW 530I 6 cyl, 3 L, Manual (6 speed), Premium 20 30
7 BMW 545I 8 cyl, 4.4 L, Manual (6 speed), Premium 17 25
8 Buick Century 6 cyl, 3.1 L, Automatic (4 speed), Regular 20 30
9 Buick Lacrosse/allure 6 cyl, 3.6 L, Automatic (4 speed), Regular 19 27
10 Cadillac CTS 6 cyl, 2.8 L, Automatic (5 speed), Regular 18 27
11 Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular 17 24
12 Chevrolet Classic 4 cyl, 2.2 L, Automatic (4 speed), Regular 25 34
13 Chevrolet Epica 6 cyl, 2.5 L, Automatic (4 speed), Regular 20 28
14 Chevrolet Malibu 4 cyl, 2.2 L, Automatic (4 speed), Regular 24 35
15 Chevrolet Monte Carlo 6 cyl, 3.4 L, Automatic (4 speed), Regular 21 32
16 Chrysler Sebring 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30
17 Dodge Stratus 4 Door 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30
18 Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium 11 17
19 Honda Accord 4 cyl, 2.4 L, Automatic (5 speed), Regular 24 34
20 Honda Accord 6 cyl, 3 L, Automatic (5 speed), Regular 21 30
22
ประเภทรถ ในเมือง ทางหลวง
21 Honda Accord Hybrid 6 cyl, 3 L, Automatic (5 speed), Regular 29 37
22 Hyundai Elantra 4 cyl, 2 L, Automatic (4 speed), Regular 24 32
23 Hyundai Sonata 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30
24 Hyundai XG350 6 cyl, 3.5 L, Automatic (5 speed), Regular 18 26
25 Infinity Q45 8 cyl, 4.5 L, Auto(S5), Premium 17 23
26 Jaquar S-Type R 8 cyl, 4.2 L, Automatic (6 speed), Premium 17 24
27 Kia Optima 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30
28 Kia Optima 6 cyl, 2.7 L, Automatic (4 speed), Regular 20 27
29 Kia Spectra 4 cyl, 2 L, Automatic (4 speed), Regular 24 34
30 Lexus ES 330 6 cyl, 3.3 L, Automatic (5 speed), Regular 21 29
31 Lexus GS 300/GS 430 6 cyl, 3 L, Auto(S5), Premium 18 25
32 Lincoln LS 6 cyl, 3 L, Automatic (5 speed), Premium 20 26
33 Mazda 6 4 cyl, 2.3 L, Manual (5 speed), Regular 23 31
34 Mercedes-Benz E320 6 cyl, 3.2 L, Automatic (5 speed), Premium 20 28
35 Mercedes Benz E500 8 cyl, 5 L, Auto(L7), Premium 17 25
36 Mercury Sable 6 cyl, 3 L, Automatic (4 speed), Regular 20 27
37 Mitsubishi Galant 4 cyl, 2.4 L, Automatic (4 speed), Regular 23 30
38 Nissan Altima 4 cyl, 2.5 L, Automatic (4 speed), Regular 23 29
39 Nissan Altima 6 cyl, 3.5 L, Manual (5 speed), Regular 21 27
40 Nissan Maxima 6 cyl, 3.5 L, Manual (6 speed), Regular 20 29
41 Pontiac Grand Prix 6 cyl, 3.8 L, Automatic (4 speed), Premium 19 28
42 Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium 12 19
43 Saab 9-5 4 cyl, 2.3 L, Manual (5 speed), Premium 20 30
44 Saturn L300 6 cyl, 3 L, Automatic (4 speed), Regular 21 28
45 Suzuki Verona 6 cyl, 2.5 L, Automatic (4 speed), Regular 20 28
46 Toyota Camry 4 cyl, 2.4 L, Automatic (5 speed), Regular 24 34
47 Toyota Camry 6 cyl, 3 L, Automatic (5 speed), Regular 20 28
48 Volkswagen Passat 4 cyl, 1.8 L, Manual (5 speed), Premium 22 31
49 Volvo S80 AWD 5 cyl, 2.5 L, Automatic (5 speed), Premium 19 26
50 Volvo S80 FWD 5 cyl, 2.5 L, Automatic (5 speed), Premium 21 30
23
ขอมูลดังกลาวเปนขอมูลจากตัวอยางขนาด 50
2.1 ทานจะใชคากลางชนิดใดในการสรุปจํานวนไมลตอแกลลอนของรถยนตดังกลาว
เมื่อวิ่งในเมืองและเมื่อวิ่งบนทางหลวง เพราะเหตุใด
2.2 ทานจะวัดการกระจายของจํานวนไมลตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมือง
และเมื่อวิ่งบนทางหลวงดวยสถิติใด เพราะเหตุใด
2.3 ใหอธิบายลักษณะที่สําคัญ (คากลาง การกระจาย คาผิดปกติ (ถามี)) ของจํานวนไมล
ตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมืองและเมื่อวิ่งบนทางหลวง
2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองหรือเมื่อวิ่งบนทางหลวงมีขอมูลจํานวนไมลตอแกลลอนแตกตาง
หรือกระจายมากกวากัน
2.5 ถารัฐบาลกําหนดวา รถที่มีจํานวนไมลตอแกลลอนต่ําจะตองเสียภาษีรถยนตชนิดพิเศษเพิ่ม
มีรถกี่ประเภทที่มีจํานวนไมลตอแกลลอนต่ํา เมื่อใชเกณฑวารถชนิดพิเศษนี้มีจํานวนไมลตอแกลอน
ต่ํากวาควอรไทลที่ 1 ของจํานวนไมลตอแกลลอนเมื่อวิ่งในเมือง และเมื่อวิ่งบนทางหลวง
3. จากขอมูลในขอ 2 จงอธิบายวา รถยนตขนาดกลางรุนที่ผลิตในป พ.ศ. 2548 ที่นํามา
ใชเปนตัวอยางมีลักษณะที่สําคัญอยางไร เชน
- จํานวนกระบอกสูบ (cyl.)
- ขนาดเครื่องยนต (L)
- ประเภทของเกียร (เกียรอัตโนมัติหรือเกียรธรรมดา)
- รถชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium)
4. จากขอมูลในขอ2 ใหทําขอ2.1ถึง2.4 อีกครั้งโดยจําแนกรถยนตตามลักษณะดังตอไปนี้
- ประเภทของเกียร (แบบอัตโนมัติ และแบบธรรมดา)
- รถชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium)
5. จากขอมูลในขอ 2 ใหตัดขอมูลที่มีคาสูงหรือต่ํากวาปกติตอไปนี้
ลําดับที่ 18 รถยนต Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium
ลําดับที่ 42 รถยนต Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium
ลําดับที่ 21 รถยนต Honda Accord Hybrid 6 cyl, 3 L, Automatic (5 speed), Regular
แลวทําขอ 2.1-2.5 อีกครั้งหนึ่ง เปรียบเทียบกับผลที่ไดกับกรณีที่มีคาผิดปกติอยู
6. ขอมูลตอไปนี้แสดงปริมาณโคเลสเตอรอลในอาหารตาง ๆ หนวยเปนมิลลิกรัมตอปริมาณ
อาหาร100 กรัม (จาก http://www.bangkokhealth.com/consumer_htdoc/consumer_health_detail.asp?
number=9072)
24
ประเภทอาหาร อาหาร ปริมาณโคเลสเตอรอล (มิลลิกรัม/100 กรัม)
ไข ไขไกทั้งฟอง 427
ตับไก 336
ตับหมู 364
ตับวัว 218
ไตหมู 235
หัวใจหมู 133
หัวใจวัว 165
หัวใจไก 157
เครื่องใน
ไสตันหมู 140
หอยนางรม 231
หอยแครง 195
หอยแมลงภู 148
กุงแชบวย 192
กุงกุลาดํา 175
อาหารทะเล
กุงนาง 138
มันกุงนาง 138
มันปูทะเล 361
ปูมา 90
ปูทะเล 87
ปลาหมึกกระดองหัว 405
ปลาหมึกกระดองเนื้อ 322
ปลาหมึกกลวยหัว 321
ปลาหมึกกลวยเนื้อ 251
เนื้อวัว 65
เนื้อไก 70
เนื้อเปด 100
เนื้อหานพะโล 121
เนื้อกบ 47
ปลาดุก 94
ปลาชอน 44
ปลากราย 77
ปลากระบอก 64
เนื้อสัตว
ปลาทู 76
25
ถาอาหารแตละอยางเปนตัวแทนของอาหารประเภทนั้นๆ
6.1 สําหรับผูที่ตองการลดปริมาณโคเลสเตอรอลควรรับประทานอาหารประเภทใดเพราะเหตุใด
6.2 อาหารประเภทเครื่องในและอาหารทะเลมีปริมาณโคเลสเตอรอลใกลเคียงกันหรือไม
อาหารประเภทอาหารทะเลมีปริมาณโคเลสเตอรอลตอ 100 กรัมแตกตางกันมากกวาอาหารประเภท
เครื่องในใชหรือไม
7. ถายอดขายของบริษัทแหงหนึ่งในชวงหาปที่ผานมาเพิ่มขึ้นรอยละ 9.4, 13.8, 11.7, 11.9,
และ 14.7 ใหคํานวณคาเฉลี่ยเรขาคณิตของยอดขายที่เพิ่มขึ้นในชวงเวลาดังกลาว
8. เพราะเหตุใดการคํานวณคากลางเชน คาเฉลี่ยเลขคณิต ของขอมูลที่อยูในตารางแจกแจงความถี่
คาที่คํานวณไดจึงเปนเพียงคาโดยประมาณเทานั้น
เฉลยแบบทดสอบประจําบท
1. 1.1 นายกรัฐมนตรีของไทยทานที่มีอายุนอยที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก คือ
หมอมราชวงศ เสนีย ปราโมช (อายุ 40 ป)
1.2 นายกรัฐมนตรีของไทยทานที่มีอายุมากที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก คือ
พลเอก ชาติชาย ชุณหะวัณ (อายุ 68 ป)
1.3 โดยเฉลี่ยแลวนายกรัฐมนตรีของไทยรับตําแหนงนายกรัฐมนตรีครั้งแรกเมื่ออายุ 53 ป
1.4 เมื่อเทียบกับนายกรัฐมนตรีของไทยในอดีต นายกรัฐมนตรีคนปจจุบันพันตํารวจโท
ทักษิณ ชินวัตร มีอายุเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก 52 ป เทากับ มัธยฐานของ
อายุของทั้งกลุม ดังนั้นจึงไมนอยเกินไปและไมมากเกินไป
1.5 ใหกลุมที่ 1 คือนายกรัฐมนตรีลําดับที่ 1 ถึง 11 จํานวน 11 คน และกลุมที่ 2 คือ
นายกรัฐมนตรีลําดับที่ 12 ถึง 23 จํานวน 12 คน
กลุมที่ 1 มีอายุเฉลี่ย 45.27 ป
มัธยฐานของอายุ 46.00 ป
อายุนอยสุด 40 ป และอายุมากสุด 52 ป
กลุมที่ 2 มีอายุเฉลี่ย 60.08 ป
มัธยฐานของอายุ 60.00 ป
อายุนอยสุด 50 ป และอายุมากสุด 68 ป
หรือพิจารณาจากแผนภาพกลองในรูปที่ 1 จะเห็นวาตั้งแตนายกรัฐมนตรีคนที่ 12 เปนตนไป
อายุเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรกมากกวาอายุของนายกรัฐมนตรีสมัยกอนๆ
เมื่อรับตําแหนงครั้งแรก
26
รูปที่ 1 แผนภาพกลองแสดงอายุของนายกรัฐมนตรีเมื่อรับตําแหนงครั้งแรก แผนภาพซายคือ
แผนภาพของกลุมที่ 1 สวนแผนภาพขวาคือแผนภาพของกลุมที่ 2
2. 2.1 ใชคาเฉลี่ยหรือมัธยฐานก็ไดเพื่อเปนคากลางของขอมูลดังกลาวเนื่องจากตัวแปรทั้งสองเปนขอมูล
เชิงปริมาณ และการแจกแจงของตัวแปรทั้งสองสามารถประมาณไดวามีลักษณะสมมาตร
(พิจารณาจากฮิสโทแกรมในรูปที่ 2 และรูปที่ 3)
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีคาเฉลี่ยเลขคณิต20.24
ไมลตอแกลลอนและมีมัธยฐาน 20.00 ไมลตอแกลลอน
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีคาเฉลี่ยเลขคณิตเทากับ
28.34 ไมลตอแกลลอนและมีมัธยฐาน 28.00 ไมลตอแกลลอน
CITY
30.027.525.022.520.017.515.012.510.0
Histogram
Frequency
30
20
10
0
Std. Dev = 3.03
Mean = 20.2
N = 50.00
รูปที่ 2 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง
1211N =
GR
2.001.00
อายุเมื่อไดรับตําแหนง
80
70
60
50
40
30
27
HWY
37.535.032.530.027.525.022.520.017.5
Histogram
Frequency
20
10
0
Std. Dev = 3.75
Mean = 28.3
N = 50.00
รูปที่ 3 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง
2.2 วัดการกระจายของจํานวนไมลตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมืองและเมื่อวิ่ง
บนทางหลวงดวยสวนเบี่ยงเบนมาตรฐาน เพราะตัวแปรทั้งสองเปนขอมูลเชิงปริมาณ โดยสวนเบี่ยงเบน
มาตรฐานใชขอมูลทุกๆคามาคํานวณ และตัวแปรทั้งสองมีการแจกแจงที่ประมาณไดวามีลักษณะสมมาตร
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีสวนเบี่ยงเบนมาตรฐาน
3.03 ไมลตอแกลลอน
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีสวนเบี่ยงเบนมาตรฐาน
3.75 ไมลตอแกลลอน
2.3 ลักษณะของตัวแปรทั้งสองคือ
- รถยนตดังกลาวเมื่อวิ่งในเมืองวิ่งไดระยะทางนอยสุด 11 ไมลตอแกลลอน และวิ่งได
ระยะทางมากสุด 29 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 20.24 ไมลตอแกลลอนโดยมี
สวนเบี่ยงเบนมาตรฐาน 3.03 ไมลตอแกลลอน
อนึ่งถาพิจารณาจากแผนภาพกลองในรูปที่ 4 จะเห็นวามีขอมูลที่มีคาต่ํากวาปกติสองคา
ไดแก รถยนตลําดับที่ 18 (11 ไมลตอแกลลอน) และลําดับที่ 42 (12 ไมลตอแกลลอน) และคาสูงผิดปกติ
หนึ่งคา ไดแกรถยนตลําดับที่ 21 (29 ไมลตอแกลลอน)
- รถยนตดังกลาวเมื่อวิ่งบนทางหลวงวิ่งไดเร็วกวาวิ่งในเมืองโดยวิ่งไดระยะทางอยางนอยสุด
17 ไมลตอแกลลอน และวิ่งไดระยะทางมากสุด 37 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 28.34
ไมลตอแกลลอนโดยมีสวนเบี่ยงเบนมาตรฐาน 3.75 ไมลตอแกลลอน
อนึ่งถาพิจารณาจากแผนภาพกลองในรูปที่ 5 จะเห็นวามีขอมูลที่มีคาต่ํากวาปกติสองคา
ไดแก รถยนตลําดับที่ 18 (17 ไมลตอแกลลอน) และลําดับที่ 42 (19 ไมลตอแกลลอน) และคาสูงผิดปกติ
หนึ่งคา ไดแกรถยนตลําดับที่ 21 (37 ไมลตอแกลลอน)
28
ลําดับที่ของรถยนตที่เปนคาผิดปกติเมื่อวิ่งบนทางหลวงนี้สอดคลองกับลําดับที่ของรถ
ยนตที่เปนคาผิดปกติเมื่อวิ่งในเมือง
หมายเหตุ ลําดับที่ 18 คือรถยนต Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium
ลําดับที่ 42 คือรถยนต Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium
ลําดับที่ 21 คือรถยนต Honda Accord Hybrid 6 cyl, 3 L, Automatic (5 speed), Regular
50N =
CITY
40
30
20
10
0
42
18
21
รูปที่ 4 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง
50N =
HWY
40
30
20
10
42
18
21
รูปที่ 5 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง
29
2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองมีจํานวนไมลตอแกลลอนแตกตางหรือกระจายมากกวาเมื่อวิ่ง
บนทางหลวงเนื่องจาก สัมประสิทธิ์ของความแปรผันของขอมูลเมื่อวิ่งในเมืองคือ (3.03/20.24) ×100 %
หรือ 14.97 % แตเมื่อวิ่งบนทางหลวงมีคาสัมประสิทธิ์ของความแปรผันของขอมูลเทคือ (3.75/28.34) × 100 %
หรือ 13.23 % แมวาสวนเบี่ยงเบนมาตรฐานของขอมูลเมื่อรถยนตวิ่งในเมืองจะมีคานอยกวา
สวนเบี่ยงเบนมาตรฐานของขอมูลเมื่อรถยนตวิ่งบนทางหลวงก็ตาม (ซึ่งพิจารณาจากสวนเบี่ยงเบน
มาตรฐานอยางเดียวไมได)
2.5 เนื่องจากควอรไทลที่ 1 ของ จํานวนไมลตอแกลลอนเมื่อรถยนตวิ่งในเมืองคือ 18.75 ไมล
ตอแกลลอน และควอรไทลที่ 1 ของจํานวนไมลตอแกลลอนเมื่อรถยนตวิ่งบนทางหลวงคือ 26.00
ไมลตอแกลลอน ดังนั้นจะมีรถยนต 9 ประเภทขางลางนี้ที่มีคาของตัวแปรทั้งสองนอยกวาควอรไทลที่ 1 ของ
ตัวแปรนั้นๆ
- Audi A8 8 cyl, 4.2 L, Auto(S6), Premium
- BMW 545I 8 cyl, 4.4 L, Manual (6 speed), Premium
- Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular
- Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular
- Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular
- Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium
- Jaquar S-Type R 8 cyl, 4.2 L, Automatic (6 speed), Premium
- Lexus GS 300/GS 430 6 cyl, 3 L, Auto(S5), Premium
- Mercedes Benz E500 8 cyl, 5 L, Auto(L7), Premium
- Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium
3. รถยนตขนาดกลางรุนที่ผลิตในป พ.ศ. 2548 ที่นํามาใชเปนตัวอยาง มีลักษณะที่สําคัญคือ
- จํานวนกระบอกสูบ (cyl.)
ตารางแจกแจงความถี่ของจํานวนกระบอกสูบของรถยนตดังกลาว คือ
จํานวนกระบอกสูบ จํานวนรถยนต (คัน)
4
5
6
8
12
15
2
26
5
2
รวม 50
30
รถยนตที่นํามาใชเปนตัวอยางสวนใหญมีจํานวนกระบอกสูบ 6 กระบอก (26 คันจาก 50 คัน)
รองลงมาคือ 4 กระบอก (15 คัน จาก 50 คัน) จํานวนกระบอกสูบที่นอยที่สุดคือ 4 กระบอกและ
จํานวนกระบอกสูบที่มากที่สุดคือ 12 กระบอก (มีเพียง 2 คันจาก 50 คัน)
หมายเหตุ มัธยฐานของขอมูลคือ6กระบอกเทากับฐานนิยมสวนคาเฉลี่ยเลขคณิตเทากับ5.80 กระบอก
- ขนาดเครื่องยนต (L)
รถยนตที่นํามาใชเปนตัวอยางมีขนาดเครื่องยนตตั้งแต 1.8 L ถึง 6.7 L มีคาเฉลี่ย 3.102 L
และสวนเบี่ยงเบนมาตรฐาน 0.949 L
หมายเหตุ มัธยฐานของขอมูลคือ 3.00 L
- ประเภทของเกียร (เกียรอัตโนมัติหรือเกียรธรรมดา)
รถยนตที่นํามาใชเปนตัวอยางสวนใหญเปนรถที่ใชเกียรอัตโนมัติ (40 จาก 50 คันหรือคิดเปน
80% ของทั้งหมด) รถยนตที่ใชเกียรธรรมดามีเพียง 10 คันหรือ 20 % เทานั้น
- รถชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium)
รถยนตที่นํามาใชเปนตัวอยางสวนใหญเปนรถชนิดธรรมดา (30 จาก 50 คันหรือคิดเปน
60% ของทั้งหมด) และชนิดพิเศษมีจํานวน 20 คันหรือคิดเปน 40% ของทั้งหมด
4. ในที่นี้จะแสดงการอธิบายขอมูลเฉพาะการจําแนกรถยนตตามประเภทของเกียร(แบบอัตโนมัติ
และแบบธรรมดา) สวนการจําแนกประเภทรถยนตชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium)
สามารถทําไดในลักษณะเดียวกัน
รถยนตประเภทเกียรอัตโนมัติ
2.1 ใชคาเฉลี่ยเลขคณิตหรือมัธยฐานก็ไดเพื่อเปนคากลางของขอมูลดังกลาว เนื่องจากตัวแปร
ทั้งสองเปนขอมูลเชิงปริมาณ และการแจกแจงของตัวแปรทั้งสองสามารถประมาณไดวามีลักษณะสมมาตร
(พิจารณาจากฮิสโทแกรมในรูปที่ 6 และรูปที่ 7)
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีคาเฉลี่ยเลขคณิต
20.48 ไมลตอแกลลอนและมีมัธยฐาน 20.00 ไมลตอแกลลอน
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีคาเฉลี่ยเลขคณิต
28.50 ไมลตอแกลลอนและมีมัธยฐาน 28.00 ไมลตอแกลลอน
31
CITY
30.027.525.022.520.017.515.012.5
Histogram
For GEER= a
Frequency
20
10
0
Std. Dev = 2.95
Mean = 20.5
N = 40.00
รูปที่ 6 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง
(ประเภทเกียรอัตโนมัติ)
HWY
37.535.032.530.027.525.022.520.0
Histogram
For GEER= a
Frequency
12
10
8
6
4
2
0
Std. Dev = 3.67
Mean = 28.5
N = 40.00
รูปที่ 7 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง
(ประเภทเกียรอัตโนมัติ)
2.2 วัดการกระจายของจํานวนไมลตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมืองและเมื่อวิ่งบน
ทางหลวงดวยสวนเบี่ยงเบนมาตรฐาน เพราะตัวแปรทั้งสองเปนขอมูลเชิงปริมาณโดยสวนเบี่ยงเบน
มาตรฐานใชขอมูลทุกๆคามาคํานวณ และตัวแปรทั้งสองมีการแจกแจงที่ประมาณไดวามีลักษณะสมมาตร
-ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีสวนเบี่ยงเบนมาตรฐาน
2.95 ไมลตอแกลลอน
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีสวนเบี่ยงเบนมาตรฐาน
3.67 ไมลตอแกลลอน
32
2.3 ลักษณะของตัวแปรทั้งสองคือ
- รถยนตดังกลาวเมื่อวิ่งในเมืองวิ่งไดระยะทางนอยสุด 12 ไมลตอแกลลอน และวิ่ง
ไดระยะทางมากสุด 29 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 20.48 ไมลตอแกลลอนโดยมี
สวนเบี่ยงเบนมาตรฐาน 2.95 ไมลตอแกลลอน
ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 42 (12 ไมลตอแกลลอน)
และคาสูงผิดปกติหนึ่งคา ไดแกรถยนตลําดับที่ 21 (29 ไมลตอแกลลอน)
- รถยนตดังกลาวเมื่อวิ่งบนทางหลวงวิ่งไดเร็วกวาวิ่งในเมืองโดยวิ่งไดระยะทางอยางนอยสุด
19 ไมลตอแกลลอน และวิ่งไดระยะทางมากสุด 37 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 28.50
ไมลตอแกลลอนโดยมีสวนเบี่ยงเบนมาตรฐาน 3.67 ไมลตอแกลลอน
ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 42 (19 ไมลตอแกลลอน)
และคาสูงผิดปกติหนึ่งคา ไดแกรถยนตลําดับที่ 21 (37 ไมลตอแกลลอน)
ลําดับที่ของรถยนตที่เปนคาผิดปกติเมื่อวิ่งบนทางหลวงนี้สอดคลองกับลําดับที่ของ
รถยนตที่เปนคาผิดปกติเมื่อวิ่งในเมือง
สําหรับแผนภาพกลองใหพิจารณาในรูปที่ 10 และ 11
2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองมีจํานวนไมลตอแกลลอนแตกตางหรือกระจายมากกวาเมื่อ
วิ่งบนทางหลวงเนื่องจากสัมประสิทธิ์ของความแปรผันของขอมูลเมื่อวิ่งในเมือง (2.95/20.48) ×100 %
หรือ 14.40 % แตเมื่อวิ่งบนทางหลวงมีคาสัมประสิทธิ์ของความแปรผันของขอมูล(3.67/28.50) × 100 %
หรือ 12.88 %
รถยนตประเภทเกียรธรรมดา
2.1 ใชคามัธยฐานเพื่อเปนคากลางของขอมูลดังกลาว เนื่องจากตัวแปรทั้งสองเปนขอมูลเชิงปริมาณ
และการแจกแจงของตัวแปรทั้งสองมีลักษณะเบซาย(พิจารณาจากฮิสโทแกรมในรูปที่ 8และรูปที่9)
อยางไรก็ตามคาเฉลี่ยเลขคณิตในกรณีนี้ก็ไมตางจากมัธยฐานมากนัก
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีคามัธยฐาน 20.00
ไมลตอแกลลอน(คาเฉลี่ยเลขคณิต 19.30 ไมลตอแกลลอน)
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีคามัธยฐาน
29.00 ไมลตอแกลลอน (คาเฉลี่ยเลขคณิต 27.70 ไมลตอแกลลอน)
33
CITY
22.520.017.515.012.510.0
Histogram
For GEER= m
Frequency
7
6
5
4
3
2
1
0
Std. Dev = 3.33
Mean = 19.3
N = 10.00
รูปที่ 8 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง
(ประเภทเกียรธรรมดา)
HWY
30.027.525.022.520.017.5
Histogram
For GEER= m
Frequency
7
6
5
4
3
2
1
0
Std. Dev = 4.19
Mean = 27.7
N = 10.00
รูปที่ 9 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง
(ประเภทเกียรธรรมดา)
2.2 อาจวัดการกระจายในกรณีที่การแจกแจงของขอมูลมีลักษณะเบดวยสวนเบี่ยงเบนมาตรฐานก็ได
เพราะตัวแปรทั้งสองเปนขอมูลเชิงปริมาณ และสวนเบี่ยงเบนมาตรฐานใชขอมูลทุกๆคา มาคํานวณ
อยางไรก็ตามในการสรุปขอมูลไมควรใชแคคาเฉลี่ยและสวนเบี่ยงเบนมาตรฐานเทานั้น ควรใชแผนภาพ
ชวยอธิบายขอมูลดวย เชน ฮิสโทแกรมหรือแผนภาพกลอง (กลาวถึงในขอ 2.3 ถัดไป) เปนตน
34
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีสวนเบี่ยงเบนมาตรฐาน
3.33 ไมลตอแกลลอน
- ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีสวนเบี่ยงเบนมาตรฐาน
4.19 ไมลตอแกลลอน
2.3 ลักษณะของตัวแปรทั้งสองคือ
-รถยนตดังกลาวเมื่อวิ่งในเมืองวิ่งไดระยะทางนอยสุด 11ไมลตอแกลลอน ควอรไทลที่หนึ่ง
คือ 18.50 ควอรไทลที่สองหรือมัธยฐานคือ 20.00 ควอรไทลที่สามคือ 21.25 ไมลตอแกลลอน และวิ่ง
ไดระยะทางมากสุด 23 ไมลตอแกลลอน พิจารณาแผนภาพกลองในรูปที่ 10
ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 18 (11 ไมลตอแกลลอน)
- รถยนตดังกลาวเมื่อวิ่งบนทางหลวงวิ่งไดเร็วกวาวิ่งในเมืองโดยวิ่งไดระยะทางอยางนอยสุด
17 ไมลตอแกลลอน ควอรไทลที่หนึ่งคือ 26.50 ควอรไทลที่สองหรือมัธยฐานคือ 29.00 ควอรไทลที่
สามคือ 30.25 ไมลตอแกลลอน และวิ่งไดระยะทางมากสุด 31 ไมลตอแกลลอน พิจารณาแผนภาพ
กลองในรูปที่ 11
ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 18 (17 ไมลตอแกลลอน)
ลําดับที่ของรถยนตที่เปนคาผิดปกติเมื่อวิ่งบนทางหลวงนี้สอดคลองกับลําดับที่ของรถยนต
ที่เปนคาผิดปกติเมื่อวิ่งในเมือง
1040N =
GEER
ma
CITY
40
30
20
10
0
18
42
21
รูปที่ 10 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองแผนภาพซายมือ
คือรถยนตที่ใชเกียรอัตโนมัติและแผนภาพขวามือคือรถยนตที่ใชเกียรธรรมดา
35
2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองมีจํานวนไมลตอแกลลอนแตกตางหรือกระจายมากกวาเมื่อวิ่ง
บนทางหลวงเนื่องจาก สัมประสิทธิ์ของความแปรผันของขอมูลเมื่อวิ่งในเมืองคือ (3.33/19.30) ×100 %
หรือ 17.25 % แตเมื่อวิ่งบนทางหลวงมีคาสัมประสิทธิ์ของความแปรผันของขอมูลคือ (4.19/27.70) × 100 %
หรือ 15.13 %
1040N =
GEER
ma
HWY 40
30
20
10
18
42
21
รูปที่ 11 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง แผนภาพ
ซายมือคือรถยนตที่ใชเกียรอัตโนมัติและแผนภาพขวามือคือรถยนตที่ใชเกียรธรรมดา
5. เมื่อตัดขอมูลที่มีคาสูงหรือต่ํากวาปกติ แลวใหทําเชนเดียวกันกับขอ 2
6. 6.1 สําหรับผูที่ตองการลดปริมาณโคเลสเตอรอลควรรับประทานอาหารประเภทเนื้อสัตวเนื่องจาก
อาหารประเภทเนื้อสัตว
มีปริมาณโคเลสเตอรอลโดยเฉลี่ย75.80มิลลิกรัมตอ100กรัม
มีมัธยฐาน 73 มิลลิกรัมตอ 100 กรัม
มีคานอยสุดคือ 44 และคามากสุดคือ 121 มิลลิกรัมตอ 100 กรัม
สวนอาหารประเภทอื่นๆ ใหดูจาก 6.2
6.2อาหารประเภทเครื่องในและอาหารทะเลมีปริมาณโคเลสเตอรอลพอๆกันเนื่องจาก
อาหารประเภทเครื่องใน
มีปริมาณโคเลสเตอรอลโดยเฉลี่ย218.50มิลลิกรัมตอ100กรัม
มีมัธยฐาน 191.50 มิลลิกรัมตอ 100 กรัม
อาหารประเภทอาหารทะเล
มีปริมาณโคเลสเตอรอลโดยเฉลี่ย 218.50 มิลลิกรัมตอ 100 กรัม
มีมัธยฐาน 193.50 มิลลิกรัมตอ 100 กรัม
อยางไรก็ตาม อาหารประเภทอาหารทะเลมีปริมาณโคเลสเตอรอลตอ 100 กรัม
36
กระจายหรือแตกตางกันมากกวาอาหารประเภทเครื่องใน เพราะวา
อาหารประเภทอาหารทะเล
มีปริมาณโคเลสเตอรอลต่ําสุด 87 และสูงสุด 405 มิลลิกรัมตอ 100 กรัม
มีสัมประสิทธิ์ความแปรผัน 46.19 %
อาหารประเภทเครื่องใน
มีปริมาณโคเลสเตอรอลต่ําสุด 133 และสูงสุด 364 มิลลิกรัมตอ 100 กรัม
มีสัมประสิทธิ์ความแปรผัน 40.70 %
หรือพิจารณาจากแผนภาพกลองในรูปที่ 12
10148N =
TYPE
432
cholestrerol
500
400
300
200
100
0
รูปที่ 12 แผนภาพกลองของปริมาณโคเลสเตอรอลตอ 100 กรัม ของอาหารประเภทเครื่องใน
อาหารประเภทอาหารทะเล และอาหารประเภทเนื้อสัตว(จากซายไปขวาตามลําดับ)
7. คาเฉลี่ยเรขาคณิตของยอดขายที่เพิ่มขึ้นในชวงเวลาดังกลาว คือ
5 (9.4)(13.8)(11.7)(11.9)(14.7) 12.16≈ %
8. เนื่องจากเราไมทราบคาที่แทจริงของขอมูลทั้งหลายที่ตกอยูในแตละชั้นและสมมุติวาคา
ทั้งหลายเหลานั้นมีคาเทากัน และเทากับจุดกึ่งกลางของแตละชั้น คาที่คํานวณไดจึงเปนคาโดยประมาณ
เทานั้น
37
เฉลยแบบฝกหัด 1.1 (ก)
1. (1)
10
i 1
c
=
∑ =
10
i 1
2
=
∑
= 10(2)
= 20
(2)
5
3
i
i 1
(x 2)
=
−∑ = (1 – 2)3
+ (3 – 2)3
+ (4 – 2)3
+ (7 – 2)3
+ (0 – 2)3
= –1 + 1 + 8 + 125 – 8
= 125
(3)
3
i i
i 1
(f x c)
=
+∑ = ((10 × 1) + 2) + ((15 × 3) + 2) + ((5 × 4) + 2)
= 12 + 47 + 22
= 81
(4)
4
i i
i 1
(x 3)(x 3)
=
− +∑ =
4
2
i
i 1
(x 9)
=
−∑
= (12
– 9) + (32
– 9) + (42
– 9) + (72
– 9)
= –8 + 0 + 7 + 40
= 39
หรือ
4
i i
i 1
(x 3)(x 3)
=
− +∑ = (1 – 3)(1 + 3) + (3 – 3)(3 + 3) + (4 – 3)(4 + 3)
+ (7 – 3)(7 + 3)
= –8 + 0 + 7 + 40
= 39
2.
5
i
i 1
(5y 50)
=
−∑ =
5
i
i 1
5 y 50(5)
=
−∑
= 5(10) – 250
= –200
5
2
i
i 1
(y 3)
=
−∑ =
5
2
i i
i 1
(y 6y 9)
=
− +∑
=
5 5
2
i i
i 1 i 1
y 6 y 9(5)
= =
− +∑ ∑
= 30 – 6(10) + 45
= 15
38
3.
4
i i
i 1
(x 1)(4y 3)
=
+ −∑ =
4
i i i i
i 1
(4x y 3x 4y 3)
=
− + −∑
=
4 4 4
i i i i
i 1 i 1 i 1
4 x y 3 x 4 y 3(4)
= = =
− + −∑ ∑ ∑
= 4(4) – 3(5) + 4(–2) – 12
= –19
4. (1) 2 2 2
1 2 102x 2x 2x+ + + =
10
2
i
i 1
2 x
=
∑
(2) 1 1 2 2 k k(x X)f (x X)f (x X)f− + − + + − =
k
i i
i 1
(x X)f
=
−∑
(3) 2 2 2
1 1 2 2 k k
1
{(y Y) f (y Y) f (y Y) f }
n
− + − + + − =
k
2
i i
i 1
1
(y Y) f
n =
−∑
5.
N
i i i
i 1
(x 3y 2z 1)
=
− + +∑ = (x1 – 3y1 + 2z1 + 1) + (x2 – 3y2 + 2z2 + 1)
+ ... + (xN – 3yN + 2zN + 1)
= (x1 + x2 + ... + xN) – 3(y1 + y2 + ... + yN)
+ 2(z1+z2 + ... + zN) + (1 + 1 + ... + 1)
=
N N N
i i i
i 1 i 1 i 1
x 3 y 2 z N
= = =
− + +∑ ∑ ∑
ดังนั้น
N
i i i
i 1
(x 3y 2z 1)
=
− + +∑ =
N N N
i i i
i 1 i 1 i 1
x 3 y 2 z N
= = =
− + +∑ ∑ ∑
6. จากขอมูลทําตารางไดดังนี้
ชวงคะแนน จุดกึ่งกลาง จํานวนนักเรียน
60 – 80
90 – 100
70
95
40
10
(1) คาเฉลี่ยเลขคณิต µ = 70(40) 95(10)
40 10
+
+
= 2800 950
50
+
= 75
ดังนั้น คาเฉลี่ยเลขคณิตของคะแนนสอบวิชาสถิติทั้ง 50 คน เทากับ 75 คะแนน
มี 1 อยู N ตัว
39
(2) คาเฉลี่ยเลขคณิต µ = 75(40) 95(10)
40 10
+
+
= 3000 950
50
+
= 79
ดังนั้น คาเฉลี่ยเลขคณิตที่คํานวณได (79 คะแนน) จะไมเทากับคาเฉลี่ยเลขคณิต
จากขอ (1) (75 คะแนน)
(3) จากคาเฉลี่ยเลขคณิตในขอ (1) เทากับ 75 คะแนน
ดังนั้น คะแนนสอบวิชาสถิติรวม 50 คน เทากับ 50 × 75 = 3,750 คะแนน
7. คาเฉลี่ยเลขคณิตรวม µ = 40(165) 45(168) 50(167) 45(164)
40 45 50 45
+ + +
+ + +
= 6600 7560 8350 7380
180
+ + +
= 29890
180
= 166.06
ดังนั้น คาเฉลี่ยเลขคณิตของสวนสูงของนักเรียนชั้นมัธยมศึกษาปที่ 5 ทั้งหมดเทากับ 166.06
เซนติเมตร
8. กําหนดให S = 10 + 1.4B
จะได Si = 10 + 1.4Bi เมื่อ i คือ 1, 2, ..., 10
ดังนั้น S = 10 + 1.4B
B = 80 85 70 80 75 78 82 86 79 69
10
+ + + + + + + + +
= 784
10
= 78.4
จะได S = 10 + 1.4(78.4)
= 119.76
นั่นคือ ราคาขายเฉลี่ยของสินคาชนิดนี้ เทากับ 119.76 บาท
9. ราคาเฉลี่ยของไขไก µ = 50(2.30) 30(2.00) 20(1.70)
50 30 20
+ +
+ +
= 209
100
= 2.09
นั่นคือ เฉลี่ยแลวธนากรซื้อไขไกมาฟองละ 2.09 บาท
40
10. (1) จะแสดงวา
N
i
i 1
x
=
∑ = Nµ
เพราะวา
N
i
i 1
x
=
∑ = x1 + x2 + x3 + ... + xN
= N
N
(x1 + x2 + x3 + ... + xN)
=
N
i
i 1
x
N
N
=
⎛ ⎞
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠
∑
= Nµ
(2) จะแสดงวา
N
i
i 1
(x ) 0
=
−µ =∑
เพราะวา
N
i
i 1
(x )
=
−µ∑ = 1 2 3 N(x ) (x ) (x ) (x )− µ + − µ + − µ + + − µ
= (x1 + x2 + x3 + ... + xN) – ( )µ + µ + µ + + µ
=
N
i
i 1
x N
=
− µ∑
= Nµ – Nµ
= 0
(4) จะแสดงวา xmin < µ < xmax
เนื่องจาก xmin + xmin + ... + xmin < x1 + x2 + x3 + ... + xN
< xmax + xmax + ... + xmax
จะได Nxmin <
N
i
i 1
x
=
∑ < Nxmax
minNx
N
<
N
i
i 1
x
N
=
∑
< maxNx
N
xmin < µ < xmax
มี µ อยู N ตัว
มี xmin อยู N ตัว
มี xmax อยู N ตัว
41
(5) จะแสดงวา Y = aX b+
เนื่องจาก Yi = axi + b
ดังนั้น
n
i
i 1
Y
=
∑ =
n
i
i 1
(ax b)
=
+∑
=
n
i
i 1
a x nb
=
+∑
จะได
n
i
i 1
y
n
=
∑
=
n
i
i 1
a x
nb
n n
=
+
∑
ดังนั้น Y = aX b+
เฉลยแบบฝกหัด 1.1 (ข)
1. เรียงขอมูลจากนอยไปมาก จะได 11 11 15 16 18 22 22 22 28 36
มัธยฐานอยูตําแหนงที่ 10 1
5.5
2
+
=
ดังนั้น มัธยฐานของขอมูลชุดนี้เทากับ 18 22
20
2
+
= บาท
นักเรียนที่ตองจายคาใชจายรายวันเกินกวามัธยฐานมีอยู 5 คน
2. เรียงขอมูลจากนอยไปมาก จะได
44.3 466.4 974.0 1,080.8 1,724.4 2,148.8 5,270.9
มัธยฐานอยูตําแหนงที่ 7 1
2
+
= 4
ดังนั้น มัธยฐานของจํานวนผูมีงานทําจําแนกตามประเภทอุตสาหกรรมในป พ.ศ. 2546
เทากับ 1,080.8 พันคน หรือ 1,080,800 คน
3. x1, x2, x3, ..., xN เปนขอมูลที่เรียงจากนอยไปหามาก หรือมากไปหานอย
(1) เมื่อ N เปนจํานวนคู
ขอมูลที่อยูตรงกลางจะมี 2 จํานวน คือ N
2
x กับ N
1
2
x
+
ดังนั้น มัธยฐาน คือ
N N
1
2 2
x x
2
+
+
(2) เมื่อ N เปนจํานวนคี่
ขอมูลที่อยูตรงกลางจะมี 1 จํานวน คือ N
1
2
x
+
ดังนั้น มัธยฐาน คือ N
1
2
x
+
42
เฉลยแบบฝกหัด 1.1 (ค)
1. อายุของเด็ก 15 คน เรียงลําดับจากนอยไปมากไดดังนี้
5 5 6 6 7 7 7 7 7 8 8 8 8 9 9
จะได ฐานนิยมของอายุเด็ก 15 คน คือ 7 ป
2. จํานวนไขไกที่ใชบริโภคตอเดือนเรียงลําดับจากนอยไปมากดังนี้
32 35 38 44 44 46 47 48 48 48 48 49 51 52 54 60 60 60 60 65
จะได ฐานนิยมของจํานวนไขไกที่แตละครอบครัวบริโภคตอเดือนคือ 48 และ 60 ฟอง
คากึ่งกลางพิสัยของจํานวนไขไกที่แตละครอบครัวบริโภคตอเดือนคือ 48.5 ฟอง
3. เงินเดือนของพนักงาน 7 คน เรียงลําดับจากนอยไปมากดังนี้
3400 3450 3500 3500 3500 3600 21000
คาเฉลี่ยเลขคณิตของเงินเดือนเทากับ 3400 3450 3(3500) 3600 21000
7
+ + + +
= 5992.86
จะได มัธยฐานของเงินเดือนพนักงาน 7 คน คือ 3500 บาท
ฐานนิยมของเงินเดือนพนักงาน 7 คน คือ 3500 บาท
มัธยฐานและฐานนิยมจะเปนตัวแทนของเงินเดือนของพนักงาน 7 คน ไดดีกวาคาเฉลี่ยเลขคณิตเพราะ มี
ขอมูลที่มีคาสูงผิดปกติอยูคือ 21000 ถาใชคาเฉลี่ยเลขคณิตซึ่งคือ 5992.86 บาท จะไมใชตัวแทนที่ดี
เนื่องจากพนักงาน6คนจาก7คน เงินเดือนนอยกวาคานี้นั่นคือมีขอมูลผิดปกติทําใหเกิดผลกระทบตอคา
เฉลี่ยเลขคณิตแตไมมีผลกระทบตอคามัธยฐานหรือฐานนิยม
4. เนื่องจาก ระยะทาง = เวลา × ความเร็ว
จะได เวลา =
ดังนั้น เวลาที่ใชในการเดินทางระยะ d1, d2 และ d3 เทากับ 1 2
2 2
d d
,
v v
และ 3
3
d
v
ตามลําดับ
เนื่องจาก อัตราเร็วเฉลี่ย =
จะได อัตราเร็วเฉลี่ย (v) = 1 2 3
31 2
1 2 3
d d d
dd d
v v v
+ +
+ +
ซึ่งเปนคาเฉลี่ยฮารมอนิกถวงน้ําหนัก
ถา d1 = 2500, d2 = 1200, d3 = 500, v1 = 500, v2 = 400 และ v3 = 250
ระยะทาง
ความเร็ว
ระยะทางทั้งหมด
เวลาที่ใชทั้งหมด
43
จะได v = 2500 1200 500
2500 1200 500
500 400 250
+ +
+ +
v = 4200
10
= 420
ดังนั้น v เทากับ 420 ไมลตอชั่วโมง
5. (1) เพราะคาเฉลี่ยเลขคณิตไมใชคากลางที่แบงจํานวนขอมูลทั้งหมดออกเปนสองสวนแตเปนมัธยฐาน
(2)
(3)
(4) ฐานนิยมของขอมูลอาจมีมากกวา 1 คาก็ได กรณีที่ขอมูลชุดใดมีฐานนิยมมากกวา 2 คา
อาจถือไดวาขอมูลชุดนั้นไมมีฐานนิยมได หรืออาจหาตัวแปรอื่นเชน เพศ มาแบงขอมูลที่มี
ฐานนิยมมากกวาสองคาออกใหเห็นฐานนิยมเพียงคาเดียวภายใตแตละเพศหรือแตละกลุม
(5) ไมจําเปนขึ้นอยูกับการกระจายของขอมูลชุดนั้น ๆ
6.
รายการที่เสียหาย คาเฉลี่ยเลขคณิตของความเสียหาย(ลานบาท)
ที่ดิน
บาน/อาคารสิ่งปลูกสราง
อุปกรณ
ยานพาหนะ
อื่นๆ
43.75
128.8
62.14
50.67
38.45
7. เราไมสามารถหาคากลางโดยใชมัธยฐาน ฐานนิยม หรือคากึ่งกลางพิสัยไดเนื่องจาก วัตถุประสงค
ของการนําคากลางของขอมูลในตารางมาใชเพื่อตองการทราบขอมูลเกี่ยวกับมูลคาความเสียหายโดย
ประมาณ ซึ่งถาใชคามัธยฐาน ฐานนิยม หรือคากึ่งกลางพิสัยอาจทําใหไดคากลางที่มีคาต่ําหรือสูง
เกินไป
เฉลยแบบฝกหัดระคน
1. จุดเดนที่แตกตางระหวางการใชคาเฉลี่ยเลขคณิต และมัธยฐาน มีดังนี้
1.1 คาเฉลี่ยเลขคณิตเมื่อคูณกับจํานวนขอมูลทั้งหมด จะเทากับผลรวมของขอมูลทุก ๆ คาเสมอ
แตถาใชมัธยฐานคูณกับจํานวนขอมูลทั้งหมดผลลัพธอาจจะเทากับหรือไมเทากับผลรวมของ
ขอมูลทุก ๆ คาก็ได
44
1.2 ผลรวมของผลตางระหวางแตละคาของขอมูลกับคาเฉลี่ยเลขคณิตของขอมูลชุดนั้น ๆ
จะเทากับ 0 เสมอ แตผลรวมของผลตางระหวางแตละคาของขอมูลกับมัธยฐานของ
ขอมูลชุดนั้น ๆ จะเทากับ 0 หรือไมเทากับ 0 ก็ได
1.3 ผลรวมของผลตางกําลังสองระหวางแตละคาของขอมูลกับคาเฉลี่ยเลขคณิตจะมีคานอยที่สุด
แตผลรวมของคาสัมบูรณของผลตางระหวางขอมูลแตละคากับมัธยฐานของขอมูลชุดนั้นจะมีคา
นอยที่สุด
1.4 คาเฉลี่ยเลขคณิตคํานวณจากขอมูลทุกคา แตมัธยฐานคํานวณจากคาที่อยูในตําแหนงกึ่งกลาง
ของขอมูลที่เรียงลําดับไวจึงไมถูกกระทบจากคาของขอมูลที่สูงหรือต่ํากวาปกติ
2. ขอมูลที่มีการแจกแจงแบบสมมาตร คาเฉลี่ยเลขคณิต มัธยฐานและฐานนิยม จะมีคาเทากัน ดังรูป
ขอมูลที่มีการแจกแจงแบบเบ คาเฉลี่ยเลขคณิต มัธยฐานและฐานนิยม จะมีคาไมเทากัน ซึ่ง
แยกได 2 กรณี คือ กรณีที่ 1 แจกแจงแบบเบซาย (เบทางลบ) จะได
คาเฉลี่ยเลขคณิต < มัธยฐาน < ฐานนิยม ดังรูป
กรณีที่ 2 แจกแจงแบบเบขวา (เบทางบวก) จะได
ฐานนิยม < มัธยฐาน < คาเฉลี่ยเลขคณิต ดังรูป
คาเฉลี่ยเลขคณิต
มัธยฐาน
ฐานนิยม
คาเฉลี่ยฐานนิยม
มัธยฐาน
ฐานนิยมคาเฉลี่ย
มัธยฐาน
45
3. สําหรับขอมูลตัวอยางซึ่งไมมีคาผิดปกติ และเปนตัวแทนของประชากร ตัวอยางที่นํามาศึกษาบางครั้ง
อาจมีจํานวนนอย การวิเคราะหขอมูลจึงควรพิจารณาเลือกการใชคากลางใหเหมาะสมดังนี้
1. ในกรณีที่ขอมูลมีจํานวนนอย ไมควรใชฐานนิยม ฐานนิยมอาจมีคาแตกตางกันมากระหวาง
ขอมูลชุดหนึ่งกับขอมูลอีกชุดหนึ่งที่มีจํานวนเทากัน
2. ในกรณีที่ขอมูลสามารถเรียงลําดับไดและเปนขอมูลตอเนื่องดวยควรใชคาเฉลี่ยเลขคณิตจะ
เหมาะสมกวาใชมัธยฐานเปนตัวแทนของคากลาง
3. ในกรณีที่ขอมูลมีการแจกแจงความถี่ที่มีความกวางของแตละอันตรภาคชั้นไมเทากัน ควรใช
มัธยฐานเปนตัวแทนของคากลาง
4. ในกรณีที่ตองการหาคากลางเพื่อตองนําไปใชในการคํานวณทางสถิติขั้นสูงตอไป ควรใช
คาเฉลี่ยเลขคณิตเปนตัวแทนของคากลางของขอมูลนั้น ๆ เพราะคาเฉลี่ยเลขคณิตเปนคากลาง
ที่ไดจากการนําทุก ๆ คาของขอมูลมาเฉลี่ย
5. (1) คาเฉลี่ยเลขคณิต คือ 1 2 3
3
+ +
= 2
มัธยฐาน คือ 2
(2) คาเฉลี่ยเลขคณิต คือ 1 2 6
3
+ +
= 3
มัธยฐาน คือ 2
(3) คาเฉลี่ยเลขคณิต คือ 1 2 9
3
+ +
= 4
มัธยฐาน คือ 2
(4) คาเฉลี่ยเลขคณิต คือ 1 2 297
3
+ +
= 100
มัธยฐาน คือ 2
(5) คาเฉลี่ยเลขคณิต คือ 1 2 3 4
4
+ + +
= 2.5
มัธยฐาน คือ 2 3
2
+
= 2.5
(6) คาเฉลี่ยเลขคณิต คือ 1 2 3 4 5
5
+ + + +
= 3
มัธยฐาน คือ 3
46
(7) คาเฉลี่ยเลขคณิต คือ 1 2 3 4 5 6
6
+ + + + +
= 3.5
มัธยฐาน คือ 3 4
2
+
= 3.5
(8) คาเฉลี่ยเลขคณิต คือ 1 2 98 99
99
+ + + +
= 4950
99
= 50
มัธยฐาน คือ 50
6. จากผลลัพธที่ไดจากขอ 5 เมื่อเปรียบเทียบคาเฉลี่ยเลขคณิตและมัธยฐาน จะไดวา
(1), (5), (6), (7) และ (8) ไดคาเฉลี่ยเลขคณิตและมัธยฐานเทากัน
(2), (3) และ (4) ไดคาเฉลี่ยเลขคณิตและมัธยฐานไมเทากัน
จากการสังเกตผลลัพธจาก (4) และ (8) จะเห็นวา (4) ไดคาเฉลี่ยเลขคณิตและมัธยฐานไมเทากัน
แต (8) ไดคาเฉลี่ยเลขคณิตและมัธยฐานเทากัน เพราะ (4) มีขอมูล 247 ที่สูงผิดปกติทําใหคาเฉลี่ย
เลขคณิตและมัธยฐานแตกตางกันมาก สวน (8) ไมมีขอมูลที่ผิดปกติและความแตกตางของขอมูล
แตละหนวยมีคาเทากัน ดังนั้น คาเฉลี่ยเลขคณิตจึงมีคาเทากับมัธยฐาน
7. จากขอมูลเปนปริมาณรอยละของเมทิลแอลกอฮอล ซึ่งเปนขอมูลเชิงปริมาณและควรใชคาเฉลี่ย
เลขคณิตเปนคากลางของขอมูล ซึ่งคํานวณไดผลดังตาราง
หองปฏิบัติการ คาเฉลี่ยเลขคณิต
LAB 1
LAB 2
LAB 3
LAB 4
85.06
84.72
84.77
84.24
จากคากลางที่ไดจะเห็นวา คากลางของขอมูลในหองปฏิบัติการ LAB 2 และ LAB 3
มีคาใกลเคียงกัน
เฉลยแบบฝกหัด 1.2
1. คะแนนสอบเรียงลําดับจากนอยไปมาก ดังนี้
43 45 48 49 50 51 53 54 54 54
55 56 56 58 60 60 62 63 65 65
65 66 67 69 74 75 76 76 77 78
80 80 82 84 85 92 94 96 97 98
47
(1) คะแนนสอบที่มีนักเรียนประมาณครึ่งหนึ่งของชั้นไดคะแนนต่ํากวาคือ คะแนนที่ Q2
เนื่องจาก Q2 อยูในตําแหนงที่ 2(40 1)
4
+
= 20.5
นั่นคือ Q2 = 65 65
2
+
= 65 คะแนน
ดังนั้น นักเรียนจะตองสอบไดคะแนน 65 คะแนน จึงจะมีนักเรียนประมาณครึ่งหนึ่ง
ของชั้นไดคะแนนต่ํากวา
(2) คะแนนสอบที่มีนักเรียนประมาณหนึ่งในสี่ของชั้นไดคะแนนสูงกวาคือ คะแนนที่ Q3
เนื่องจาก Q3 อยูในตําแหนงที่ 3(40 1)
4
+
= 30.75
ดังนั้น Q3 มีคาอยูระหวาง 78 กับ 78
นั่นคือ Q3 = 78 คะแนน
ดังนั้น นักเรียนจะตองสอบไดคะแนน 78 คะแนน จึงจะมีนักเรียนประมาณหนึ่งในสี่
ของชั้นไดคะแนนสูงกวา
(3) คะแนนสอบที่มีนักเรียนสอบไดนอยกวาอยู 6 ใน 10 คือ คะแนนที่ D6
เนื่องจาก D6 อยูในตําแหนงที่ 6
(40 1)
10
+ = 24.6
ดังนั้น D6 มีคาอยูระหวาง 69 กับ 74
ตําแหนงตางกัน 1 คะแนนเพิ่มขึ้น 5 คะแนน
ตําแหนงตางกัน 0.6 คะแนนเพิ่มขึ้น 5 × 0.6 = 3 คะแนน
นั่นคือ D6 = 69 + 3 = 72 คะแนน
ดังนั้น นักเรียนจะตองสอบไดคะแนน 72 คะแนน จึงจะมีผูที่สอบไดนอยกวา 6 ใน 10
2. เวลา (นาที) ที่ใชในการทําขอสอบเรียงลําดับจากนอยไปมาก ดังนี้
30 35 39 40 42 43 44 45 46 48
49 50 51 52 53 55 57 58 58 60
61 62 63 65 69 70 72 73 75 80
(1) เวลาในการทําขอสอบที่มีจํานวนนักเรียนซึ่งใชเวลานอยกวาอยูประมาณรอยละ 55 คือ
เวลาที่ P55
เนื่องจาก P55 อยูในตําแหนงที่ 55
(30 1)
100
+ = 17.05
ดังนั้น P55 มีคาอยูระหวาง 57 กับ 58
ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 1 นาที
ตําแหนงตางกัน 0.05 เวลาเพิ่มขึ้น 0.05 นาที
48
นั่นคือ P55 = 57 + 0.05 = 57.05 นาที
ดังนั้น สมชายใชเวลาในการทําขอสอบ 57.05 นาที จึงจะมีนักเรียนซึ่งใชเวลา
ในการทําขอสอบนอยกวาประมาณรอยละ 68
เวลาในการทําขอสอบที่มีจํานวนนักเรียนซึ่งใชเวลานอยกวาอยูประมาณรอยละ 68 คือ
เวลาที่ P68 อยูในตําแหนงที่ 68
(30 1)
100
+ = 21.08
ดังนั้น P68 มีคาอยูระหวาง 61 กับ 62
ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 1 นาที
ตําแหนงตางกัน 0.08 เวลาเพิ่มขึ้น 0.08 นาที
นั่นคือ P68 = 61 + 0.08 = 61.08 นาที จึงจะมีนักเรียนซึ่งใชเวลาในการทําขอสอบ
นอยกวาประมาณรอยละ 68
(2) เวลาในการทําขอสอบที่มีจํานวนนักเรียนใชเวลานอยกวาอยู 8 ใน 10 คือ D8
เนื่องจาก D8 อยูในตําแหนงที่ 8
(30 1)
10
+ = 24.8
ดังนั้น D8 มีคาอยูระหวาง 65 กับ 69
ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 4 นาที
ตําแหนงตางกัน 0.8 เวลาเพิ่มขึ้น 0.8×4 = 3.2 นาที
นั่นคือ D8 = 65 + 3.2 = 68.2 นาที
ดังนั้น ดวงจันทรใชเวลาในการทําขอสอบ 68.2 นาที
(3) นักเรียนที่ใชเวลาในการทําขอสอบมากกวานักเรียนที่เขาแขงขันประมาณ 3 ใน 4 คือ
นักเรียนที่ใชเวลาในการทําขอสอบมากกวาเวลาที่ใช Q1
เนื่องจาก Q1 อยูในตําแหนงที่ 40 1
4
+
= 10.25
ดังนั้น Q1 มีคาอยูระหวาง 48 กับ 49 นาที
ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 1 นาที
ตําแหนงตางกัน 0.25 เวลาเพิ่มขึ้น 0.25 นาที
นั่นคือ Q1 = 48 + 0.25 = 48.25 นาที
ดังนั้น นักเรียนที่ไดรับรางวัลเปนกลองดินสอใชเวลาในการทําขอสอบนอยที่สุด 48.25 นาที
49
3. จํานวนนักเรียนจําแนกตามคะแนนสอบ
ชวงคะแนน ความถี่ ความถี่สะสม
55 – 64
65 – 74
75 – 84
85 – 94
95 – 104
105 – 114
115 – 124
125 – 134
135 – 144
3
21
78
182
305
209
81
21
5
3
24
102
284
589
798
879
900
905
(1) ตําแหนงที่ของ Q2 เทากับ 2
(905)
4
= 452.50
ตําแหนงที่ของ Q2 อยูระหวางความถี่สะสม 284 กับ 589
ในอันตรภาคชั้น 85 – 94 กับ 95 – 104
ความถี่สะสมตางกัน 305 คะแนนสอบเพิ่มขึ้น 10 คะแนน
ความถี่สะสมตางกัน 168.5 คะแนนสอบเพิ่มขึ้น 10 168.5
5.52
305
×
= คะแนน
จะได Q2 เทากับ 94.5 + 5.52 = 100.02 คะแนน
ตําแหนงที่ของ D5 เทากับ 5
(905) 452.5
10
=
ซึ่งตรงกับตําแหนงที่ของ Q2
จะได D5 = Q2 = 100.02
ตําแหนงที่ของ P50 เทากับ 50
(905) 452.5
100
=
ซึ่งตรงกับตําแหนงที่ของ Q2
จะได P50 = D5 = Q2 = 100.02 คะแนน
(2) ตําแหนงที่ของ Q1 เทากับ 905
4
= 226.25
ตําแหนงที่ของ Q1 อยูระหวางความถี่สะสม 102 กับ 284
ในอันตรภาคชั้น 75 – 84 กับ 85 – 94
ความถี่สะสมตางกัน 182 คะแนนสอบเพิ่มขึ้น 10 คะแนน
ความถี่สะสมตางกัน 124.25 คะแนนสอบเพิ่มขึ้น 10 124.25
182
×
= 6.83 คะแนน
จะได Q1 เทากับ 84.5 + 6.83 = 91.33 คะแนน
50
ตําแหนงที่ของ D1 และ D3 เทากับ 905
10
= 90.5 และ 3
(905)
10
= 271.5 ตามลําดับ
ตําแหนงที่ของ D1 อยูระหวางความถี่สะสม 24 กับ 102
ในอันตรภาคชั้น 65 – 74 กับ 75 – 84
จะได D1 เทากับ 10 66.5
74.5 ( )
78
×
+ = 83.03
ตําแหนงที่ของ D3 อยูระหวางความถี่สะสม 102 กับ 284 ในอันตรภาคชั้น 75 – 84
กับ 85 – 94
จะได D3 เทากับ 10 169.5
84.5 ( )
182
×
+ = 93.81
ดังนั้น D1 + D3 = 83.03 + 93.81 = 176.84 คะแนน
ตําแหนงที่ของ P25 เทากับ 25
(905)
100
= 226.25
ซึ่งตรงกับตําแหนงที่ของ Q1
จะได P25 เทากับ 91.33 คะแนน
นั่นคือ Q1 เทากับ P25 แต Q1 หรือ P25 ไมเทากับ D1 + D3
4. จํานวนนักเรียนจําแนกตามหองและคะแนนสอบ
ชวงคะแนน จํานวนนักเรียน
หอง ก.
ความถี่สะสม
หอง ก.
จํานวนนักเรียน
หอง ข.
ความถี่สะสม
หอง ข.
จํานวนนักเรียน
ทั้ง 2 หอง
ความถี่สะสม
ทั้ง 2 หอง
1 – 5
6 – 10
11 – 15
16 – 20
21 – 25
26 – 30
31 – 35
36 – 40
41 – 45
46 – 50
51 – 55
56 – 60
61 – 65
66 – 70
71 – 75
0
1
0
3
2
2
5
4
6
7
3
4
2
0
1
0
1
1
4
6
8
13
17
23
30
33
37
39
39
40
1
0
1
4
0
3
4
5
5
6
4
3
3
0
1
1
1
2
6
6
9
13
18
23
29
33
36
39
39
40
1
1
1
7
2
5
9
9
11
13
7
7
5
0
2
1
2
3
10
12
17
26
35
46
59
66
73
78
78
80
51
(1) ตําแหนงที่ของ P25 ของคะแนนสอบหอง ก เทากับ 25
(40) 10
100
=
ตําแหนงที่ของ P25 ของคะแนนสอบหอง ก อยูระหวางความถี่สะสม 8 กับ 13
ในอันตรภาคชั้น 26 – 30 กับ 31 – 35
จะได P25 ของคะแนนสอบหอง ก คือ 5 2
30.5 ( )
5
×
+ = 32.5
นั่นคือ P25 ของคะแนนสอบหอง ก เทากับ 32.5 คะแนน
ตําแหนงที่ของ P25 ของคะแนนสอบหอง ข เทากับ 25
(40)
100
= 10
ตําแหนงที่ของ P25 ของคะแนนสอบหอง ข อยูระหวางความถี่สะสม 9 กับ 13
ในอันตรภาคชั้น 26 – 30 กับ 31 – 35
จะได P25 ของคะแนนสอบหอง ข คือ 5 1
30.5 ( )
4
×
+ = 31.75
นั่นคือ P25 ของคะแนนสอบหอง ข เทากับ 31.75 คะแนน
ตําแหนงที่ของ P50 ของคะแนนสอบทั้งหมด เทากับ 50
(80)
100
= 40
ตําแหนงที่ของ P50 ของคะแนนสอบทั้งหมดอยูระหวางความถี่สะสม 35 กับ 46
ในอันตรภาคชั้น 36 – 40 กับ 41 – 45
จะได P50 ของคะแนนสอบทั้งหมด คือ 5 5
40.5 ( )
11
×
+ = 42.77
นั่นคือ P50 ของคะแนนสอบทั้งหมด เทากับ 42.77 คะแนน
(2) ตําแหนงที่ของ Q3 ของคะแนนสอบหอง ก เทากับ 3
(40) 30
4
=
ตําแหนงที่ของ Q3 ของคะแนนสอบหอง ก อยูตรงกับความถี่สะสม 30 พอดี
ในอันตรภาคชั้น 46 – 50
จะได Q3 ของคะแนนสอบหอง ก เทากับ 50.5 คะแนน
ตําแหนงที่ของ Q2 ของคะแนนสอบหอง ข เทากับ 2
(40) 20
4
=
ตําแหนงที่ของ Q2 ของคะแนนสอบหอง ข อยูระหวางความถี่สะสม 18 กับ 23
ในอันตรภาคชั้น 36 – 40 กับ 41 – 45
จะได Q2 ของคะแนนสอบหอง ข เทากับ 5 2
40.5 ( )
5
×
+ = 42.5 คะแนน
จะเห็นวา Q3 ของคะแนนสอบหอง ก มากกวา Q2 ของคะแนนสอบหอง ข
ดังนั้น ถานักเรียนในหอง ก สอบไดคะแนนเทากับ Q3 ถาเขาไปอยูหอง ข เขาจะสอบได
คะแนนสูงกวานักเรียนหอง ข มากกวาครึ่งหอง
52
5. ความถี่สะสมจําแนกตามคะแนน
ชวงคะแนน 46 – 55 56 – 65 66 – 75 76 – 85 86 – 95 96 – 105
ความถี่ 3 4 8 9 4 2
ความถี่สะสม 3 7 15 24 28 30
(1) ตําแหนงที่ของ Q1 เทากับ 30
4
= 7.5
ตําแหนงที่ของ Q1 อยูระหวางความถี่สะสม 7 กับ 15 ในอันตรภาคชั้น 56 – 65 กับ 66 – 75
จะได Q1 เทากับ 10 0.5
65.5 ( )
8
×
+ = 66.13 คะแนน
ตําแหนงที่ของ Q3 เทากับ 3
(30)
4
= 22.5
ตําแหนงที่ของ Q3 อยูระหวางความถี่สะสม 15 กับ 24 ในอันตรภาคชั้น 66 – 75 กับ 76 – 85
จะได Q3 เทากับ 10 7.5
75.5 ( )
9
×
+ = 83.83 คะแนน
ตําแหนงที่ของ D2 เทากับ 2
(30)
10
= 6
ตําแหนงที่ของ D2 อยูระหวางความถี่สะสม 3 กับ 7
ในอันตรภาคชั้น 46 – 55 กับ 56 – 65
จะได D2 เทากับ 10 3
55.5 ( )
4
×
+ = 63 คะแนน
ตําแหนงที่ของ D9 เทากับ 9
(30)
10
= 27
ตําแหนงที่ของ D9 อยูระหวางความถี่สะสม 24 กับ 28 ในอันตรภาคชั้น 76 – 85 กับ 86 – 95
จะได D9 เทากับ 10 3
85.5 ( )
4
×
+ = 93 คะแนน
(2) ตําแหนงที่ของ Q2 เทากับ 2
(30)
4
= 15
ตําแหนงที่ของ Q2 ตรงกับความถี่สะสม 15 ในอันตรภาคชั้น 66 – 75 พอดี
จะได Q2 เทากับ 75.5 คะแนน
จากขอ (1) 1 3
1
(Q Q )
2
+ = 1
(66.13 83.83)
2
+
= 74.98 คะแนน
ดังนั้น คาของ Q2 มากกวาคาของ 1 3
1
(Q Q )
2
+
53
6. จํานวนนักเรียนจําแนกตามคะแนนสอบวิชาคณิตศาสตร
คะแนน 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99
จํานวนนักเรียน 1 4 10 22 45 30 8
ความถี่สะสม 1 5 15 37 82 112 120
(1) กลุมนักเรียนที่ไดคะแนนสูงสุดมี 20% ของนักเรียนทั้งหมดเทากับ 20
(120)
100
= 24 คน
ดังนั้น นักเรียนที่ไดคะแนนต่ําสุดในกลุมนี้จะอยูในตําแหนงที่ 120 – 23 = 97 ซึ่งอยูระหวาง
ความถี่สะสม 82 กับ 112 ในอันตรภาคชั้น 70 – 79 กับ 80 – 89
จะได คะแนนต่ําสุดของกลุมนักเรียนที่ไดคะแนนสูงสุดเทากับ 10 15
79.5 ( )
30
×
+ = 84.5 คะแนน
(2) กลุมนักเรียนที่ไดคะแนนต่ําสุดมี 15% ของนักเรียนทั้งหมดเทากับ 15
(120)
100
= 18 คน
ดังนั้นนักเรียนที่ไดคะแนนสูงสุดในกลุมนี้จะอยูในตําแหนงที่ 18 ซึ่งอยูระหวางความถี่สะสม
15 กับ 37 ในอันตรภาคชั้น 50 – 59 กับ 60 – 69
จะไดคะแนนสูงสุดของกลุมนักเรียนที่ไดคะแนนต่ําสุดเทากับ 10 3
59.5 ( )
22
×
+ = 60.86 คะแนน
(3) คะแนน 75 ตรงกับอันตรภาคชั้น 70 – 79
คะแนนตางกัน 79.5 – 69.5 = 10 คะแนน ความถี่สะสมตางกัน 82 – 37 = 45
คะแนนตางกัน 75 – 69.5 = 5.5 คะแนน ความถี่สะสมตางกัน 45(5.5)
10
= 24.75
จะได คะแนน 75 ตรงกับความถี่สะสม 37 + 24.75 = 61.75
ขอมูลทั้งหมด 120 อยูที่ความถี่สะสม 61.75
ขอมูลทั้งหมด 100 อยูที่ความถี่สะสม 61.75 100
120
×
= 51.46
ดังนั้น นักเรียนที่สอบได 75 คะแนน จะไดคะแนนเปนเปอรเซ็นไทลที่ 51.46
54
เฉลยแบบฝกหัด 1.3 (ก)
1. กําลังผลิตไฟฟาจําแนกตามเขื่อนเรียงจากนอยไปหามากดังนี้
1.06 1.28 6.00 9.00 17.50 25.20 36.00 38.00
40.00 72.00 136.00 240.00 300.00 500.00 720.00 743.90
ตําแหนงที่ของ Q1 เทากับ 16 1
4
+
= 4.25
ดังนั้น Q1 มีคาอยูระหวาง 9.00 กับ 17.50
จะได Q1 เทากับ 9.00 (8.5 0.25)+ × = 11.125 เมกกะวัตต
ตําแหนงที่ของ Q3 เทากับ 3
(16 1)
4
+ = 12.75
ดังนั้น Q3 มีคาอยูระหวาง 240.00 กับ 300.00
จะได Q3 เทากับ 240.00 + (60 × 0.75) = 285.00 เมกะวัตต
ดังนั้น สวนเบี่ยงเบนควอรไทลเทากับ 285.00 11.125
2
−
= 136.94 เมกะวัตต
คาเฉลี่ยเลขคณิต = 1.06 1.28 743.90
16
+ + +
= 2885.94
16
= 180.37 เมกะวัตต
เนื่องจากสวนเบี่ยงเบนเฉลี่ย =
n
i
i 1
x X
n
=
−∑
ดังนั้น สวนเบี่ยงเบนเฉลี่ยเทากับ 179.31 179.09 563.53
16
+ + +
= 3204.08
16
= 200.26 เมกะวัตต
2. การวัดการกระจายของขอมูลชุดนี้โดยใชพิสัย คาที่วัดไดจะมีความถูกตองพอที่จะเชื่อถือได เพราะคา
ของขอมูลมีคาใกลเคียงกันไมมีคาที่สูงหรือต่ําผิดปกติ
3. ปริมาณการผลิตไมสักในประเทศไทยจําแนกตามจังหวัดในป พ.ศ. 2545 เรียงจากนอยไปมากไดดังนี้
39 44 45 50 426 678 884 6,284
(1) พิสัยเทากับ 6,284 – 39 = 6,245 ลูกบาศกเมตร
ตําแหนงที่ของ Q1 เทากับ 8 1
4
+
= 2.25
ดังนั้น Q1 มีคาอยูระหวาง 44 กับ 45
จะได Q1 เทากับ 44.25
ตําแหนงที่ของ Q3 เทากับ 3
(8 1)
4
+ = 6.75
ดังนั้น Q3 มีคาอยูระหวาง 678 กับ 884
จะได Q3 มีคาเทากับ 678 + (206 × 0.75) = 832.50 ลูกบาศกเมตร
55
ดังนั้น สวนเบี่ยงเบนควอรไทลเทากับ 832.50 44.25
2
−
= 394.125 ลูกบาศกเมตร
คาเฉลี่ยเลขคณิต = 39 44 45 50 426 678 884 6,284
8
+ + + + + + +
= 8,450
8
= 1,056.25 ลูกบาศกเมตร
เนื่องจากสวนเบี่ยงเบนเฉลี่ย =
n
i
i 1
x X
n
=
−∑
จะไดสวนเบี่ยงเบนเฉลี่ย
= 10,17.25 10,12.25 1,011.25 1,006.25 630.25 378.25 172.25 5,227.75
8
+ + + + + + +
= 10,455.50
8
= 1,306.94 ลูกบาศกเมตร
(2) เมื่อเปรียบเทียบคาพิสัย สวนเบี่ยงเบนควอรไทล และสวนเบี่ยงเบนเฉลี่ย แลวการวัดการกระจาย
ของขอมูลชุดนี้ไมควรใชพิสัย เพราะคาสูงสุดของชุดนี้สูงกวาคาอื่น ๆ มาก
(3) การวัดการกระจายของขอมูลชุดนี้ควรใชสวนเบี่ยงเบนควอรไทลจะเหมาะสมที่สุดเพราะคาของ
ขอมูลมีคาแตกตางกันมาก
4. การแจกแจงความถี่ของรายได
รายได จุดกึ่งกลาง
xi
จํานวนคนงาน
fi
ความถี่สะสม
fixi ix X− i if x X−
1500 – 1599
1600 – 1699
1700 – 1799
1800 – 1899
1900 – 1999
2000 – 2099
2100 - 2199
1549.5
1649.5
1749.5
1849.5
1949.5
2049.5
2149.5
20
70
120
100
60
20
10
20
90
210
310
370
390
400
30990
115465
209940
184950
116970
40990
21495
252.5
152.5
52.5
47.5
147.5
247.5
347.5
5050
10675
6300
4750
8850
4950
3475
400 720800 44050
56
จากตาราง จะได X = 720800
400
= 1802
ตําแหนงที่ของ Q1 เทากับ 400
4
= 100
ตําแหนงที่ของ Q1 อยูระหวางความถี่สะสม 90 กับ 210
ในอันตรภาคชั้น 1600 – 1699 กับ 1700 – 1799
จะได Q1 เทากับ 1699.5 + 100 10
( )
120
×
= 1707.83
ตําแหนงที่ของ Q3 เทากับ 3
(400)
4
= 300
ตําแหนงที่ของ Q3 อยูระหวางความถี่สะสม 210 กับ 310
ในอันตรภาคชั้น 1700 – 1799 กับ 1800 – 1899
จะได Q3 เทากับ 1799.5 + 100 90
( )
100
×
= 1889.5
ดังนั้น สวนเบี่ยงเบนควอรไทลเทากับ 1889.5 1707.83
2
−
= 181.67
2
= 90.835 บาท
จากตารางสวนเบี่ยงเบนเฉลี่ยเทากับ 44050
400
= 110.125 บาท
พิสัยเทากับ 2199.5 – 1499.5 = 700 บาท
เปรียบเทียบคาของสวนเบี่ยงเบนควอรไทล และสวนเบี่ยงเบนเฉลี่ยกับคาพิสัย
จะพบวาพิสัยมีคาสูงกวาสวนเบี่ยงเบนควอไทลและสวนเบี่ยงเบนเฉลี่ยมาก
5. (1) สวนเบี่ยงเบนควอรไทลของอัตราเร็วในการวิ่งของสัตวเลี้ยงเทากับ 40 30
2
−
= 5
สวนเบี่ยงเบนควอรไทลของอัตราเร็วในการวิ่งของสัตวปาเทากับ 43.5 27.5
2
−
= 8
(2) สัตวปามีการกระจายของขอมูลมากกวาสัตวเลี้ยง
6. (1) ขอมูล 1 2 3 4 5 6
ตําแหนงที่ของ Q1 เทากับ 6 1
4
+
= 1.75
จะได Q1 เทากับ 1.75
ตําแหนงที่ของ Q2 เทากับ 2
(6 1)
4
+ = 3.50
จะได Q2 เทากับ 3.50
ตําแหนงที่ของ Q3 เทากับ 3
(6 1)
4
+ = 5.25
จะได Q3 เทากับ 5.25
สวนเบี่ยงเบนควอรไทลเทากับ 5.25 1.75
2
−
= 1.75
57
(2) ขอมูล 1 2 3 4 5 6 7
ตําแหนงที่ของ Q1 เทากับ 7 1
4
+
= 2
จะได Q1 เทากับ 2
ตําแหนงที่ของ Q2 เทากับ 2
(7 1)
4
+ = 4
จะได Q2 เทากับ 4
ตําแหนงที่ของ Q3 เทากับ 3
(7 1)
4
+ = 6
จะได Q3 เทากับ 6
สวนเบี่ยงเบนควอรไทลเทากับ 6 2
2
−
= 2
(3) ขอมูล 1 2 3 4 5 6 7 8
ตําแหนงที่ของ Q1 เทากับ 8 1
4
+
= 2.25
จะได Q1 เทากับ 2.25
ตําแหนงที่ของ Q2 เทากับ 2
(8 1)
4
+ = 4.5
จะได Q2 เทากับ 4.5
ตําแหนงที่ของ Q3 เทากับ 3
(8 1)
4
+ = 6.75
จะได Q3 เทากับ 6.75
สวนเบี่ยงเบนควอรไทลเทากับ 6.75 2.25
2
−
= 2.25
(4) ขอมูล 1 2 3 4 5 6 7 8 9
ตําแหนงที่ของ Q1 เทากับ 9 1
4
+
= 2.5
จะได Q1 เทากับ 2.5
ตําแหนงที่ของ Q2 เทากับ 2
(9 1)
4
+ = 5
จะได Q2 เทากับ 5
ตําแหนงที่ของ Q3 เทากับ 3
(9 1)
4
+ = 7.5
จะได Q3 เทากับ 7.5
สวนเบี่ยงเบนควอรไทลเทากับ 7.5 2.5
2
−
= 2.5
58
เฉลยแบบฝก 1.3 (ข)
1. ราคาเครื่องสําอางชนิดหนึ่งที่นํามาเปนตัวอยางจากรานคา 8 แหง เรียงจากนอยไปมากดังนี้
400 410 410 410 410 415 425 640
พิสัยเทากับ 640 – 400 = 240 บาท
คาเฉลี่ยเลขคณิต (X) = 400 4(410) 415 425 640
8
+ + + +
= 3520
8
= 440 บาท
สวนเบี่ยงเบนมาตรฐาน (s) =
n
2
i
i 1
(x X)
n 1
=
−
−
∑
=
2 2 2 2 2
( 40) 4( 30) ( 25) ( 15) (200)
8 1
− + − + − + − +
−
= 46050
7
= 81.11 บาท
สวนเบี่ยงเบนเฉลี่ย =
n
i
i 1
x X
n
=
−∑
= 40 4(30) 25 15 200
8
+ + + +
= 400
8
= 50 บาท
ตําแหนงที่ของ Q1 เทากับ 8 1
4
+
= 2.25
จะได Q1 เทากับ 410
ตําแหนงที่ของ Q3 เทากับ 3
(8 1)
4
+ = 6.75
จะได Q3 เทากับ 415 + (10 × 0.75) = 422.5
จะไดสวนเบี่ยงเบนควอรไทลเทากับ 422.5 410
2
−
= 6.25 บาท
ดังนั้น การวัดการกระจายของขอมูลชุดนี้ ควรใชสวนเบี่ยงควอรไทลจึงเหมาะสมกับขอมูลที่สุด
เนื่องจากราคาเครื่องสําอาง 640 บาท เปนคาที่สูงผิดปกติเมื่อเปรียบเทียบกับคาอื่นๆ
59
2. ปริมาณน้ําฝนจําแนกตามจังหวัด
จังหวัด ปริมาณน้ําฝน (xi) xi – X (xi – X )2
ขอนแกน
ชัยภูมิ
นครพนม
มุกดาหาร
รอยเอ็ด
เลย
สกลนคร
สุรินทร
หนองคาย
อุดรธานี
1,402.6
927.5
2,995.9
1,901.7
1,357.2
1,414.8
1,888.6
1,857.9
2,247.5
1,777.0
–374.47
–849.57
1218.83
124.63
–419.87
–362.27
111.53
80.83
470.43
–0.07
140227.78
721769.19
1485546.57
15532.64
176290.82
131239.55
12438.94
6533.49
221304.39
0.005
รวม 17770.7 2910883.36
จากตัวอยางที่ 3 จะได X = 1,777.07 มิลลิเมตร
เนื่องจากความแปรปรวน s2
=
2n
i
i 1
(x X)
n 1=
−
−
∑
= 2910883.36
10 1−
= 323,431.49 มิลลิเมตร
ดังนั้น สวนเบี่ยงเบนมาตรฐานเทากับ 568.71 มิลลิเมตร
3. ราคาสินคาชนิดหนึ่งที่ขายตามรานตาง ๆ ในสองทองที่
ราคา (บาท)
ทองที่ที่หนึ่ง 50 52 45 55 54 48 53
ทองที่ที่สอง 40 50 51 52 51 51 62 53 49
หา X และ s2
ของทั้งสองทองที่รวมกัน
X = 50 52 45 48 53 40 50 53 49
7 9
+ + + + + + + + + +
+
= 816
16
= 51 บาท
s2
=
2 2 2 2 2 2 2 2 2 2 2 2 2
( 1) 1 ( 6) 4 3 ( 3) 2 ( 11) ( 1) 1 11 2 ( 2)
(7 9) 1
− + + − + + + − + + − + − + + + + −
+ −
= 328
15
= 21.87
ดังนั้นความแปรปรวนของสินคาในสองทองที่ เทากับ 21.87 บาท
60
4. อายุของครอบครัวนี้เปน 45 42 20 17 16 14
จะไดวา คาเฉลี่ยเลขคณิตเทากับ 45 42 20 17 16 14
6
+ + + + +
= 154
6
= 25.67 ป
ความแปรปรวน เทากับ
2 2 2 2 2 2
245 42 20 17 16 14
(25.67)
6
+ + + + +
− = 4930
658.9489
6
−
= 162.72 ป
สวนเบี่ยงเบนมาตรฐานเทากับ 12.76 ป
ในอีก 5 ปขางหนา สวนเบี่ยงเบนมาตรฐาน และความแปรปรวนของอายุสมาชิกในครอบครัวนี้จะมี
คาเทาเดิม เนื่องจากขอมูลแตละคาเพิ่มขึ้นเทาเดิม
5. จากขอมูล n = 20 X = 10 และ s = 2
ผลรวมของขอมูล
20
i
i 1
x
=
∑ เทากับ 20 × 10 = 200
เพราะวา s2
=
n
2
i
2i 1
x
(X)
n 1
=
−
−
∑
จะได
20
2
i
i 1
x
=
∑ = 2 2
(s (X) )(n 1)+ −
= (104)(19) = 1976
แตบันทึกขอมูลผิดพลาดจาก 12 บันทึกเปน 8
ดังนั้น
20
i
i 1
x
=
∑ ที่ถูกตองเทากับ 200 – 8 + 12 = 204
20
2
i
i 1
x
=
∑ ที่ถูกตองเทากับ 1976 – 64 + 144 = 2056
จะได คาเฉลี่ยเลขคณิตที่ถูกตองเทากับ 204
10.2
20
=
สวนเบี่ยงเบนมาตรฐานที่ถูกตองเทากับ 22056
(10.2)
20 1
−
−
= 4.17 = 2.04
6. จากสูตร s1 =
n
2
i
i 1
(x X)
n 1
=
−
−
∑
และ s2 =
n
2
i
i 1
(x X)
n
=
−∑
เมื่อใช n – 1 เปนตัวหารจะใหผลลัพธมากกวาใช n เปนตัวหาร
และนิยมใชสูตร s1 =
n
2
i
i 1
(x X)
n 1
=
−
−
∑
เปนสูตรที่ใชประมาณสวนเบี่ยงเบนมาตรฐานของ
ประชากร (σ) ซึ่งเปนการใชขอมูลตัวอยางไปสรุปผลขอมูลประชากร สูตรที่หารดวย n – 1 ใหขอ
ผิดพลาดในการสรุปผิดนอยกวา (Watkins, 2004 p. 65)
61
7. จากตัวอยางที่ 7 สวนเบี่ยงเบนมาตรฐานและคาเฉลี่ยของอายุขัยของสัตวเลี้ยงลูกดวยนมเปน 4.67 ป
และ 11 ป ตามลําดับ หมายความวา สัตวเลี้ยงลูกดวยนมที่นํามาเปนตัวอยางมีอายุตางจาก 11 ป โดย
เฉลี่ย4.67 ป ดังนั้นคําตอบจึงใช แตไมไดหมายความวาตองมีบางตัวอายุ 11 – 4.67 = 6.33 ป หรือมี
บางตัวอายุ 11 + 4.67 = 15.67 ป เพราะสวนเบี่ยงเบนมาตรฐานเหมือนกับการเฉลี่ยความแตกตาง
ของขอมูลจากคากลางดังนั้นขอมูลแตละตัวไมจําเปนตองตรงกับคาที่ไดจากการบวกและลบสวนเบี่ยง
เบนมาตรฐานกับคากลาง
8. สวนเบี่ยงเบนมาตรฐานมีหนวยเปนป
มัธยฐานมีหนวยเปนป
พิสัยมีหนวยเปนป
กึ่งชวงควอรไทลมีหนวยเปนป
เฉลยแบบฝกหัด 1.3 (ค)
1. อายุของบุตรในครอบครัวที่หนึ่ง (ป) 6 5 3 1
อายุของบุตรในครอบครัวที่สอง (ป) 25 24 22 21 17
(1) เนื่องจากสัมประสิทธิ์ของพิสัย = max min
max min
x x
x x
−
+
ดังนั้น สัมประสิทธิ์ของพิสัยของครอบครัวที่หนึ่ง = 6 1
6 1
−
+
= 0.714
สัมประสิทธิ์ของพิสัยของครอบครัวที่สอง = 25 17
25 17
−
+
= 0.190
จะได อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง
(2) เนื่องจากสัมประสิทธิ์ของสวนเบี่ยงเบนควอรไทล = 3 1
3 1
Q Q
Q Q
−
+
ตําแหนงที่ของ Q1 ของครอบครัวที่หนึ่งเทากับ 4 1
4
+
= 1.25
จะได Q1 ของครอบครัวที่หนึ่งเทากับ 1 + (2 × 0.25) = 1.5
ตําแหนงที่ของ Q3 ของครอบครัวที่หนึ่งเทากับ 3
(4 1)
4
+ = 3.75
จะได Q3 ของครอบครัวที่หนึ่งเทากับ 5 + (1 × 0.75) = 5.75
สัมประสิทธิ์สวนเบี่ยงเบนควอรไทลครอบครัวที่หนึ่งเทากับ 5.75 1.5
5.75 1.5
−
+
= 0.586
ตําแหนงที่ของ Q1 ของครอบครัวที่สองเทากับ 5 1
4
+
= 1.5
จะได Q1 ของครอบครัวที่สองเทากับ 17 + (4 × 0.5) = 19
ตําแหนงที่ของ Q3 ของครอบครัวที่สองเทากับ 3
(5 1)
4
+ = 4.5
จะได Q3 ของครอบครัวที่สองเทากับ 24 + (1 × 0.5) = 24.5
62
สัมประสิทธิ์สวนเบี่ยงเบนควอรไทลที่สองเทากับ 24.5 19
24.5 19
−
+
= 0.126
จะได อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง
(3) เนื่องจากสัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ย = M.D.
X
X ของครอบครัวที่หนึ่งเทากับ 6 5 3 1
4
+ + +
= 3.75
M.D. ของครอบครัวที่หนึ่งเทากับ 2.25 1.25 0.75 2.75
4
+ + +
= 1.75
สัมประสิทธิ์สวนเบี่ยงเบนเฉลี่ยครอบครัวที่หนึ่งเทากับ 1.75
3.75
= 0.467
X ของครอบครัวที่สองเทากับ 25 24 22 21 17
5
+ + + +
= 21.8
M.D. ของครอบครัวที่สองเทากับ 3.2 2.2 0.2 0.8 4.8
5
+ + + +
= 2.24
สัมประสิทธิ์สวนเบี่ยงเบนเฉลี่ยครอบครัวที่สองเทากับ 2.24
21.8
= 0.103
จะไดอายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง
(4) เนื่องจากสัมประสิทธิ์ของการแปรผัน = s
X
s ของครอบครัวที่หนึ่งเทากับ
2 2 2 2
(2.25) (1.25) ( 0.75) ( 2.75)
4 1
+ + − + −
−
= 14.75
3
= 2.217
สัมประสิทธิ์การแปรผันของครอบครัวที่หนึ่งเทากับ 2.217
3.75
= 0.591
s ของครอบครัวที่สองเทากับ
2 2 2 2 2
(3.2) (2.2) (0.2) ( 0.8) ( 4.8)
5 1
+ + + − + −
−
= 38.8
4
= 3.114
สัมประสิทธิ์การแปรผันของครอบครัวที่สองเทากับ 3.114
21.8
= 0.143
จะได อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง
ผลของการเปรียบเทียบที่ไดจากขอ (1) – (4) เหมือนกัน
สรุปไดวา อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง
63
2. จากโจทยเรียงลําดับขอมูลจากนอยไปหามากไดดังนี้
ราคาขาวเปลือก (บาท) 71 72 73 74 75 76
ราคาขาวสาร (บาท) 110 112 114 115 117 118
X ของราคาขาวเปลือก เทากับ 71 72 73 74 75 76
6
+ + + + +
= 441
6
= 73.5
s ของราคาขาวเปลือกเทากับ
2 2 2 2 2 2
( 2.5) ( 1.5) ( 0.5) (0.5) (1.5) (2.5)
6 1
− + − + − + + +
−
= 17.5
5
= 1.871
สัมประสิทธิ์การแปรผันของราคาขาวเปลือกเทากับ 1.871
73.5
= 0.025
X ของราคาขาวสาร เทากับ 110 112 114 115 117 118
6
+ + + + +
= 686
6
= 114.33
s ของราคาขาวสารเทากับ
2 2 2 2 2 2
( 4.33) ( 2.33) ( 0.33) (0.67) (2.67) (3.67)
6 1
− + − + − + + +
−
= 45.3334
5
= 3.011
สัมประสิทธิ์การแปรผันของราคาขาวสารเทากับ 3.011
114.33
= 0.026
สัมประสิทธิ์ของพิสัยของราคาขาวเปลือก เทากับ 76 71
76 71
−
+
= 0.034
สัมประสิทธิ์ของพิสัยของราคาขาวสารเทากับ 118 110
118 110
−
+
= 0.035
จากคาที่ไดจะสรุปไดวา ราคาของขาวเปลือกตอถังมีการกระจายนอยกวาราคาขาวสารตอถัง
3. เนื่องจากสัมประสิทธิ์ของการแปรผันเทากับ s
X
ดังนั้น สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ป.2 ไดเทากับ 24
18
= 0.272
สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ป.6 ไดเทากับ 40
20
= 0.316
สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ม.3 ไดเทากับ 40
22
= 0.287
สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ม.6 ไดเทากับ 51
25
= 0.286
จะเห็นวา การกระจายของจํานวนเงินที่นักเรียน ป.2 ไดมาใชนอยที่สุด หมายความวานักเรียน ป. 2
ไดเงินจากผูปกครองใกลเคียงกันมากกวานักเรียน ป. 6, ม. 3 และ ม. 6 และการกระจายของจํานวน
เงินที่นักเรียน ป.6 ไดมาใชมากที่สุด หมายความวานักเรียน ป. 6 ไดเงินจากผูปกครองแตกตางกัน
มากกวานักเรียนหองอื่น ๆ
64
4. เนื่องจากสัมประสิทธิ์ของพิสัยเทากับ max min
max min
x x
x x
−
+
จะได 0.0625 = min
min
170 x
170 x
−
+
10.625 + 0.0625xmin = 170 – xmin
1.0625xmin = 159.375
xmin = 150
ดังนั้น ความสูงของนักเรียนคนที่เตี้ยที่สุดในชั้นเทากับ 150 เซนติเมตร
5. เนื่องจากสัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ยเทากับ M.D.
X
จะได 0.12 = 8.5
X
X = 8.5
0.12
= 70.83
เนื่องจากสัมประสิทธิ์ของการแปรผันเทากับ s
X
จะได สัมประสิทธิ์ของการแปรผันเทากับ 10
70.83
= 0.141
6. (1)
(2) ไมจําเปน ขึ้นอยูกับคาของขอมูลที่นํามาคํานวณ
(3) ไมจําเปน เพราะเปนสวนเบี่ยงเบนควอรไทลหาจากคาควอรไทลที่ 3 และ 1 จะไดผล
อยางไรอยูที่คาของตัวเลขซึ่งไมจําเปนตองเทากับมัธยฐาน
(4) สวนเบี่ยงเบนเฉลี่ยตองมีคามากกวาหรือเทากับศูนยเสมอเพราะสวนเบี่ยงเบนเฉลี่ยเปน
การเฉลี่ยผลตางโดยใชจํานวนมากเปนตัวตั้งจํานวนนอยเปนตัวลบจึงไมมีทางนอยกวาศูนย
(5) สวนเบี่ยงเบนมาตรฐานตองมีคามากกวาหรือเทากับศูนยเสมอ
(6) เชน กรณีที่สวนเบี่ยงเบนมาตรฐานเปน 1
(7)
(8)
(9) สวนเบี่ยงเบนมาตรฐานใชวัดการกระจายสําหรับขอมูลเพียงชุดเดียว ไมสามารถนํามาใช
เปรียบเทียบกับการกระจายของขอมูล 2 ชุด ถาตองการเปรียบเทียบขอมูล 2 ชุด ตองใช
สัมประสิทธิ์การแปรผัน
65
7. ถามีขอมูลผิดปกติจะมีผลกระทบตอการหาคาเฉลี่ยเลขคณิต เพราะตองใชทุกคาของขอมูลมาคํานวณ
สวนการวัดการกระจายที่มีการเปลี่ยนแปลงไปมากเนื่องจากคาผิดปกติ คือ คาพิสัย เพราะตองใชคา
มากสุด และคานอยสุดในการคํานวณในกรณีที่ขอมูลผิดปกติ จะไมมีผลกระทบหรือมีผลกระทบนอย
ตอคากลางที่คํานวณโดยการหาคามัธยฐานหรือฐานนิยม สวนการวัดการกระจายที่ไมมีผลกระทบ
หรือมีผลกระทบนอย คือ คาสวนเบี่ยงเบนควอรไทล เพราะไมไดเอาคาต่ําสุด หรือสูงสุดมาใช
คํานวณ
8.
จังหวัด ความเสียหายรวม (ลานบาท)
กระบี่
พังงา
ระนอง
ตรัง
ภูเก็ต
สตูล
321.3
1,077.4
203.3
43.0
188.6
109.2
หาสวนเบี่ยงเบนมาตรฐาน และสัมประสิทธิ์ของพิสัย
X = 321.3 1,077.4 203.3 43.0 188.6 109.2
6
+ + + + +
= 323.8
จาก s =
n
2
i
i 1
(x X)
n 1
=
−
−
∑
จะได s =
2 2 2
(321.3 323.8) (1,077.4 323.8) (109.2 323.8)
6 1
− + − + + −
−
= 145124.1 = 380.95
สัมประสิทธิ์ของพิสัย = max min
max min
x x
x x
−
+
= 1,077.4 43.0
1,077.4 43.0
−
+
= 1034.40
1120.40
= 0.923
66
9. จากตาราง
หองปฏิบัติการหนวย
ทดลอง LAB 1 LAB 2 LAB 3 LAB 4
1
2
3
85.06
85.25
84.87
84.99
84.28
84.88
84.48
84.72
85.10
84.10
84.55
84.05
สัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ย = M.D.
X
M.D =
n
i
i 1
x X
n
=
−∑
คาเฉลี่ยของรอยละเมทิลแอลกอฮอลของหองปฏิบัติการที่ 3 คือ
84.48 84.72 85.10
3
+ +
= 84.77
จะได M.D. =
84.48 84.77 84.72 84.77 85.10 84.77
3
− + − + −
= 0.223
สัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ยของรอยละของเมทิลแอลของหองปฏิบัติการที่ 3 คือ
0.223
84.77
= 0.0026
คาเฉลี่ยของรอยละของเมทิลแอลกาฮอลของหองปฏิบัติการที่ 4 คือ
84.10 84.55 84.05
3
+ +
= 84.23
จะได M.D. =
84.10 84.23 84.55 84.23 84.05 84.23
3
− + − + −
= 0.21
สัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ยของรอยละของเมทิลแอลกอฮอลของหองปฏิบัติการที่ 4 คือ
6.21
84.23
= 0.0025

More Related Content

PDF
แผนการวัดผล(ตัวชี้วัด)ม.3พื้นฐาน
PDF
01real
PDF
คณิตศาสตร์เพิ่มเติม 1 ค 31201
PDF
แผนการวัดผล(ผลการเรียนรู้ที่คาดหวังม.4)
PDF
ข้อสอบกลางวิชาคณิตศาสตร์ ม.2 ฉบับที่ 3 ปี 2558
PDF
หน่วยที่ 3 เลขยกกำลัง ม.1
PDF
แผน 2คณิตศาสตร์เพิ่มเติม3
แผนการวัดผล(ตัวชี้วัด)ม.3พื้นฐาน
01real
คณิตศาสตร์เพิ่มเติม 1 ค 31201
แผนการวัดผล(ผลการเรียนรู้ที่คาดหวังม.4)
ข้อสอบกลางวิชาคณิตศาสตร์ ม.2 ฉบับที่ 3 ปี 2558
หน่วยที่ 3 เลขยกกำลัง ม.1
แผน 2คณิตศาสตร์เพิ่มเติม3

What's hot (19)

PDF
3หลักสูตรคณิตเพิ่มเติมม.ต้น
PDF
หน่วยที่2 ระบบจำนวนเต็ม ม.1
DOCX
แผนการสอน 32102 สัปดาห์ 1
PDF
แผนการจัดการเรียนรู้ที่ 1 เรื่อง ทบทวนการแก้สมการเชิงเส้นตัวแปรเดี่ยว
PDF
แผนการเรียนรู้คณิตศาสตร์ม.3 ชุด 2
PDF
ใบความรู้ เรื่องสถิติ
PDF
ตัวชี้วัดและสาระการเรียนรู้แกนกลาง ม.ปลาย
PDF
แบบทดสอบความสามารถด้านเหตุผลปีการศึกษา2559
PDF
คำอธิบายรายวิชาม.2ปรับอ.สมนึก
PDF
ข้อสอบตามตัวชี้วัด คณิตศาสตร์ ม3ภาคเรียนที1
PDF
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
PDF
บทความวิชาการ
PDF
บทที่ 1 สถิติและการวิเคราะห์ข้อมูล
PDF
แผนลำดับ
PDF
แผน3 4คณิตศาสตร์เพิ่มเติม3
3หลักสูตรคณิตเพิ่มเติมม.ต้น
หน่วยที่2 ระบบจำนวนเต็ม ม.1
แผนการสอน 32102 สัปดาห์ 1
แผนการจัดการเรียนรู้ที่ 1 เรื่อง ทบทวนการแก้สมการเชิงเส้นตัวแปรเดี่ยว
แผนการเรียนรู้คณิตศาสตร์ม.3 ชุด 2
ใบความรู้ เรื่องสถิติ
ตัวชี้วัดและสาระการเรียนรู้แกนกลาง ม.ปลาย
แบบทดสอบความสามารถด้านเหตุผลปีการศึกษา2559
คำอธิบายรายวิชาม.2ปรับอ.สมนึก
ข้อสอบตามตัวชี้วัด คณิตศาสตร์ ม3ภาคเรียนที1
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
บทความวิชาการ
บทที่ 1 สถิติและการวิเคราะห์ข้อมูล
แผนลำดับ
แผน3 4คณิตศาสตร์เพิ่มเติม3
Ad

Similar to Add m6-1-chapter1 (20)

PDF
Epi info unit09
PDF
สรุปสถิติ
DOCX
สูตรสถิติ
PDF
4. กลวิธี star
PPT
สื่อการสอนวิชาคณิตศาสตร์ลองทำ
PDF
Statistic1
PDF
Statistical research for work - OpenOffice.org Calc
PDF
statistics
PDF
ข้อสอบปลายภาค คณิต ม.5 ฉบับที่ 1
PPT
การวิเคราะห์ข้อมูลเชิงปริมาณ
DOC
สถิติ
PDF
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
PDF
58 statistics
PDF
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
PDF
สถิติเบื้องต้นกลุ่ม 2 สำรอง
PDF
สถิติเบื้องต้นกลุ่ม 2 สำรอง
PDF
9789740328018
Epi info unit09
สรุปสถิติ
สูตรสถิติ
4. กลวิธี star
สื่อการสอนวิชาคณิตศาสตร์ลองทำ
Statistic1
Statistical research for work - OpenOffice.org Calc
statistics
ข้อสอบปลายภาค คณิต ม.5 ฉบับที่ 1
การวิเคราะห์ข้อมูลเชิงปริมาณ
สถิติ
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
58 statistics
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
สถิติเบื้องต้นกลุ่ม 2 สำรอง
สถิติเบื้องต้นกลุ่ม 2 สำรอง
9789740328018
Ad

More from กลุ่มสาระการเรียนรู้คณิตศาสตร์ โรงเรียนอุตรดิตถ์ (20)

Add m6-1-chapter1

  • 1. บทที่ 1 การวิเคราะหขอมูลเบื้องตน (40 ชั่วโมง) ผลการเรียนรูที่คาดหวัง 1. เลือกวิธีวิเคราะหขอมูลเบื้องตนและอธิบายผลการวิเคราะหขอมูลไดถูกตอง 2. นําความรูเรื่องการวิเคราะหขอมูลไปใชได ขอเสนอแนะ 1. ผูสอนควรทบทวนระดับของการวิเคราะหขอมูลที่กลาวไวในหนังสือเรียนสาระการเรียนรู พื้นฐาน คณิตศาสตรเลม 2 ชั้นมัธยมศึกษาปที่ 5 กอนในหัวขอ 1.2 ความหมายของสถิติ ที่แบงออกเปน สองสวน คือ การวิเคราะหขั้นตนที่มุงวิเคราะหเพื่ออธิบายลักษณะกวางๆ ของขอมูลชุดนั้น (สถิติเชิง พรรณนา) และการวิเคราะหขอมูลที่เก็บรวบรวมไดจากตัวแทนหรือตัวอยางเพื่ออางอิงไปถึงขอมูล ทั้งหมดหรือประชากร (สถิติเชิงอนุมาน) เนื่องจากในบทที่ 1 นี้จะกลาวถึงวิธีการคํานวณสถิติตาง ๆ โดยแยกวาเปนการคํานวณเพื่อใชในสถิติเชิงพรรณนาหรือการคํานวณเพื่อใชในสถิติเชิงอนุมาน 2. ในบทที่ 1 ไดกลาวถึงการวัดคากลางของขอมูล (คาเฉลี่ยเลขคณิต มัธยฐานและ ฐานนิยม) การวัดตําแหนงที่ (ควอรไทล เดไซล และเปอรเซ็นไทล) และ การวัดการกระจายของขอมูล (การวัด การกระจายสัมบูรณ และ การวัดการกระจายสัมพัทธ) โดยมีจุดมุงหมายเพื่อใหเลือกวิธีการวิเคราะห ขอมูลดังกลาวไดอยางเหมาะสม ผูสอนควรเนนผูเรียนวาวิธีการวิเคราะหขอมูลในบทที่ 1 นั้นเนนเฉพาะขอมูลเชิงปริมาณ และกลาวถึงเฉพาะวิธีการที่ใชสรุปขอมูลในรูปของตัวเลข ซึ่ง การสรุปขอมูลนี้มีความจําเปนโดย เฉพาะอยางยิ่งในกรณีที่ขอมูลมีจํานวนมากเพื่อผูใชจะไดเห็นภาพรวมๆ ของขอมูลชุดนั้นหรือเพื่อ ใหไดจํานวนจํานวนหนึ่งที่สามารถเก็บสารสนเทศของขอมูลทั้งหมดนั้นได นอกจากนั้นการวิเคราะห ขอมูลในบทที่ 1 นี้จะเนนการใชสถิติในสวนของสถิติเชิงพรรณนา แตมีการกลาวถึงการคํานวณคา สถิติในกรณีที่ใชกับสถิติเชิงอนุมานควบคูไปดวย เพื่อเปนแนวทางสําหรับนักเรียนในการศึกษาตอในระดับ ที่สูงขึ้นและการใชสถิติในระดับที่สูงขึ้นจะเกี่ยวของกับสถิติเชิงอนุมานเปนสวนใหญ ดังนั้นผูเรียน จะเห็นการคํานวณสถิติตัวเดียวกันแตใชสูตรที่แตกตางกันบางขึ้นอยูกับวาเปนการคํานวณเพื่อใชใน ของสถิติเชิงพรรณนาหรือสถิติเชิงอนุมาน
  • 2. 2 การเลือกใชวิธีการสรุปขอมูลในบทที่ 1 นี้ โดยทั่วไปแลวขึ้นอยูกับ (1) ลักษณะของขอมูลวาเปนขอมูลเชิงปริมาณหรือขอมูลเชิงคุณภาพ หรือระดับการ วัดของขอมูล แมวาในบทที่ 1 จะเนนการวิเคราะหขอมูลเชิงปริมาณก็ตาม แตไดกลาวถึงการใชฐาน นิยมเพื่อสรุปขอมูลเชิงคุณภาพไวดวย เนื่องจากคากลางชนิดอื่นนั้นไมสื่อความหมายหรือคํานวณไมไดหาก นํามาใชกับขอมูลเชิงคุณภาพ (2) ลักษณะการแจกแจงของขอมูล วามีลักษณะสมมาตรหรือใกลเคียงแบบสมมาตร หรือมีลักษณะเบเนื่องจากมีคาที่สูงกวาปกติหรือมีคาที่ต่ํากวาปกติอยูจํานวนหนึ่ง ผูใชจึงควรสรุปขอมูล ดวยกราฟกอนเพื่อใหเห็นลักษณะการแจกแจงของขอมูลชุดนั้นๆ (3) ระดับของการวิเคราะหขอมูลวาเปนการวิเคราะหขอมูลเบื้องตนในสถิติเชิงพรรณนา หรือการวิเคราะหขอมูลเพื่อใชในสถิติเชิงอนุมาน เพื่อใหเลือกใชสูตรการคํานวณหรือเลือกฟงกชันที่มีใน เครื่องคํานวณไดอยางถูกตอง อนึ่งสําหรับการวิเคราะหขอมูลโดยทั่วไปยังขึ้นอยูกับวัตถุประสงคของการศึกษาในเรื่อง นั้นๆ ดวย เชนตองการพรรณนาขอมูล ตองการเปรียบเทียบคากลางของขอมูลสองชุด หรือตองการ ศึกษาความสัมพันธระหวางตัวแปรสองตัว เปนตน 3. การคํานวณสถิติในบทที่ 1 จะเห็นวาแบงออกเปนสองลักษณะไดแก การคํานวณสถิติ เมื่อทราบขอมูลดิบหรือทราบคาของขอมูลแตละคาอยางแนนอน และการคํานวณสถิติเมื่อไดมีการสรุป ขอมูลชุดนั้นในรูปของตารางแจกแจงความถี่ (มีการแบงออกเปนอันตรภาคชั้น) ซึ่งในกรณีที่สองนี้ อาจเกิดจากผูใชไดขอมูลจากแหลงทุติยภูมิที่นําเสนอขอมูลในรูปของตารางแจกแจงความถี่ ใหผูสอน เนนกับผูเรียนวาในทางปฏิบัติถาทําการเก็บขอมูลจากแหลงปฐมภูมิและไดขอมูลดิบใหคํานวณสถิติจาก ขอมูลดิบที่ทราบคาของขอมูลแตละคาโดยใชเครื่องคอมพิวเตอรประมวลผลดังนั้นเราจะหันมาเลือกใชวิธี การคํานวณหรือสูตรที่ใชสําหรับขอมูลที่มีการแจกแจงความถี่ไวแลวเฉพาะในกรณีที่ไมทราบคาของ ขอมูลแตละตัวเทานั้น สําหรับขอมูลที่แจกแจงความถี่ในรูปของตารางแจกแจงความถี่ที่มีการใชอันตภาคชั้น ใหผูสอน เนนผูเรียนวา คาสถิติใดๆ ที่คํานวณจากตารางแจกแจงความถี่นี้เปนคาโดยประมาณเทานั้น ไมใช คาที่แนนอนเหมือนในกรณีที่ทราบขอมูลจริงของคาสังเกตแตละคา เชน เปนคาเฉลี่ยเลขคณิตโดย ประมาณ คามัธยฐานโดยประมาณ เปนตน ดังนั้นผูสอนจึงไมควรเนนในเรื่องของสูตรที่ยุงยาก และ การคํานวณตางๆ หากผูเรียนสามารถคาดเดาไดวาคาที่ตองการควรจะอยูในชวงใด มีคาระหวางคา ใด และหมายถึงอะไรนําไปใชไดอยางไรเพียงเทานี้นาจะเปนการเพียงพอแลว 4. การพิจารณาขอมูลที่มีคาสูงผิดปกติหรือขอมูลที่มีคาต่ําผิดปกติ มีวิธีพิจารณาหลายวิธี วิธีหนึ่งไดแก การคํานวณควอรไทลที่สาม (Q3) และควอรไทลที่หนึ่ง (Q1) จากนั้นหาผลตางระหวาง ควอรไทลที่สาม(Q3)และควอรไทลที่หนึ่ง(Q1)(InterquartileRange หรือ IQR)ซึ่งคือ Q3 – Q1 เราจะเรียกคาสังเกตนั้นวา คานอกกลุม(outlier) ถาคาสังเกตอยูในตําแหนงที่สูงกวาควอรไทลที่สาม ไปเปนระยะทาง 1.5 เทาของ IQR (หรือมีคามากกวา Q3 + (1.5 × (IQR))) หรืออยูในตําแหนงที่
  • 3. 3 * ต่ํากวาควอรไทลที่หนึ่งไปเปนระยะทาง 1.5 เทาของ IQR (หรือมีคานอยกวา Q1 – (1.5 × (IQR))) ตัวอยางเชน ผูจําหนายเครื่องใชไฟฟาบริษัทหนึ่งทําการเก็บขอมูลระยะเวลา (หนวยเปนวัน) ที่ลูกคาใชในการชําระเงินนับตั้งแตไดรับใบสงของ เปนดังนี้ 13 13 13 20 26 27 31 34 34 34 35 35 36 37 38 41 41 41 45 47 47 47 50 51 53 54 56 62 67 82 จากขอมูลนี้ Q1 = 33.25 และ Q3 = 50.25 ดังนั้น IQR = 50.25 – 33.25 = 17 นั่นคือ Q1 – 1.5 (17) = 7.75 และ Q3 + 1.5(17) = 75.75 เมื่อตรวจสอบขอมูลชุดนี้ ไมมีคาสังเกตใดที่ต่ํากวา 7.75 แตมีคาสังเกต 1 คาที่มากกวา 75.75 ไดแก 82 จึงถือวาระยะเวลาจํานวน 82 วันนี้ เปนคานอกกลุมที่มีคาสูงผิดปกติ สวนใหญในการสรางแผนภาพกลอง นิยมแสดงคานอกกลุมดวยเครื่องหมาย ดอกจัน (*) ดังนี้ (แผนภาพจากการใชโปรแกรมสําเร็จรูปทางสถิติ MINITAB) 5. ผูสอนควรบอกใหผูเรียนเขาใจตรงกันวาคําวาคาเฉลี่ยประชากร นั้นเปนคาคงที่สําหรับ ประชากรหนึ่ง ๆ สวนคําวาคาเฉลี่ยตัวอยางที่ใชสําหรับคาดเดาหรือประมาณคาเฉลี่ยประชากรนั้นจะมี คาแตกตางกันไปในแตละครั้งของการเลือกตัวอยางซึ่งเปนการกระทําซ้ํา ๆ กันดวยขนาดตัวอยางเทาเดิมจาก ประชากรเดียวกัน แมวาแตละครั้งนั้นจะใชคาเฉลี่ยที่ไดจากตัวอยางซึ่งมีคาไมเทากันในการเลือกตัวอยาง แตละครั้ง เพื่อประมาณคาเฉลี่ยประชากร (ซึ่งมีเพียงคาเดียว) ก็ตาม ในทางปฏิบัติจะเลือกตัวอยาง เพียงชุดเดียว ดังนั้นมักจะไมทราบวาคาเฉลี่ยตัวอยางที่คํานวณจากขอมูลแตละชุดใหคาที่แตกตางกัน หรือไม และแตกตางกันอยางไร
  • 4. 4 ตัวอยางเชน บริษัทแหงหนึ่งมีพนักงานทั้งสิ้น40คน ขอมูลตอไปนี้แสดงจํานวนป(ปดเศษขึ้น ถาจํานวนเดือนมากกวาหกเดือน และปดเศษลงถาจํานวนเดือนนอยกวาหกเดือน) ที่พนักงานทํางาน หรือประสบการณการทํางานของพนักงานแตละคนในบริษัทนี้ 11 4 18 2 1 2 0 2 2 4 3 4 1 2 2 3 3 19 8 3 7 1 0 2 7 0 4 5 1 14 16 8 9 1 1 2 5 10 2 3 ถาขอมูลขางตน (คาสังเกตจากพนักงานทั้งหมด 40 คา) ประกอบกันเปนประชากรที่สนใจ ศึกษาจะไดจํานวนปโดยเฉลี่ยในการทํางานของพนักงานคือ 11 4 18 ... 2 3 40 + + + + + µ = = 4.80 ป เมื่อ เจาของบริษัทตองการจัดตั้งคณะกรรมการจํานวน 5 คนเพื่อหาขอมูลเกี่ยวกับการประกันสุขภาพที่ จะทําใหกับพนักงานทั้งหมด ดวยการเลือกคณะกรรมการโดยสุมจํานวน 5 คน หลายๆ ครั้งเพื่อ พิจารณาวาประสบการณการทํางานโดยเฉลี่ยของคณะกรรมการจะแตกตางจากประสบการณการ ทํางานโดยเฉลี่ยของพนักงานทั้งหมดหรือไม ตัวอยางขนาด 5 คน ในแตละครั้งและคาเฉลี่ยตัวอยาง แสดงดังนี้ ตัวอยางกลุมที่ ขอมูลจากตัวอยาง คาเฉลี่ยตัวอยาง (X ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 9 0 19 14 7 4 4 1 3 8 19 8 2 1 4 18 2 0 11 4 2 4 7 18 1 2 0 3 2 2 3 2 0 2 11 2 9 2 4 9 0 4 2 7 1 1 1 11 1 2 0 0 10 2 0 2 3 2 16 2 3 1 1 1 3 7 3 4 3 1 2 3 1 4 8.6 3.8 7.6 7.0 7.0 1.6 1.8 5.6 4.4 3.0 2.8 4.6 1.6 4.0 2.2
  • 5. 5 ใหสังเกตวาในทางปฏิบัติไมสามารถทราบขอมูลทั้งหมดของประชากร(จํานวนประชากรไมไดมี ขนาด 40 คนเหมือนตัวอยางนี้) ถาอาจทําการเลือกตัวอยางจํานวนหนึ่ง (เชน 5 คนจากตัวอยางนี้) แลว ใชคาจากตัวอยางซึ่งในที่นี้ไดแกคาเฉลี่ยตัวอยางจากตัวอยางเพียงชุดเดียว เพื่อเปนคาประมาณของ คาเฉลี่ยประชากร ทั้งนี้คาเฉลี่ยตัวอยางที่ใชประมาณคาเฉลี่ยประชากรไมจําเปนตองเทากับคา เฉลี่ยประชากรหรือพารามิเตอรเสมอไป(ในตัวอยางขางตนไมมีตัวอยางชุดใดที่ใหคาเฉลี่ยเทากับ µ หรือ 4.8 ป) เพียงแตเราคาดหวังวาถามีการเลือกตัวอยางหลายๆ ชุด คาเฉลี่ยของคาเฉลี่ยตัวอยางจาก ทุกๆ ชุดจะมีคาใกลเคียงคาพารามิเตอร หรือคาเฉลี่ยประชากร (4.8 ป) 6. ใหผูสอนตระหนักวา สัญลักษณ ∑ เปนอักษรกรีกเรียกวา Capital Sigma หรือ “ซิกมา ตัวอักษรตัวใหญ” เมื่อใชรวมกับตัวหอย(subscript) i จะเปนเครื่องหมายที่แทนการบวกสวนสัญลักษณ σ เปนอักษรกรีกเรียกวา Sigma หรือ “ซิกมา” ทางสถิติจะใชสัญลักษณนี้แทนสวนเบี่ยงเบนมาตรฐาน ของประชากร การใชสัญลักษณ Capital Sigma แทนการบวก เชน ∑= n i iX 1 ในภาษาอังกฤษจะอานวา “Summation(ซัมเมชัน) iX โดยที่ i เทากับ1 ถึง n” ไมไดอานวา “Sigma (ซิกมา) iX โดยที่ i เทากับ 1 ถึง n” 7. เนื่องจากสูตรการคํานวณทั้งในกรณีที่ขอมูลไมไดแจกแจงความถี่ หรือในกรณีที่ทราบขอมูลดิบ แตละตัวและในกรณีที่มีการแจกแจงในรูปของตารางแจกแจงความถี่ที่แบงเปน k ชั้น ใชสัญลักษณ iX แทนคาของขอมูลเหมือนกันทั้งสองสูตร ดังนั้นจึงควรมีความระมัดระวังดังตอไปนี้ (1) สําหรับในกรณีที่ทราบคาของขอมูลจริงๆ ทุกตัว iX จะแทนคาจริงของขอมูลแตละตัว และตัวหอย i จะเริ่มตั้งแต 1 ถึง n หรือ N (จํานวนคาสังเกตทั้งหมด) (2) ในกรณีที่ขอมูลอยูในรูปตารางแจกแจงความถี่และมีอันตรภาคชั้น iX จะแทนคา ที่ใชเปนตัวแทนของบรรดาขอมูลในอันตรภาคชั้นนั้น หรือจุดกึ่งกลางของชั้นนั่นเองและตัวหอย i จะเริ่มตั้งแต 1 ถึง k (จํานวนอันตรภาคชั้น) 8. การหาคาเฉลี่ยเลขคณิตรวม ใหผูสอนเนนกับผูเรียนวาตองเปนการหาคาเฉลี่ยของ ขอมูลเดียวกันหรือตัวแปรเดียวกัน และสัญลักษณ k ในที่นี้ใชแทนจํานวนชุดขอมูลทั้งหมด ถาเปนขอมูล คนละตัวแปรกัน เชน ราคาซื้อและราคาขาย รายไดและรายจาย คะแนนสอบวิชาคณิตศาสตร คะแนนสอบวิชาฟสิกสและคะแนนสอบวิชาเคมี นํามาเฉลี่ยรวมกันผลลัพธที่ไดจะไมสื่อความหมาย อยางไรก็ตาม แมวาในบางครั้งจะเปนตัวแปรเดียวกัน เชน อายุ กลาวคือ คาเฉลี่ยเลขคณิต ของอายุนักเรียนชั้นมัธยมศึกษาปที่ 3, 4, และ 5 คือ 15 ป, 17 ป และ 18 ป ตามลําดับ โดยโรงเรียน แหงนี้มีนักเรียนในแตละชั้นเปน 60, 50, และ 40 คน ตามลําดับ เชนนี้ การหาคาเฉลี่ยเลขคณิตของ อายุนักเรียนสามชั้นรวมกันอาจไมเหมาะสม เนื่องจากเปนนักเรียนคนละกลุมกัน ถานักเรียนเรียน ตามเกณฑ ก็จะทราบดีอยูแลววา แตละชั้นนั้นมีอายุหางกันประมาณ 1 ป ไมสมควรจะมาหาคาเฉลี่ยของ อายุ แตถาเปนเรื่องคะแนนสอบวิชาคณิตศาสตรของชั้นมัธยมศึกษาปที่ 3 โดยใชขอสอบชุดเดียวกัน
  • 6. 6 และทราบวา ม.3/1 ไดคะแนนเฉลี่ย 80 คะแนน หอง ม.3/2 ไดคะแนนเฉลี่ย 60 คะแนน และหอง ม.3/3 ไดคะแนนเฉลี่ย 75 คะแนน การหาคาเฉลี่ยรวมของคะแนนสอบวิชาคณิตศาสตรของนักเรียนชั้น ม.3 สามหองรวมกันจะมีความหมายมากกวาตัวอยางขางตน 9. สําหรับสูตรการหาคามัธยฐานสําหรับขอมูลที่แจกแจงความถี่ ไมควรเนนใหทองจําหรือ ทําการวัดผลจากสูตรนั้น เนื่องจากเปนการประมาณคามัธยฐานของขอมูลชุดนั้นที่ไมทราบคาที่แทจริง ของคาสังเกตแตละตัว ดังนั้นการที่ผูเรียนทราบหรือสามารถกะประมาณไดวามัธยฐานควรมีคาเทาไร ในชวงใดหรือคํานวณไดแบบหยาบๆ ก็เพียงพอแลว 10. ฐานนิยมจะสื่อความหมายไดเมื่อใชสรุปขอมูลที่เปนขอมูลเชิงคุณภาพ เชน เพศ อาชีพ ภูมิลําเนา เบอรหรือขนาดเสื้อ ความคิดเห็น ความชอบ หรือความเครียด เปนตน ไมควรเนนการ หาฐานนิยมสําหรับขอมูลเชิงปริมาณ และใหผูสอนเนนกับผูเรียนวาฐานนิยม คือคาสังเกตที่มี ความถี่สูงสุด แตไมใชคาความถี่ของคาสังเกตนั้น เชน การวัดความคิดเห็น ถาขอมูลที่สํารวจมาพบ วา มีผูเห็นดวยอยางยิ่งจํานวน 22 คน มีผูเห็นดวยจํานวน 20 คน มีผูไมมีความเห็นจํานวน 5คนมีผูไม เห็นดวย จํานวน 14 คน มีผูไมเห็นดวยอยางยิ่งจํานวน11คน ในที่นี้ฐานนิยมคือ เห็นดวยอยางยิ่งสวน คา22 ไมใชฐานนิยม แตเปนความถี่ของผูที่ตอบวาเห็นดวยอยางยิ่ง 11. ขอนารูเพิ่มเติมเกี่ยวกับคาเฉลี่ยเรขาคณิต คาเฉลี่ยเรขาคณิตมีประโยชนอยางยิ่ง ในการหาคากลางหรือคาเฉลี่ยของขอมูลที่อยูในรูปของรอยละ อัตราสวน ดัชนี หรืออัตราการเจริญเติบโต (growth rate) ซึ่งใชอยางกวางขวางในทางธุรกิจ เศรษฐศาสตร และชีววิทยา เนื่องจากมีความสนใจ ที่จะหารอยละของการเปลี่ยนแปลงราคาขาย เงินเดือน หรือเครื่องชี้ภาวะของเศรษฐกิจ ประชากร เชน ผลผลิตมวลรวมของชาติ (Gross National Product) ที่สรางจากตัวแปรหลายๆ ตัวประกอบกัน ขอจํากัดของการหาคาเฉลี่ยเรขาคณิตคือคาที่จะนํามาหาคาเฉลี่ยเรขาคณิตแตละคาตองมีคา มากกวาศูนย คาเฉลี่ยเรขาคณิตจะนอยกวาหรือเทากับคาเฉลี่ยเลขคณิตเสมอ ตัวอยางของการตีความหมาย คาเฉลี่ยเรขาคณิตจะเห็นไดดังตอไปนี้ สมมุติวา นาย ก ไดรับเงินเดือนเพิ่มขึ้นรอยละ 5 ในปที่ 1 และไดรับเงินเดือนเพิ่มขึ้นรอยละ 15 ในปที่ 2 ถาคํานวณคาเฉลี่ยเลขคณิตของการเพิ่มขึ้นของเงินเดือน คือ รอยละ 10 (หรือคํานวณจาก (5+15)/2) แตจริงๆ แลวรอยละโดยเฉลี่ยของเงินเดือนที่เพิ่มขึ้นคือ รอยละ 9.886 ไมใช รอยละ 10 ซึ่งคานี้ไดจากการหาคาเฉลี่ยเรขาคณิตของ 5 และ 15 เนื่องจาก ถามีเงินเดือน 100 บาท เงินเดือนเพิ่มรอยละ 5 คือไดเงินเดือน 105 บาทหรือ 1.05 ตอเงิน 1 บาท และเงินเดือนเพิ่มรอยละ 15 คือ 115 บาทหรือ 1.15 ตอเงิน 1 บาท นั่นคือคาเฉลี่ยเรขาคณิตตอเงิน 1 บาท เทากับ (1.05)(1.15) 1.09886≈ หรือรอยละ 9.886 การตรวจสอบความสมเหตุสมผลของการใชคาเฉลี่ยเรขาคณิตทําไดโดยสมมุติวา เงินเดือนในปที่ 1 กอนที่จะขึ้นเงินเดือนรอยละ 5 ของนาย ก คือ 30,000 บาท ปที่ 1 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 5 หรือคิดเปนเงิน30,000(.05) = 1,500 บาท ปที่ 2 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 5 ของเงินเดือนในปแรก หรือคิดเปนเงิน 31,500(.15)=4,725บาท รวมเงินดือนเพิ่มขึ้นสองป 6,225 บาท เงินเดือนที่เพิ่มขึ้น
  • 7. 7 รวมสองป 6,225 บาท เทากับการใชคาเฉลี่ยเรขาคณิตแทนในการคํานวณรอยละที่เพิ่มขึ้นในแตละปดังนี้ ปที่ 1 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 9.886 หรือคิดเปนเงิน 30,000(.09886) = 2,965.8 บาท ปที่ 2 ไดรับเงินเดือนเพิ่มขึ้น รอยละ 9.886 ของเงินเดือนในปแรก หรือคิดเปนเงิน 32,965.8(.09886) = 3,259.0 บาท รวมเงินเดือนเพิ่มขึ้นสองป 6,224.8 บาท ซึ่งใกลเคียงหรือเทากันหากมีการปดเศษ กับการใชรอยละ 5 และรอยละ 15 ในการคํานวณเงินที่ได รับเพิ่มในปที่ 1 และ ปที่ 2 ตามลําดับ ตัวอยางที่ 1 ถาบริษัทแหงหนึ่งลงทุนในปที่ 1 ไดกําไร รอยละ 10 ในปที่สองไดกําไรรอยละ 50 และในปที่ สามไดกําไรรอยละ 30 อัตราผลตอบแทนหรือกําไรโดยเฉลี่ยควรเปนเทาไร อัตราผลตอบแทนโดยเฉลี่ยคือ 3 )30.1)(50.1)(10.1( ≈ 1.2897 หรือรอยละ 28.97 จะเห็นวาในการคํานวณเงินทุนในปแรกตองคูณดวย 1.10 และในปที่สองตองคูณ ดวย 1.50 และในปที่สามตองคูณดวย 1.30 ดังนั้นหากตองการคาคงที่ที่จะไปคูณในเงิน ลงทุนแตละปโดยที่ไมตองใชคา 1.10, 1.50, และ 1.30 คูณในปที่ 1, 2, และ 3 ตามลําดับ คานั้นไดแกคาเฉลี่ยเรขาคณิต 1.2897 นั่นเอง สมมุติวามีคาสังเกต5คา บวกกันไดผลรวมจํานวนหนึ่ง สมมุติเปน100 คาเฉลี่ยเลขคณิต ของคาสังเกต 5 คานั้น คือคาคงที่คาหนึ่งซึ่งเมื่อบวกกัน 5 ครั้งแลวจะไดผลรวมเปน 100 เทาเดิม ในทํานองเดียวกัน ถาเรามีคาสังเกต 5 คาคูณกันได ผลคูณจํานวนหนึ่งสมมุติวาเปน 550 คาเฉลี่ยเรขาคณิตของ คาสังเกต 5 คานี้คือคาคงที่คาหนึ่งซึ่งเมื่อนํามาคูณกัน 5 ครั้งแลวจะได ผลคูณเปน 550 เทาเดิม จากตัวอยางที่ 1 จะเห็นวา (1.10)(1.50)(1.30) ≈ 2.145 และ (1.2897)(1.2897)(1.2897) ≈ 2.145 เชนกัน ตัวอยางที่ 2 ถาเริ่มลงทุนดวยเงินทุน 1,000 บาท ในแตละปไดผลตอบแทน 13%, 22%, 12%, -5%, และ -13% ตารางตอไปนี้แสดงเงินรวมที่ไดจากการลงทุนเมื่อสิ้นสุดของแตละป ปที่ ผลตอบแทนตอป เงินรวม 1 13% 1,000(1.13) ≈1,130 บาท 2 22% 1,130(1.22) ≈ 1,379 บาท 3 12% 1,379(1.12) ≈1,544 บาท 4 -5% 1,544(0.95) ≈1,467 บาท 5 -13% 1,467(0.87) ≈1,276 บาท
  • 8. 8 ถาตองการหาอัตราผลตอบแทนตอป จะตองหาคาเฉลี่ยเรขาคณิตของผลตอบแทนแตละป แทนที่จะใชรอยละผลตอบแทนในการคํานวณ จะใชตัวคูณที่แสดงถึงคาของเงินเมื่อสิ้นสุดของแตละป นั่นคือ ผลตอบแทน 13% จะแทนดวยตัวคูณ 1.13 และผลตอบแทน –5% หรือการขาดทุน จะแทนดวย ตัวคูณ 0.95 คาเฉลี่ยเรขาคณิตของตัวคูณ 1.13, 1.22, 1.12, 0.95, และ 0.87 คือ 5 (1.13)(1.22)(1.12)(0.95)(0.87) = 1.0499 หรือ 1.05 นั่นคืออัตราผลตอบแทนโดยเฉลี่ยตอป คือ 5% ตารางตอไปนี้แสดงเงินรวมเมื่อสิ้นสุดในแตละปเมื่อใชอัตราผลตอบแทนเฉลี่ย 5% ซึ่งจะ เห็นวาเมื่อสิ้นสุดปที่ 5 จะไดเงินรวมในปสุดทายเทากับการลงทุนที่มีผลตอบแทนในแตละปคือ 13%, 22%, 12%, -5%, และ -13% ดังตารางขางตน ปที่ ผลตอบแทนตอป เงินรวม 1 5% 1,000(1.05) ≈ 1,050 บาท 2 5% 1,050(1.05) ≈1,103 บาท 3 5% 1,103(1.05) ≈1,158 บาท 4 5% 1,158(1.05) ≈1,216 บาท 5 5% 1,216(1.05) ≈1,276 บาท ตัวอยางที่3 บริษัทรับเหมากอสรางแหงหนึ่งไดรับกําไรจากโครงการ4โครงการที่ผานมาคือรอยละ3 รอยละ 2 รอยละ 4 และรอยละ 6 คาเฉลี่ยเรขาคณิตของกําไรคิดเปนรอยละเทาใด คาเฉลี่ยเรขาคณิตคือ 4 )6)(4)(2)(3( = 4 144 ≈ 3.46 นั่นคือ คาเฉลี่ยเรขาคณิตของกําไรคือ รอยละ 3.46 แตถาคํานวณคาเฉลี่ยเลขคณิตจะไดวา คาเฉลี่ยเลขคณิตเทากับ (3+2+4+6)/4 หรือ รอยละ 3.75 ใหสังเกตวาถึงแม คา 6 จะมีคา ไมสูงมากก็ตามแตมีผลทําใหคาเฉลี่ยเลขคณิตสูงขึ้นตามไปดวยในขณะที่คาเฉลี่ยเรขาคณิต รอยละ 3.46 ไมมีผลกระทบจากคา 6 ที่มากกวาคาอื่นๆ นี้ โดยทั่วไปคาเฉลี่ยเรขาคณิตจะ ไมมากกวาคาเฉลี่ยเลขคณิต ตัวอยางการประยุกตใชคาเฉลี่ยเรขาคณิตอีกอยางหนึ่งไดแก การหารอยละที่เพิ่มขึ้นโดยเฉลี่ยในชวงระยะเวลาหนึ่ง ตัวอยางเชนถานาย ขมีรายไดสุทธิ ในป พ.ศ. 2537 เปน 30,000 บาท และมีรายไดสุทธิในป พ.ศ. 2547 เปน 50,000 บาท อัตรการเพิ่มขึ้นของรายไดสุทธิตอปในชวง 10 ปนี้คํานวณจากสูตรดังตอไปนี้ รอยละโดยเฉลี่ยที่เพิ่มขึ้นในชวง 10 ป คือ 1 30000 5000010 − ≈ 0.0524 หรืออัตราการเพิ่ม ขึ้นของรายไดสุทธิตอปโดยเฉลี่ยประมาณรอยละ 5.24
  • 9. 9 สําหรับขอมูลทางชีววิทยาหรือทางเคมี เชน การแจกแจงของจํานวนแบคทีเรีย จุลินทรีย สวนใหญมักมีการแจกแจงที่เบขวาหรือหางยาวทางขวาหรือมีคาสังเกตสวนใหญที่มีคาต่ําและมีคาสังเกต จํานวนนอยที่มีคาสูง ซึ่งสวนใหญแลวในการวิเคราะหทางสถิติมักมีขอตกลงวาการแจกแจงของ ขอมูลตองมีลักษณะสมมาตร เชน มีการแจกแจงแบบปกติ เปนตน ดังนั้นมักทําการแปลงขอมูลที่เบ ใหมีลักษณะสมมาตรขึ้นหรือใหคลายกับการแจกแจงแบบปกติ ในกรณีที่ขอมูลมีลักษณะเบขวา การแปลงขอมูลโดยใชลอการิทึมแทนคาขอมูลเดิมจะชวยใหขอมูลมีลักษณะสมมาตรขึ้น ถาขอมูลเดิม มีการแจกแจงแบบเบขวา เมื่อแปลงขอมูลแตละตัวโดยใชคาลอการิทึมแลวทําใหการแจกแจงใหมนี้มีการแจกแจง ที่ประมาณไดวาเปนแบบปกติจะเรียกขอมูลเดิมวามีการแจกแจงแบบลอกนอรมอล (log-normal)ซึ่งคาที่ดีที่สุด ที่ใชวัดคากลางของการแจกแจงแบบลอกนอรมอลก็คือคาเฉลี่ยเรขาคณิตนั่นเอง ความจริงขอนี้ให พิจารณาจากเหตุผลตอไปนี้ ถาให X แทนขอมูลเดิม และให Y แทนขอมูลที่ไดจากการแปลงโดยใชลอการิทึม กลาวคือ 1 1Y ln(X )= , 2 2Y ln(X )= , …, และ n nY ln(X )= คากลางของขอมูลที่แปลงแลวซึ่ง มีลักษณะการแจกแจงสมมาตรขึ้นคือ คาเฉลี่ยเลขคณิตของ Y หรือ Y เมื่อไดคา Y แลว สามารถ ตีความกลับไปยังขอมูลเดิมไดดังนี้ เนื่องจาก Y = ln(X) ดังนั้นความสัมพันธระหวางขอมูลเดิมและขอมูลที่แปลงแลวคือ Y X e= ทําใหไดวา คากลางของขอมูลเดิมจึงควรเปน Y e = n i i 1 1 Y n e = ∑ = n i i 1 1 ln(X ) n e = ∑ = 1 2 n 1 ln(X X ...X ) n e = 1 2 n 1 ln(X X ...X ) ne = 1 n 1 2 n(X X ...X ) = n 1 2 nX X ...X หรือเทากับคาเฉลี่ยเรขาคณิตของขอมูลเดิมที่มีลักษณะเบขวานั่นเอง นั่นคือ ขอมูลที่มีลักษณะเบขวา คากลางที่ใชควรเปนคาเฉลี่ยเรขาคณิต 12. ขอนารูเพิ่มเติมเกี่ยวกับคาเฉลี่ยฮารมอนิก คาเฉลี่ยฮารมอนิก (H.M.) ของจํานวน n จํานวน ( 1 2 3 nX ,X ,X ,...,X ) นิยามโดย n i 1 i 1 1 1 H.M. n X= = ∑ หรือ n i 1 i n H.M. 1 X= = ∑ กรณีที่ n = 2 จะไดวา 1 2 1 2 1 2 1 2 X X 2X X H.M. 1 X X(X X ) 2 = = ++
  • 10. 10 กรณีที่ n = 3 จะไดวา 1 2 3 1 2 3 1 2 1 3 2 3 1 2 1 3 2 3 X X X 3X X X H.M. 1 X X X X X X(X X X X X X ) 3 = = + ++ + ถาให 1 2 3 nw ,w ,w ,...,w คือน้ําหนักของ 1 2 3 nX ,X ,X ,...,X ตามลําดับคาเฉลี่ยฮารมอนิก ถวงน้ําหนักนิยามโดย n i i 1 n i i 1 i w H.M. w X = = = ∑ ∑ คาเฉลี่ยฮารมอนิก นิยมใชสําหรับการหาอัตราเฉลี่ยหรือใชสําหรับเฉลี่ยขอมูล เชน ระยะทาง ตอชั่วโมง (กิโลเมตรตอชั่วโมง) งานตอหนวยเวลา เปนตน ซึ่งความเปนมาของคาเฉลี่ยฮารมอนิกอาจ พิจารณางายๆ ดังนี้ ตัวอยางที่ 1 นาย ก ทํางานหนึ่งหนวยแลวเสร็จในเวลา 4 นาที นาย ข นาย ค นาย ง และ นายจ ทํางานหนวยเดียวกันนี้เสร็จในเวลา 5, 6, 10, และ 12 นาทีตามลําดับ ถาตองการ หาคาเฉลี่ยของอัตราการทํางานของคนทั้งหาคนนี้สามารถทําไดดังนี้ เนื่องจากนายกทํางาน1หนวยใชเวลา 4 นาที ดังนั้นใน1นาทีนายกทํางานได 1 4 หนวย นาย ข ทํางาน 1 หนวย ใชเวลา 5 นาที ดังนั้น ใน 1 นาที นาย ข ทํางานได 1 5 หนวย นาย ค ทํางาน 1 หนวย ใชเวลา 6 นาที ดังนั้น ใน 1 นาที นาย ค ทํางานได 1 6 หนวย นาย ง ทํางาน 1 หนวย ใชเวลา 10 นาที ดังนั้น ใน 1 นาที นาย ง ทํางานได 1 10 หนวย นาย จ ทํางาน 1 หนวย ใชเวลา 12 นาที ดังนั้น ใน 1 นาที นาย จ ทํางานได 1 12 หนวย นั่นคือ ใน 1 นาที ทั้งหาคนทํางานรวมกันได 1 4 1 5 + 1 1 1 6 10 12 + + + หนวย หรือเฉลี่ยแลวไดงาน 1 1 1 1 1 4 5 6 10 12 5 + + + + หนวยตอนาที นั่นคือ งาน 1 1 1 1 1 4 5 6 10 12 5 + + + + หนวย ใชเวลา 1 นาที ดังนั้น งาน 1 หนวยใชเวลา 12 1 10 1 6 1 5 1 4 1 5 ++++ นาที หรือมีคาเทากับ 12 1 10 1 6 1 5 1 4 1 5 ++++ ซึ่งคือคาเฉลี่ยฮารมอนิกนั่นเอง
  • 11. 11 ตัวอยางขาง ตนนักเรียนสามารถหาคาเฉลี่ยที่เหมาะสมไดโดยไมจําเปนตองจําสูตร คาเฉลี่ยฮารมอนิก ตัวอยางที่ 2 สมมุติวาแบงระยะทาง40กิโลเมตรเปนสี่ระยะเทาๆกันโดยระยะทาง10กิโลเมตรแรก ใชอัตราเร็วในการขับรถ 100 กิโลเมตรตอชั่วโมง ระยะทาง 10 กิโลเมตรตอๆ ไปใช อัตราเร็ว 110, 90, และ 120 กิโลเมตรตอชั่วโมงตามลําดับ ตองการหาอัตราเร็วโดยเฉลี่ย ในการขับรถสําหรับระยะทาง 40 กิโลเมตรนี้ เนื่องจากอัตราเร็วคือระยะทาง/เวลา ดังนั้นตองหาเวลารวมที่ใชในการขับรถในระยะทาง 40 กิโลเมตรกอนขับรถ10กิโลเมตรแรก ใชเวลาเทากับ10/100 ชั่วโมง ขับรถ10กิโลเมตร ที่สองใชเวลาเทากับ 10 110 ชั่วโมงขับรถ10กิโลเมตรที่สามใชเวลาเทากับ10/90 ชั่วโมง ขับรถ 10 กิโลเมตรสุดทายใชเวลาเทากับ 10 120 ชั่วโมง รวมเวลาที่ใชทั้งสิ้น 10 10 10 10 100 110 90 120 + + + ชั่วโมง ดังนั้นอัตราเร็วเฉลี่ยในระยะเวลา 40 กิโลเมตร คือ 40 10 10 10 10 100 110 90 120 + + + กิโลเมตรตอชั่วโมง หรือเทากับ 120 10 90 10 110 10 100 10 40 +++ = 120 1 90 1 110 1 100 1 4 +++ ซึ่งก็คือคาเฉลี่ยฮารมอนิกนั่นเอง อยางไรก็ตามใหระวังคําถามในลักษณะเดียวกัน ซึ่งถาไมพิจารณาใหรอบคอบจะทําให เกิดความผิดพลาดได ดังตัวอยางตอไปนี้ ตัวอยางที่3 นายกขับรถในชั่วโมงแรกใชอัตราเร็ว80กิโลเมตรตอชั่วโมง จากนั้นในชั่วโมงที่สอง ไดเพิ่มอัตราเร็วเปน100กิโลเมตรตอชั่วโมง อัตราเร็วเฉลี่ยในการขับรถในชวงระยะทางที่วิ่งได สองชั่วโมงนี้คือ (80 100) 2 + เทากับ 90กิโลเมตรตอชั่วโมง หรือคือคาเฉลี่ยเลขคณิตนั่นเอง เนื่องจากระยะทางที่วิ่งไดทั้งหมดคือ 80 + 100 กิโลเมตร และเวลาทั้งสิ้นคือ 2 ชั่วโมง แตถากําหนดวา ในระยะทางครึ่งแรกของการเดินทางขับรถดวยอัตราเร็ว 80 กิโลเมตรตอ ชั่วโมง สวนระยะทางครึ่งหลังใชอัตราเร็ว 100 กิโลเมตรตอชั่วโมง อัตราเร็วเฉลี่ยของ การขับรถในชวงที่วิ่งไดคือ 2 1 1 80 100 + กิโลเมตรตอชั่วโมงหรือคือคาเฉลี่ยฮารมอนิก เนื่องจากถาสมมุติวาระยะทางที่วิ่งไดในครึ่งแรกคือd กิโลเมตรเวลาที่ใชในครึ่งแรกคือ d 8 0 ชั่วโมง สวนระยะทางที่วิ่งไดในครึ่งหลังคือdกิโเมตรเชนกันและเวลาที่ใชในครึ่งหลัง
  • 12. 12 คือ d 100 ชั่วโมงนั่นคืออัตราเร็วเฉลี่ยไดแก 2d d d ( ) 80 100 + เทากับ 2 1 1 ( ) 80 100 + ≈ 88.89 กิโลเมตรตอชั่วโมง 13. ใหระวังวา การหาตําแหนงของขอมูล เชน ควอรไทล นั้นแบงขอมูลออกเปนสี่สวน เทาๆ กัน ตามความถี่หรือจํานวนขอมูล ไมใชแบงตามระยะหางของขอมูล หรือระยะระหวางคา นอยสุดกับคามากสุด แตตองพิจารณาจํานวนขอมูลในแตละสวนใหมีจํานวนเทาๆ กัน 14. การวัดการกระจายของขอมูลวัดหยาบๆไดโดยใชพิสัยแตถาตองการใหละเอียดขึ้นใหใชสวน เบี่ยงเบนมาตรฐานหรือความแปรปรวน สวนการเปรียบเทียบการกระจายใหใชสัมประสิทธิ์ของความ แปรผันนั่นคือการนําเขาสูเนื้อหาควรเปนลักษณะนี้ไมควรนําเขาสูเนื้อหาวาการวัดการกระจาย มีสอง แบบ คือแบบสัมบูรณและแบบสัมพัทธ เนื่องจากการวัดการกระจายมีแบบเดียวแลวแตวาจะวัด หยาบๆ หรือใหละเอียด สวนการเปรียบเทียบการกระจายของขอมูลสองชุดขึ้นไปก็มีเครื่องมือวัด อีกเชนกัน การจัดการเรียนการสอนในหัวขอนี้ใหเนนแคพิสัย สวนเบี่ยงเบนมาตรฐาน และ สัมประสิทธิ์ของความแปรผันก็พอ 15. หนวยของสวนเบี่ยงเบนมาตรฐานจะเปนหนวยเดียวกับขอมูลที่นํามาวิเคราะห สวนหนวย ของความแปรปรวน มีหนวยเชนเดียวกับขอมูลที่นํามาวิเคราะหยกกําลังสอง เชน ขอมูลแทนความยาวมี หนวยเปนเมตร สวนเบี่ยงเบนมาตรฐานจะมีหนวยเปนเมตร แตความแปรปรวนจะมีหนวยเปน เมตร2 16. ความแปรปรวนรวม ที่คํานวณจากขอมูลระดับประชากรหลายๆ กลุมนั้นไมคอยจะมี ประโยชนในการนําไปใชเทาไรนัก เชน ขอมูลประชากรกลุมที่ 1 1N 2 2 1 i i 11 1 (X ) N = σ = −µ∑ ขอมูลประชากรกลุมที่ 2 2N 2 2 2 i i 12 1 (X ) N = σ = −µ∑ ขอมูลประชากรกลุมที่ 3 3N 2 2 3 i i 13 1 (X ) N = σ = −µ∑ ดังนั้น ความแปรปรวนรวม 2 2 2 2 1 1 2 2 3 3 1 2 3 N N N N N N σ + σ + σ σ = + + ใหสังเกตวาขอมูลแตละกลุมมีคาเฉลี่ยประชากรµ เทากัน สําหรับขอมูลตัวอยางหลายชุด ที่สุมจากประชากรเดียวกัน ซึ่งแตละชุดสามารถคํานวณความแปรปรวนตัวอยาง ดังนี้ ขอมูลตัวอยางกลุมที่ 1 1n 2 2 1 i 1 i 11 1 s (X X ) n 1 = = − − ∑ ขอมูลตัวอยางกลุมที่ 2 2n 2 2 2 i 2 i 12 1 s (X X ) n 1 = = − − ∑ ขอมูลตัวอยางกลุมที่ 3 3n 2 2 3 i 3 i 13 1 s (X X ) n 1 = = − − ∑
  • 13. 13 เมื่อใชคาความแปรปรวนที่ไดจากตัวอยางทุกชุดที่มาจากประชากรเดียวกันเพื่อประมาณคาความ แปรปรวนประชากร 2 σ ไดโดยความแปรปรวนรวม 2 2 2 2 1 1 2 2 3 3 1 2 3 (n 1)s (n 1)s (n 1)s s (n 1) (n 1) (n 1) − + − + − = − + − + − ความแปรปรวนรวมนี้มีประโยชนและมีความหมายในทางสถิติ กลาวคือเปนการประมาณคา ความแปรปรวนประชากร 2 σ โดยใชขอมูลจากตัวอยางหลายๆ ชุดที่ไดมาจากประชากรนั้น เพื่อใหได คาประมาณที่ดีขึ้น 17. เครื่องคิดเลขบางชนิดอาจมีการคํานวณ สวนเบี่ยงเบนมาตรฐานโดยไมไดสนใจวา เปนขอมูลประชากรหรือตัวอยาง ควรตรวจสอบสูตรในการคํานวณสําหรับเครื่องแตละเครื่อง กลาวคือ อาจคํานวณสวนเบี่ยงเบนมาตรฐานโดยใชตัวหารคือ N หรือ N-1 ก็ได ทั้งนี้เครื่องบางเครื่องอาจใช สัญลักษณ nσ หมายถึง สวนเบี่ยงเบนมาตรฐานของขอมูลระดับประชากร (σ ) และ n 1−σ หมาย ถึงสวนเบี่ยงเบนมาตรฐานของขอมูลตัวอยาง (s) แมวาจะใชสัญลักษณที่ไมถูกตองก็ตาม กิจกรรมเสนอแนะ กิจกรรมที่ 1 การใช Microsoft Excel ชวยในการวิเคราะหขอมูล เนื่องจากการวิเคราะหขอมูลในปจจุบันใชโปรแกรมสําเร็จรูปทางสถิติหรือโปรแกรมชวย คํานวณในรูปแบบอื่น ๆ ดังนั้นควรใหผูเรียนไดทราบถึงการวิเคราะหขอมูลดวยเครื่องคอมพิวเตอร โดยเฉพาะโปรแกรมที่ไดติดตั้งมากับเครื่องคอมพิวเตอร เชน Microsoft Excel เปนตน การวิเคราะหขอมูลโดยใช Microsoft Excel นั้นอาจใชฟงกชันในการคํานวณของโปรแกรมเอง หรือทําการเพิ่มเครื่องมือที่เรียกวา Analysis ToolPak ใหกับ Excel ก็ได ในที่นี้จะเสนอตัวอยางการ คํานวณสถิติพรรณนาโดยใช Analysis ToolPak ดังนี้ หลังจากปอนขอมูลในแผนทํางานของExcelแลวใหไปที่เมนูเครื่องมือ โปรแกรมเพิ่ม…
  • 14. 14 เมื่อหนาจอปรากฏ กลองขอความใหเลือก ดังนี้ ใหคลิก เครื่องหมายถูกดวยเมาส เลือก Analysis ToolPak และ Analysis ToolPak –VBA แลว คลิกที่ ตกลง คลิกที่เครื่องมืออีกทีจะเห็นเมนู Data Analysis เพิ่มขึ้นมา ใหเลือกเมนู Data Analysis …นี้
  • 15. 15 เลือกเมนู Descriptive Statistics จากกลองขอความที่ปรากฏขึ้นมาหลังจากที่ไดเลือกเมนู Data Analysis…จากนั้นคลิกที่ OK คลิกที่ ลูกศรสีแดงในชอง แรกที่เขียนวา Input Range เพื่อระบุที่อยูของขอมูลที่ตองการวิเคราะห
  • 16. 16 สรางสดมภที่ตองการวิเคราะหขอมูล (ปริมาณไขไก) ตั้งแต B1 ถึง B21 คลิกที่ลูกศรสีแดงอีกที คลิกเครื่องหมายถูก เลือก Labels in First Row เนื่องจากในการกําหนดที่อยูของขอมูล ไดรวมปายชื่อหรือชื่อสดมภ (ที่เขียนวา “ปริมาณไขไก”) ในบรรทัดแรกของขอมูลเขาไวดวย ในกรณีที่ ไมไดเลือกชื่อสดมภเขามา ก็ไมตองคลิกที่ ชอง Labels in First Row นี้ จากนั้นคลิกเลือก Summary Statistics แลวคลิกที่ OK
  • 17. 17 หลังจากนั้นจะไดผลลัพธที่แสดงคาสถิติพรรณนาในแผนงานอีกแผนหนึ่ง จากผลลัพธที่ได ปริมาณการบริโภคไขไกตอเดือนจากครอบครัว 20 ครอบครัวนี้ รวมได 989ฟองตอเดือน ปริมาณการบริโภคนอยสุดคือ32ฟองตอเดือน ปริมาณการบริโภคมากสุดคือ65ฟองตอเดือน นั่นคือมีความแตกตางกันหรือพิสัย33ฟองตอเดือน ปริมาณการบริโภคเฉลี่ยคือ49.45ฟองตอเดือนโดยมีสวนเบี่ยงเบนมาตรฐาน8.73ฟองตอเดือน มัธยฐานของปริมาณการบริโภคไขไกเทากับ 48 ฟองตอเดือน ครอบครัวที่จะบริโภคไขไก 60ฟองตอเดือนมีจํานวนมากที่สุด(ควรระบุดวยวามีกี่ครอบครัว) หมายเหตุ การคํานวณสวนเบี่ยงเบนมาตรฐานและความแปรปรวนในสถิติพรรณนาของ โปรแกรม Microsoft Excel นี้เปนการคํานวณของตัวอยาง ใหสังเกตคําวา Sample Variance
  • 18. 18 กิจกรรมที่ 2 การเก็บขอมูลจากแหลงปฐมภูมิและทุติยภูมิ เมื่อผูเรียนสามารถทําการวิเคราะหขอมูลดวยคอมพิวเตอรไดแลว ใหแบงกลุมผูเรียนเพื่อศึกษา และวางแผนเก็บรวบรวมขอมูลในเรื่องที่ผูเรียนสนใจ โดยใหสมมุติวาขอมูลที่ไดมาเปนตัวอยางหรือ ตัวแทนที่ดีจากประชากร ขอมูลที่รวบรวมมานี้อาจมาจากแหลงปฐมภูมิโดยการสอบถาม สัมภาษณ หรือจากแหลงขอมูลทุติยภูมิ เชน หนังสือพิมพ อินเทอรเน็ต เปนตน ขอมูลอาจประกอบดวยตัวแปร หลายตัว มีทั้งตัวแปรเชิงคุณภาพ เชน เพศ ระดับการศึกษา การอยูในเขตเทศบาลหรือไม และตัวแปร เชิงปริมาณ เชน ระดับคะแนนเฉลี่ยสะสม จํานวนชั่วโมงในการอานหนังสือโดยเฉลี่ยตอวัน คาใชจาย ในการซื้ออาหารกลางวัน สวนสูง น้ําหนัก เปนตน จากนั้นใหผูเรียนใชโปรแกรม Microsoft Excel ใน การสรุปขอมูล แยกตามตัวแปรที่สนใจ เชน แยกเพศ แยกระดับการศึกษา โดยตัวแปรเชิงปริมาณควร หาสถิติพรรณนาตางๆ ตามแบบที่เสนอในกิจกรรมที่ 1 กิจกรรมที่3 คาเฉลี่ยและความแปรปรวนของ ตัวแปรสองตัวที่มีความสัมพันธเชิงเสนตรง ให C เปนตัวแปรแทนอุณหภูมิที่มีหนวยเปนองศาเซลเซียส และ F เปนตัวแปรแทนอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮต จากความสัมพันธในหนังสือเรียนสาระการเรียนรูพื้นฐาน คณิตศาสตร เลม 2 ชั้นมัธยมศึกษา ปที่5 เราทราบวา 9 F C 32 5 = + ใหสมมุติขอมูลประมาณ 10 ตัวเพื่อแทนอุณหภูมิหนวยเปนองศาเซลเซียส จากนั้นแปลง ขอมูลแตละตัวใหเปนอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮต จากนั้นคํานวณคาเฉลี่ย ความแปรปรวน โดยใชสูตรของความแปรปรวนที่ใชกับขอมูลประชากร (อาจใชโปรแกรม Microsoft Excel ชวยใน การคํานวณแตตองแปลงคาความแปรปรวนจากตัวอยางใหเปนความแปรปรวนของประชากร) ตรวจสอบวาคาเฉลี่ยของอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮตและที่มีหนวยเปนองศาเซลเซียส สัมพันธกันในรูปแบบ 9 F C 32 5 = + หรือไม นอกจากนี้ความแปรปรวนประชากรของอุณหภูมิ ที่มีหนวยเปนองศาฟาเรนไฮตและที่มีหนวยเปนองศาเซลเซียสสัมพันธกันในรูปแบบใด (ยกเวนความ ผิดพลาดจากการปดเศษ จะไดวา 2 2 2 F C 9 5 ⎛ ⎞ σ = σ⎜ ⎟ ⎝ ⎠ เมื่อ 2 Fσ และ 2 Cσ แทนความแปรปรวนประชากร ของอุณหภูมิที่มีหนวยเปนองศาฟาเรนไฮตและอุณหภูมิที่มีหนวยเปนองศาเซลเซียสตามลําดับ) โดยสรุป ถา Y สัมพันธกับ X ในรูปฟงกชันเสนตรง Y = aX + b เมื่อ a และ b เปนคาคง ตัวใดๆ แลว (1) bXaY += (2) 222 XY a σσ =
  • 19. 19 กิจกรรมที่ 4 คาเฉลี่ยเลขคณิตและมัธยฐานกอนและหลังการเพิ่มคาผิดปกติ ใหเก็บขอมูลอายุของนักเรียนในชั้นเรียนแลวคํานวณคาเฉลี่ยเลขคณิตและมัธยฐาน ดวยตนเอง และโดยการใชเครื่องคิดเลขหรือโปรแกรม Microsoft Excel ใหสังเกตวาคาที่ไดไมนา จะแตกตางกันเนื่องจากอายุของนักเรียนในชั้นเรียนเดียวกันไมนาจะแตกตางกันมากนัก จากนั้นใหนําอายุของอาจารยประจําชั้นเพิ่มเขาไปอีก 1 คา (สมมุติวาอาจารยประจําชั้นมีอายุ ตางจากนักเรียนมากพอสมควร) ขอมูลอายุของอาจารยประจําชั้นนี้สมมุติวาเปนขอมูลที่มีคาผิดปกติ กลาว คือมีคาสูงกวาปกติ (อาจเกิดจากการบันทึกผิด การเขาใจผิด หรือเหตุอื่นๆ ที่ไมทราบทําใหเขาใจวาเปน ขอมูลของนักเรียนชั้นนี้) ใหคํานวณคาเฉลี่ยเลขคณิต และมัธยฐานของขอมูลที่มีคาสูงผิดปกตินี้รวมอยูดวย สังเกต ความแตกตางของคาที่คํานวณทั้งสองครั้ง คาเฉลี่ยเลขคณิตจะมีคาตางกันในแตละครั้ง แตมัธยฐานมีคา ไมเปลี่ยนแปลงมากนักดังนั้นขอมูลที่มีคาสูงหรือต่ําผิดปกติอยูดวยหรือมีลักษณะเบมากๆ ควรนําเสนอ คากลางดวยมัธยฐานไมใชคาเฉลี่ยเลขคณิต การประเมินผล เนื่องจากในการเรียนการสอนเรื่อง การวิเคราะหขอมูลเบื้องตน ใหความสําคัญกับการเลือกวิธี การวิเคราะหขอมูลเบื้องตน และการอธิบายผลการวิเคราะหขอมูลใหถูกตอง พรอมกับการนําความรู เรื่องการวิเคราะหขอมูลไปใชได ดังนั้นในการประเมินผลผูสอนอาจประเมินจากแบบฝกหัด ขอสอบที่ เนนการเลือกใชวิธีการวิเคราะหขอมูล และการอธิบายผลการวิเคราะหขอมูลตามประเภทของขอมูล (เชิงปริมาณหรือเชิงคุณภาพ) ลักษณะการแจกแจงของขอมูล (สมมาตร หรือเบ มีคาผิดปกติหรือไม) ระดับของการวิเคราะหขอมูล (สถิติเชิงพรรณนาหรือสถิติเชิงอนุมาน) และจุดมุงหมายในการสรุปผล (ตองการวัดคากลาง การกระจายหรือวัดตําแหนงของขอมูล) ไมควรเนนสูตรในการคํานวณโดย เฉพาะสูตรที่ใชกับขอมูลที่แจกแจงความถี่แลวซึ่งเปนสูตรที่ซับซอนและไมไดแสดงวิธีซึ่งเปนที่มา ของสูตรดังกลาว โดยคาที่ไดก็เปนคาโดยประมาณเทานั้น นอกจากนั้นอาจประเมินผลโดยพิจารณาจากผลงานที่ผูเรียนแตละกลุมทํากิจกรรมโดย พิจารณาจากวัตถุประสงค การเก็บรวบรวมขอมูล ความถูกตองนาเชื่อถือของขอมูล การนําเสนองาน การ สรุปผลและการสื่อสารใหเปนที่เขาใจงายตอผูฟงทั่วไป
  • 20. 20 ตัวอยางแบบทดสอบประจําบท 1. ขอมูลตอไปนี้แสดงอายุโดยประมาณเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรกของนายกรัฐมนตรีไทย (ขอมูลบางสวนจากhttp://www.cabinet.thaigov.go.th/bb_main21.htm) ลําดับ นายกรัฐมนตรี อายุเมื่อไดรับตําแหนง (ป) 1 พระยามโนปกรณนิติธาดา (กอน หุตะสิงห) 48 2 พันเอก พระยาพหลพลพยุหเสนา (พจน พหลโยธิน) 46 3 จอมพล แปลก พิบูลสงคราม (แปลก ขีตตะสังคะ) 41 4 พันตรี ควง อภัยวงศ 42 5 นาย ทวี บุญยเกตุ 41 6 หมอมราชวงศ เสนีย ปราโมช 40 7 นาย ปรีดี พนมยงศ (หลวงประดิษฐมนูธรรม) 46 8 พลเรือตรี ถวัลย ธํารงนาวาสวัสดิ์ (หลวงธํารงนาวาสวัสดิ์) 45 9 นาย พจน สารสิน 52 10 จอมพล ถนอม กิตติขจร 46 11 จอมพล สฤษดิ์ ธนะรัชต 51 12 นาย สัญญา ธรรมศักดิ์ 67 13 พลตรี หมอมราชวงศ คึกฤทธิ์ ปราโมช 64 14 นาย ธานินทร กรัยวิเชียร 50 15 พลเอก เกรียงศักดิ์ ชมะนันท 60 16 พลเอก เปรม ติณสูลานนท 60 17 พลเอก ชาติชาย ชุณหะวัณ 68 18 นาย อานันท ปนยารชุน 59 19 พลเอก สุจินดา คราประยูร 59 20 นาย ชวน หลีกภัย 54 21 นาย บรรหาร ศิลปอาชา 63 22 พลเอก ชวลิต ยงใจยุทธ 65 23 พันตํารวจโท ทักษิณ ชินวัตร 52 1.1 นายกรัฐมนตรีของไทยทานใดที่มีอายุนอยที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก 1.2 นายกรัฐมนตรีของไทยทานใดที่มีอายุมากที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก 1.3 โดยเฉลี่ยแลวนายกรัฐมนตรีของไทยรับตําแหนงนายกรัฐมนตรีครั้งแรกเมื่ออายุเทาใด
  • 21. 21 1.4 เมื่อเทียบกับนายกรัฐมนตรีของไทยในอดีต นายกรัฐมนตรีคนปจจุบันมีอายุเมื่อรับ ตําแหนงนายกรัฐมนตรีครั้งแรกนอยเกินไปหรือมากเกินไป 1.5 นายสัญญา ธรรมศักดิ์ รับตําแหนงนายกรัฐมนตรีคนที่ 12 ของไทยเมื่อวันที่ 14 ตุลาคม 2516 ตามพระบรมราชโองการ ซึ่งดูเหมือนวาตั้งแตนั้นมานายกรัฐมนตรีคนตอๆ ไปนั้น จะมีอายุเมื่อรับตําแหนงครั้งแรกมากขึ้นกวานายกรัฐมนตรีสมัยกอนๆ จงแสดงความ คิดเห็นและใหขอมูลสนับสนุน 2. ขอมูลตอไปนี้ (จาก http://www.fueleconomy.gov/feg/byclass/Midsize_Cars2005.shtml) เปน จํานวนไมลที่วิ่งไดตอน้ํามัน 1 แกลลอน (MPG) ของรถยนตขนาดกลางรุนที่ผลิตในป พ.ศ. 2548 เมื่อวิ่งในเมืองและวิ่งบนทางหลวงจําแนกตามประเภทของรถ ประเภทรถ ในเมือง ทางหลวง 1 Acura RL 6 cyl, 3.5 L, Auto(S5), Premium 18 26 2 Acura TL 6 cyl, 3.2 L, Manual (6 speed), Premium 20 29 3 Audi A6 Quattro 6 cyl, 3.1 L, Auto(S6), Premium 19 26 4 Audi A8 8 cyl, 4.2 L, Auto(S6), Premium 18 24 5 BMW 525I 6 cyl, 2.5 L, Manual (6 speed), Premium 19 28 6 BMW 530I 6 cyl, 3 L, Manual (6 speed), Premium 20 30 7 BMW 545I 8 cyl, 4.4 L, Manual (6 speed), Premium 17 25 8 Buick Century 6 cyl, 3.1 L, Automatic (4 speed), Regular 20 30 9 Buick Lacrosse/allure 6 cyl, 3.6 L, Automatic (4 speed), Regular 19 27 10 Cadillac CTS 6 cyl, 2.8 L, Automatic (5 speed), Regular 18 27 11 Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular 17 24 12 Chevrolet Classic 4 cyl, 2.2 L, Automatic (4 speed), Regular 25 34 13 Chevrolet Epica 6 cyl, 2.5 L, Automatic (4 speed), Regular 20 28 14 Chevrolet Malibu 4 cyl, 2.2 L, Automatic (4 speed), Regular 24 35 15 Chevrolet Monte Carlo 6 cyl, 3.4 L, Automatic (4 speed), Regular 21 32 16 Chrysler Sebring 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30 17 Dodge Stratus 4 Door 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30 18 Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium 11 17 19 Honda Accord 4 cyl, 2.4 L, Automatic (5 speed), Regular 24 34 20 Honda Accord 6 cyl, 3 L, Automatic (5 speed), Regular 21 30
  • 22. 22 ประเภทรถ ในเมือง ทางหลวง 21 Honda Accord Hybrid 6 cyl, 3 L, Automatic (5 speed), Regular 29 37 22 Hyundai Elantra 4 cyl, 2 L, Automatic (4 speed), Regular 24 32 23 Hyundai Sonata 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30 24 Hyundai XG350 6 cyl, 3.5 L, Automatic (5 speed), Regular 18 26 25 Infinity Q45 8 cyl, 4.5 L, Auto(S5), Premium 17 23 26 Jaquar S-Type R 8 cyl, 4.2 L, Automatic (6 speed), Premium 17 24 27 Kia Optima 4 cyl, 2.4 L, Automatic (4 speed), Regular 22 30 28 Kia Optima 6 cyl, 2.7 L, Automatic (4 speed), Regular 20 27 29 Kia Spectra 4 cyl, 2 L, Automatic (4 speed), Regular 24 34 30 Lexus ES 330 6 cyl, 3.3 L, Automatic (5 speed), Regular 21 29 31 Lexus GS 300/GS 430 6 cyl, 3 L, Auto(S5), Premium 18 25 32 Lincoln LS 6 cyl, 3 L, Automatic (5 speed), Premium 20 26 33 Mazda 6 4 cyl, 2.3 L, Manual (5 speed), Regular 23 31 34 Mercedes-Benz E320 6 cyl, 3.2 L, Automatic (5 speed), Premium 20 28 35 Mercedes Benz E500 8 cyl, 5 L, Auto(L7), Premium 17 25 36 Mercury Sable 6 cyl, 3 L, Automatic (4 speed), Regular 20 27 37 Mitsubishi Galant 4 cyl, 2.4 L, Automatic (4 speed), Regular 23 30 38 Nissan Altima 4 cyl, 2.5 L, Automatic (4 speed), Regular 23 29 39 Nissan Altima 6 cyl, 3.5 L, Manual (5 speed), Regular 21 27 40 Nissan Maxima 6 cyl, 3.5 L, Manual (6 speed), Regular 20 29 41 Pontiac Grand Prix 6 cyl, 3.8 L, Automatic (4 speed), Premium 19 28 42 Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium 12 19 43 Saab 9-5 4 cyl, 2.3 L, Manual (5 speed), Premium 20 30 44 Saturn L300 6 cyl, 3 L, Automatic (4 speed), Regular 21 28 45 Suzuki Verona 6 cyl, 2.5 L, Automatic (4 speed), Regular 20 28 46 Toyota Camry 4 cyl, 2.4 L, Automatic (5 speed), Regular 24 34 47 Toyota Camry 6 cyl, 3 L, Automatic (5 speed), Regular 20 28 48 Volkswagen Passat 4 cyl, 1.8 L, Manual (5 speed), Premium 22 31 49 Volvo S80 AWD 5 cyl, 2.5 L, Automatic (5 speed), Premium 19 26 50 Volvo S80 FWD 5 cyl, 2.5 L, Automatic (5 speed), Premium 21 30
  • 23. 23 ขอมูลดังกลาวเปนขอมูลจากตัวอยางขนาด 50 2.1 ทานจะใชคากลางชนิดใดในการสรุปจํานวนไมลตอแกลลอนของรถยนตดังกลาว เมื่อวิ่งในเมืองและเมื่อวิ่งบนทางหลวง เพราะเหตุใด 2.2 ทานจะวัดการกระจายของจํานวนไมลตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมือง และเมื่อวิ่งบนทางหลวงดวยสถิติใด เพราะเหตุใด 2.3 ใหอธิบายลักษณะที่สําคัญ (คากลาง การกระจาย คาผิดปกติ (ถามี)) ของจํานวนไมล ตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมืองและเมื่อวิ่งบนทางหลวง 2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองหรือเมื่อวิ่งบนทางหลวงมีขอมูลจํานวนไมลตอแกลลอนแตกตาง หรือกระจายมากกวากัน 2.5 ถารัฐบาลกําหนดวา รถที่มีจํานวนไมลตอแกลลอนต่ําจะตองเสียภาษีรถยนตชนิดพิเศษเพิ่ม มีรถกี่ประเภทที่มีจํานวนไมลตอแกลลอนต่ํา เมื่อใชเกณฑวารถชนิดพิเศษนี้มีจํานวนไมลตอแกลอน ต่ํากวาควอรไทลที่ 1 ของจํานวนไมลตอแกลลอนเมื่อวิ่งในเมือง และเมื่อวิ่งบนทางหลวง 3. จากขอมูลในขอ 2 จงอธิบายวา รถยนตขนาดกลางรุนที่ผลิตในป พ.ศ. 2548 ที่นํามา ใชเปนตัวอยางมีลักษณะที่สําคัญอยางไร เชน - จํานวนกระบอกสูบ (cyl.) - ขนาดเครื่องยนต (L) - ประเภทของเกียร (เกียรอัตโนมัติหรือเกียรธรรมดา) - รถชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium) 4. จากขอมูลในขอ2 ใหทําขอ2.1ถึง2.4 อีกครั้งโดยจําแนกรถยนตตามลักษณะดังตอไปนี้ - ประเภทของเกียร (แบบอัตโนมัติ และแบบธรรมดา) - รถชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium) 5. จากขอมูลในขอ 2 ใหตัดขอมูลที่มีคาสูงหรือต่ํากวาปกติตอไปนี้ ลําดับที่ 18 รถยนต Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium ลําดับที่ 42 รถยนต Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium ลําดับที่ 21 รถยนต Honda Accord Hybrid 6 cyl, 3 L, Automatic (5 speed), Regular แลวทําขอ 2.1-2.5 อีกครั้งหนึ่ง เปรียบเทียบกับผลที่ไดกับกรณีที่มีคาผิดปกติอยู 6. ขอมูลตอไปนี้แสดงปริมาณโคเลสเตอรอลในอาหารตาง ๆ หนวยเปนมิลลิกรัมตอปริมาณ อาหาร100 กรัม (จาก http://www.bangkokhealth.com/consumer_htdoc/consumer_health_detail.asp? number=9072)
  • 24. 24 ประเภทอาหาร อาหาร ปริมาณโคเลสเตอรอล (มิลลิกรัม/100 กรัม) ไข ไขไกทั้งฟอง 427 ตับไก 336 ตับหมู 364 ตับวัว 218 ไตหมู 235 หัวใจหมู 133 หัวใจวัว 165 หัวใจไก 157 เครื่องใน ไสตันหมู 140 หอยนางรม 231 หอยแครง 195 หอยแมลงภู 148 กุงแชบวย 192 กุงกุลาดํา 175 อาหารทะเล กุงนาง 138 มันกุงนาง 138 มันปูทะเล 361 ปูมา 90 ปูทะเล 87 ปลาหมึกกระดองหัว 405 ปลาหมึกกระดองเนื้อ 322 ปลาหมึกกลวยหัว 321 ปลาหมึกกลวยเนื้อ 251 เนื้อวัว 65 เนื้อไก 70 เนื้อเปด 100 เนื้อหานพะโล 121 เนื้อกบ 47 ปลาดุก 94 ปลาชอน 44 ปลากราย 77 ปลากระบอก 64 เนื้อสัตว ปลาทู 76
  • 25. 25 ถาอาหารแตละอยางเปนตัวแทนของอาหารประเภทนั้นๆ 6.1 สําหรับผูที่ตองการลดปริมาณโคเลสเตอรอลควรรับประทานอาหารประเภทใดเพราะเหตุใด 6.2 อาหารประเภทเครื่องในและอาหารทะเลมีปริมาณโคเลสเตอรอลใกลเคียงกันหรือไม อาหารประเภทอาหารทะเลมีปริมาณโคเลสเตอรอลตอ 100 กรัมแตกตางกันมากกวาอาหารประเภท เครื่องในใชหรือไม 7. ถายอดขายของบริษัทแหงหนึ่งในชวงหาปที่ผานมาเพิ่มขึ้นรอยละ 9.4, 13.8, 11.7, 11.9, และ 14.7 ใหคํานวณคาเฉลี่ยเรขาคณิตของยอดขายที่เพิ่มขึ้นในชวงเวลาดังกลาว 8. เพราะเหตุใดการคํานวณคากลางเชน คาเฉลี่ยเลขคณิต ของขอมูลที่อยูในตารางแจกแจงความถี่ คาที่คํานวณไดจึงเปนเพียงคาโดยประมาณเทานั้น เฉลยแบบทดสอบประจําบท 1. 1.1 นายกรัฐมนตรีของไทยทานที่มีอายุนอยที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก คือ หมอมราชวงศ เสนีย ปราโมช (อายุ 40 ป) 1.2 นายกรัฐมนตรีของไทยทานที่มีอายุมากที่สุดเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก คือ พลเอก ชาติชาย ชุณหะวัณ (อายุ 68 ป) 1.3 โดยเฉลี่ยแลวนายกรัฐมนตรีของไทยรับตําแหนงนายกรัฐมนตรีครั้งแรกเมื่ออายุ 53 ป 1.4 เมื่อเทียบกับนายกรัฐมนตรีของไทยในอดีต นายกรัฐมนตรีคนปจจุบันพันตํารวจโท ทักษิณ ชินวัตร มีอายุเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรก 52 ป เทากับ มัธยฐานของ อายุของทั้งกลุม ดังนั้นจึงไมนอยเกินไปและไมมากเกินไป 1.5 ใหกลุมที่ 1 คือนายกรัฐมนตรีลําดับที่ 1 ถึง 11 จํานวน 11 คน และกลุมที่ 2 คือ นายกรัฐมนตรีลําดับที่ 12 ถึง 23 จํานวน 12 คน กลุมที่ 1 มีอายุเฉลี่ย 45.27 ป มัธยฐานของอายุ 46.00 ป อายุนอยสุด 40 ป และอายุมากสุด 52 ป กลุมที่ 2 มีอายุเฉลี่ย 60.08 ป มัธยฐานของอายุ 60.00 ป อายุนอยสุด 50 ป และอายุมากสุด 68 ป หรือพิจารณาจากแผนภาพกลองในรูปที่ 1 จะเห็นวาตั้งแตนายกรัฐมนตรีคนที่ 12 เปนตนไป อายุเมื่อรับตําแหนงนายกรัฐมนตรีครั้งแรกมากกวาอายุของนายกรัฐมนตรีสมัยกอนๆ เมื่อรับตําแหนงครั้งแรก
  • 26. 26 รูปที่ 1 แผนภาพกลองแสดงอายุของนายกรัฐมนตรีเมื่อรับตําแหนงครั้งแรก แผนภาพซายคือ แผนภาพของกลุมที่ 1 สวนแผนภาพขวาคือแผนภาพของกลุมที่ 2 2. 2.1 ใชคาเฉลี่ยหรือมัธยฐานก็ไดเพื่อเปนคากลางของขอมูลดังกลาวเนื่องจากตัวแปรทั้งสองเปนขอมูล เชิงปริมาณ และการแจกแจงของตัวแปรทั้งสองสามารถประมาณไดวามีลักษณะสมมาตร (พิจารณาจากฮิสโทแกรมในรูปที่ 2 และรูปที่ 3) - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีคาเฉลี่ยเลขคณิต20.24 ไมลตอแกลลอนและมีมัธยฐาน 20.00 ไมลตอแกลลอน - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีคาเฉลี่ยเลขคณิตเทากับ 28.34 ไมลตอแกลลอนและมีมัธยฐาน 28.00 ไมลตอแกลลอน CITY 30.027.525.022.520.017.515.012.510.0 Histogram Frequency 30 20 10 0 Std. Dev = 3.03 Mean = 20.2 N = 50.00 รูปที่ 2 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง 1211N = GR 2.001.00 อายุเมื่อไดรับตําแหนง 80 70 60 50 40 30
  • 27. 27 HWY 37.535.032.530.027.525.022.520.017.5 Histogram Frequency 20 10 0 Std. Dev = 3.75 Mean = 28.3 N = 50.00 รูปที่ 3 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง 2.2 วัดการกระจายของจํานวนไมลตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมืองและเมื่อวิ่ง บนทางหลวงดวยสวนเบี่ยงเบนมาตรฐาน เพราะตัวแปรทั้งสองเปนขอมูลเชิงปริมาณ โดยสวนเบี่ยงเบน มาตรฐานใชขอมูลทุกๆคามาคํานวณ และตัวแปรทั้งสองมีการแจกแจงที่ประมาณไดวามีลักษณะสมมาตร - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีสวนเบี่ยงเบนมาตรฐาน 3.03 ไมลตอแกลลอน - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีสวนเบี่ยงเบนมาตรฐาน 3.75 ไมลตอแกลลอน 2.3 ลักษณะของตัวแปรทั้งสองคือ - รถยนตดังกลาวเมื่อวิ่งในเมืองวิ่งไดระยะทางนอยสุด 11 ไมลตอแกลลอน และวิ่งได ระยะทางมากสุด 29 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 20.24 ไมลตอแกลลอนโดยมี สวนเบี่ยงเบนมาตรฐาน 3.03 ไมลตอแกลลอน อนึ่งถาพิจารณาจากแผนภาพกลองในรูปที่ 4 จะเห็นวามีขอมูลที่มีคาต่ํากวาปกติสองคา ไดแก รถยนตลําดับที่ 18 (11 ไมลตอแกลลอน) และลําดับที่ 42 (12 ไมลตอแกลลอน) และคาสูงผิดปกติ หนึ่งคา ไดแกรถยนตลําดับที่ 21 (29 ไมลตอแกลลอน) - รถยนตดังกลาวเมื่อวิ่งบนทางหลวงวิ่งไดเร็วกวาวิ่งในเมืองโดยวิ่งไดระยะทางอยางนอยสุด 17 ไมลตอแกลลอน และวิ่งไดระยะทางมากสุด 37 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 28.34 ไมลตอแกลลอนโดยมีสวนเบี่ยงเบนมาตรฐาน 3.75 ไมลตอแกลลอน อนึ่งถาพิจารณาจากแผนภาพกลองในรูปที่ 5 จะเห็นวามีขอมูลที่มีคาต่ํากวาปกติสองคา ไดแก รถยนตลําดับที่ 18 (17 ไมลตอแกลลอน) และลําดับที่ 42 (19 ไมลตอแกลลอน) และคาสูงผิดปกติ หนึ่งคา ไดแกรถยนตลําดับที่ 21 (37 ไมลตอแกลลอน)
  • 28. 28 ลําดับที่ของรถยนตที่เปนคาผิดปกติเมื่อวิ่งบนทางหลวงนี้สอดคลองกับลําดับที่ของรถ ยนตที่เปนคาผิดปกติเมื่อวิ่งในเมือง หมายเหตุ ลําดับที่ 18 คือรถยนต Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium ลําดับที่ 42 คือรถยนต Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium ลําดับที่ 21 คือรถยนต Honda Accord Hybrid 6 cyl, 3 L, Automatic (5 speed), Regular 50N = CITY 40 30 20 10 0 42 18 21 รูปที่ 4 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง 50N = HWY 40 30 20 10 42 18 21 รูปที่ 5 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง
  • 29. 29 2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองมีจํานวนไมลตอแกลลอนแตกตางหรือกระจายมากกวาเมื่อวิ่ง บนทางหลวงเนื่องจาก สัมประสิทธิ์ของความแปรผันของขอมูลเมื่อวิ่งในเมืองคือ (3.03/20.24) ×100 % หรือ 14.97 % แตเมื่อวิ่งบนทางหลวงมีคาสัมประสิทธิ์ของความแปรผันของขอมูลเทคือ (3.75/28.34) × 100 % หรือ 13.23 % แมวาสวนเบี่ยงเบนมาตรฐานของขอมูลเมื่อรถยนตวิ่งในเมืองจะมีคานอยกวา สวนเบี่ยงเบนมาตรฐานของขอมูลเมื่อรถยนตวิ่งบนทางหลวงก็ตาม (ซึ่งพิจารณาจากสวนเบี่ยงเบน มาตรฐานอยางเดียวไมได) 2.5 เนื่องจากควอรไทลที่ 1 ของ จํานวนไมลตอแกลลอนเมื่อรถยนตวิ่งในเมืองคือ 18.75 ไมล ตอแกลลอน และควอรไทลที่ 1 ของจํานวนไมลตอแกลลอนเมื่อรถยนตวิ่งบนทางหลวงคือ 26.00 ไมลตอแกลลอน ดังนั้นจะมีรถยนต 9 ประเภทขางลางนี้ที่มีคาของตัวแปรทั้งสองนอยกวาควอรไทลที่ 1 ของ ตัวแปรนั้นๆ - Audi A8 8 cyl, 4.2 L, Auto(S6), Premium - BMW 545I 8 cyl, 4.4 L, Manual (6 speed), Premium - Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular - Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular - Cadillac STS 2WD 6 cyl, 3.6 L, Auto(S5), Regular - Ferrari 612 Scaqlietti 12 cyl, 5.7 L, Manual (6 speed), Premium - Jaquar S-Type R 8 cyl, 4.2 L, Automatic (6 speed), Premium - Lexus GS 300/GS 430 6 cyl, 3 L, Auto(S5), Premium - Mercedes Benz E500 8 cyl, 5 L, Auto(L7), Premium - Rolls-Royce Phantom 12 cyl, 6.7 L, Auto(S6), Premium 3. รถยนตขนาดกลางรุนที่ผลิตในป พ.ศ. 2548 ที่นํามาใชเปนตัวอยาง มีลักษณะที่สําคัญคือ - จํานวนกระบอกสูบ (cyl.) ตารางแจกแจงความถี่ของจํานวนกระบอกสูบของรถยนตดังกลาว คือ จํานวนกระบอกสูบ จํานวนรถยนต (คัน) 4 5 6 8 12 15 2 26 5 2 รวม 50
  • 30. 30 รถยนตที่นํามาใชเปนตัวอยางสวนใหญมีจํานวนกระบอกสูบ 6 กระบอก (26 คันจาก 50 คัน) รองลงมาคือ 4 กระบอก (15 คัน จาก 50 คัน) จํานวนกระบอกสูบที่นอยที่สุดคือ 4 กระบอกและ จํานวนกระบอกสูบที่มากที่สุดคือ 12 กระบอก (มีเพียง 2 คันจาก 50 คัน) หมายเหตุ มัธยฐานของขอมูลคือ6กระบอกเทากับฐานนิยมสวนคาเฉลี่ยเลขคณิตเทากับ5.80 กระบอก - ขนาดเครื่องยนต (L) รถยนตที่นํามาใชเปนตัวอยางมีขนาดเครื่องยนตตั้งแต 1.8 L ถึง 6.7 L มีคาเฉลี่ย 3.102 L และสวนเบี่ยงเบนมาตรฐาน 0.949 L หมายเหตุ มัธยฐานของขอมูลคือ 3.00 L - ประเภทของเกียร (เกียรอัตโนมัติหรือเกียรธรรมดา) รถยนตที่นํามาใชเปนตัวอยางสวนใหญเปนรถที่ใชเกียรอัตโนมัติ (40 จาก 50 คันหรือคิดเปน 80% ของทั้งหมด) รถยนตที่ใชเกียรธรรมดามีเพียง 10 คันหรือ 20 % เทานั้น - รถชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium) รถยนตที่นํามาใชเปนตัวอยางสวนใหญเปนรถชนิดธรรมดา (30 จาก 50 คันหรือคิดเปน 60% ของทั้งหมด) และชนิดพิเศษมีจํานวน 20 คันหรือคิดเปน 40% ของทั้งหมด 4. ในที่นี้จะแสดงการอธิบายขอมูลเฉพาะการจําแนกรถยนตตามประเภทของเกียร(แบบอัตโนมัติ และแบบธรรมดา) สวนการจําแนกประเภทรถยนตชนิดธรรมดา (Regular) หรือชนิดพิเศษ (Premium) สามารถทําไดในลักษณะเดียวกัน รถยนตประเภทเกียรอัตโนมัติ 2.1 ใชคาเฉลี่ยเลขคณิตหรือมัธยฐานก็ไดเพื่อเปนคากลางของขอมูลดังกลาว เนื่องจากตัวแปร ทั้งสองเปนขอมูลเชิงปริมาณ และการแจกแจงของตัวแปรทั้งสองสามารถประมาณไดวามีลักษณะสมมาตร (พิจารณาจากฮิสโทแกรมในรูปที่ 6 และรูปที่ 7) - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีคาเฉลี่ยเลขคณิต 20.48 ไมลตอแกลลอนและมีมัธยฐาน 20.00 ไมลตอแกลลอน - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีคาเฉลี่ยเลขคณิต 28.50 ไมลตอแกลลอนและมีมัธยฐาน 28.00 ไมลตอแกลลอน
  • 31. 31 CITY 30.027.525.022.520.017.515.012.5 Histogram For GEER= a Frequency 20 10 0 Std. Dev = 2.95 Mean = 20.5 N = 40.00 รูปที่ 6 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง (ประเภทเกียรอัตโนมัติ) HWY 37.535.032.530.027.525.022.520.0 Histogram For GEER= a Frequency 12 10 8 6 4 2 0 Std. Dev = 3.67 Mean = 28.5 N = 40.00 รูปที่ 7 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง (ประเภทเกียรอัตโนมัติ) 2.2 วัดการกระจายของจํานวนไมลตอแกลลอนของรถยนตดังกลาวเมื่อวิ่งในเมืองและเมื่อวิ่งบน ทางหลวงดวยสวนเบี่ยงเบนมาตรฐาน เพราะตัวแปรทั้งสองเปนขอมูลเชิงปริมาณโดยสวนเบี่ยงเบน มาตรฐานใชขอมูลทุกๆคามาคํานวณ และตัวแปรทั้งสองมีการแจกแจงที่ประมาณไดวามีลักษณะสมมาตร -ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีสวนเบี่ยงเบนมาตรฐาน 2.95 ไมลตอแกลลอน - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีสวนเบี่ยงเบนมาตรฐาน 3.67 ไมลตอแกลลอน
  • 32. 32 2.3 ลักษณะของตัวแปรทั้งสองคือ - รถยนตดังกลาวเมื่อวิ่งในเมืองวิ่งไดระยะทางนอยสุด 12 ไมลตอแกลลอน และวิ่ง ไดระยะทางมากสุด 29 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 20.48 ไมลตอแกลลอนโดยมี สวนเบี่ยงเบนมาตรฐาน 2.95 ไมลตอแกลลอน ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 42 (12 ไมลตอแกลลอน) และคาสูงผิดปกติหนึ่งคา ไดแกรถยนตลําดับที่ 21 (29 ไมลตอแกลลอน) - รถยนตดังกลาวเมื่อวิ่งบนทางหลวงวิ่งไดเร็วกวาวิ่งในเมืองโดยวิ่งไดระยะทางอยางนอยสุด 19 ไมลตอแกลลอน และวิ่งไดระยะทางมากสุด 37 ไมลตอแกลลอน เฉลี่ยแลววิ่งไดระยะทาง 28.50 ไมลตอแกลลอนโดยมีสวนเบี่ยงเบนมาตรฐาน 3.67 ไมลตอแกลลอน ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 42 (19 ไมลตอแกลลอน) และคาสูงผิดปกติหนึ่งคา ไดแกรถยนตลําดับที่ 21 (37 ไมลตอแกลลอน) ลําดับที่ของรถยนตที่เปนคาผิดปกติเมื่อวิ่งบนทางหลวงนี้สอดคลองกับลําดับที่ของ รถยนตที่เปนคาผิดปกติเมื่อวิ่งในเมือง สําหรับแผนภาพกลองใหพิจารณาในรูปที่ 10 และ 11 2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองมีจํานวนไมลตอแกลลอนแตกตางหรือกระจายมากกวาเมื่อ วิ่งบนทางหลวงเนื่องจากสัมประสิทธิ์ของความแปรผันของขอมูลเมื่อวิ่งในเมือง (2.95/20.48) ×100 % หรือ 14.40 % แตเมื่อวิ่งบนทางหลวงมีคาสัมประสิทธิ์ของความแปรผันของขอมูล(3.67/28.50) × 100 % หรือ 12.88 % รถยนตประเภทเกียรธรรมดา 2.1 ใชคามัธยฐานเพื่อเปนคากลางของขอมูลดังกลาว เนื่องจากตัวแปรทั้งสองเปนขอมูลเชิงปริมาณ และการแจกแจงของตัวแปรทั้งสองมีลักษณะเบซาย(พิจารณาจากฮิสโทแกรมในรูปที่ 8และรูปที่9) อยางไรก็ตามคาเฉลี่ยเลขคณิตในกรณีนี้ก็ไมตางจากมัธยฐานมากนัก - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีคามัธยฐาน 20.00 ไมลตอแกลลอน(คาเฉลี่ยเลขคณิต 19.30 ไมลตอแกลลอน) - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีคามัธยฐาน 29.00 ไมลตอแกลลอน (คาเฉลี่ยเลขคณิต 27.70 ไมลตอแกลลอน)
  • 33. 33 CITY 22.520.017.515.012.510.0 Histogram For GEER= m Frequency 7 6 5 4 3 2 1 0 Std. Dev = 3.33 Mean = 19.3 N = 10.00 รูปที่ 8 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมือง (ประเภทเกียรธรรมดา) HWY 30.027.525.022.520.017.5 Histogram For GEER= m Frequency 7 6 5 4 3 2 1 0 Std. Dev = 4.19 Mean = 27.7 N = 10.00 รูปที่ 9 ฮิสโทแกรมของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง (ประเภทเกียรธรรมดา) 2.2 อาจวัดการกระจายในกรณีที่การแจกแจงของขอมูลมีลักษณะเบดวยสวนเบี่ยงเบนมาตรฐานก็ได เพราะตัวแปรทั้งสองเปนขอมูลเชิงปริมาณ และสวนเบี่ยงเบนมาตรฐานใชขอมูลทุกๆคา มาคํานวณ อยางไรก็ตามในการสรุปขอมูลไมควรใชแคคาเฉลี่ยและสวนเบี่ยงเบนมาตรฐานเทานั้น ควรใชแผนภาพ ชวยอธิบายขอมูลดวย เชน ฮิสโทแกรมหรือแผนภาพกลอง (กลาวถึงในขอ 2.3 ถัดไป) เปนตน
  • 34. 34 - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองมีสวนเบี่ยงเบนมาตรฐาน 3.33 ไมลตอแกลลอน - ตัวแปรจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวงมีสวนเบี่ยงเบนมาตรฐาน 4.19 ไมลตอแกลลอน 2.3 ลักษณะของตัวแปรทั้งสองคือ -รถยนตดังกลาวเมื่อวิ่งในเมืองวิ่งไดระยะทางนอยสุด 11ไมลตอแกลลอน ควอรไทลที่หนึ่ง คือ 18.50 ควอรไทลที่สองหรือมัธยฐานคือ 20.00 ควอรไทลที่สามคือ 21.25 ไมลตอแกลลอน และวิ่ง ไดระยะทางมากสุด 23 ไมลตอแกลลอน พิจารณาแผนภาพกลองในรูปที่ 10 ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 18 (11 ไมลตอแกลลอน) - รถยนตดังกลาวเมื่อวิ่งบนทางหลวงวิ่งไดเร็วกวาวิ่งในเมืองโดยวิ่งไดระยะทางอยางนอยสุด 17 ไมลตอแกลลอน ควอรไทลที่หนึ่งคือ 26.50 ควอรไทลที่สองหรือมัธยฐานคือ 29.00 ควอรไทลที่ สามคือ 30.25 ไมลตอแกลลอน และวิ่งไดระยะทางมากสุด 31 ไมลตอแกลลอน พิจารณาแผนภาพ กลองในรูปที่ 11 ขอมูลชุดนี้มีคาต่ํากวาปกติหนึ่งคา ไดแก รถยนตลําดับที่ 18 (17 ไมลตอแกลลอน) ลําดับที่ของรถยนตที่เปนคาผิดปกติเมื่อวิ่งบนทางหลวงนี้สอดคลองกับลําดับที่ของรถยนต ที่เปนคาผิดปกติเมื่อวิ่งในเมือง 1040N = GEER ma CITY 40 30 20 10 0 18 42 21 รูปที่ 10 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งในเมืองแผนภาพซายมือ คือรถยนตที่ใชเกียรอัตโนมัติและแผนภาพขวามือคือรถยนตที่ใชเกียรธรรมดา
  • 35. 35 2.4 รถยนตดังกลาวเมื่อวิ่งในเมืองมีจํานวนไมลตอแกลลอนแตกตางหรือกระจายมากกวาเมื่อวิ่ง บนทางหลวงเนื่องจาก สัมประสิทธิ์ของความแปรผันของขอมูลเมื่อวิ่งในเมืองคือ (3.33/19.30) ×100 % หรือ 17.25 % แตเมื่อวิ่งบนทางหลวงมีคาสัมประสิทธิ์ของความแปรผันของขอมูลคือ (4.19/27.70) × 100 % หรือ 15.13 % 1040N = GEER ma HWY 40 30 20 10 18 42 21 รูปที่ 11 แผนภาพกลองของจํานวนไมลตอแกลลอนของรถยนตเมื่อวิ่งบนทางหลวง แผนภาพ ซายมือคือรถยนตที่ใชเกียรอัตโนมัติและแผนภาพขวามือคือรถยนตที่ใชเกียรธรรมดา 5. เมื่อตัดขอมูลที่มีคาสูงหรือต่ํากวาปกติ แลวใหทําเชนเดียวกันกับขอ 2 6. 6.1 สําหรับผูที่ตองการลดปริมาณโคเลสเตอรอลควรรับประทานอาหารประเภทเนื้อสัตวเนื่องจาก อาหารประเภทเนื้อสัตว มีปริมาณโคเลสเตอรอลโดยเฉลี่ย75.80มิลลิกรัมตอ100กรัม มีมัธยฐาน 73 มิลลิกรัมตอ 100 กรัม มีคานอยสุดคือ 44 และคามากสุดคือ 121 มิลลิกรัมตอ 100 กรัม สวนอาหารประเภทอื่นๆ ใหดูจาก 6.2 6.2อาหารประเภทเครื่องในและอาหารทะเลมีปริมาณโคเลสเตอรอลพอๆกันเนื่องจาก อาหารประเภทเครื่องใน มีปริมาณโคเลสเตอรอลโดยเฉลี่ย218.50มิลลิกรัมตอ100กรัม มีมัธยฐาน 191.50 มิลลิกรัมตอ 100 กรัม อาหารประเภทอาหารทะเล มีปริมาณโคเลสเตอรอลโดยเฉลี่ย 218.50 มิลลิกรัมตอ 100 กรัม มีมัธยฐาน 193.50 มิลลิกรัมตอ 100 กรัม อยางไรก็ตาม อาหารประเภทอาหารทะเลมีปริมาณโคเลสเตอรอลตอ 100 กรัม
  • 36. 36 กระจายหรือแตกตางกันมากกวาอาหารประเภทเครื่องใน เพราะวา อาหารประเภทอาหารทะเล มีปริมาณโคเลสเตอรอลต่ําสุด 87 และสูงสุด 405 มิลลิกรัมตอ 100 กรัม มีสัมประสิทธิ์ความแปรผัน 46.19 % อาหารประเภทเครื่องใน มีปริมาณโคเลสเตอรอลต่ําสุด 133 และสูงสุด 364 มิลลิกรัมตอ 100 กรัม มีสัมประสิทธิ์ความแปรผัน 40.70 % หรือพิจารณาจากแผนภาพกลองในรูปที่ 12 10148N = TYPE 432 cholestrerol 500 400 300 200 100 0 รูปที่ 12 แผนภาพกลองของปริมาณโคเลสเตอรอลตอ 100 กรัม ของอาหารประเภทเครื่องใน อาหารประเภทอาหารทะเล และอาหารประเภทเนื้อสัตว(จากซายไปขวาตามลําดับ) 7. คาเฉลี่ยเรขาคณิตของยอดขายที่เพิ่มขึ้นในชวงเวลาดังกลาว คือ 5 (9.4)(13.8)(11.7)(11.9)(14.7) 12.16≈ % 8. เนื่องจากเราไมทราบคาที่แทจริงของขอมูลทั้งหลายที่ตกอยูในแตละชั้นและสมมุติวาคา ทั้งหลายเหลานั้นมีคาเทากัน และเทากับจุดกึ่งกลางของแตละชั้น คาที่คํานวณไดจึงเปนคาโดยประมาณ เทานั้น
  • 37. 37 เฉลยแบบฝกหัด 1.1 (ก) 1. (1) 10 i 1 c = ∑ = 10 i 1 2 = ∑ = 10(2) = 20 (2) 5 3 i i 1 (x 2) = −∑ = (1 – 2)3 + (3 – 2)3 + (4 – 2)3 + (7 – 2)3 + (0 – 2)3 = –1 + 1 + 8 + 125 – 8 = 125 (3) 3 i i i 1 (f x c) = +∑ = ((10 × 1) + 2) + ((15 × 3) + 2) + ((5 × 4) + 2) = 12 + 47 + 22 = 81 (4) 4 i i i 1 (x 3)(x 3) = − +∑ = 4 2 i i 1 (x 9) = −∑ = (12 – 9) + (32 – 9) + (42 – 9) + (72 – 9) = –8 + 0 + 7 + 40 = 39 หรือ 4 i i i 1 (x 3)(x 3) = − +∑ = (1 – 3)(1 + 3) + (3 – 3)(3 + 3) + (4 – 3)(4 + 3) + (7 – 3)(7 + 3) = –8 + 0 + 7 + 40 = 39 2. 5 i i 1 (5y 50) = −∑ = 5 i i 1 5 y 50(5) = −∑ = 5(10) – 250 = –200 5 2 i i 1 (y 3) = −∑ = 5 2 i i i 1 (y 6y 9) = − +∑ = 5 5 2 i i i 1 i 1 y 6 y 9(5) = = − +∑ ∑ = 30 – 6(10) + 45 = 15
  • 38. 38 3. 4 i i i 1 (x 1)(4y 3) = + −∑ = 4 i i i i i 1 (4x y 3x 4y 3) = − + −∑ = 4 4 4 i i i i i 1 i 1 i 1 4 x y 3 x 4 y 3(4) = = = − + −∑ ∑ ∑ = 4(4) – 3(5) + 4(–2) – 12 = –19 4. (1) 2 2 2 1 2 102x 2x 2x+ + + = 10 2 i i 1 2 x = ∑ (2) 1 1 2 2 k k(x X)f (x X)f (x X)f− + − + + − = k i i i 1 (x X)f = −∑ (3) 2 2 2 1 1 2 2 k k 1 {(y Y) f (y Y) f (y Y) f } n − + − + + − = k 2 i i i 1 1 (y Y) f n = −∑ 5. N i i i i 1 (x 3y 2z 1) = − + +∑ = (x1 – 3y1 + 2z1 + 1) + (x2 – 3y2 + 2z2 + 1) + ... + (xN – 3yN + 2zN + 1) = (x1 + x2 + ... + xN) – 3(y1 + y2 + ... + yN) + 2(z1+z2 + ... + zN) + (1 + 1 + ... + 1) = N N N i i i i 1 i 1 i 1 x 3 y 2 z N = = = − + +∑ ∑ ∑ ดังนั้น N i i i i 1 (x 3y 2z 1) = − + +∑ = N N N i i i i 1 i 1 i 1 x 3 y 2 z N = = = − + +∑ ∑ ∑ 6. จากขอมูลทําตารางไดดังนี้ ชวงคะแนน จุดกึ่งกลาง จํานวนนักเรียน 60 – 80 90 – 100 70 95 40 10 (1) คาเฉลี่ยเลขคณิต µ = 70(40) 95(10) 40 10 + + = 2800 950 50 + = 75 ดังนั้น คาเฉลี่ยเลขคณิตของคะแนนสอบวิชาสถิติทั้ง 50 คน เทากับ 75 คะแนน มี 1 อยู N ตัว
  • 39. 39 (2) คาเฉลี่ยเลขคณิต µ = 75(40) 95(10) 40 10 + + = 3000 950 50 + = 79 ดังนั้น คาเฉลี่ยเลขคณิตที่คํานวณได (79 คะแนน) จะไมเทากับคาเฉลี่ยเลขคณิต จากขอ (1) (75 คะแนน) (3) จากคาเฉลี่ยเลขคณิตในขอ (1) เทากับ 75 คะแนน ดังนั้น คะแนนสอบวิชาสถิติรวม 50 คน เทากับ 50 × 75 = 3,750 คะแนน 7. คาเฉลี่ยเลขคณิตรวม µ = 40(165) 45(168) 50(167) 45(164) 40 45 50 45 + + + + + + = 6600 7560 8350 7380 180 + + + = 29890 180 = 166.06 ดังนั้น คาเฉลี่ยเลขคณิตของสวนสูงของนักเรียนชั้นมัธยมศึกษาปที่ 5 ทั้งหมดเทากับ 166.06 เซนติเมตร 8. กําหนดให S = 10 + 1.4B จะได Si = 10 + 1.4Bi เมื่อ i คือ 1, 2, ..., 10 ดังนั้น S = 10 + 1.4B B = 80 85 70 80 75 78 82 86 79 69 10 + + + + + + + + + = 784 10 = 78.4 จะได S = 10 + 1.4(78.4) = 119.76 นั่นคือ ราคาขายเฉลี่ยของสินคาชนิดนี้ เทากับ 119.76 บาท 9. ราคาเฉลี่ยของไขไก µ = 50(2.30) 30(2.00) 20(1.70) 50 30 20 + + + + = 209 100 = 2.09 นั่นคือ เฉลี่ยแลวธนากรซื้อไขไกมาฟองละ 2.09 บาท
  • 40. 40 10. (1) จะแสดงวา N i i 1 x = ∑ = Nµ เพราะวา N i i 1 x = ∑ = x1 + x2 + x3 + ... + xN = N N (x1 + x2 + x3 + ... + xN) = N i i 1 x N N = ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ∑ = Nµ (2) จะแสดงวา N i i 1 (x ) 0 = −µ =∑ เพราะวา N i i 1 (x ) = −µ∑ = 1 2 3 N(x ) (x ) (x ) (x )− µ + − µ + − µ + + − µ = (x1 + x2 + x3 + ... + xN) – ( )µ + µ + µ + + µ = N i i 1 x N = − µ∑ = Nµ – Nµ = 0 (4) จะแสดงวา xmin < µ < xmax เนื่องจาก xmin + xmin + ... + xmin < x1 + x2 + x3 + ... + xN < xmax + xmax + ... + xmax จะได Nxmin < N i i 1 x = ∑ < Nxmax minNx N < N i i 1 x N = ∑ < maxNx N xmin < µ < xmax มี µ อยู N ตัว มี xmin อยู N ตัว มี xmax อยู N ตัว
  • 41. 41 (5) จะแสดงวา Y = aX b+ เนื่องจาก Yi = axi + b ดังนั้น n i i 1 Y = ∑ = n i i 1 (ax b) = +∑ = n i i 1 a x nb = +∑ จะได n i i 1 y n = ∑ = n i i 1 a x nb n n = + ∑ ดังนั้น Y = aX b+ เฉลยแบบฝกหัด 1.1 (ข) 1. เรียงขอมูลจากนอยไปมาก จะได 11 11 15 16 18 22 22 22 28 36 มัธยฐานอยูตําแหนงที่ 10 1 5.5 2 + = ดังนั้น มัธยฐานของขอมูลชุดนี้เทากับ 18 22 20 2 + = บาท นักเรียนที่ตองจายคาใชจายรายวันเกินกวามัธยฐานมีอยู 5 คน 2. เรียงขอมูลจากนอยไปมาก จะได 44.3 466.4 974.0 1,080.8 1,724.4 2,148.8 5,270.9 มัธยฐานอยูตําแหนงที่ 7 1 2 + = 4 ดังนั้น มัธยฐานของจํานวนผูมีงานทําจําแนกตามประเภทอุตสาหกรรมในป พ.ศ. 2546 เทากับ 1,080.8 พันคน หรือ 1,080,800 คน 3. x1, x2, x3, ..., xN เปนขอมูลที่เรียงจากนอยไปหามาก หรือมากไปหานอย (1) เมื่อ N เปนจํานวนคู ขอมูลที่อยูตรงกลางจะมี 2 จํานวน คือ N 2 x กับ N 1 2 x + ดังนั้น มัธยฐาน คือ N N 1 2 2 x x 2 + + (2) เมื่อ N เปนจํานวนคี่ ขอมูลที่อยูตรงกลางจะมี 1 จํานวน คือ N 1 2 x + ดังนั้น มัธยฐาน คือ N 1 2 x +
  • 42. 42 เฉลยแบบฝกหัด 1.1 (ค) 1. อายุของเด็ก 15 คน เรียงลําดับจากนอยไปมากไดดังนี้ 5 5 6 6 7 7 7 7 7 8 8 8 8 9 9 จะได ฐานนิยมของอายุเด็ก 15 คน คือ 7 ป 2. จํานวนไขไกที่ใชบริโภคตอเดือนเรียงลําดับจากนอยไปมากดังนี้ 32 35 38 44 44 46 47 48 48 48 48 49 51 52 54 60 60 60 60 65 จะได ฐานนิยมของจํานวนไขไกที่แตละครอบครัวบริโภคตอเดือนคือ 48 และ 60 ฟอง คากึ่งกลางพิสัยของจํานวนไขไกที่แตละครอบครัวบริโภคตอเดือนคือ 48.5 ฟอง 3. เงินเดือนของพนักงาน 7 คน เรียงลําดับจากนอยไปมากดังนี้ 3400 3450 3500 3500 3500 3600 21000 คาเฉลี่ยเลขคณิตของเงินเดือนเทากับ 3400 3450 3(3500) 3600 21000 7 + + + + = 5992.86 จะได มัธยฐานของเงินเดือนพนักงาน 7 คน คือ 3500 บาท ฐานนิยมของเงินเดือนพนักงาน 7 คน คือ 3500 บาท มัธยฐานและฐานนิยมจะเปนตัวแทนของเงินเดือนของพนักงาน 7 คน ไดดีกวาคาเฉลี่ยเลขคณิตเพราะ มี ขอมูลที่มีคาสูงผิดปกติอยูคือ 21000 ถาใชคาเฉลี่ยเลขคณิตซึ่งคือ 5992.86 บาท จะไมใชตัวแทนที่ดี เนื่องจากพนักงาน6คนจาก7คน เงินเดือนนอยกวาคานี้นั่นคือมีขอมูลผิดปกติทําใหเกิดผลกระทบตอคา เฉลี่ยเลขคณิตแตไมมีผลกระทบตอคามัธยฐานหรือฐานนิยม 4. เนื่องจาก ระยะทาง = เวลา × ความเร็ว จะได เวลา = ดังนั้น เวลาที่ใชในการเดินทางระยะ d1, d2 และ d3 เทากับ 1 2 2 2 d d , v v และ 3 3 d v ตามลําดับ เนื่องจาก อัตราเร็วเฉลี่ย = จะได อัตราเร็วเฉลี่ย (v) = 1 2 3 31 2 1 2 3 d d d dd d v v v + + + + ซึ่งเปนคาเฉลี่ยฮารมอนิกถวงน้ําหนัก ถา d1 = 2500, d2 = 1200, d3 = 500, v1 = 500, v2 = 400 และ v3 = 250 ระยะทาง ความเร็ว ระยะทางทั้งหมด เวลาที่ใชทั้งหมด
  • 43. 43 จะได v = 2500 1200 500 2500 1200 500 500 400 250 + + + + v = 4200 10 = 420 ดังนั้น v เทากับ 420 ไมลตอชั่วโมง 5. (1) เพราะคาเฉลี่ยเลขคณิตไมใชคากลางที่แบงจํานวนขอมูลทั้งหมดออกเปนสองสวนแตเปนมัธยฐาน (2) (3) (4) ฐานนิยมของขอมูลอาจมีมากกวา 1 คาก็ได กรณีที่ขอมูลชุดใดมีฐานนิยมมากกวา 2 คา อาจถือไดวาขอมูลชุดนั้นไมมีฐานนิยมได หรืออาจหาตัวแปรอื่นเชน เพศ มาแบงขอมูลที่มี ฐานนิยมมากกวาสองคาออกใหเห็นฐานนิยมเพียงคาเดียวภายใตแตละเพศหรือแตละกลุม (5) ไมจําเปนขึ้นอยูกับการกระจายของขอมูลชุดนั้น ๆ 6. รายการที่เสียหาย คาเฉลี่ยเลขคณิตของความเสียหาย(ลานบาท) ที่ดิน บาน/อาคารสิ่งปลูกสราง อุปกรณ ยานพาหนะ อื่นๆ 43.75 128.8 62.14 50.67 38.45 7. เราไมสามารถหาคากลางโดยใชมัธยฐาน ฐานนิยม หรือคากึ่งกลางพิสัยไดเนื่องจาก วัตถุประสงค ของการนําคากลางของขอมูลในตารางมาใชเพื่อตองการทราบขอมูลเกี่ยวกับมูลคาความเสียหายโดย ประมาณ ซึ่งถาใชคามัธยฐาน ฐานนิยม หรือคากึ่งกลางพิสัยอาจทําใหไดคากลางที่มีคาต่ําหรือสูง เกินไป เฉลยแบบฝกหัดระคน 1. จุดเดนที่แตกตางระหวางการใชคาเฉลี่ยเลขคณิต และมัธยฐาน มีดังนี้ 1.1 คาเฉลี่ยเลขคณิตเมื่อคูณกับจํานวนขอมูลทั้งหมด จะเทากับผลรวมของขอมูลทุก ๆ คาเสมอ แตถาใชมัธยฐานคูณกับจํานวนขอมูลทั้งหมดผลลัพธอาจจะเทากับหรือไมเทากับผลรวมของ ขอมูลทุก ๆ คาก็ได
  • 44. 44 1.2 ผลรวมของผลตางระหวางแตละคาของขอมูลกับคาเฉลี่ยเลขคณิตของขอมูลชุดนั้น ๆ จะเทากับ 0 เสมอ แตผลรวมของผลตางระหวางแตละคาของขอมูลกับมัธยฐานของ ขอมูลชุดนั้น ๆ จะเทากับ 0 หรือไมเทากับ 0 ก็ได 1.3 ผลรวมของผลตางกําลังสองระหวางแตละคาของขอมูลกับคาเฉลี่ยเลขคณิตจะมีคานอยที่สุด แตผลรวมของคาสัมบูรณของผลตางระหวางขอมูลแตละคากับมัธยฐานของขอมูลชุดนั้นจะมีคา นอยที่สุด 1.4 คาเฉลี่ยเลขคณิตคํานวณจากขอมูลทุกคา แตมัธยฐานคํานวณจากคาที่อยูในตําแหนงกึ่งกลาง ของขอมูลที่เรียงลําดับไวจึงไมถูกกระทบจากคาของขอมูลที่สูงหรือต่ํากวาปกติ 2. ขอมูลที่มีการแจกแจงแบบสมมาตร คาเฉลี่ยเลขคณิต มัธยฐานและฐานนิยม จะมีคาเทากัน ดังรูป ขอมูลที่มีการแจกแจงแบบเบ คาเฉลี่ยเลขคณิต มัธยฐานและฐานนิยม จะมีคาไมเทากัน ซึ่ง แยกได 2 กรณี คือ กรณีที่ 1 แจกแจงแบบเบซาย (เบทางลบ) จะได คาเฉลี่ยเลขคณิต < มัธยฐาน < ฐานนิยม ดังรูป กรณีที่ 2 แจกแจงแบบเบขวา (เบทางบวก) จะได ฐานนิยม < มัธยฐาน < คาเฉลี่ยเลขคณิต ดังรูป คาเฉลี่ยเลขคณิต มัธยฐาน ฐานนิยม คาเฉลี่ยฐานนิยม มัธยฐาน ฐานนิยมคาเฉลี่ย มัธยฐาน
  • 45. 45 3. สําหรับขอมูลตัวอยางซึ่งไมมีคาผิดปกติ และเปนตัวแทนของประชากร ตัวอยางที่นํามาศึกษาบางครั้ง อาจมีจํานวนนอย การวิเคราะหขอมูลจึงควรพิจารณาเลือกการใชคากลางใหเหมาะสมดังนี้ 1. ในกรณีที่ขอมูลมีจํานวนนอย ไมควรใชฐานนิยม ฐานนิยมอาจมีคาแตกตางกันมากระหวาง ขอมูลชุดหนึ่งกับขอมูลอีกชุดหนึ่งที่มีจํานวนเทากัน 2. ในกรณีที่ขอมูลสามารถเรียงลําดับไดและเปนขอมูลตอเนื่องดวยควรใชคาเฉลี่ยเลขคณิตจะ เหมาะสมกวาใชมัธยฐานเปนตัวแทนของคากลาง 3. ในกรณีที่ขอมูลมีการแจกแจงความถี่ที่มีความกวางของแตละอันตรภาคชั้นไมเทากัน ควรใช มัธยฐานเปนตัวแทนของคากลาง 4. ในกรณีที่ตองการหาคากลางเพื่อตองนําไปใชในการคํานวณทางสถิติขั้นสูงตอไป ควรใช คาเฉลี่ยเลขคณิตเปนตัวแทนของคากลางของขอมูลนั้น ๆ เพราะคาเฉลี่ยเลขคณิตเปนคากลาง ที่ไดจากการนําทุก ๆ คาของขอมูลมาเฉลี่ย 5. (1) คาเฉลี่ยเลขคณิต คือ 1 2 3 3 + + = 2 มัธยฐาน คือ 2 (2) คาเฉลี่ยเลขคณิต คือ 1 2 6 3 + + = 3 มัธยฐาน คือ 2 (3) คาเฉลี่ยเลขคณิต คือ 1 2 9 3 + + = 4 มัธยฐาน คือ 2 (4) คาเฉลี่ยเลขคณิต คือ 1 2 297 3 + + = 100 มัธยฐาน คือ 2 (5) คาเฉลี่ยเลขคณิต คือ 1 2 3 4 4 + + + = 2.5 มัธยฐาน คือ 2 3 2 + = 2.5 (6) คาเฉลี่ยเลขคณิต คือ 1 2 3 4 5 5 + + + + = 3 มัธยฐาน คือ 3
  • 46. 46 (7) คาเฉลี่ยเลขคณิต คือ 1 2 3 4 5 6 6 + + + + + = 3.5 มัธยฐาน คือ 3 4 2 + = 3.5 (8) คาเฉลี่ยเลขคณิต คือ 1 2 98 99 99 + + + + = 4950 99 = 50 มัธยฐาน คือ 50 6. จากผลลัพธที่ไดจากขอ 5 เมื่อเปรียบเทียบคาเฉลี่ยเลขคณิตและมัธยฐาน จะไดวา (1), (5), (6), (7) และ (8) ไดคาเฉลี่ยเลขคณิตและมัธยฐานเทากัน (2), (3) และ (4) ไดคาเฉลี่ยเลขคณิตและมัธยฐานไมเทากัน จากการสังเกตผลลัพธจาก (4) และ (8) จะเห็นวา (4) ไดคาเฉลี่ยเลขคณิตและมัธยฐานไมเทากัน แต (8) ไดคาเฉลี่ยเลขคณิตและมัธยฐานเทากัน เพราะ (4) มีขอมูล 247 ที่สูงผิดปกติทําใหคาเฉลี่ย เลขคณิตและมัธยฐานแตกตางกันมาก สวน (8) ไมมีขอมูลที่ผิดปกติและความแตกตางของขอมูล แตละหนวยมีคาเทากัน ดังนั้น คาเฉลี่ยเลขคณิตจึงมีคาเทากับมัธยฐาน 7. จากขอมูลเปนปริมาณรอยละของเมทิลแอลกอฮอล ซึ่งเปนขอมูลเชิงปริมาณและควรใชคาเฉลี่ย เลขคณิตเปนคากลางของขอมูล ซึ่งคํานวณไดผลดังตาราง หองปฏิบัติการ คาเฉลี่ยเลขคณิต LAB 1 LAB 2 LAB 3 LAB 4 85.06 84.72 84.77 84.24 จากคากลางที่ไดจะเห็นวา คากลางของขอมูลในหองปฏิบัติการ LAB 2 และ LAB 3 มีคาใกลเคียงกัน เฉลยแบบฝกหัด 1.2 1. คะแนนสอบเรียงลําดับจากนอยไปมาก ดังนี้ 43 45 48 49 50 51 53 54 54 54 55 56 56 58 60 60 62 63 65 65 65 66 67 69 74 75 76 76 77 78 80 80 82 84 85 92 94 96 97 98
  • 47. 47 (1) คะแนนสอบที่มีนักเรียนประมาณครึ่งหนึ่งของชั้นไดคะแนนต่ํากวาคือ คะแนนที่ Q2 เนื่องจาก Q2 อยูในตําแหนงที่ 2(40 1) 4 + = 20.5 นั่นคือ Q2 = 65 65 2 + = 65 คะแนน ดังนั้น นักเรียนจะตองสอบไดคะแนน 65 คะแนน จึงจะมีนักเรียนประมาณครึ่งหนึ่ง ของชั้นไดคะแนนต่ํากวา (2) คะแนนสอบที่มีนักเรียนประมาณหนึ่งในสี่ของชั้นไดคะแนนสูงกวาคือ คะแนนที่ Q3 เนื่องจาก Q3 อยูในตําแหนงที่ 3(40 1) 4 + = 30.75 ดังนั้น Q3 มีคาอยูระหวาง 78 กับ 78 นั่นคือ Q3 = 78 คะแนน ดังนั้น นักเรียนจะตองสอบไดคะแนน 78 คะแนน จึงจะมีนักเรียนประมาณหนึ่งในสี่ ของชั้นไดคะแนนสูงกวา (3) คะแนนสอบที่มีนักเรียนสอบไดนอยกวาอยู 6 ใน 10 คือ คะแนนที่ D6 เนื่องจาก D6 อยูในตําแหนงที่ 6 (40 1) 10 + = 24.6 ดังนั้น D6 มีคาอยูระหวาง 69 กับ 74 ตําแหนงตางกัน 1 คะแนนเพิ่มขึ้น 5 คะแนน ตําแหนงตางกัน 0.6 คะแนนเพิ่มขึ้น 5 × 0.6 = 3 คะแนน นั่นคือ D6 = 69 + 3 = 72 คะแนน ดังนั้น นักเรียนจะตองสอบไดคะแนน 72 คะแนน จึงจะมีผูที่สอบไดนอยกวา 6 ใน 10 2. เวลา (นาที) ที่ใชในการทําขอสอบเรียงลําดับจากนอยไปมาก ดังนี้ 30 35 39 40 42 43 44 45 46 48 49 50 51 52 53 55 57 58 58 60 61 62 63 65 69 70 72 73 75 80 (1) เวลาในการทําขอสอบที่มีจํานวนนักเรียนซึ่งใชเวลานอยกวาอยูประมาณรอยละ 55 คือ เวลาที่ P55 เนื่องจาก P55 อยูในตําแหนงที่ 55 (30 1) 100 + = 17.05 ดังนั้น P55 มีคาอยูระหวาง 57 กับ 58 ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 1 นาที ตําแหนงตางกัน 0.05 เวลาเพิ่มขึ้น 0.05 นาที
  • 48. 48 นั่นคือ P55 = 57 + 0.05 = 57.05 นาที ดังนั้น สมชายใชเวลาในการทําขอสอบ 57.05 นาที จึงจะมีนักเรียนซึ่งใชเวลา ในการทําขอสอบนอยกวาประมาณรอยละ 68 เวลาในการทําขอสอบที่มีจํานวนนักเรียนซึ่งใชเวลานอยกวาอยูประมาณรอยละ 68 คือ เวลาที่ P68 อยูในตําแหนงที่ 68 (30 1) 100 + = 21.08 ดังนั้น P68 มีคาอยูระหวาง 61 กับ 62 ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 1 นาที ตําแหนงตางกัน 0.08 เวลาเพิ่มขึ้น 0.08 นาที นั่นคือ P68 = 61 + 0.08 = 61.08 นาที จึงจะมีนักเรียนซึ่งใชเวลาในการทําขอสอบ นอยกวาประมาณรอยละ 68 (2) เวลาในการทําขอสอบที่มีจํานวนนักเรียนใชเวลานอยกวาอยู 8 ใน 10 คือ D8 เนื่องจาก D8 อยูในตําแหนงที่ 8 (30 1) 10 + = 24.8 ดังนั้น D8 มีคาอยูระหวาง 65 กับ 69 ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 4 นาที ตําแหนงตางกัน 0.8 เวลาเพิ่มขึ้น 0.8×4 = 3.2 นาที นั่นคือ D8 = 65 + 3.2 = 68.2 นาที ดังนั้น ดวงจันทรใชเวลาในการทําขอสอบ 68.2 นาที (3) นักเรียนที่ใชเวลาในการทําขอสอบมากกวานักเรียนที่เขาแขงขันประมาณ 3 ใน 4 คือ นักเรียนที่ใชเวลาในการทําขอสอบมากกวาเวลาที่ใช Q1 เนื่องจาก Q1 อยูในตําแหนงที่ 40 1 4 + = 10.25 ดังนั้น Q1 มีคาอยูระหวาง 48 กับ 49 นาที ตําแหนงตางกัน 1 เวลาเพิ่มขึ้น 1 นาที ตําแหนงตางกัน 0.25 เวลาเพิ่มขึ้น 0.25 นาที นั่นคือ Q1 = 48 + 0.25 = 48.25 นาที ดังนั้น นักเรียนที่ไดรับรางวัลเปนกลองดินสอใชเวลาในการทําขอสอบนอยที่สุด 48.25 นาที
  • 49. 49 3. จํานวนนักเรียนจําแนกตามคะแนนสอบ ชวงคะแนน ความถี่ ความถี่สะสม 55 – 64 65 – 74 75 – 84 85 – 94 95 – 104 105 – 114 115 – 124 125 – 134 135 – 144 3 21 78 182 305 209 81 21 5 3 24 102 284 589 798 879 900 905 (1) ตําแหนงที่ของ Q2 เทากับ 2 (905) 4 = 452.50 ตําแหนงที่ของ Q2 อยูระหวางความถี่สะสม 284 กับ 589 ในอันตรภาคชั้น 85 – 94 กับ 95 – 104 ความถี่สะสมตางกัน 305 คะแนนสอบเพิ่มขึ้น 10 คะแนน ความถี่สะสมตางกัน 168.5 คะแนนสอบเพิ่มขึ้น 10 168.5 5.52 305 × = คะแนน จะได Q2 เทากับ 94.5 + 5.52 = 100.02 คะแนน ตําแหนงที่ของ D5 เทากับ 5 (905) 452.5 10 = ซึ่งตรงกับตําแหนงที่ของ Q2 จะได D5 = Q2 = 100.02 ตําแหนงที่ของ P50 เทากับ 50 (905) 452.5 100 = ซึ่งตรงกับตําแหนงที่ของ Q2 จะได P50 = D5 = Q2 = 100.02 คะแนน (2) ตําแหนงที่ของ Q1 เทากับ 905 4 = 226.25 ตําแหนงที่ของ Q1 อยูระหวางความถี่สะสม 102 กับ 284 ในอันตรภาคชั้น 75 – 84 กับ 85 – 94 ความถี่สะสมตางกัน 182 คะแนนสอบเพิ่มขึ้น 10 คะแนน ความถี่สะสมตางกัน 124.25 คะแนนสอบเพิ่มขึ้น 10 124.25 182 × = 6.83 คะแนน จะได Q1 เทากับ 84.5 + 6.83 = 91.33 คะแนน
  • 50. 50 ตําแหนงที่ของ D1 และ D3 เทากับ 905 10 = 90.5 และ 3 (905) 10 = 271.5 ตามลําดับ ตําแหนงที่ของ D1 อยูระหวางความถี่สะสม 24 กับ 102 ในอันตรภาคชั้น 65 – 74 กับ 75 – 84 จะได D1 เทากับ 10 66.5 74.5 ( ) 78 × + = 83.03 ตําแหนงที่ของ D3 อยูระหวางความถี่สะสม 102 กับ 284 ในอันตรภาคชั้น 75 – 84 กับ 85 – 94 จะได D3 เทากับ 10 169.5 84.5 ( ) 182 × + = 93.81 ดังนั้น D1 + D3 = 83.03 + 93.81 = 176.84 คะแนน ตําแหนงที่ของ P25 เทากับ 25 (905) 100 = 226.25 ซึ่งตรงกับตําแหนงที่ของ Q1 จะได P25 เทากับ 91.33 คะแนน นั่นคือ Q1 เทากับ P25 แต Q1 หรือ P25 ไมเทากับ D1 + D3 4. จํานวนนักเรียนจําแนกตามหองและคะแนนสอบ ชวงคะแนน จํานวนนักเรียน หอง ก. ความถี่สะสม หอง ก. จํานวนนักเรียน หอง ข. ความถี่สะสม หอง ข. จํานวนนักเรียน ทั้ง 2 หอง ความถี่สะสม ทั้ง 2 หอง 1 – 5 6 – 10 11 – 15 16 – 20 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 – 65 66 – 70 71 – 75 0 1 0 3 2 2 5 4 6 7 3 4 2 0 1 0 1 1 4 6 8 13 17 23 30 33 37 39 39 40 1 0 1 4 0 3 4 5 5 6 4 3 3 0 1 1 1 2 6 6 9 13 18 23 29 33 36 39 39 40 1 1 1 7 2 5 9 9 11 13 7 7 5 0 2 1 2 3 10 12 17 26 35 46 59 66 73 78 78 80
  • 51. 51 (1) ตําแหนงที่ของ P25 ของคะแนนสอบหอง ก เทากับ 25 (40) 10 100 = ตําแหนงที่ของ P25 ของคะแนนสอบหอง ก อยูระหวางความถี่สะสม 8 กับ 13 ในอันตรภาคชั้น 26 – 30 กับ 31 – 35 จะได P25 ของคะแนนสอบหอง ก คือ 5 2 30.5 ( ) 5 × + = 32.5 นั่นคือ P25 ของคะแนนสอบหอง ก เทากับ 32.5 คะแนน ตําแหนงที่ของ P25 ของคะแนนสอบหอง ข เทากับ 25 (40) 100 = 10 ตําแหนงที่ของ P25 ของคะแนนสอบหอง ข อยูระหวางความถี่สะสม 9 กับ 13 ในอันตรภาคชั้น 26 – 30 กับ 31 – 35 จะได P25 ของคะแนนสอบหอง ข คือ 5 1 30.5 ( ) 4 × + = 31.75 นั่นคือ P25 ของคะแนนสอบหอง ข เทากับ 31.75 คะแนน ตําแหนงที่ของ P50 ของคะแนนสอบทั้งหมด เทากับ 50 (80) 100 = 40 ตําแหนงที่ของ P50 ของคะแนนสอบทั้งหมดอยูระหวางความถี่สะสม 35 กับ 46 ในอันตรภาคชั้น 36 – 40 กับ 41 – 45 จะได P50 ของคะแนนสอบทั้งหมด คือ 5 5 40.5 ( ) 11 × + = 42.77 นั่นคือ P50 ของคะแนนสอบทั้งหมด เทากับ 42.77 คะแนน (2) ตําแหนงที่ของ Q3 ของคะแนนสอบหอง ก เทากับ 3 (40) 30 4 = ตําแหนงที่ของ Q3 ของคะแนนสอบหอง ก อยูตรงกับความถี่สะสม 30 พอดี ในอันตรภาคชั้น 46 – 50 จะได Q3 ของคะแนนสอบหอง ก เทากับ 50.5 คะแนน ตําแหนงที่ของ Q2 ของคะแนนสอบหอง ข เทากับ 2 (40) 20 4 = ตําแหนงที่ของ Q2 ของคะแนนสอบหอง ข อยูระหวางความถี่สะสม 18 กับ 23 ในอันตรภาคชั้น 36 – 40 กับ 41 – 45 จะได Q2 ของคะแนนสอบหอง ข เทากับ 5 2 40.5 ( ) 5 × + = 42.5 คะแนน จะเห็นวา Q3 ของคะแนนสอบหอง ก มากกวา Q2 ของคะแนนสอบหอง ข ดังนั้น ถานักเรียนในหอง ก สอบไดคะแนนเทากับ Q3 ถาเขาไปอยูหอง ข เขาจะสอบได คะแนนสูงกวานักเรียนหอง ข มากกวาครึ่งหอง
  • 52. 52 5. ความถี่สะสมจําแนกตามคะแนน ชวงคะแนน 46 – 55 56 – 65 66 – 75 76 – 85 86 – 95 96 – 105 ความถี่ 3 4 8 9 4 2 ความถี่สะสม 3 7 15 24 28 30 (1) ตําแหนงที่ของ Q1 เทากับ 30 4 = 7.5 ตําแหนงที่ของ Q1 อยูระหวางความถี่สะสม 7 กับ 15 ในอันตรภาคชั้น 56 – 65 กับ 66 – 75 จะได Q1 เทากับ 10 0.5 65.5 ( ) 8 × + = 66.13 คะแนน ตําแหนงที่ของ Q3 เทากับ 3 (30) 4 = 22.5 ตําแหนงที่ของ Q3 อยูระหวางความถี่สะสม 15 กับ 24 ในอันตรภาคชั้น 66 – 75 กับ 76 – 85 จะได Q3 เทากับ 10 7.5 75.5 ( ) 9 × + = 83.83 คะแนน ตําแหนงที่ของ D2 เทากับ 2 (30) 10 = 6 ตําแหนงที่ของ D2 อยูระหวางความถี่สะสม 3 กับ 7 ในอันตรภาคชั้น 46 – 55 กับ 56 – 65 จะได D2 เทากับ 10 3 55.5 ( ) 4 × + = 63 คะแนน ตําแหนงที่ของ D9 เทากับ 9 (30) 10 = 27 ตําแหนงที่ของ D9 อยูระหวางความถี่สะสม 24 กับ 28 ในอันตรภาคชั้น 76 – 85 กับ 86 – 95 จะได D9 เทากับ 10 3 85.5 ( ) 4 × + = 93 คะแนน (2) ตําแหนงที่ของ Q2 เทากับ 2 (30) 4 = 15 ตําแหนงที่ของ Q2 ตรงกับความถี่สะสม 15 ในอันตรภาคชั้น 66 – 75 พอดี จะได Q2 เทากับ 75.5 คะแนน จากขอ (1) 1 3 1 (Q Q ) 2 + = 1 (66.13 83.83) 2 + = 74.98 คะแนน ดังนั้น คาของ Q2 มากกวาคาของ 1 3 1 (Q Q ) 2 +
  • 53. 53 6. จํานวนนักเรียนจําแนกตามคะแนนสอบวิชาคณิตศาสตร คะแนน 30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99 จํานวนนักเรียน 1 4 10 22 45 30 8 ความถี่สะสม 1 5 15 37 82 112 120 (1) กลุมนักเรียนที่ไดคะแนนสูงสุดมี 20% ของนักเรียนทั้งหมดเทากับ 20 (120) 100 = 24 คน ดังนั้น นักเรียนที่ไดคะแนนต่ําสุดในกลุมนี้จะอยูในตําแหนงที่ 120 – 23 = 97 ซึ่งอยูระหวาง ความถี่สะสม 82 กับ 112 ในอันตรภาคชั้น 70 – 79 กับ 80 – 89 จะได คะแนนต่ําสุดของกลุมนักเรียนที่ไดคะแนนสูงสุดเทากับ 10 15 79.5 ( ) 30 × + = 84.5 คะแนน (2) กลุมนักเรียนที่ไดคะแนนต่ําสุดมี 15% ของนักเรียนทั้งหมดเทากับ 15 (120) 100 = 18 คน ดังนั้นนักเรียนที่ไดคะแนนสูงสุดในกลุมนี้จะอยูในตําแหนงที่ 18 ซึ่งอยูระหวางความถี่สะสม 15 กับ 37 ในอันตรภาคชั้น 50 – 59 กับ 60 – 69 จะไดคะแนนสูงสุดของกลุมนักเรียนที่ไดคะแนนต่ําสุดเทากับ 10 3 59.5 ( ) 22 × + = 60.86 คะแนน (3) คะแนน 75 ตรงกับอันตรภาคชั้น 70 – 79 คะแนนตางกัน 79.5 – 69.5 = 10 คะแนน ความถี่สะสมตางกัน 82 – 37 = 45 คะแนนตางกัน 75 – 69.5 = 5.5 คะแนน ความถี่สะสมตางกัน 45(5.5) 10 = 24.75 จะได คะแนน 75 ตรงกับความถี่สะสม 37 + 24.75 = 61.75 ขอมูลทั้งหมด 120 อยูที่ความถี่สะสม 61.75 ขอมูลทั้งหมด 100 อยูที่ความถี่สะสม 61.75 100 120 × = 51.46 ดังนั้น นักเรียนที่สอบได 75 คะแนน จะไดคะแนนเปนเปอรเซ็นไทลที่ 51.46
  • 54. 54 เฉลยแบบฝกหัด 1.3 (ก) 1. กําลังผลิตไฟฟาจําแนกตามเขื่อนเรียงจากนอยไปหามากดังนี้ 1.06 1.28 6.00 9.00 17.50 25.20 36.00 38.00 40.00 72.00 136.00 240.00 300.00 500.00 720.00 743.90 ตําแหนงที่ของ Q1 เทากับ 16 1 4 + = 4.25 ดังนั้น Q1 มีคาอยูระหวาง 9.00 กับ 17.50 จะได Q1 เทากับ 9.00 (8.5 0.25)+ × = 11.125 เมกกะวัตต ตําแหนงที่ของ Q3 เทากับ 3 (16 1) 4 + = 12.75 ดังนั้น Q3 มีคาอยูระหวาง 240.00 กับ 300.00 จะได Q3 เทากับ 240.00 + (60 × 0.75) = 285.00 เมกะวัตต ดังนั้น สวนเบี่ยงเบนควอรไทลเทากับ 285.00 11.125 2 − = 136.94 เมกะวัตต คาเฉลี่ยเลขคณิต = 1.06 1.28 743.90 16 + + + = 2885.94 16 = 180.37 เมกะวัตต เนื่องจากสวนเบี่ยงเบนเฉลี่ย = n i i 1 x X n = −∑ ดังนั้น สวนเบี่ยงเบนเฉลี่ยเทากับ 179.31 179.09 563.53 16 + + + = 3204.08 16 = 200.26 เมกะวัตต 2. การวัดการกระจายของขอมูลชุดนี้โดยใชพิสัย คาที่วัดไดจะมีความถูกตองพอที่จะเชื่อถือได เพราะคา ของขอมูลมีคาใกลเคียงกันไมมีคาที่สูงหรือต่ําผิดปกติ 3. ปริมาณการผลิตไมสักในประเทศไทยจําแนกตามจังหวัดในป พ.ศ. 2545 เรียงจากนอยไปมากไดดังนี้ 39 44 45 50 426 678 884 6,284 (1) พิสัยเทากับ 6,284 – 39 = 6,245 ลูกบาศกเมตร ตําแหนงที่ของ Q1 เทากับ 8 1 4 + = 2.25 ดังนั้น Q1 มีคาอยูระหวาง 44 กับ 45 จะได Q1 เทากับ 44.25 ตําแหนงที่ของ Q3 เทากับ 3 (8 1) 4 + = 6.75 ดังนั้น Q3 มีคาอยูระหวาง 678 กับ 884 จะได Q3 มีคาเทากับ 678 + (206 × 0.75) = 832.50 ลูกบาศกเมตร
  • 55. 55 ดังนั้น สวนเบี่ยงเบนควอรไทลเทากับ 832.50 44.25 2 − = 394.125 ลูกบาศกเมตร คาเฉลี่ยเลขคณิต = 39 44 45 50 426 678 884 6,284 8 + + + + + + + = 8,450 8 = 1,056.25 ลูกบาศกเมตร เนื่องจากสวนเบี่ยงเบนเฉลี่ย = n i i 1 x X n = −∑ จะไดสวนเบี่ยงเบนเฉลี่ย = 10,17.25 10,12.25 1,011.25 1,006.25 630.25 378.25 172.25 5,227.75 8 + + + + + + + = 10,455.50 8 = 1,306.94 ลูกบาศกเมตร (2) เมื่อเปรียบเทียบคาพิสัย สวนเบี่ยงเบนควอรไทล และสวนเบี่ยงเบนเฉลี่ย แลวการวัดการกระจาย ของขอมูลชุดนี้ไมควรใชพิสัย เพราะคาสูงสุดของชุดนี้สูงกวาคาอื่น ๆ มาก (3) การวัดการกระจายของขอมูลชุดนี้ควรใชสวนเบี่ยงเบนควอรไทลจะเหมาะสมที่สุดเพราะคาของ ขอมูลมีคาแตกตางกันมาก 4. การแจกแจงความถี่ของรายได รายได จุดกึ่งกลาง xi จํานวนคนงาน fi ความถี่สะสม fixi ix X− i if x X− 1500 – 1599 1600 – 1699 1700 – 1799 1800 – 1899 1900 – 1999 2000 – 2099 2100 - 2199 1549.5 1649.5 1749.5 1849.5 1949.5 2049.5 2149.5 20 70 120 100 60 20 10 20 90 210 310 370 390 400 30990 115465 209940 184950 116970 40990 21495 252.5 152.5 52.5 47.5 147.5 247.5 347.5 5050 10675 6300 4750 8850 4950 3475 400 720800 44050
  • 56. 56 จากตาราง จะได X = 720800 400 = 1802 ตําแหนงที่ของ Q1 เทากับ 400 4 = 100 ตําแหนงที่ของ Q1 อยูระหวางความถี่สะสม 90 กับ 210 ในอันตรภาคชั้น 1600 – 1699 กับ 1700 – 1799 จะได Q1 เทากับ 1699.5 + 100 10 ( ) 120 × = 1707.83 ตําแหนงที่ของ Q3 เทากับ 3 (400) 4 = 300 ตําแหนงที่ของ Q3 อยูระหวางความถี่สะสม 210 กับ 310 ในอันตรภาคชั้น 1700 – 1799 กับ 1800 – 1899 จะได Q3 เทากับ 1799.5 + 100 90 ( ) 100 × = 1889.5 ดังนั้น สวนเบี่ยงเบนควอรไทลเทากับ 1889.5 1707.83 2 − = 181.67 2 = 90.835 บาท จากตารางสวนเบี่ยงเบนเฉลี่ยเทากับ 44050 400 = 110.125 บาท พิสัยเทากับ 2199.5 – 1499.5 = 700 บาท เปรียบเทียบคาของสวนเบี่ยงเบนควอรไทล และสวนเบี่ยงเบนเฉลี่ยกับคาพิสัย จะพบวาพิสัยมีคาสูงกวาสวนเบี่ยงเบนควอไทลและสวนเบี่ยงเบนเฉลี่ยมาก 5. (1) สวนเบี่ยงเบนควอรไทลของอัตราเร็วในการวิ่งของสัตวเลี้ยงเทากับ 40 30 2 − = 5 สวนเบี่ยงเบนควอรไทลของอัตราเร็วในการวิ่งของสัตวปาเทากับ 43.5 27.5 2 − = 8 (2) สัตวปามีการกระจายของขอมูลมากกวาสัตวเลี้ยง 6. (1) ขอมูล 1 2 3 4 5 6 ตําแหนงที่ของ Q1 เทากับ 6 1 4 + = 1.75 จะได Q1 เทากับ 1.75 ตําแหนงที่ของ Q2 เทากับ 2 (6 1) 4 + = 3.50 จะได Q2 เทากับ 3.50 ตําแหนงที่ของ Q3 เทากับ 3 (6 1) 4 + = 5.25 จะได Q3 เทากับ 5.25 สวนเบี่ยงเบนควอรไทลเทากับ 5.25 1.75 2 − = 1.75
  • 57. 57 (2) ขอมูล 1 2 3 4 5 6 7 ตําแหนงที่ของ Q1 เทากับ 7 1 4 + = 2 จะได Q1 เทากับ 2 ตําแหนงที่ของ Q2 เทากับ 2 (7 1) 4 + = 4 จะได Q2 เทากับ 4 ตําแหนงที่ของ Q3 เทากับ 3 (7 1) 4 + = 6 จะได Q3 เทากับ 6 สวนเบี่ยงเบนควอรไทลเทากับ 6 2 2 − = 2 (3) ขอมูล 1 2 3 4 5 6 7 8 ตําแหนงที่ของ Q1 เทากับ 8 1 4 + = 2.25 จะได Q1 เทากับ 2.25 ตําแหนงที่ของ Q2 เทากับ 2 (8 1) 4 + = 4.5 จะได Q2 เทากับ 4.5 ตําแหนงที่ของ Q3 เทากับ 3 (8 1) 4 + = 6.75 จะได Q3 เทากับ 6.75 สวนเบี่ยงเบนควอรไทลเทากับ 6.75 2.25 2 − = 2.25 (4) ขอมูล 1 2 3 4 5 6 7 8 9 ตําแหนงที่ของ Q1 เทากับ 9 1 4 + = 2.5 จะได Q1 เทากับ 2.5 ตําแหนงที่ของ Q2 เทากับ 2 (9 1) 4 + = 5 จะได Q2 เทากับ 5 ตําแหนงที่ของ Q3 เทากับ 3 (9 1) 4 + = 7.5 จะได Q3 เทากับ 7.5 สวนเบี่ยงเบนควอรไทลเทากับ 7.5 2.5 2 − = 2.5
  • 58. 58 เฉลยแบบฝก 1.3 (ข) 1. ราคาเครื่องสําอางชนิดหนึ่งที่นํามาเปนตัวอยางจากรานคา 8 แหง เรียงจากนอยไปมากดังนี้ 400 410 410 410 410 415 425 640 พิสัยเทากับ 640 – 400 = 240 บาท คาเฉลี่ยเลขคณิต (X) = 400 4(410) 415 425 640 8 + + + + = 3520 8 = 440 บาท สวนเบี่ยงเบนมาตรฐาน (s) = n 2 i i 1 (x X) n 1 = − − ∑ = 2 2 2 2 2 ( 40) 4( 30) ( 25) ( 15) (200) 8 1 − + − + − + − + − = 46050 7 = 81.11 บาท สวนเบี่ยงเบนเฉลี่ย = n i i 1 x X n = −∑ = 40 4(30) 25 15 200 8 + + + + = 400 8 = 50 บาท ตําแหนงที่ของ Q1 เทากับ 8 1 4 + = 2.25 จะได Q1 เทากับ 410 ตําแหนงที่ของ Q3 เทากับ 3 (8 1) 4 + = 6.75 จะได Q3 เทากับ 415 + (10 × 0.75) = 422.5 จะไดสวนเบี่ยงเบนควอรไทลเทากับ 422.5 410 2 − = 6.25 บาท ดังนั้น การวัดการกระจายของขอมูลชุดนี้ ควรใชสวนเบี่ยงควอรไทลจึงเหมาะสมกับขอมูลที่สุด เนื่องจากราคาเครื่องสําอาง 640 บาท เปนคาที่สูงผิดปกติเมื่อเปรียบเทียบกับคาอื่นๆ
  • 59. 59 2. ปริมาณน้ําฝนจําแนกตามจังหวัด จังหวัด ปริมาณน้ําฝน (xi) xi – X (xi – X )2 ขอนแกน ชัยภูมิ นครพนม มุกดาหาร รอยเอ็ด เลย สกลนคร สุรินทร หนองคาย อุดรธานี 1,402.6 927.5 2,995.9 1,901.7 1,357.2 1,414.8 1,888.6 1,857.9 2,247.5 1,777.0 –374.47 –849.57 1218.83 124.63 –419.87 –362.27 111.53 80.83 470.43 –0.07 140227.78 721769.19 1485546.57 15532.64 176290.82 131239.55 12438.94 6533.49 221304.39 0.005 รวม 17770.7 2910883.36 จากตัวอยางที่ 3 จะได X = 1,777.07 มิลลิเมตร เนื่องจากความแปรปรวน s2 = 2n i i 1 (x X) n 1= − − ∑ = 2910883.36 10 1− = 323,431.49 มิลลิเมตร ดังนั้น สวนเบี่ยงเบนมาตรฐานเทากับ 568.71 มิลลิเมตร 3. ราคาสินคาชนิดหนึ่งที่ขายตามรานตาง ๆ ในสองทองที่ ราคา (บาท) ทองที่ที่หนึ่ง 50 52 45 55 54 48 53 ทองที่ที่สอง 40 50 51 52 51 51 62 53 49 หา X และ s2 ของทั้งสองทองที่รวมกัน X = 50 52 45 48 53 40 50 53 49 7 9 + + + + + + + + + + + = 816 16 = 51 บาท s2 = 2 2 2 2 2 2 2 2 2 2 2 2 2 ( 1) 1 ( 6) 4 3 ( 3) 2 ( 11) ( 1) 1 11 2 ( 2) (7 9) 1 − + + − + + + − + + − + − + + + + − + − = 328 15 = 21.87 ดังนั้นความแปรปรวนของสินคาในสองทองที่ เทากับ 21.87 บาท
  • 60. 60 4. อายุของครอบครัวนี้เปน 45 42 20 17 16 14 จะไดวา คาเฉลี่ยเลขคณิตเทากับ 45 42 20 17 16 14 6 + + + + + = 154 6 = 25.67 ป ความแปรปรวน เทากับ 2 2 2 2 2 2 245 42 20 17 16 14 (25.67) 6 + + + + + − = 4930 658.9489 6 − = 162.72 ป สวนเบี่ยงเบนมาตรฐานเทากับ 12.76 ป ในอีก 5 ปขางหนา สวนเบี่ยงเบนมาตรฐาน และความแปรปรวนของอายุสมาชิกในครอบครัวนี้จะมี คาเทาเดิม เนื่องจากขอมูลแตละคาเพิ่มขึ้นเทาเดิม 5. จากขอมูล n = 20 X = 10 และ s = 2 ผลรวมของขอมูล 20 i i 1 x = ∑ เทากับ 20 × 10 = 200 เพราะวา s2 = n 2 i 2i 1 x (X) n 1 = − − ∑ จะได 20 2 i i 1 x = ∑ = 2 2 (s (X) )(n 1)+ − = (104)(19) = 1976 แตบันทึกขอมูลผิดพลาดจาก 12 บันทึกเปน 8 ดังนั้น 20 i i 1 x = ∑ ที่ถูกตองเทากับ 200 – 8 + 12 = 204 20 2 i i 1 x = ∑ ที่ถูกตองเทากับ 1976 – 64 + 144 = 2056 จะได คาเฉลี่ยเลขคณิตที่ถูกตองเทากับ 204 10.2 20 = สวนเบี่ยงเบนมาตรฐานที่ถูกตองเทากับ 22056 (10.2) 20 1 − − = 4.17 = 2.04 6. จากสูตร s1 = n 2 i i 1 (x X) n 1 = − − ∑ และ s2 = n 2 i i 1 (x X) n = −∑ เมื่อใช n – 1 เปนตัวหารจะใหผลลัพธมากกวาใช n เปนตัวหาร และนิยมใชสูตร s1 = n 2 i i 1 (x X) n 1 = − − ∑ เปนสูตรที่ใชประมาณสวนเบี่ยงเบนมาตรฐานของ ประชากร (σ) ซึ่งเปนการใชขอมูลตัวอยางไปสรุปผลขอมูลประชากร สูตรที่หารดวย n – 1 ใหขอ ผิดพลาดในการสรุปผิดนอยกวา (Watkins, 2004 p. 65)
  • 61. 61 7. จากตัวอยางที่ 7 สวนเบี่ยงเบนมาตรฐานและคาเฉลี่ยของอายุขัยของสัตวเลี้ยงลูกดวยนมเปน 4.67 ป และ 11 ป ตามลําดับ หมายความวา สัตวเลี้ยงลูกดวยนมที่นํามาเปนตัวอยางมีอายุตางจาก 11 ป โดย เฉลี่ย4.67 ป ดังนั้นคําตอบจึงใช แตไมไดหมายความวาตองมีบางตัวอายุ 11 – 4.67 = 6.33 ป หรือมี บางตัวอายุ 11 + 4.67 = 15.67 ป เพราะสวนเบี่ยงเบนมาตรฐานเหมือนกับการเฉลี่ยความแตกตาง ของขอมูลจากคากลางดังนั้นขอมูลแตละตัวไมจําเปนตองตรงกับคาที่ไดจากการบวกและลบสวนเบี่ยง เบนมาตรฐานกับคากลาง 8. สวนเบี่ยงเบนมาตรฐานมีหนวยเปนป มัธยฐานมีหนวยเปนป พิสัยมีหนวยเปนป กึ่งชวงควอรไทลมีหนวยเปนป เฉลยแบบฝกหัด 1.3 (ค) 1. อายุของบุตรในครอบครัวที่หนึ่ง (ป) 6 5 3 1 อายุของบุตรในครอบครัวที่สอง (ป) 25 24 22 21 17 (1) เนื่องจากสัมประสิทธิ์ของพิสัย = max min max min x x x x − + ดังนั้น สัมประสิทธิ์ของพิสัยของครอบครัวที่หนึ่ง = 6 1 6 1 − + = 0.714 สัมประสิทธิ์ของพิสัยของครอบครัวที่สอง = 25 17 25 17 − + = 0.190 จะได อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง (2) เนื่องจากสัมประสิทธิ์ของสวนเบี่ยงเบนควอรไทล = 3 1 3 1 Q Q Q Q − + ตําแหนงที่ของ Q1 ของครอบครัวที่หนึ่งเทากับ 4 1 4 + = 1.25 จะได Q1 ของครอบครัวที่หนึ่งเทากับ 1 + (2 × 0.25) = 1.5 ตําแหนงที่ของ Q3 ของครอบครัวที่หนึ่งเทากับ 3 (4 1) 4 + = 3.75 จะได Q3 ของครอบครัวที่หนึ่งเทากับ 5 + (1 × 0.75) = 5.75 สัมประสิทธิ์สวนเบี่ยงเบนควอรไทลครอบครัวที่หนึ่งเทากับ 5.75 1.5 5.75 1.5 − + = 0.586 ตําแหนงที่ของ Q1 ของครอบครัวที่สองเทากับ 5 1 4 + = 1.5 จะได Q1 ของครอบครัวที่สองเทากับ 17 + (4 × 0.5) = 19 ตําแหนงที่ของ Q3 ของครอบครัวที่สองเทากับ 3 (5 1) 4 + = 4.5 จะได Q3 ของครอบครัวที่สองเทากับ 24 + (1 × 0.5) = 24.5
  • 62. 62 สัมประสิทธิ์สวนเบี่ยงเบนควอรไทลที่สองเทากับ 24.5 19 24.5 19 − + = 0.126 จะได อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง (3) เนื่องจากสัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ย = M.D. X X ของครอบครัวที่หนึ่งเทากับ 6 5 3 1 4 + + + = 3.75 M.D. ของครอบครัวที่หนึ่งเทากับ 2.25 1.25 0.75 2.75 4 + + + = 1.75 สัมประสิทธิ์สวนเบี่ยงเบนเฉลี่ยครอบครัวที่หนึ่งเทากับ 1.75 3.75 = 0.467 X ของครอบครัวที่สองเทากับ 25 24 22 21 17 5 + + + + = 21.8 M.D. ของครอบครัวที่สองเทากับ 3.2 2.2 0.2 0.8 4.8 5 + + + + = 2.24 สัมประสิทธิ์สวนเบี่ยงเบนเฉลี่ยครอบครัวที่สองเทากับ 2.24 21.8 = 0.103 จะไดอายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง (4) เนื่องจากสัมประสิทธิ์ของการแปรผัน = s X s ของครอบครัวที่หนึ่งเทากับ 2 2 2 2 (2.25) (1.25) ( 0.75) ( 2.75) 4 1 + + − + − − = 14.75 3 = 2.217 สัมประสิทธิ์การแปรผันของครอบครัวที่หนึ่งเทากับ 2.217 3.75 = 0.591 s ของครอบครัวที่สองเทากับ 2 2 2 2 2 (3.2) (2.2) (0.2) ( 0.8) ( 4.8) 5 1 + + + − + − − = 38.8 4 = 3.114 สัมประสิทธิ์การแปรผันของครอบครัวที่สองเทากับ 3.114 21.8 = 0.143 จะได อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง ผลของการเปรียบเทียบที่ไดจากขอ (1) – (4) เหมือนกัน สรุปไดวา อายุของบุตรครอบครัวที่หนึ่งมีการกระจายมากกวาอายุของบุตรครอบครัวที่สอง
  • 63. 63 2. จากโจทยเรียงลําดับขอมูลจากนอยไปหามากไดดังนี้ ราคาขาวเปลือก (บาท) 71 72 73 74 75 76 ราคาขาวสาร (บาท) 110 112 114 115 117 118 X ของราคาขาวเปลือก เทากับ 71 72 73 74 75 76 6 + + + + + = 441 6 = 73.5 s ของราคาขาวเปลือกเทากับ 2 2 2 2 2 2 ( 2.5) ( 1.5) ( 0.5) (0.5) (1.5) (2.5) 6 1 − + − + − + + + − = 17.5 5 = 1.871 สัมประสิทธิ์การแปรผันของราคาขาวเปลือกเทากับ 1.871 73.5 = 0.025 X ของราคาขาวสาร เทากับ 110 112 114 115 117 118 6 + + + + + = 686 6 = 114.33 s ของราคาขาวสารเทากับ 2 2 2 2 2 2 ( 4.33) ( 2.33) ( 0.33) (0.67) (2.67) (3.67) 6 1 − + − + − + + + − = 45.3334 5 = 3.011 สัมประสิทธิ์การแปรผันของราคาขาวสารเทากับ 3.011 114.33 = 0.026 สัมประสิทธิ์ของพิสัยของราคาขาวเปลือก เทากับ 76 71 76 71 − + = 0.034 สัมประสิทธิ์ของพิสัยของราคาขาวสารเทากับ 118 110 118 110 − + = 0.035 จากคาที่ไดจะสรุปไดวา ราคาของขาวเปลือกตอถังมีการกระจายนอยกวาราคาขาวสารตอถัง 3. เนื่องจากสัมประสิทธิ์ของการแปรผันเทากับ s X ดังนั้น สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ป.2 ไดเทากับ 24 18 = 0.272 สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ป.6 ไดเทากับ 40 20 = 0.316 สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ม.3 ไดเทากับ 40 22 = 0.287 สัมประสิทธิ์ของการแปรผันของจํานวนเงินที่นักเรียน ม.6 ไดเทากับ 51 25 = 0.286 จะเห็นวา การกระจายของจํานวนเงินที่นักเรียน ป.2 ไดมาใชนอยที่สุด หมายความวานักเรียน ป. 2 ไดเงินจากผูปกครองใกลเคียงกันมากกวานักเรียน ป. 6, ม. 3 และ ม. 6 และการกระจายของจํานวน เงินที่นักเรียน ป.6 ไดมาใชมากที่สุด หมายความวานักเรียน ป. 6 ไดเงินจากผูปกครองแตกตางกัน มากกวานักเรียนหองอื่น ๆ
  • 64. 64 4. เนื่องจากสัมประสิทธิ์ของพิสัยเทากับ max min max min x x x x − + จะได 0.0625 = min min 170 x 170 x − + 10.625 + 0.0625xmin = 170 – xmin 1.0625xmin = 159.375 xmin = 150 ดังนั้น ความสูงของนักเรียนคนที่เตี้ยที่สุดในชั้นเทากับ 150 เซนติเมตร 5. เนื่องจากสัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ยเทากับ M.D. X จะได 0.12 = 8.5 X X = 8.5 0.12 = 70.83 เนื่องจากสัมประสิทธิ์ของการแปรผันเทากับ s X จะได สัมประสิทธิ์ของการแปรผันเทากับ 10 70.83 = 0.141 6. (1) (2) ไมจําเปน ขึ้นอยูกับคาของขอมูลที่นํามาคํานวณ (3) ไมจําเปน เพราะเปนสวนเบี่ยงเบนควอรไทลหาจากคาควอรไทลที่ 3 และ 1 จะไดผล อยางไรอยูที่คาของตัวเลขซึ่งไมจําเปนตองเทากับมัธยฐาน (4) สวนเบี่ยงเบนเฉลี่ยตองมีคามากกวาหรือเทากับศูนยเสมอเพราะสวนเบี่ยงเบนเฉลี่ยเปน การเฉลี่ยผลตางโดยใชจํานวนมากเปนตัวตั้งจํานวนนอยเปนตัวลบจึงไมมีทางนอยกวาศูนย (5) สวนเบี่ยงเบนมาตรฐานตองมีคามากกวาหรือเทากับศูนยเสมอ (6) เชน กรณีที่สวนเบี่ยงเบนมาตรฐานเปน 1 (7) (8) (9) สวนเบี่ยงเบนมาตรฐานใชวัดการกระจายสําหรับขอมูลเพียงชุดเดียว ไมสามารถนํามาใช เปรียบเทียบกับการกระจายของขอมูล 2 ชุด ถาตองการเปรียบเทียบขอมูล 2 ชุด ตองใช สัมประสิทธิ์การแปรผัน
  • 65. 65 7. ถามีขอมูลผิดปกติจะมีผลกระทบตอการหาคาเฉลี่ยเลขคณิต เพราะตองใชทุกคาของขอมูลมาคํานวณ สวนการวัดการกระจายที่มีการเปลี่ยนแปลงไปมากเนื่องจากคาผิดปกติ คือ คาพิสัย เพราะตองใชคา มากสุด และคานอยสุดในการคํานวณในกรณีที่ขอมูลผิดปกติ จะไมมีผลกระทบหรือมีผลกระทบนอย ตอคากลางที่คํานวณโดยการหาคามัธยฐานหรือฐานนิยม สวนการวัดการกระจายที่ไมมีผลกระทบ หรือมีผลกระทบนอย คือ คาสวนเบี่ยงเบนควอรไทล เพราะไมไดเอาคาต่ําสุด หรือสูงสุดมาใช คํานวณ 8. จังหวัด ความเสียหายรวม (ลานบาท) กระบี่ พังงา ระนอง ตรัง ภูเก็ต สตูล 321.3 1,077.4 203.3 43.0 188.6 109.2 หาสวนเบี่ยงเบนมาตรฐาน และสัมประสิทธิ์ของพิสัย X = 321.3 1,077.4 203.3 43.0 188.6 109.2 6 + + + + + = 323.8 จาก s = n 2 i i 1 (x X) n 1 = − − ∑ จะได s = 2 2 2 (321.3 323.8) (1,077.4 323.8) (109.2 323.8) 6 1 − + − + + − − = 145124.1 = 380.95 สัมประสิทธิ์ของพิสัย = max min max min x x x x − + = 1,077.4 43.0 1,077.4 43.0 − + = 1034.40 1120.40 = 0.923
  • 66. 66 9. จากตาราง หองปฏิบัติการหนวย ทดลอง LAB 1 LAB 2 LAB 3 LAB 4 1 2 3 85.06 85.25 84.87 84.99 84.28 84.88 84.48 84.72 85.10 84.10 84.55 84.05 สัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ย = M.D. X M.D = n i i 1 x X n = −∑ คาเฉลี่ยของรอยละเมทิลแอลกอฮอลของหองปฏิบัติการที่ 3 คือ 84.48 84.72 85.10 3 + + = 84.77 จะได M.D. = 84.48 84.77 84.72 84.77 85.10 84.77 3 − + − + − = 0.223 สัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ยของรอยละของเมทิลแอลของหองปฏิบัติการที่ 3 คือ 0.223 84.77 = 0.0026 คาเฉลี่ยของรอยละของเมทิลแอลกาฮอลของหองปฏิบัติการที่ 4 คือ 84.10 84.55 84.05 3 + + = 84.23 จะได M.D. = 84.10 84.23 84.55 84.23 84.05 84.23 3 − + − + − = 0.21 สัมประสิทธิ์ของสวนเบี่ยงเบนเฉลี่ยของรอยละของเมทิลแอลกอฮอลของหองปฏิบัติการที่ 4 คือ 6.21 84.23 = 0.0025