SlideShare a Scribd company logo
6
Most read
7
Most read
14
Most read
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)                1


                                               บทที่ 1
                                       ความรู้เบื้องต้นทางสถิติ
                                   (Introduction of Statistical)
  1.1 ความหมายของชีวสถิติ

            • คือ ข้อมูลสถิติ (Statistical Data) ข้อมูลสรุปได้จากการประมวลหรือวิเคราะห์กลุ่มของข้อมูลเพื่อใช้
  แสดงลักษณะข้อมูลของกลุ่มนั้น
            • คือ สถิติศาสตร์ (Statistics) ศาสตร์ว่าด้วยการจัดกระทาต่างๆเกี่ยวกับข้อมูลเพื่อบรรยายลักษณะ
  ของสิ่งที่ศึกษาได้อย่างเที่ยงตรงและเชื่อถือได้นาเอาไปใช้คาดคะเนและการตัดสินใจต่างๆ

  1.2 ประเภทของสถิติ

           • สถิติพรรณนา (Descriptive Statistics) วิธีการทางสถิติที่ใช้พรรณนาลักษณะ สิ่งต้องการศึกษาให้
  อยู่ในรูปของตารางข้อมูลสรุป การนาเสนอแบบต่างๆเพื่อให้เข้าใจถึงข้อมูลที่รวบรวมมาได้ แต่ไม่สามารถ
  คาดคะเนนอกเหนือไปจากข้อมูลที่มีอยู่ได้
           • สถิติอนุมาน (Inferential Statistics) วิธีการทางสถิติที่ใช้ทฤษฏีความน่าจะเป็นในการอนุมาน
  ลักษณะของประชากรจากข้อมูลของตัวอย่างเช่นการศึกษาโรคขาดสารอาหารในเด็กวัยก่อนเรียนในภาคอีสาน
  ส่วนใหญ่จะสุ่มจากเด็กวัยก่อนเรียนมาบางส่วนเพื่อประเมินหาอัตราการขาดสารอาหาร เป็นต้น

  1.3 ประเภทข้อมูล
          ข้อมูล (Data) หมายถึง ข้อเท็จจริงที่เก็บรวบรวมได้จากตัวอย่างหรือประชากร
          1.3.1 แบ่งตามลักษณะข้อมูล ได้ 2 ประเภท ดังนี้
                 1. ข้อมูลเชิงปริมาณ (Quantitative Data) เป็นข้อมูลที่วัดค่าได้ว่ามากหรือน้อยในเชิง
  ปริมาณ เช่น รายได้ อายุ ความสูงจานวนสินค้า ฯลฯ ซึ่งแบ่งได้ 2 แบบ คือ
                    1.1 ข้อมูลแบบต่อเนื่อง (Continuous Data) หมายถึง ข้อมูลที่มีค่าต่อเนื่องกันในช่วงที่
  กาหนด สามารถแจงสมาชิกในข้อมูลได้ เช่น ความสูง อายุ ระยะทาง เป็นต้น
                    1.2 ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) หมายถึง ข้อมูลที่มีค่าเป็นจานวนเต็มหรือ
  จานวนนับ เช่น จานวนนักศึกษา จานวนสมาชิกในครัวเรือน เป็นต้น
                 2. ข้อมูลเชิงคุณภาพ (Qualitative Data) เป็นข้อมูลที่ไม่สามารถระบุค่าได้ว่ามากหรือ น้อย
  อาจแทนด้วยตัวเลขก็ได้โดยตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณ เช่น เพศ ระดับการศึกษา อาชีพ
  ทัศนคติ เป็นต้น
          1.3.2 แบ่งตามแหล่งที่มาของข้อมูล ได้ 2 ประเภท ดังนี้


                                                           อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)                2

                 1. ข้อมูลปฐมภูมิ (Primary Data) เป็นข้อมูลที่ผู้ใช้ไปเก็บรวบรวมข้อมูลเอง ข้อ มูลที่ได้จะมี
  ความทันสมัยมีความถูกต้องน่าเชื่อถือ แต่การรวบรวมข้อมูลต้องใช้เวลานาน ต้องใช้กาลังคนมาก เสียค่าใช้จ่าย
  สูง ไม่สะดวกเท่าที่ควร
                 2. ข้อมูลทุติยภูมิ (Secondary Data) เป็นข้อมูลที่มีการเก็บรวบรวมไว้แล้วผู้ใช้เป็นเพียงผู้ที่
  นาข้อมูลนั้นมาใช้ จึงเป็นการประหยัดทั้งเวลาและค่าใช้จ่าย แต่บางครั้งจะเป็นข้อมูลที่ไม่ตรงกับความต้องการ
  หรือไม่ละเอียดพอ นอกจากนี้ผู้ใช้มักจะไม่ทราบถึงข้อผิดพลาดของข้อมูล ซึ่งมีผลทาให้การวิเคราะห์ผลอาจจะ
  ผิดพลาดได้

  1.4 ระดับของการวัด (Level of Measurement)

          ข้อมูลในการวิจัยจานวนมากได้มาจากการวัด ซึ่งการวัด (Measurement) หมายถึง การกาหนด
  ตัวเลข หรือสัญลักษณ์อื่น ๆ แทนปริมาณหรือคุณภาพหรือคุณลักษณะ ของสิ่งที่วัด มาตราการวัดมี 4 ระดับ
  คือ

         1. มาตรานามบัญญัติ (Nominal Scale or Classification Scale)
              เป็นข้อมูลที่มีลักษณะจาแนกกลุ่มหรือประเภท โดยตัวเลขหรือค่าที่กาหนดให้นามาบวก ลบ คูณ
  หาร กันไม่ได้ เป็นระดับการวัดที่ต่า ที่สุด เป็นการกาหนดตัวเลขแทนชื่อคน แทนคุณลักษณะต่าง ๆ แทน
  เหตุการณ์ต่างๆ หรือแทนสิ่งต่าง ๆ เช่น เบอร์นางงามที่เข้าประกวด เบอร์นักฟุตบอล เลขทะเบียนรถต่าง ๆ
  การกาหนดให้เลข 0 แทน เพศหญิงเลข 1 แทนเพศชาย คุณสมบัติที่สาคัญของมาตรานี้ก็คือ ตัวเลขที่
  กาหนดให้จะเพียงแต่ชี้ถึง ความแตกต่างกัน คือชี้ว่าไม่ใช่สิ่งเดียวกัน ไม่ได้แทนอันดับ ขนาด ปริมาณหรือ
  คุณภาพใด ๆ ซึ่งตัวเลขหรือค่าต่าง ๆ ที่กาหนดให้นั้นนามาบวก ลบ คูณ หารกันไม่ได้ และจากการที่ไม่ได้ชี้
  ปริมาณหรือคุณภาพดังกล่าว นักจิตวิทยาบางท่านจึงไม่ยอมรับการวัดชนิดนี้ว่าเป็นการวัด (Measurement)

      ข้อมูลที่ได้จากการวัดโดยใช้มาตรานามบัญญัติ (Nominal scale)

      1.   เพศ  ชาย                         หญิง
      2.   เชื้อชาติ (ไทย, จีน, ฯลฯ)
      3.   ศาสนา (พุทธ, คริสต์, อิสลาม, ฯลฯ
      4.   อาชีพ  หมอ  นักเรียน  ครู
      5.   หมายเลขโทรศัพท์ .........................
      6.   เลขที่บ้าน .............................




                                                           อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)             3

          สรุป ถ้าข้อมูลบอกความแตกต่างได้แต่เพียงชื่อ เป็นความแตกต่างที่หยาบที่สุด เช่นชื่อนักศึกษาทั้ง 30
  คน ไม่ได้ให้รายละเอียดอะไร นอกจากว่าแต่ละคนชื่อแตกต่างกัน เราเรียกข้อมูลที่สามารถจาแนกได้แต่เพียง
  ชื่อว่า ข้อมูลระดับมาตรานามบัญญัติ( Nominal scale)

          2. มาตรอันดับ (Ordinal Scale)
             เป็นระดับของการวัดที่สูงกว่ามาตรานามบัญญัติ เป็นการกาหนดตัวเลขหรือสั ญลักษณ์เพื่อชี้ถึง
  อันดับ เช่น หลังจากพิจารณาภาพที่นักเรียนวาดมาแล้วก็ได้อันดับจากภาพที่ดีที่สุดเป็นอันดับ 1 รองลงมาเป็น
  อันอับ 2 , 3 ,…… ตามลาดับ เป็นต้น จะเห็นได้ว่าในมาตรานี้มีคุณสมบัติของมาตรานามบัญญัติคือ ความ
  แตกต่าง อันดับ 1 และอันดับ 2 จะเป็นคนละคนไม่เหมือนกัน สิ่งที่เราทราบเพิ่มขึ้นจากมาตรานามบัญญัติคือ
  ทิศทาง ของความแตกต่าง อันดับ 1 อยู่เหนือกว่าอันดับ 2 เนื่องจากมีปริมาณหรือคุณภาพมากกว่า อย่างไรก็
  ตาม แม้จะทราบว่าใครมากกว่า น้อยกว่า แต่ไม่อาจทราบว่ามากกว่ากันเท่าใด และช่วงระหว่างอันดับต่าง ๆ
  มักไม่เท่ากัน เช่นที่ 1 อาจมีคุณภาพเหนือกว่าที่ 2 มากขณะที่ 2 มีคุณภาพห่างจากที่ 3 เพียงเล็กน้อย เป็นต้น
  จากการที่ช่วงอันดับไม่เท่ากันดังกล่าว จึงไม่สามารถนาเอาตัวเลขในมาตรานี้มาบวก ลบ คูณ หรือหารกันได้
  เช่น ผลการแข่งขันกีฬามหาวิทยาลัย ระดับความคิดเห็น ตาแหน่งทางวิชาการ

            ข้อมูลที่ได้จากการวัดโดยใช้มาตรอันดับ (Ordinal scale)
            เป็นข้อมูลที่นอกจากมีลักษณะจาแนกกลุ่มหรือประเภทได้แล้วยังสามารถเรียงอันดับได้ด้วย เช่น
  ตาแหน่ง (ที่ 1, ที่ 2, ที่ 3, ฯลฯ) ระดับความพอใจ (มากที่สุด, มาก, ปานกลาง, น้อย, น้อยทีสุด)
                                                                                         ่
               1. กิจกรรมที่นิยมทาในวันหยุด (เรียงลาดับมากที่สุดเป็นลาดับ 1)
                     ......... ดูหนัง

                   ......... ฟังเพลง

                   ......... เล่นกีฬา

                   ......... ดูโทรทัศน์

                   ......... ช๊อปปิ้ง

          สรุป ถ้าข้อมูลบอกความแตกต่างได้ เป็นการจาแนกข้อมูลที่ละเอียดขึ้น เพราะบอกความแตกต่างได้
  เช่นชื่อนักศึกษาที่เรียงกันตามระดับความสูงทั้ง 30 คน เราเรียกข้อมูลที่เราสามารถจาแนกถึงความแตกต่างได้
  นี้ว่า ข้อมูลระดับมาตราอันดับบัญญัติ ( Ordinal scale )




                                                           อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)                        4

           3. มาตรอันตรภาค (Interval Scale)
               เป็นระดับของการวัดที่สูงกว่าสองมาตราที่กล่าว มาโดยมีคุณสมบัติเพิ่มขึ้นอีก 2 ประการ คือ มี
  ศูนย์สมมุติ (Arbitrary Zero or Relative Zero) และมีหน่วยของการวัดที่เท่ากัน ตัวอย่างของมาตรานี้ ได้แก่
  การวัดอุณหภูมิ เช่น ในหน่วยวัดอุณหภูมิแบบเซลเซียส จะกาหนดจุดที่น้ากลายเป็นน้าแข็งเป็น 0° ซ. เป็นศูนย์
  เทียมไม่ได้หมายความว่าถึง ณ อุณหภูมิ 0° ซ. นี้ไม่มีความร้อนอยู่เลยแต่เป็นเพียงจุดที่น้ากลายเป็นน้าแข็ง
  จากการที่มีหน่วยของการวัดที่เท่ากัน และมีศูนย์เทียมจึงสามารถเปรียบเทียบปริมาณ หรือคุณภาพได้ว่า
  มากกว่ากันเท่าไร เช่น 40° ซ. จะมีอุณหภูมิสูงกว่า 30° ซ. อยู่ 10° ซ. และสามารถพูดได้ว่าอุณหภูมิ 20° ซ. สูง
  กว่าอุณหภูมิ 15° ซ. เท่ากับอุณหภูมิ 14° ซ. สูงกว่าอุณหภูมิ 9° ซ. เพราะต่างก็สูงกว่ากัน 5° ซ. (ไม่อาจพูดได้
  ว่าอุณหภูมิ 60° ซ. ร้อนเป็นสองเท่าของอุณหภูมิ 30° ซ. เพราะความร้อนไม่ได้เริ่มที่จุด 0° ซ.) หรือ 60° ซ. =
  2 (30° ซ.) แต่ปริมาณความร้อนของสสาร 60° ซ. ? 2 (ความร้อนของสสาร 30° ซ.) นักพฤติกรรมศาสตร์มัก
  ถือเอาว่าคะแนนการสอบเป็นการวัดในมาตรานี้ จึงตีความในลักษณะเดียวกันกับกรณีของอุณหภูมิที่กล่าวมา
  เช่น ในแบบทดสอบที่มีจานวน 60 ข้อ ถ้า ก สอบได้ 50 คะแนน ข สอบได้ 30 คะแนน ค สอบได้ 25 คะแนน
  และ ง สอบได้ 5 คะแนน ก็กล่าวว่า ก ได้คะแนนมากกว่า ข 20 คะแนน ข ได้คะแนนมากกว่า ง 25 คะแนน ก
  ได้คะแนนมากกว่า ข เท่ากับ ค ได้คะแนนมากกว่า ง (ต่างกันมากกว่า 20 คะแนน) แต่ไม่สามารถตีความได้ว่า
  ก มีความรู้เป็น 2 เท่าของ ค เพราะจุดเริ่มต้นไม่ใช้ศูนย์แท้ ผู้สอบได้คะแนนศูนย์ไม่ได้หมายความว่าไม่มีความรู้
  ในวิชานั้น เป็นเพียงแต่ว่าทาข้อสอบชุดนั้นไม่ได้ ถ้าออกข้อสอบมากกว่านั้น หรือง่ายกว่านั้นเขาอาจทาได้บ้าง
  มาตราอั น ตราภาคนั บ ว่ า เป็ น มาตราที่ เ ป็ น ปริ ม าณอย่ า งแท้ จ ริ ง ไม่ เ หมื อ นมาตรานามบั ญ ญั ติ แ ละมาตรา
  เรียงลาดับข้อมูลที่ได้จากการวัดโดยใช้มาตราอันตรภาค (Interval scale)
               เป็นข้อมูลที่มีลักษณะจาแนกกลุ่ม เรียงอันดับ และแบ่งเป็นช่วง ๆ โดยแต่ละช่วงมีขนาดเท่ากัน
  ศูนย์ของข้อมูลประเภทนี้เป็นศูนย์สมมติ ไม่มีศูนย์แท้ เช่น คะแนนสอบ อุณหภูมิ เวลา IQ
               สรุป ถ้าข้อมูลบอกความแตกต่างเป็นหน่วยที่เท่ากันได้ เป็นการจาแนกความแตกต่างที่ละเอียด
  ขึ้น เพราะสามารถบอกความแตกต่างเป็นปริมาณหน่วยที่เท่ากัน ทาให้บอกระดับความแตกต่างที่ละเอียดมาก
  และบอกได้ว่าแต่ละคนแตกต่างกันเป็นปริมาณเท่าใด โดยเปรียบเทียบกับหน่วยปริมาณที่เท่ากันได้ เช่น
  คะแนนสอบของนักศึกษาทั้ง 30 คน เราเรียกข้อมูลที่จาแนกถึง หน่วยที่แตกต่างกันได้ว่า ข้อมูลระดับช่วง
  บัญญัติ ( Interval scale)
           4. มาตรอัตราส่วน (Ratio Scale)
               เป็นระดับของการวัดที่สูงที่สุด มีความสมบูรณ์ มากกว่ามาตราวัดอันตรภาค นอกจากจะมี
  คุณสมบัติเหมือนมาตราวัดอันตรภาคแล้วยังมี ศูนย์แท้ (Absolute Zero) ในขณะที่มาตราอันตรภาคมีเพียง
  ศูนย์สมมุติ ตัวอย่างการวัดในมาตรานี้ได้แก่ การวัดความยาว น้าหนัก ส่วนสูง อายุแต่ละหน่วยของความยาว
  จะมีช่วงเท่ากันแต่ละหน่วยของ น้าหนักมีขนาดเท่ากัน เช่น เอื้อมพร หนัก 40 กิโลกรัม จะหนักเป็น 2 เท่าของ
  นิตยารัตน์ ซึ่งหนัก 20 กิโลกรัม การที่กล่าวเช่นนี้ได้เนื่องจากแต่ละหน่วยกิโลกรัมมีน้าหนักเท่ากัน และเริ่มจาก
  ศูนย์แท้ น้าหนักศูนย์กิโลกรั มก็คือไม่มีน้าหนักเลยเนื่องจากการวัดระดับนี้มีความสมบูรณ์ทุกประการ จึง
  สามารถนามาจัดกระทาตามหลักคณิตศาสตร์ได้ทุกประการ เช่น บวก ลบ คูณ หาร ถอดราก และยกกาลังได้

                                                               อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)          5

          ข้อมูลที่ได้จากการวัดโดยใช้มาตราอัตราส่วน (Ratio scale) เป็นข้อมูลที่มีลักษณะจาแนกกลุ่ม เรียง
  อันดับ แบ่งเป็นช่วงเท่า ๆ กัน และมีศูนย์แท้ สามารถเปรียบเทียบในเชิงอัตราส่วนได้ เช่น ระยะทาง
  เวลา น้าหนัก ส่วนสูง อายุ

          ตัวอย่าง ของ มาตรอัตราส่วน (Ratio Scale)

     1.   รายได้ต่อเดือน ......................
     2.   อายุ ......................
     3.   ค่าใช้จ่าย .......................
     4.   น้าหนัก ...................
     5.   ส่วนสูง .....................
          สรุป ถ้าข้อมูลบอกความแตกต่างเป็นหน่วยที่เท่ากันได้และค่าศูนย์เป็นค่าศูนย์ที่แท้จริง (Absolute
  Zero) เช่น ความสูงเป็นเซนติเมตรของนักศึกษาทั้ง 30 คน เราเรียกข้อมูลที่สามารถจาแนกเป็นปริมาณที่
  แตกต่างกันเท่ากันและมีศูนย์แท้ว่า ข้อมูลระดับมาตราอัตราส่วนบัญญัติ(Radio scale)

  คุณสมบัติของแต่ละมาตรา สรุปได้ดังนี้

                      มาตรา                                       คุณสมบัติ
          นามบัญญัติ (Nominal Scale)      ความแตกต่างกัน
          เรียงลาดับ (Ordinal Scale)      ความแตกต่างกัน + ทิศทาง
          อันตรภาค (Interval Scale)       ความแตกต่างกัน + ทิศทาง + ช่วงเท่ากัน + ศูนย์สมมุติ
          อัตราส่วน (Ratio Scale)         ความแตกต่างกัน + ทิศทาง + ช่วงเท่ากัน + ศูนย์แท

  สถิติสาหรับตัวแปรเดียว

                 ลักษณะของข้อมูล            สถิติที่ใช้                     การนาเสนอข้อมูล
          1. สเกลนามบัญญัติ (Nominal        ความถี่                      ตารางแจกแจงความถี่
          Scale)                            อัตราส่วนร้อย                ร้อยละ สัดส่วน
          2. สเกลอันดับ (Ordinal Scale)     ความถี่ อัตราส่วนร้อย        ตารางแจกแจงความถี่
                                            เปอร์เซ็นต์ไทส์              ร้อยละ สัดส่วน
          3. สเกลอันตรภาคและอัตราส่วน       ความถี่ อัตราส่วนร้อยละ      ตารางแจกแจงความถี่ ค่า
          (Interval and Ratio Scale)        ส่วนเบี่ยงเบนมาตรฐาน         ความเบ้ ค่าความโด่ง
                                            ความแปรปรวน พิสัย
                                            เปอร์เซ็นต์ไทล์ ค่าเฉลี่ย

                                                         อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)            6

  1.5 ประชากรและตัวอย่าง

            ประชากร (Population) หมายถึง หน่วยต่าง ๆ ทุกหน่วยของสิ่งที่เราสนใจจะทาการศึกษา เป็น
  หน่ ว ยที่สามารถให้ ข้อมูล ต่าง ๆ แก่เราได้ เช่น สนใจรายได้เฉลี่ยของข้าราชการในจังหวัดสุ รินทร์ ดังนั้น
  ประชากรคือ ข้าราชการทุกคนที่ทางานอยู่ในจังหวัดสุรินทร์
            ลักษณะของประชากรที่ศึกษาอาจมีจานวนจากัด (finite population) ดังตัวอย่างข้างต้นหรืออาจมี
  จานวนอนันต์ (infinite population) เช่น การศึกษาเกี่ยวกับประสิทธิภาพของยาชนิดหนึ่ง ประชากรจะเป็น
  ผลการทดสอบประสิทธิภาพของยาในผู้ป่วยที่ใช้ยานี้ ซึ่งไม่สามารถบอกถึงจานวนทั้งหมดได้
            ตัวอย่าง (Sample) หมายถึง หน่วยบางหน่วยของประชากรที่จะให้ข้อเท็จจริงต่าง ๆ ที่เราสนใจ
  ศึกษา เช่น สนใจรายได้เฉลี่ยของข้าราชการที่ทางานอยู่ในจังหวัดสุรินทร์ ดังนั้นประชากร คือ ข้าราชการทุก
  คนที่ทางานอยู่ในจังหวัดสุรินทร์และตัวอย่าง คือข้าราชการบางคนที่ทางานอยู่ในจังหวัดสุรินทร์

  1.6 ค่าพารามิเตอร์และค่าสถิติ

          พารามิเตอร์ (Parameter) หมายถึง ค่าที่คานวณมาจากทุก ๆ หน่วยของประชากรเป็นตัวที่บ่งชี้ถึง
  คุณลักษณะของประชากรค่าสถิติ (Statistic) หมายถึง ค่าที่คานวณได้จากข้อมูลที่เป็นตัวอย่าง เป็นตัวที่บ่งชี้
  ถึงคุณลักษณะของตัวอย่าง ค่าสถิติจะเป็นตัวประมาณค่าพารามิเตอร์

                              ตารางที่ 1.1 สัญลักษณ์ค่าพารามิเตอร์และค่าสถิติ
                                                             สัญลักษณ์
                                   ความหมาย
                                                       ค่าสถิติ ค่าพารามิเตอร์
                                  ค่าเฉลี่ยเลขคณิต                   μ
                                  ค่าเบี่ยงเบน
                                                         S           σ
                                  มาตราฐาน
                                  ความแปรปรวน            S2         σ2


  1.7 ระเบียบวิธีทางสถิติ
         ระเบียบวิธีทางสถิติ แบ่งออกเป็น 4 ขั้นตอน ดังนี้
                  1. การรวบรวมข้อมูล
                  2. การนาเสนอข้อมูล
                  3. การวิเคราะห์ข้อมูล
                  4. การตีความหมาย


                                                         อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)            7

           1. การเก็บรวบรวมข้อมูล (data collection)
              เป็นการรวบรวมข้อมูล จากแหล่งข้อมูล ตามที่ได้มการวางแผนไว้ ซึ่งอาจเป็น ได้ทั้ง ข้อมูลปฐมภูมิ
                                                            ี
  หรือทุติยภูมิ
           2. การนาเสนอข้อมูล (data presentation)
              เป็นการจัดทาข้อมูลที่รวบรวมได้ให้อยู่ในรูปแบบที่กะทัดรัด เช่น ตาราง กราฟ แผนภูมิ
  ข้อความ เป็นต้น เพือความสะดวกในการอ่านข้อมูล ให้เข้าใจง่าย และเพื่อประโยชน์ในการวิเคราะห์ต่อไป
                      ่
           3. การวิเคราะห์ข้อมูล (data analysis)
              เป็นขั้นตอนการประมวลผลข้อมูลซึ่งในการวิเคราะห์จาเป็นต้องใช้สูตรทางสถิติต่างๆหรือใช้การ
  อ้าง อิงทางสถิติขึ้นกับวัตถุประสงค์ของงานนั้นๆ เช่น การวิเคราะห์แนวโน้มเข้าสู่ส่วนกลาง การวัดการ
  กระจาย การทดสอบสมมติฐาน การประมาณค่า เป็นต้น
           4. การแปลความหมาย (interpretation)
              เป็นขั้นตอนของการนาผลการวิเคราะห์มาอธิบายให้บุคคลทั่ว ไปเข้า ใจ อาจจาเป็น ต้องมีการ
  ขยายความในการอธิบาย เพื่อให้งานที่ศึกษาเป็นประโยชน์ต่อคนทั่ว ไปได้จากกระบวนการทางสถิติดังกล่าว
  เราสามารถจาแนกเป็นสถิติศาสตร์ที่สอดคล้องกับขั้นตอนต่างๆ ได้2 ลักษณะคือ สถิติบรรยาย (หรือสถิติเชิง
  พรรณนา) และสถิติอ้างอิง (หรือสถิติเชิงอนุมาน)

  1.8 การวัดแนวโน้มเข้าสู่ส่วนกลาง

          ในการนาเสนอข้อมูลทั้งหมดข้างต้น ถ้ามีข้อมูลจานวนมาก อาจทาให้ผู้อ่านหรือผู้ใช้เข้าใจได้ยาก จึงมี
  การนาเสนอค่าตัวแทนของข้อมูลเพื่อ ให้เห็นลักษณะของข้อมูลจากค่าตัวแทนของข้อมูลค่าใดค่าหนึ่ง ค่าตัว
  แทนของข้อมูล หรือการวัดแนวโน้มเข้าสู่ส่วนกลางที่นิยมใช้ได้แก่ ค่าเฉลี่ยเลขคณิต (arithmetic mean, X)
  ค่ามัธยฐาน (median) และค่าฐานนิยม (mode)
          1.8.1 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) ค่าเฉลี่ยเลขคณิตเป็นค่าเฉลี่ยที่นิยมใช้กันมากที่สุด
  จะแทนด้วย μ (มิว) เมื่อคานวณจากข้อมูลทั้งประชากร และแทนด้วย          เมื่อคานวณจากข้อมูลตัวอย่าง การ
  คานวณหาได้จากผลรวมของข้อมูลทุกค่าแล้วหารด้วยจานวนข้อมูลทั้งหมด สาหรับการคานวณหาค่าเฉลี่ยเลข
  คณิตแบ่งเป็น 2 กรณี คือ

  • กรณีข้อมูลไม่มีการจัดหมวดหมู่

  ข้อมูลประชากร                              ข้อมูลตัวอย่าง
  ถ้ามีข้อมูล X 1 ,…, X N รวม N ตัว          ถ้ามีข้อมูล X 1,…, X n รวม n ตัว




                                                         อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)                   8




  - ถ้าข้อมูล X1 ,…,XK มีความถี่ หรือปรากฏรวม f1,…,fK ครั้งตามลาดับ



  ข้อมูลประชากร                                              ข้อมูลตัวอย่าง
  ถ้ามีข้อมูล X 1 ,…, X N รวม N ตัว                          ถ้ามีข้อมูล X 1,…, X n รวม n ตัว




  • กรณีข้อมูลมีการจัดหมวดหมู่

  ข้อมูลประชากร                                              ข้อมูลตัวอย่าง
  ถ้ามีข้อมูล X 1 ,…, X N รวม N ตัว                          ถ้ามีข้อมูล X 1,…, X n รวม n ตัว




  ถ้าข้อมูล X 1 ,…,X K มีความถี่ หรือปรากฏรวม f 1,…,f K ครั้งตามลาดับ

  เมื่อ     K คือ จานวนชั้นของข้อมูล
          คือ ค่ากึ่งกลางของชั้นที่ i เมื่อ I = 1, 2, 3, … , K

          คือ ความถี่ของชั้นที่ i เมื่อ I = 1, 2, 3, … , K

  ตัวอย่าง 1. โรงงานแห่งหนึ่งมีพนักงาน 36, 45, 28 และ 41 คน ที่ได้รับค่าจ้างรายวันเฉลี่ย 162.5, 170.2,
                159.5 และ 167 บาทตามลาดับ จงหาค่าจ้างรายวันเฉลี่ยโดยรวมของพนักงานทั้ง 4 กลุ่มนี้

  วิธีทา ค่าจ้างรายวันเฉลี่ยโดยรวมของพนักงานทั้ง 4 กลุ่ม คานวณจากสูตร


                                                                   อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)          9




                                      36 x162.5  45x170.2  28x159.5  41x167
                                   =
                                                    36  45  28  41
                                       5850  7659  4466  6847
                                   =
                                                 150

                                       24822
                                   =
                                        150

                                   = 165.48

  ดังนั้น ค่าจ้างรายวันเฉลี่ยโดยรวมของพนักงานทั้ง 4 กลุ่มเท่ากับ 165.48 บาท

  คุณสมบัติของค่าเฉลี่ย
          1. เป็นตัวแทนข้อมูล ที่ใช้ข้อมูลทุกค่ามาทาการคานวณหาขนาดของค่าเฉลี่ย
          2. เนื่องจากมีการนาข้อมูลทุกค่ามาคานวณตามหลักคณิตศาสตร์จึงสามารถใช้ในการ
  วิเคราะห์สถิติขั้นสูงได้
          3. เนื่องจากมีการใช้ข้อมูลทุกค่ามาคานวณ ดังนั้นหากมีข้อมูลบางตัวทีมีขนาดใหญ่มากๆหรือเล็ก
                                                                            ่
  มากๆ ผิดปกติจะมีผลต่อการคานวณขนาดของค่าเฉลี่ยด้วย
          4. ข้อมูลที่มีมาตรวัดเป็นนามบัญญัติ (nominal scale) และเรียงอันดับ (ordinal scale) ไม่
  สามารถใช้คานวณค่าเฉลี่ยได้

          1.8.2 (Median) เป็นค่าที่บอกภาพรวมของข้อมูล โดยพิจารณาจากตาแหน่งกลางของข้อมูลที่เรียก
  ลาดับจากน้อยไปหามากแทนด้วย Me

  ก. กรณีที่ข้อมูลไม่ได้แจกแจงความถี่
          - ข้อมูลเป็นเลขคี่
               มัธยฐาน = ค่าของข้อมูลลาดับที่(n+1)/2
          - ข้อมูลเป็นเลขคู่
               มัธยฐาน = [ ค่าของข้อมูลลาดับที่(n)/2 + ค่าของข้อมูลลาดับที่(n+1)/2 ] / 2
  ข. กรณีที่ข้อมูลมีการแจกแจงความถี่




                                                          อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)            10




                                                N F 
                                      Me  U   2 fu  I
                                               
                                                     
                                                      

  โดยที่ L แทนขอบเขตล่างของชั้นมัธยฐาน
         U แทนขอบเขตบนของชั้นมัธยฐาน
         I แทนความกว้างของชั้น
         n แทนจานวนข้อมูลทั้งหมด
         fL แทนความถีของชั้นที่มีค่าสังเกตต่ากว่าชั้นมัธยฐาน
                     ่
         fU แทนความถี่ของชั้นที่มีค่าสังเกตสูงกว่าชั้นมัธยฐาน
         fm แทนความถี่ของชั้นที่มค่ามธัยฐาน
                                  ี

  ตัวอย่าง 2. จากข้อมูลต่อไปนี้จงหาค่ามัธยฐาน

      6.5      12.0      14.9      10.0       7.9       21.9     12.5      12.5       14.5        9.2


  วิธีทา เรียงลาดับข้อมูลจากน้อยไปมาก และเนื่องจาก N = 9 ซึ่งเป็นเลขคี่ ดังนั้น ค่าของข้อมูลตัวที่ = 5 จะ
  เป็นค่ามัธยฐานดังนั้น ค่ามัธยฐานของข้อมูลชุดนี้เท่ากับ 12.0

  ตัวอย่าง จากข้อมูลตารางแจกแจงความถี่ของคะแนนสอบวิชาสถิติเบื้องต้น จากนิสิตที่สุ่มมา 150 คน จงหา
  ค่าคะแนนสอบเฉลี่ยของวิชานี้ จงหาค่ากลางโดยใช้มัธยฐาน




                                                          อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)            11

                                คะแนนสอบ        ความถี่ (f I)   ค่ากลาง (X i)
                                 10 - 19          1              14.5
                                 20 - 29          6              24.5
                                 30 - 39          9              34.5
                                 40 - 49         31              44.5
                                 50 - 59         42              54.5
                                 60 - 69         32              64.5
                                 70 - 79         17              74.5
                                 80 - 89         10              84.5
                                 90 - 99          2              84.5
                                   รวม           150
  วิธีทา เรียงลาดับข้อมูลจากน้อยไปมาก และเนื่องจาก N = 9 ซึ่งเป็นเลขคี่ ดังนั้น ค่าของข้อมูลตัวที่ = 5 จะ
        เป็นค่ามัธยฐาน

  ขั้นตอนที่ 3 หาตาแหน่งของมัธยฐานสาหรับข้อมูลชุดนี้ เนื่องจาก N=150 เป็นเลขคู่ Me จะอยู่ระหว่าง
               ตาแหน่งที่ 75 และ 76ซึ่งอยู่ในช่วงคะแนน 50 – 59 หรือจะกล่าวได้ว่า ชั้นที่มีมัธยฐานอยู่ คือ
               ชั้นที่ 5 (สังเกตจากความถี่สะสม) นั่นคือL5 = 49.5 N = 150 F = 47 f5 = 42 I = 10

  ขั้นตอนที่ 2 แทนค่าต่าง ๆ ลงในสูตร




                                            =

                                            = 49.5 + 6.67

                                            = 56.17

  ดังนั้น ค่ามัธยฐานของคะแนนสอบวิชานี้เท่ากับ 56.17 คะแนน



                                                           อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)              12

  คุณสมบัติของค่ามัธยฐาน
            1. มัธยฐาน เป็นการใช้ค่าของข้อมูลที่อยู่ตาแหน่งตรงกลาง มาเป็นตัวแทน ดังนั้นข้อมูลที่มีค่ามาก
  หรือน้อยผิดปกติจะไม่มีผลกระทบต่อค่ามัธยฐาน และถ้ามีการเปลี่ยนแปลงข้อมูลบางตัวในกลุ่มจะมีผลกระทบ
  ต่อค่ามัธยฐานน้อยมาก
            2. มัธยฐาน จะเป็นค่าตัวแทนของข้อมูลได้ใกล้เคียงกับประชากรส่วนใหญ่มากกว่าค่าเฉลี่ย หากการ
  แจกแจงข้อมูลเบ้ไปทางใดทางหนึ่ง
            3. ข้อมูลทีมีมาตรวัดเป็นนามบัญญัติ (nominal scale) ไม่สามารถใช้คานวณหาค่า มัธยฐานได้
                       ่
            4. กรณีที่มีข้อมูลกระจุกอยู่ที่ค่าต่าสุด หรือสูงสุดมากเกินไปจะไม่สามารถหาค่ามัธยฐานได้ เช่น น้า
  หนักของผู้ป่วย 9 คน เป็น 55 55 55 55 55 60 65 70 72 ค่ามัธยฐานเป็น 55 ซึ่งไม่ได้เป็นค่าของข้อมูลที่อยู่
  ครึ่งหนึ่งตามความหมายของมัธยฐาน

            1.8.3 ฐานนิยม (mode) เป็นค่าที่มีความถี่สูงสุดในข้อมูลชุดหนึ่ง ฐานนิยมอาจมีค่าเดียวในชุด
  ข้อมูลนั้น หรืออาจมีหลายค่าได้กรณีที่มีข้อมูลที่ความถี่สูงสุดเท่ากันหลายค่ากรณีทข้อมุลมีการแจกแจงความถี่
                                                                                  ี่

                                           d1 
                                Mo  L1              I
                                           d1  d 2 
                                                     
           โดยที่ L แทนขอบเขตล่างของช้นั ที่มคี วามถ่สี งู สดุ
                  I แทนความกว้างของชั้น
           d1 แทนผลต่างระหว่างความถี่ของชั้นที่มีความถี่สูงสุด กับชั้นติดกันที่มีข้อมูลต่ากว่า
           d2 แทนผลต่างระหว่างความถี่ของชั้นที่มีความถี่สูงสุด กับชั้นติดกันที่มีข้อมูลสูงกว่า

  ตัวอย่าง 4 จากข้อมูลในตัวอย่าง 1.7 จงหาค่ากลางโดยใช้ฐานนิยม

  วิธีทา คานวณค่าฐานนิยมของคะแนนสอบวิชาสถิติเบื้องต้น ดังนี้

  ขั้นตอนที่ 1 หาชั้นที่มีฐานนิยมสาหรับข้อมูลชุดนี้ พบว่า ช่วงคะแนน 50 – 59 จะมีความถี่มากที่สุด หรือจะ
  กล่าวได้ว่า ชั้นที่มีฐานนิยมอยู่คือ ชั้นที่ 5 นั่น คือ

                           L5 = 49.5 N d1 = 42 - 31 = 31 d2 = 42 - 32 l = 10
  ขั้นตอนที่ 2 แทนค่าต่าง ๆ ลงในสูตร

                                                         d1 
                                              Mo  L1              I
                                                         d1  d 2 
                                                                   


                                                             อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)       13

                                                    11 
                                           49.5           10
                                                   11  10 
                                                            
                                          = 49.5 + 5.24
                                          = 54.74
  ดังนั้น ค่าฐานนิยมของคะแนนสอบวิชานี้เท่ากับ 54.74 คะแนน

  คุณสมบัติของฐานนิยม
  1. สามารถคานวณได้ง่าย รวดเร็ว
  2. ใช้กับข้อมูลที่มีมาตรวัดนามบัญญัติ(norminal scale)
  3. ข้อมูลที่มีค่ามาก หรือน้อยผิดปกติ จะไม่มีผลกระทบต่อค่าฐานนิยม และถ้ามีการ
  เปลี่ยนแปลงข้อมูลบางตัวในกลุ่มจะไม่มีผลกระทบต่อค่าฐานนิยม หรือมีน้อยมาก

  ความสัมพันธ์ระหว่าง Mean , Median และ Mode

  • ข้อมูลที่มีการกระจายอย่างสมมาตรค่า Mean Median และ Mode จะเท่ากันหรืออยู่ใกล้เคียงกัน




  • ข้อมูลที่มีการกระจายไม่เท่ากัน ค่า Mean ,Median และ Mode จะแตกต่างกัน




                                                       อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical)         14

                                         แบบฝึกหัดประจาบทเรียน

  1. ลักษณะของตัวอย่างที่ดีที่สามารถนามาศึกษาได้ควรเป็นอย่างไร
  2. จงบอกถึงข้อดี ข้อเสีย ของค่าเฉลี่ย ฐานนิยมและมัธยฐาน
  3. ทาการสุ่มตัวอย่างนักศึกษาวิชาเอกสถิติจานวน 10 คน ได้ข้อมูล ดังนี้
                           คนที่       อายุ      %fat         เพศ        grade
                            1          23         9.5          M          3.58
                            2          27         27.9         M          2.52
                            3          29         7.8          F          2.89
                            4          39         17.8         M          1.86
                            5          41         31.4         F          3.25
                            6          45         25.9         F          2.66
                            7          50         27.4         F          2.99
                            8          28         25.2         M          3.41
                            9          20         31.1         M          1.75
                            10         22         34.7         M          3.00


          3.1 อยากทราบว่าตัวแปร อายุ, % fat,เพศ, gradeเป็นข้อมูลประเภทใด และอยู่ใน scale ไหน
          3.2 จงสร้าง histogram ของตัวแปร age ถ้ากาหนดให้ความกว้างของแต่ละชั้นเป็น 5 และ 10
  ตามลาดับ
  4. จงหาค่าเฉลี่ยเลขคณิต และมัธยฐานของข้อมูลต่อไปนี้
  5.1 5 4 8 3 7 2 9
  5.2 18.3 20.6 19.3 22.4 20.2 18.8 16.7 20.0
  5. เลขชุดหนึ่งประกอบด้วยเลข 6.2 5.1 8.7 6.2 4.1 3.3 5.4 6.2 6.7 และ 9.6
  5.1 จงหา Mean Mode Median
          5.2 คูณทุกตัวด้วย 10 แล้วหา Mean Mode Median
          5.3 บวกทุกตัวด้วย 10 แล้วหา Mean Mode Median
  6. จากการสารวจคนงานในโรงงานหนึ่ง พบว่าคนงานชายและหญิงทั้งหมด มีรายจ่ายค่าอาหารเย็นเฉลี่ยคนละ
  12 บาท โดยแยกเป็นคนงานชายทั้งหมด 20 คน มีรายจ่ายค่าอาหารเย็นเฉลี่ยคนละ 15 คน ส่วนคนงานหญิงมี
  รายจ่ายค่าอาหารเย็นคนละ 11 บาท จงหาว่าโรงงานแห่งนี้มีคนงานหญิงกี่คน



                                                         อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)

More Related Content

PDF
โวหารในการเขียน
PDF
ประโยคที่ซับซ้อน
DOC
คำนำ
PDF
ปกนวัตกรรมการปฏิบัติที่เป็นเลิศ
PDF
ตัวอย่างแผนการเรียนรู้ BackWard Design
PPTX
Testแนวการออกข้อสอบวัดการคิดระดับสังเคราะห์
DOCX
โครงการจิตอาสาพัฒนาวัดบ้านเรา
โวหารในการเขียน
ประโยคที่ซับซ้อน
คำนำ
ปกนวัตกรรมการปฏิบัติที่เป็นเลิศ
ตัวอย่างแผนการเรียนรู้ BackWard Design
Testแนวการออกข้อสอบวัดการคิดระดับสังเคราะห์
โครงการจิตอาสาพัฒนาวัดบ้านเรา

What's hot (20)

DOCX
โครงงาน Is-กลุ่มสบู่-1-5
PDF
คลื่นกล
PPTX
ศาสนาเชน
PDF
สรุปเซลล์
PDF
2.1การวิเคราะห์และนำเสนอข้อมูลเชิงคุณภาพด้วยตารางความถี่
PDF
10บรรณานุกรม
PDF
เล่มที่ 4 การเคลื่อนที่ของคน
DOC
4.ใบงาน
PPTX
ฮีตสิบสอง คองสิบสี่
PDF
คำนำ สารบัญ แบบฝึกทักษะคณิตศาสตร์ สำหรับนักเรียนชั้นมัธยมศึกษาปีที่ 1 เล่มที่...
PDF
รูปแบบการเขียนรายงานโครงงาน 5 บท
PDF
โครงงานชาผักสมุนไพรพื้นบ้าน
PDF
เด็กไม่ส่งการบ้าน
PDF
บทนมัสการมาตาปิตุคุณ1
PDF
2.2 การวิเคราะห์และนำเสนอข้อมูลเชิงคุณภาพด้วยแผนภาพ
DOC
คำกล่าวรายงาน คำกล่าวปิด
PDF
เรียงความ Is1
PDF
ศาสนาอิสลาม
PDF
ข้อสอบปลายภาค50ข้อexcel 07 2558
PDF
โวหารภาพพจน์
โครงงาน Is-กลุ่มสบู่-1-5
คลื่นกล
ศาสนาเชน
สรุปเซลล์
2.1การวิเคราะห์และนำเสนอข้อมูลเชิงคุณภาพด้วยตารางความถี่
10บรรณานุกรม
เล่มที่ 4 การเคลื่อนที่ของคน
4.ใบงาน
ฮีตสิบสอง คองสิบสี่
คำนำ สารบัญ แบบฝึกทักษะคณิตศาสตร์ สำหรับนักเรียนชั้นมัธยมศึกษาปีที่ 1 เล่มที่...
รูปแบบการเขียนรายงานโครงงาน 5 บท
โครงงานชาผักสมุนไพรพื้นบ้าน
เด็กไม่ส่งการบ้าน
บทนมัสการมาตาปิตุคุณ1
2.2 การวิเคราะห์และนำเสนอข้อมูลเชิงคุณภาพด้วยแผนภาพ
คำกล่าวรายงาน คำกล่าวปิด
เรียงความ Is1
ศาสนาอิสลาม
ข้อสอบปลายภาค50ข้อexcel 07 2558
โวหารภาพพจน์
Ad

Similar to สถิติเบื่องต้น (20)

PDF
9789740333432
PPTX
สถิติเพื่อการวิจัย
PPTX
เอกสารบรรยาย เรื่อง แนวทางการใช้สถิติเพื่อการวิจัยทางการศึกษาและการใช้คอมพิวเ...
PPT
สถิติStat
PDF
บทที่ 1
DOC
เอกสารประกอบการสอนบทที่ 1
PPTX
โครงงานคอมพิวเตอร์
PPT
Week 5 scale_and_measurement
PPTX
สถิติและคอมพิวเตอร์ 1
PPT
การวิเคราะห์ข้อมูลเชิงปริมาณ
PDF
บทเรียน1 สถิติ
PPT
สถิติเชิงบรรยาย
PPT
ความรู้เบื้องต้นเกี่ยวกับสถิติ อภิเทพ
PDF
%Ca%c3%d8%bb%ca%b6%d4%b5%d4%5 b1%5d
PDF
descriptive.pdfการวิเคราะห์ข้อมมูลสำหรับการศึกษา
PDF
6 1-ความรู้เกี่ยวกับข้อมูล
PDF
7 สถิติเพื่อการวิจัย
PDF
สถิติเบื้องต้นกลุ่ม 2 สำรอง
PDF
สถิติเบื้องต้นกลุ่ม 2 สำรอง
9789740333432
สถิติเพื่อการวิจัย
เอกสารบรรยาย เรื่อง แนวทางการใช้สถิติเพื่อการวิจัยทางการศึกษาและการใช้คอมพิวเ...
สถิติStat
บทที่ 1
เอกสารประกอบการสอนบทที่ 1
โครงงานคอมพิวเตอร์
Week 5 scale_and_measurement
สถิติและคอมพิวเตอร์ 1
การวิเคราะห์ข้อมูลเชิงปริมาณ
บทเรียน1 สถิติ
สถิติเชิงบรรยาย
ความรู้เบื้องต้นเกี่ยวกับสถิติ อภิเทพ
%Ca%c3%d8%bb%ca%b6%d4%b5%d4%5 b1%5d
descriptive.pdfการวิเคราะห์ข้อมมูลสำหรับการศึกษา
6 1-ความรู้เกี่ยวกับข้อมูล
7 สถิติเพื่อการวิจัย
สถิติเบื้องต้นกลุ่ม 2 สำรอง
สถิติเบื้องต้นกลุ่ม 2 สำรอง
Ad

More from othanatoso (17)

PDF
ค30202 แคลคูลัสเบื้องต้น
PDF
อัตราส่วนหลายๆจำนวน
PDF
อัตราส่วน คาบ 1 2 [compatibility mode]
PDF
ใบกิจกรรมที่ 2.1
PDF
ค30202 แคลคูลัสเบื้องต้น2
PDF
แผนย่อพื้นฐาน ม.2
PDF
ค30202 แคลคูลัสเบื้องต้น
PDF
ค32203 โครงการสอน
PDF
2.91 ใบความรู้ การวัดการกระจายสัมพัทธ์
PDF
2.91 แบบฝึกหัด การวัดการกระจายสัมพัทธ์
PDF
Doublecab 18102554
PDF
Introduction to basic statistics
PDF
PDF
Pretest
PDF
Post test
PDF
Pretest 11 20
PDF
ค30202 แคลคูลัสเบื้องต้น
อัตราส่วนหลายๆจำนวน
อัตราส่วน คาบ 1 2 [compatibility mode]
ใบกิจกรรมที่ 2.1
ค30202 แคลคูลัสเบื้องต้น2
แผนย่อพื้นฐาน ม.2
ค30202 แคลคูลัสเบื้องต้น
ค32203 โครงการสอน
2.91 ใบความรู้ การวัดการกระจายสัมพัทธ์
2.91 แบบฝึกหัด การวัดการกระจายสัมพัทธ์
Doublecab 18102554
Introduction to basic statistics
Pretest
Post test
Pretest 11 20

สถิติเบื่องต้น

  • 1. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 1 บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 1.1 ความหมายของชีวสถิติ • คือ ข้อมูลสถิติ (Statistical Data) ข้อมูลสรุปได้จากการประมวลหรือวิเคราะห์กลุ่มของข้อมูลเพื่อใช้ แสดงลักษณะข้อมูลของกลุ่มนั้น • คือ สถิติศาสตร์ (Statistics) ศาสตร์ว่าด้วยการจัดกระทาต่างๆเกี่ยวกับข้อมูลเพื่อบรรยายลักษณะ ของสิ่งที่ศึกษาได้อย่างเที่ยงตรงและเชื่อถือได้นาเอาไปใช้คาดคะเนและการตัดสินใจต่างๆ 1.2 ประเภทของสถิติ • สถิติพรรณนา (Descriptive Statistics) วิธีการทางสถิติที่ใช้พรรณนาลักษณะ สิ่งต้องการศึกษาให้ อยู่ในรูปของตารางข้อมูลสรุป การนาเสนอแบบต่างๆเพื่อให้เข้าใจถึงข้อมูลที่รวบรวมมาได้ แต่ไม่สามารถ คาดคะเนนอกเหนือไปจากข้อมูลที่มีอยู่ได้ • สถิติอนุมาน (Inferential Statistics) วิธีการทางสถิติที่ใช้ทฤษฏีความน่าจะเป็นในการอนุมาน ลักษณะของประชากรจากข้อมูลของตัวอย่างเช่นการศึกษาโรคขาดสารอาหารในเด็กวัยก่อนเรียนในภาคอีสาน ส่วนใหญ่จะสุ่มจากเด็กวัยก่อนเรียนมาบางส่วนเพื่อประเมินหาอัตราการขาดสารอาหาร เป็นต้น 1.3 ประเภทข้อมูล ข้อมูล (Data) หมายถึง ข้อเท็จจริงที่เก็บรวบรวมได้จากตัวอย่างหรือประชากร 1.3.1 แบ่งตามลักษณะข้อมูล ได้ 2 ประเภท ดังนี้ 1. ข้อมูลเชิงปริมาณ (Quantitative Data) เป็นข้อมูลที่วัดค่าได้ว่ามากหรือน้อยในเชิง ปริมาณ เช่น รายได้ อายุ ความสูงจานวนสินค้า ฯลฯ ซึ่งแบ่งได้ 2 แบบ คือ 1.1 ข้อมูลแบบต่อเนื่อง (Continuous Data) หมายถึง ข้อมูลที่มีค่าต่อเนื่องกันในช่วงที่ กาหนด สามารถแจงสมาชิกในข้อมูลได้ เช่น ความสูง อายุ ระยะทาง เป็นต้น 1.2 ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) หมายถึง ข้อมูลที่มีค่าเป็นจานวนเต็มหรือ จานวนนับ เช่น จานวนนักศึกษา จานวนสมาชิกในครัวเรือน เป็นต้น 2. ข้อมูลเชิงคุณภาพ (Qualitative Data) เป็นข้อมูลที่ไม่สามารถระบุค่าได้ว่ามากหรือ น้อย อาจแทนด้วยตัวเลขก็ได้โดยตัวเลขดังกล่าวไม่มีความหมายในเชิงปริมาณ เช่น เพศ ระดับการศึกษา อาชีพ ทัศนคติ เป็นต้น 1.3.2 แบ่งตามแหล่งที่มาของข้อมูล ได้ 2 ประเภท ดังนี้ อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 2. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 2 1. ข้อมูลปฐมภูมิ (Primary Data) เป็นข้อมูลที่ผู้ใช้ไปเก็บรวบรวมข้อมูลเอง ข้อ มูลที่ได้จะมี ความทันสมัยมีความถูกต้องน่าเชื่อถือ แต่การรวบรวมข้อมูลต้องใช้เวลานาน ต้องใช้กาลังคนมาก เสียค่าใช้จ่าย สูง ไม่สะดวกเท่าที่ควร 2. ข้อมูลทุติยภูมิ (Secondary Data) เป็นข้อมูลที่มีการเก็บรวบรวมไว้แล้วผู้ใช้เป็นเพียงผู้ที่ นาข้อมูลนั้นมาใช้ จึงเป็นการประหยัดทั้งเวลาและค่าใช้จ่าย แต่บางครั้งจะเป็นข้อมูลที่ไม่ตรงกับความต้องการ หรือไม่ละเอียดพอ นอกจากนี้ผู้ใช้มักจะไม่ทราบถึงข้อผิดพลาดของข้อมูล ซึ่งมีผลทาให้การวิเคราะห์ผลอาจจะ ผิดพลาดได้ 1.4 ระดับของการวัด (Level of Measurement) ข้อมูลในการวิจัยจานวนมากได้มาจากการวัด ซึ่งการวัด (Measurement) หมายถึง การกาหนด ตัวเลข หรือสัญลักษณ์อื่น ๆ แทนปริมาณหรือคุณภาพหรือคุณลักษณะ ของสิ่งที่วัด มาตราการวัดมี 4 ระดับ คือ 1. มาตรานามบัญญัติ (Nominal Scale or Classification Scale) เป็นข้อมูลที่มีลักษณะจาแนกกลุ่มหรือประเภท โดยตัวเลขหรือค่าที่กาหนดให้นามาบวก ลบ คูณ หาร กันไม่ได้ เป็นระดับการวัดที่ต่า ที่สุด เป็นการกาหนดตัวเลขแทนชื่อคน แทนคุณลักษณะต่าง ๆ แทน เหตุการณ์ต่างๆ หรือแทนสิ่งต่าง ๆ เช่น เบอร์นางงามที่เข้าประกวด เบอร์นักฟุตบอล เลขทะเบียนรถต่าง ๆ การกาหนดให้เลข 0 แทน เพศหญิงเลข 1 แทนเพศชาย คุณสมบัติที่สาคัญของมาตรานี้ก็คือ ตัวเลขที่ กาหนดให้จะเพียงแต่ชี้ถึง ความแตกต่างกัน คือชี้ว่าไม่ใช่สิ่งเดียวกัน ไม่ได้แทนอันดับ ขนาด ปริมาณหรือ คุณภาพใด ๆ ซึ่งตัวเลขหรือค่าต่าง ๆ ที่กาหนดให้นั้นนามาบวก ลบ คูณ หารกันไม่ได้ และจากการที่ไม่ได้ชี้ ปริมาณหรือคุณภาพดังกล่าว นักจิตวิทยาบางท่านจึงไม่ยอมรับการวัดชนิดนี้ว่าเป็นการวัด (Measurement) ข้อมูลที่ได้จากการวัดโดยใช้มาตรานามบัญญัติ (Nominal scale) 1. เพศ  ชาย  หญิง 2. เชื้อชาติ (ไทย, จีน, ฯลฯ) 3. ศาสนา (พุทธ, คริสต์, อิสลาม, ฯลฯ 4. อาชีพ  หมอ  นักเรียน  ครู 5. หมายเลขโทรศัพท์ ......................... 6. เลขที่บ้าน ............................. อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 3. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 3 สรุป ถ้าข้อมูลบอกความแตกต่างได้แต่เพียงชื่อ เป็นความแตกต่างที่หยาบที่สุด เช่นชื่อนักศึกษาทั้ง 30 คน ไม่ได้ให้รายละเอียดอะไร นอกจากว่าแต่ละคนชื่อแตกต่างกัน เราเรียกข้อมูลที่สามารถจาแนกได้แต่เพียง ชื่อว่า ข้อมูลระดับมาตรานามบัญญัติ( Nominal scale) 2. มาตรอันดับ (Ordinal Scale) เป็นระดับของการวัดที่สูงกว่ามาตรานามบัญญัติ เป็นการกาหนดตัวเลขหรือสั ญลักษณ์เพื่อชี้ถึง อันดับ เช่น หลังจากพิจารณาภาพที่นักเรียนวาดมาแล้วก็ได้อันดับจากภาพที่ดีที่สุดเป็นอันดับ 1 รองลงมาเป็น อันอับ 2 , 3 ,…… ตามลาดับ เป็นต้น จะเห็นได้ว่าในมาตรานี้มีคุณสมบัติของมาตรานามบัญญัติคือ ความ แตกต่าง อันดับ 1 และอันดับ 2 จะเป็นคนละคนไม่เหมือนกัน สิ่งที่เราทราบเพิ่มขึ้นจากมาตรานามบัญญัติคือ ทิศทาง ของความแตกต่าง อันดับ 1 อยู่เหนือกว่าอันดับ 2 เนื่องจากมีปริมาณหรือคุณภาพมากกว่า อย่างไรก็ ตาม แม้จะทราบว่าใครมากกว่า น้อยกว่า แต่ไม่อาจทราบว่ามากกว่ากันเท่าใด และช่วงระหว่างอันดับต่าง ๆ มักไม่เท่ากัน เช่นที่ 1 อาจมีคุณภาพเหนือกว่าที่ 2 มากขณะที่ 2 มีคุณภาพห่างจากที่ 3 เพียงเล็กน้อย เป็นต้น จากการที่ช่วงอันดับไม่เท่ากันดังกล่าว จึงไม่สามารถนาเอาตัวเลขในมาตรานี้มาบวก ลบ คูณ หรือหารกันได้ เช่น ผลการแข่งขันกีฬามหาวิทยาลัย ระดับความคิดเห็น ตาแหน่งทางวิชาการ ข้อมูลที่ได้จากการวัดโดยใช้มาตรอันดับ (Ordinal scale) เป็นข้อมูลที่นอกจากมีลักษณะจาแนกกลุ่มหรือประเภทได้แล้วยังสามารถเรียงอันดับได้ด้วย เช่น ตาแหน่ง (ที่ 1, ที่ 2, ที่ 3, ฯลฯ) ระดับความพอใจ (มากที่สุด, มาก, ปานกลาง, น้อย, น้อยทีสุด) ่ 1. กิจกรรมที่นิยมทาในวันหยุด (เรียงลาดับมากที่สุดเป็นลาดับ 1) ......... ดูหนัง ......... ฟังเพลง ......... เล่นกีฬา ......... ดูโทรทัศน์ ......... ช๊อปปิ้ง สรุป ถ้าข้อมูลบอกความแตกต่างได้ เป็นการจาแนกข้อมูลที่ละเอียดขึ้น เพราะบอกความแตกต่างได้ เช่นชื่อนักศึกษาที่เรียงกันตามระดับความสูงทั้ง 30 คน เราเรียกข้อมูลที่เราสามารถจาแนกถึงความแตกต่างได้ นี้ว่า ข้อมูลระดับมาตราอันดับบัญญัติ ( Ordinal scale ) อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 4. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 4 3. มาตรอันตรภาค (Interval Scale) เป็นระดับของการวัดที่สูงกว่าสองมาตราที่กล่าว มาโดยมีคุณสมบัติเพิ่มขึ้นอีก 2 ประการ คือ มี ศูนย์สมมุติ (Arbitrary Zero or Relative Zero) และมีหน่วยของการวัดที่เท่ากัน ตัวอย่างของมาตรานี้ ได้แก่ การวัดอุณหภูมิ เช่น ในหน่วยวัดอุณหภูมิแบบเซลเซียส จะกาหนดจุดที่น้ากลายเป็นน้าแข็งเป็น 0° ซ. เป็นศูนย์ เทียมไม่ได้หมายความว่าถึง ณ อุณหภูมิ 0° ซ. นี้ไม่มีความร้อนอยู่เลยแต่เป็นเพียงจุดที่น้ากลายเป็นน้าแข็ง จากการที่มีหน่วยของการวัดที่เท่ากัน และมีศูนย์เทียมจึงสามารถเปรียบเทียบปริมาณ หรือคุณภาพได้ว่า มากกว่ากันเท่าไร เช่น 40° ซ. จะมีอุณหภูมิสูงกว่า 30° ซ. อยู่ 10° ซ. และสามารถพูดได้ว่าอุณหภูมิ 20° ซ. สูง กว่าอุณหภูมิ 15° ซ. เท่ากับอุณหภูมิ 14° ซ. สูงกว่าอุณหภูมิ 9° ซ. เพราะต่างก็สูงกว่ากัน 5° ซ. (ไม่อาจพูดได้ ว่าอุณหภูมิ 60° ซ. ร้อนเป็นสองเท่าของอุณหภูมิ 30° ซ. เพราะความร้อนไม่ได้เริ่มที่จุด 0° ซ.) หรือ 60° ซ. = 2 (30° ซ.) แต่ปริมาณความร้อนของสสาร 60° ซ. ? 2 (ความร้อนของสสาร 30° ซ.) นักพฤติกรรมศาสตร์มัก ถือเอาว่าคะแนนการสอบเป็นการวัดในมาตรานี้ จึงตีความในลักษณะเดียวกันกับกรณีของอุณหภูมิที่กล่าวมา เช่น ในแบบทดสอบที่มีจานวน 60 ข้อ ถ้า ก สอบได้ 50 คะแนน ข สอบได้ 30 คะแนน ค สอบได้ 25 คะแนน และ ง สอบได้ 5 คะแนน ก็กล่าวว่า ก ได้คะแนนมากกว่า ข 20 คะแนน ข ได้คะแนนมากกว่า ง 25 คะแนน ก ได้คะแนนมากกว่า ข เท่ากับ ค ได้คะแนนมากกว่า ง (ต่างกันมากกว่า 20 คะแนน) แต่ไม่สามารถตีความได้ว่า ก มีความรู้เป็น 2 เท่าของ ค เพราะจุดเริ่มต้นไม่ใช้ศูนย์แท้ ผู้สอบได้คะแนนศูนย์ไม่ได้หมายความว่าไม่มีความรู้ ในวิชานั้น เป็นเพียงแต่ว่าทาข้อสอบชุดนั้นไม่ได้ ถ้าออกข้อสอบมากกว่านั้น หรือง่ายกว่านั้นเขาอาจทาได้บ้าง มาตราอั น ตราภาคนั บ ว่ า เป็ น มาตราที่ เ ป็ น ปริ ม าณอย่ า งแท้ จ ริ ง ไม่ เ หมื อ นมาตรานามบั ญ ญั ติ แ ละมาตรา เรียงลาดับข้อมูลที่ได้จากการวัดโดยใช้มาตราอันตรภาค (Interval scale) เป็นข้อมูลที่มีลักษณะจาแนกกลุ่ม เรียงอันดับ และแบ่งเป็นช่วง ๆ โดยแต่ละช่วงมีขนาดเท่ากัน ศูนย์ของข้อมูลประเภทนี้เป็นศูนย์สมมติ ไม่มีศูนย์แท้ เช่น คะแนนสอบ อุณหภูมิ เวลา IQ สรุป ถ้าข้อมูลบอกความแตกต่างเป็นหน่วยที่เท่ากันได้ เป็นการจาแนกความแตกต่างที่ละเอียด ขึ้น เพราะสามารถบอกความแตกต่างเป็นปริมาณหน่วยที่เท่ากัน ทาให้บอกระดับความแตกต่างที่ละเอียดมาก และบอกได้ว่าแต่ละคนแตกต่างกันเป็นปริมาณเท่าใด โดยเปรียบเทียบกับหน่วยปริมาณที่เท่ากันได้ เช่น คะแนนสอบของนักศึกษาทั้ง 30 คน เราเรียกข้อมูลที่จาแนกถึง หน่วยที่แตกต่างกันได้ว่า ข้อมูลระดับช่วง บัญญัติ ( Interval scale) 4. มาตรอัตราส่วน (Ratio Scale) เป็นระดับของการวัดที่สูงที่สุด มีความสมบูรณ์ มากกว่ามาตราวัดอันตรภาค นอกจากจะมี คุณสมบัติเหมือนมาตราวัดอันตรภาคแล้วยังมี ศูนย์แท้ (Absolute Zero) ในขณะที่มาตราอันตรภาคมีเพียง ศูนย์สมมุติ ตัวอย่างการวัดในมาตรานี้ได้แก่ การวัดความยาว น้าหนัก ส่วนสูง อายุแต่ละหน่วยของความยาว จะมีช่วงเท่ากันแต่ละหน่วยของ น้าหนักมีขนาดเท่ากัน เช่น เอื้อมพร หนัก 40 กิโลกรัม จะหนักเป็น 2 เท่าของ นิตยารัตน์ ซึ่งหนัก 20 กิโลกรัม การที่กล่าวเช่นนี้ได้เนื่องจากแต่ละหน่วยกิโลกรัมมีน้าหนักเท่ากัน และเริ่มจาก ศูนย์แท้ น้าหนักศูนย์กิโลกรั มก็คือไม่มีน้าหนักเลยเนื่องจากการวัดระดับนี้มีความสมบูรณ์ทุกประการ จึง สามารถนามาจัดกระทาตามหลักคณิตศาสตร์ได้ทุกประการ เช่น บวก ลบ คูณ หาร ถอดราก และยกกาลังได้ อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 5. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 5 ข้อมูลที่ได้จากการวัดโดยใช้มาตราอัตราส่วน (Ratio scale) เป็นข้อมูลที่มีลักษณะจาแนกกลุ่ม เรียง อันดับ แบ่งเป็นช่วงเท่า ๆ กัน และมีศูนย์แท้ สามารถเปรียบเทียบในเชิงอัตราส่วนได้ เช่น ระยะทาง เวลา น้าหนัก ส่วนสูง อายุ ตัวอย่าง ของ มาตรอัตราส่วน (Ratio Scale) 1. รายได้ต่อเดือน ...................... 2. อายุ ...................... 3. ค่าใช้จ่าย ....................... 4. น้าหนัก ................... 5. ส่วนสูง ..................... สรุป ถ้าข้อมูลบอกความแตกต่างเป็นหน่วยที่เท่ากันได้และค่าศูนย์เป็นค่าศูนย์ที่แท้จริง (Absolute Zero) เช่น ความสูงเป็นเซนติเมตรของนักศึกษาทั้ง 30 คน เราเรียกข้อมูลที่สามารถจาแนกเป็นปริมาณที่ แตกต่างกันเท่ากันและมีศูนย์แท้ว่า ข้อมูลระดับมาตราอัตราส่วนบัญญัติ(Radio scale) คุณสมบัติของแต่ละมาตรา สรุปได้ดังนี้ มาตรา คุณสมบัติ นามบัญญัติ (Nominal Scale) ความแตกต่างกัน เรียงลาดับ (Ordinal Scale) ความแตกต่างกัน + ทิศทาง อันตรภาค (Interval Scale) ความแตกต่างกัน + ทิศทาง + ช่วงเท่ากัน + ศูนย์สมมุติ อัตราส่วน (Ratio Scale) ความแตกต่างกัน + ทิศทาง + ช่วงเท่ากัน + ศูนย์แท สถิติสาหรับตัวแปรเดียว ลักษณะของข้อมูล สถิติที่ใช้ การนาเสนอข้อมูล 1. สเกลนามบัญญัติ (Nominal ความถี่ ตารางแจกแจงความถี่ Scale) อัตราส่วนร้อย ร้อยละ สัดส่วน 2. สเกลอันดับ (Ordinal Scale) ความถี่ อัตราส่วนร้อย ตารางแจกแจงความถี่ เปอร์เซ็นต์ไทส์ ร้อยละ สัดส่วน 3. สเกลอันตรภาคและอัตราส่วน ความถี่ อัตราส่วนร้อยละ ตารางแจกแจงความถี่ ค่า (Interval and Ratio Scale) ส่วนเบี่ยงเบนมาตรฐาน ความเบ้ ค่าความโด่ง ความแปรปรวน พิสัย เปอร์เซ็นต์ไทล์ ค่าเฉลี่ย อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 6. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 6 1.5 ประชากรและตัวอย่าง ประชากร (Population) หมายถึง หน่วยต่าง ๆ ทุกหน่วยของสิ่งที่เราสนใจจะทาการศึกษา เป็น หน่ ว ยที่สามารถให้ ข้อมูล ต่าง ๆ แก่เราได้ เช่น สนใจรายได้เฉลี่ยของข้าราชการในจังหวัดสุ รินทร์ ดังนั้น ประชากรคือ ข้าราชการทุกคนที่ทางานอยู่ในจังหวัดสุรินทร์ ลักษณะของประชากรที่ศึกษาอาจมีจานวนจากัด (finite population) ดังตัวอย่างข้างต้นหรืออาจมี จานวนอนันต์ (infinite population) เช่น การศึกษาเกี่ยวกับประสิทธิภาพของยาชนิดหนึ่ง ประชากรจะเป็น ผลการทดสอบประสิทธิภาพของยาในผู้ป่วยที่ใช้ยานี้ ซึ่งไม่สามารถบอกถึงจานวนทั้งหมดได้ ตัวอย่าง (Sample) หมายถึง หน่วยบางหน่วยของประชากรที่จะให้ข้อเท็จจริงต่าง ๆ ที่เราสนใจ ศึกษา เช่น สนใจรายได้เฉลี่ยของข้าราชการที่ทางานอยู่ในจังหวัดสุรินทร์ ดังนั้นประชากร คือ ข้าราชการทุก คนที่ทางานอยู่ในจังหวัดสุรินทร์และตัวอย่าง คือข้าราชการบางคนที่ทางานอยู่ในจังหวัดสุรินทร์ 1.6 ค่าพารามิเตอร์และค่าสถิติ พารามิเตอร์ (Parameter) หมายถึง ค่าที่คานวณมาจากทุก ๆ หน่วยของประชากรเป็นตัวที่บ่งชี้ถึง คุณลักษณะของประชากรค่าสถิติ (Statistic) หมายถึง ค่าที่คานวณได้จากข้อมูลที่เป็นตัวอย่าง เป็นตัวที่บ่งชี้ ถึงคุณลักษณะของตัวอย่าง ค่าสถิติจะเป็นตัวประมาณค่าพารามิเตอร์ ตารางที่ 1.1 สัญลักษณ์ค่าพารามิเตอร์และค่าสถิติ สัญลักษณ์ ความหมาย ค่าสถิติ ค่าพารามิเตอร์ ค่าเฉลี่ยเลขคณิต μ ค่าเบี่ยงเบน S σ มาตราฐาน ความแปรปรวน S2 σ2 1.7 ระเบียบวิธีทางสถิติ ระเบียบวิธีทางสถิติ แบ่งออกเป็น 4 ขั้นตอน ดังนี้ 1. การรวบรวมข้อมูล 2. การนาเสนอข้อมูล 3. การวิเคราะห์ข้อมูล 4. การตีความหมาย อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 7. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 7 1. การเก็บรวบรวมข้อมูล (data collection) เป็นการรวบรวมข้อมูล จากแหล่งข้อมูล ตามที่ได้มการวางแผนไว้ ซึ่งอาจเป็น ได้ทั้ง ข้อมูลปฐมภูมิ ี หรือทุติยภูมิ 2. การนาเสนอข้อมูล (data presentation) เป็นการจัดทาข้อมูลที่รวบรวมได้ให้อยู่ในรูปแบบที่กะทัดรัด เช่น ตาราง กราฟ แผนภูมิ ข้อความ เป็นต้น เพือความสะดวกในการอ่านข้อมูล ให้เข้าใจง่าย และเพื่อประโยชน์ในการวิเคราะห์ต่อไป ่ 3. การวิเคราะห์ข้อมูล (data analysis) เป็นขั้นตอนการประมวลผลข้อมูลซึ่งในการวิเคราะห์จาเป็นต้องใช้สูตรทางสถิติต่างๆหรือใช้การ อ้าง อิงทางสถิติขึ้นกับวัตถุประสงค์ของงานนั้นๆ เช่น การวิเคราะห์แนวโน้มเข้าสู่ส่วนกลาง การวัดการ กระจาย การทดสอบสมมติฐาน การประมาณค่า เป็นต้น 4. การแปลความหมาย (interpretation) เป็นขั้นตอนของการนาผลการวิเคราะห์มาอธิบายให้บุคคลทั่ว ไปเข้า ใจ อาจจาเป็น ต้องมีการ ขยายความในการอธิบาย เพื่อให้งานที่ศึกษาเป็นประโยชน์ต่อคนทั่ว ไปได้จากกระบวนการทางสถิติดังกล่าว เราสามารถจาแนกเป็นสถิติศาสตร์ที่สอดคล้องกับขั้นตอนต่างๆ ได้2 ลักษณะคือ สถิติบรรยาย (หรือสถิติเชิง พรรณนา) และสถิติอ้างอิง (หรือสถิติเชิงอนุมาน) 1.8 การวัดแนวโน้มเข้าสู่ส่วนกลาง ในการนาเสนอข้อมูลทั้งหมดข้างต้น ถ้ามีข้อมูลจานวนมาก อาจทาให้ผู้อ่านหรือผู้ใช้เข้าใจได้ยาก จึงมี การนาเสนอค่าตัวแทนของข้อมูลเพื่อ ให้เห็นลักษณะของข้อมูลจากค่าตัวแทนของข้อมูลค่าใดค่าหนึ่ง ค่าตัว แทนของข้อมูล หรือการวัดแนวโน้มเข้าสู่ส่วนกลางที่นิยมใช้ได้แก่ ค่าเฉลี่ยเลขคณิต (arithmetic mean, X) ค่ามัธยฐาน (median) และค่าฐานนิยม (mode) 1.8.1 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) ค่าเฉลี่ยเลขคณิตเป็นค่าเฉลี่ยที่นิยมใช้กันมากที่สุด จะแทนด้วย μ (มิว) เมื่อคานวณจากข้อมูลทั้งประชากร และแทนด้วย เมื่อคานวณจากข้อมูลตัวอย่าง การ คานวณหาได้จากผลรวมของข้อมูลทุกค่าแล้วหารด้วยจานวนข้อมูลทั้งหมด สาหรับการคานวณหาค่าเฉลี่ยเลข คณิตแบ่งเป็น 2 กรณี คือ • กรณีข้อมูลไม่มีการจัดหมวดหมู่ ข้อมูลประชากร ข้อมูลตัวอย่าง ถ้ามีข้อมูล X 1 ,…, X N รวม N ตัว ถ้ามีข้อมูล X 1,…, X n รวม n ตัว อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 8. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 8 - ถ้าข้อมูล X1 ,…,XK มีความถี่ หรือปรากฏรวม f1,…,fK ครั้งตามลาดับ ข้อมูลประชากร ข้อมูลตัวอย่าง ถ้ามีข้อมูล X 1 ,…, X N รวม N ตัว ถ้ามีข้อมูล X 1,…, X n รวม n ตัว • กรณีข้อมูลมีการจัดหมวดหมู่ ข้อมูลประชากร ข้อมูลตัวอย่าง ถ้ามีข้อมูล X 1 ,…, X N รวม N ตัว ถ้ามีข้อมูล X 1,…, X n รวม n ตัว ถ้าข้อมูล X 1 ,…,X K มีความถี่ หรือปรากฏรวม f 1,…,f K ครั้งตามลาดับ เมื่อ K คือ จานวนชั้นของข้อมูล คือ ค่ากึ่งกลางของชั้นที่ i เมื่อ I = 1, 2, 3, … , K คือ ความถี่ของชั้นที่ i เมื่อ I = 1, 2, 3, … , K ตัวอย่าง 1. โรงงานแห่งหนึ่งมีพนักงาน 36, 45, 28 และ 41 คน ที่ได้รับค่าจ้างรายวันเฉลี่ย 162.5, 170.2, 159.5 และ 167 บาทตามลาดับ จงหาค่าจ้างรายวันเฉลี่ยโดยรวมของพนักงานทั้ง 4 กลุ่มนี้ วิธีทา ค่าจ้างรายวันเฉลี่ยโดยรวมของพนักงานทั้ง 4 กลุ่ม คานวณจากสูตร อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 9. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 9 36 x162.5  45x170.2  28x159.5  41x167 = 36  45  28  41 5850  7659  4466  6847 = 150 24822 = 150 = 165.48 ดังนั้น ค่าจ้างรายวันเฉลี่ยโดยรวมของพนักงานทั้ง 4 กลุ่มเท่ากับ 165.48 บาท คุณสมบัติของค่าเฉลี่ย 1. เป็นตัวแทนข้อมูล ที่ใช้ข้อมูลทุกค่ามาทาการคานวณหาขนาดของค่าเฉลี่ย 2. เนื่องจากมีการนาข้อมูลทุกค่ามาคานวณตามหลักคณิตศาสตร์จึงสามารถใช้ในการ วิเคราะห์สถิติขั้นสูงได้ 3. เนื่องจากมีการใช้ข้อมูลทุกค่ามาคานวณ ดังนั้นหากมีข้อมูลบางตัวทีมีขนาดใหญ่มากๆหรือเล็ก ่ มากๆ ผิดปกติจะมีผลต่อการคานวณขนาดของค่าเฉลี่ยด้วย 4. ข้อมูลที่มีมาตรวัดเป็นนามบัญญัติ (nominal scale) และเรียงอันดับ (ordinal scale) ไม่ สามารถใช้คานวณค่าเฉลี่ยได้ 1.8.2 (Median) เป็นค่าที่บอกภาพรวมของข้อมูล โดยพิจารณาจากตาแหน่งกลางของข้อมูลที่เรียก ลาดับจากน้อยไปหามากแทนด้วย Me ก. กรณีที่ข้อมูลไม่ได้แจกแจงความถี่ - ข้อมูลเป็นเลขคี่ มัธยฐาน = ค่าของข้อมูลลาดับที่(n+1)/2 - ข้อมูลเป็นเลขคู่ มัธยฐาน = [ ค่าของข้อมูลลาดับที่(n)/2 + ค่าของข้อมูลลาดับที่(n+1)/2 ] / 2 ข. กรณีที่ข้อมูลมีการแจกแจงความถี่ อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 10. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 10  N F  Me  U   2 fu  I     โดยที่ L แทนขอบเขตล่างของชั้นมัธยฐาน U แทนขอบเขตบนของชั้นมัธยฐาน I แทนความกว้างของชั้น n แทนจานวนข้อมูลทั้งหมด fL แทนความถีของชั้นที่มีค่าสังเกตต่ากว่าชั้นมัธยฐาน ่ fU แทนความถี่ของชั้นที่มีค่าสังเกตสูงกว่าชั้นมัธยฐาน fm แทนความถี่ของชั้นที่มค่ามธัยฐาน ี ตัวอย่าง 2. จากข้อมูลต่อไปนี้จงหาค่ามัธยฐาน 6.5 12.0 14.9 10.0 7.9 21.9 12.5 12.5 14.5 9.2 วิธีทา เรียงลาดับข้อมูลจากน้อยไปมาก และเนื่องจาก N = 9 ซึ่งเป็นเลขคี่ ดังนั้น ค่าของข้อมูลตัวที่ = 5 จะ เป็นค่ามัธยฐานดังนั้น ค่ามัธยฐานของข้อมูลชุดนี้เท่ากับ 12.0 ตัวอย่าง จากข้อมูลตารางแจกแจงความถี่ของคะแนนสอบวิชาสถิติเบื้องต้น จากนิสิตที่สุ่มมา 150 คน จงหา ค่าคะแนนสอบเฉลี่ยของวิชานี้ จงหาค่ากลางโดยใช้มัธยฐาน อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 11. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 11 คะแนนสอบ ความถี่ (f I) ค่ากลาง (X i) 10 - 19 1 14.5 20 - 29 6 24.5 30 - 39 9 34.5 40 - 49 31 44.5 50 - 59 42 54.5 60 - 69 32 64.5 70 - 79 17 74.5 80 - 89 10 84.5 90 - 99 2 84.5 รวม 150 วิธีทา เรียงลาดับข้อมูลจากน้อยไปมาก และเนื่องจาก N = 9 ซึ่งเป็นเลขคี่ ดังนั้น ค่าของข้อมูลตัวที่ = 5 จะ เป็นค่ามัธยฐาน ขั้นตอนที่ 3 หาตาแหน่งของมัธยฐานสาหรับข้อมูลชุดนี้ เนื่องจาก N=150 เป็นเลขคู่ Me จะอยู่ระหว่าง ตาแหน่งที่ 75 และ 76ซึ่งอยู่ในช่วงคะแนน 50 – 59 หรือจะกล่าวได้ว่า ชั้นที่มีมัธยฐานอยู่ คือ ชั้นที่ 5 (สังเกตจากความถี่สะสม) นั่นคือL5 = 49.5 N = 150 F = 47 f5 = 42 I = 10 ขั้นตอนที่ 2 แทนค่าต่าง ๆ ลงในสูตร = = 49.5 + 6.67 = 56.17 ดังนั้น ค่ามัธยฐานของคะแนนสอบวิชานี้เท่ากับ 56.17 คะแนน อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 12. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 12 คุณสมบัติของค่ามัธยฐาน 1. มัธยฐาน เป็นการใช้ค่าของข้อมูลที่อยู่ตาแหน่งตรงกลาง มาเป็นตัวแทน ดังนั้นข้อมูลที่มีค่ามาก หรือน้อยผิดปกติจะไม่มีผลกระทบต่อค่ามัธยฐาน และถ้ามีการเปลี่ยนแปลงข้อมูลบางตัวในกลุ่มจะมีผลกระทบ ต่อค่ามัธยฐานน้อยมาก 2. มัธยฐาน จะเป็นค่าตัวแทนของข้อมูลได้ใกล้เคียงกับประชากรส่วนใหญ่มากกว่าค่าเฉลี่ย หากการ แจกแจงข้อมูลเบ้ไปทางใดทางหนึ่ง 3. ข้อมูลทีมีมาตรวัดเป็นนามบัญญัติ (nominal scale) ไม่สามารถใช้คานวณหาค่า มัธยฐานได้ ่ 4. กรณีที่มีข้อมูลกระจุกอยู่ที่ค่าต่าสุด หรือสูงสุดมากเกินไปจะไม่สามารถหาค่ามัธยฐานได้ เช่น น้า หนักของผู้ป่วย 9 คน เป็น 55 55 55 55 55 60 65 70 72 ค่ามัธยฐานเป็น 55 ซึ่งไม่ได้เป็นค่าของข้อมูลที่อยู่ ครึ่งหนึ่งตามความหมายของมัธยฐาน 1.8.3 ฐานนิยม (mode) เป็นค่าที่มีความถี่สูงสุดในข้อมูลชุดหนึ่ง ฐานนิยมอาจมีค่าเดียวในชุด ข้อมูลนั้น หรืออาจมีหลายค่าได้กรณีที่มีข้อมูลที่ความถี่สูงสุดเท่ากันหลายค่ากรณีทข้อมุลมีการแจกแจงความถี่ ี่  d1  Mo  L1   I  d1  d 2   โดยที่ L แทนขอบเขตล่างของช้นั ที่มคี วามถ่สี งู สดุ I แทนความกว้างของชั้น d1 แทนผลต่างระหว่างความถี่ของชั้นที่มีความถี่สูงสุด กับชั้นติดกันที่มีข้อมูลต่ากว่า d2 แทนผลต่างระหว่างความถี่ของชั้นที่มีความถี่สูงสุด กับชั้นติดกันที่มีข้อมูลสูงกว่า ตัวอย่าง 4 จากข้อมูลในตัวอย่าง 1.7 จงหาค่ากลางโดยใช้ฐานนิยม วิธีทา คานวณค่าฐานนิยมของคะแนนสอบวิชาสถิติเบื้องต้น ดังนี้ ขั้นตอนที่ 1 หาชั้นที่มีฐานนิยมสาหรับข้อมูลชุดนี้ พบว่า ช่วงคะแนน 50 – 59 จะมีความถี่มากที่สุด หรือจะ กล่าวได้ว่า ชั้นที่มีฐานนิยมอยู่คือ ชั้นที่ 5 นั่น คือ L5 = 49.5 N d1 = 42 - 31 = 31 d2 = 42 - 32 l = 10 ขั้นตอนที่ 2 แทนค่าต่าง ๆ ลงในสูตร  d1  Mo  L1   I  d1  d 2   อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 13. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 13  11   49.5   10 11  10   = 49.5 + 5.24 = 54.74 ดังนั้น ค่าฐานนิยมของคะแนนสอบวิชานี้เท่ากับ 54.74 คะแนน คุณสมบัติของฐานนิยม 1. สามารถคานวณได้ง่าย รวดเร็ว 2. ใช้กับข้อมูลที่มีมาตรวัดนามบัญญัติ(norminal scale) 3. ข้อมูลที่มีค่ามาก หรือน้อยผิดปกติ จะไม่มีผลกระทบต่อค่าฐานนิยม และถ้ามีการ เปลี่ยนแปลงข้อมูลบางตัวในกลุ่มจะไม่มีผลกระทบต่อค่าฐานนิยม หรือมีน้อยมาก ความสัมพันธ์ระหว่าง Mean , Median และ Mode • ข้อมูลที่มีการกระจายอย่างสมมาตรค่า Mean Median และ Mode จะเท่ากันหรืออยู่ใกล้เคียงกัน • ข้อมูลที่มีการกระจายไม่เท่ากัน ค่า Mean ,Median และ Mode จะแตกต่างกัน อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)
  • 14. เอกสารประกอบการสอนรายวิชาชีวสถิติ บทที่ 1 ความรู้เบื้องต้นทางสถิติ (Introduction of Statistical) 14 แบบฝึกหัดประจาบทเรียน 1. ลักษณะของตัวอย่างที่ดีที่สามารถนามาศึกษาได้ควรเป็นอย่างไร 2. จงบอกถึงข้อดี ข้อเสีย ของค่าเฉลี่ย ฐานนิยมและมัธยฐาน 3. ทาการสุ่มตัวอย่างนักศึกษาวิชาเอกสถิติจานวน 10 คน ได้ข้อมูล ดังนี้ คนที่ อายุ %fat เพศ grade 1 23 9.5 M 3.58 2 27 27.9 M 2.52 3 29 7.8 F 2.89 4 39 17.8 M 1.86 5 41 31.4 F 3.25 6 45 25.9 F 2.66 7 50 27.4 F 2.99 8 28 25.2 M 3.41 9 20 31.1 M 1.75 10 22 34.7 M 3.00 3.1 อยากทราบว่าตัวแปร อายุ, % fat,เพศ, gradeเป็นข้อมูลประเภทใด และอยู่ใน scale ไหน 3.2 จงสร้าง histogram ของตัวแปร age ถ้ากาหนดให้ความกว้างของแต่ละชั้นเป็น 5 และ 10 ตามลาดับ 4. จงหาค่าเฉลี่ยเลขคณิต และมัธยฐานของข้อมูลต่อไปนี้ 5.1 5 4 8 3 7 2 9 5.2 18.3 20.6 19.3 22.4 20.2 18.8 16.7 20.0 5. เลขชุดหนึ่งประกอบด้วยเลข 6.2 5.1 8.7 6.2 4.1 3.3 5.4 6.2 6.7 และ 9.6 5.1 จงหา Mean Mode Median 5.2 คูณทุกตัวด้วย 10 แล้วหา Mean Mode Median 5.3 บวกทุกตัวด้วย 10 แล้วหา Mean Mode Median 6. จากการสารวจคนงานในโรงงานหนึ่ง พบว่าคนงานชายและหญิงทั้งหมด มีรายจ่ายค่าอาหารเย็นเฉลี่ยคนละ 12 บาท โดยแยกเป็นคนงานชายทั้งหมด 20 คน มีรายจ่ายค่าอาหารเย็นเฉลี่ยคนละ 15 คน ส่วนคนงานหญิงมี รายจ่ายค่าอาหารเย็นคนละ 11 บาท จงหาว่าโรงงานแห่งนี้มีคนงานหญิงกี่คน อ.สุจรรยา ทรัพย์สิริโสภา (M.Sc.Biotechnology)