การวัดแนวโน้มกลางสำหรับข้อมูลที่จัดกลุ่ม



การวัดแนวโน้มกลางของข้อมูลที่จัดกลุ่ม พวกเขาใช้ในสถิติเพื่ออธิบายพฤติกรรมบางอย่างของกลุ่มข้อมูลที่ให้เช่นสิ่งที่พวกเขาอยู่ใกล้กับสิ่งที่เป็นค่าเฉลี่ยของข้อมูลที่เก็บรวบรวมในหมู่คนอื่น ๆ.

เมื่อมีการใช้ข้อมูลจำนวนมากจะมีประโยชน์ในการจัดกลุ่มให้มีลำดับที่ดีขึ้นและสามารถคำนวณมาตรการบางอย่างของแนวโน้มกลางได้.

ในการวัดแนวโน้มกลางที่ใช้มากที่สุดคือค่าเฉลี่ยเลขคณิต, ค่ามัธยฐานและโหมด ตัวเลขเหล่านี้บอกคุณสมบัติบางอย่างเกี่ยวกับข้อมูลที่รวบรวมในการทดสอบบางอย่าง.

ในการใช้มาตรการเหล่านี้จำเป็นต้องรู้ก่อนว่าจะจัดกลุ่มชุดข้อมูลอย่างไร.

จัดกลุ่มข้อมูล

ในการจัดกลุ่มข้อมูลก่อนอื่นคุณต้องคำนวณช่วงของข้อมูลซึ่งได้มาจากการลบค่าสูงสุดลบด้วยค่าต่ำสุดของข้อมูล.

จากนั้นเลือกตัวเลข "k" ซึ่งเป็นจำนวนชั้นเรียนที่คุณต้องการจัดกลุ่มข้อมูล.

เราดำเนินการแบ่งช่วงระหว่าง "k" เพื่อให้ได้แอมพลิจูดของคลาสที่จะจัดกลุ่ม ตัวเลขนี้คือ C = R / k.

ในที่สุดการจัดกลุ่มจะเริ่มขึ้นโดยเลือกจำนวนที่น้อยกว่าค่าที่น้อยที่สุดของข้อมูลที่ได้รับ.

หมายเลขนี้จะเป็นขีด จำกัด ล่างของชั้นหนึ่ง สำหรับสิ่งนี้จะถูกเพิ่ม C ค่าที่ได้รับจะเป็นขีด จำกัด สูงสุดของชั้นหนึ่ง.

จากนั้น C จะถูกเพิ่มเข้าไปในค่านี้และได้รับขีด จำกัด สูงสุดของคลาสที่สอง ด้วยวิธีนี้คุณจะดำเนินการต่อไปจนกว่าคุณจะได้รับขีด จำกัด สูงสุดของชั้นเรียนสุดท้าย.

หลังจากจัดกลุ่มข้อมูลแล้วคุณสามารถคำนวณค่าเฉลี่ยมัธยฐานและค่าแฟชั่นได้.

เพื่อแสดงให้เห็นว่าค่าเฉลี่ยเลขคณิตค่ามัธยฐานและโหมดคำนวณอย่างไรเราจะดำเนินการกับตัวอย่างต่อไป.

ตัวอย่าง

ดังนั้นเมื่อทำการจัดกลุ่มข้อมูลคุณจะได้รับตารางดังนี้:

3 มาตรการแนวโน้มหลักที่สำคัญ

ตอนนี้เราจะทำการคำนวณค่าเฉลี่ยเลขคณิต, ค่ามัธยฐานและโหมด ตัวอย่างข้างต้นจะถูกใช้เพื่อแสดงขั้นตอนนี้.

1- ค่าเฉลี่ยเลขคณิต

ค่าเฉลี่ยเลขคณิตประกอบด้วยการคูณแต่ละความถี่ด้วยค่าเฉลี่ยของช่วงเวลา จากนั้นผลลัพธ์ทั้งหมดเหล่านี้จะถูกเพิ่มและสุดท้ายถูกหารด้วยข้อมูลทั้งหมด.

โดยใช้ตัวอย่างก่อนหน้านี้เราจะได้รับว่าค่าเฉลี่ยเลขคณิตเท่ากับ:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 +16 + 36 + 32) / 18 = 5,11111

สิ่งนี้บ่งชี้ว่าค่าเฉลี่ยของข้อมูลในตารางคือ 5.11111.

2- ปานกลาง

ในการคำนวณค่ามัธยฐานของชุดข้อมูลอันดับแรกข้อมูลทั้งหมดจะถูกเรียงลำดับจากน้อยไปหามากที่สุด สามารถนำเสนอสองกรณี:

- หากหมายเลขข้อมูลเป็นเลขคี่ค่ามัธยฐานคือข้อมูลที่อยู่ตรงกลาง.

- ถ้าหมายเลขข้อมูลเป็นเลขคู่ค่ามัธยฐานคือค่าเฉลี่ยของข้อมูลสองค่าที่เหลืออยู่ในศูนย์.

เมื่อพูดถึงข้อมูลที่จัดกลุ่มการคำนวณค่ามัธยฐานจะกระทำด้วยวิธีดังต่อไปนี้:

- คำนวณ N / 2 โดยที่ N คือข้อมูลทั้งหมด.

- ช่วงเวลาแรกถูกค้นหาโดยเลือกความถี่สะสม (ผลรวมของความถี่) มากกว่า N / 2 และเลือกขีด จำกัด ล่างของช่วงเวลานี้เรียกว่า Li.

ค่ามัธยฐานจะได้รับจากสูตรต่อไปนี้:

Me = Li + (Ls-Li) * (N / 2 - ความถี่สะสมก่อน Li) / ความถี่ของ [Li, Ls)

Ls เป็นขีด จำกัด สูงสุดของช่วงที่กล่าวถึงข้างต้น.

หากใช้ตารางข้อมูลข้างต้นเรามี N / 2 = 18/2 = 9. ความถี่ที่สะสมคือ 4, 8, 14 และ 18 (หนึ่งสำหรับแต่ละแถวของตาราง).

ดังนั้นควรเลือกช่วงเวลาที่สามเนื่องจากความถี่สะสมมากกว่า N / 2 = 9.

ดังนั้น Li = 5 และ Ls = 7 การใช้สูตรที่อธิบายข้างต้นคุณต้อง:

ฉัน = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3- แฟชั่น

แฟชั่นเป็นค่าที่มีความถี่มากที่สุดในบรรดาข้อมูลที่จัดกลุ่มทั้งหมด นั่นคือมันเป็นค่าที่ทำซ้ำเกือบทุกครั้งในชุดข้อมูลเริ่มต้น.

เมื่อคุณมีข้อมูลจำนวนมากสูตรต่อไปนี้จะใช้ในการคำนวณโหมดของข้อมูลที่จัดกลุ่ม:

Mo = Li + (Ls-Li) * (ความถี่ Li - ความถี่ L (i-1)) / ((ความถี่ Li-Frequency ของ L (i-1)) + (ความถี่ Li-Frequency ของ L ( ฉัน + 1)))

ช่วงเวลา [Li, Ls) คือช่วงเวลาที่พบความถี่สูงสุด สำหรับตัวอย่างที่ทำในบทความนี้เรามีแฟชั่นที่ได้รับจาก:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

สูตรอื่นที่ใช้เพื่อให้ได้ค่าโดยประมาณสำหรับแฟชั่นมีดังต่อไปนี้:

Mo = Li + (Ls-Li) * (ความถี่ L (i + 1)) / (ความถี่ L (i-1) + ความถี่ L (i + 1)).

ด้วยสูตรนี้บัญชีมีดังนี้:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

การอ้างอิง

  1. Bellhouse, D. R. (2011). Abraham De Moivre: การจัดฉากสำหรับความน่าจะเป็นแบบคลาสสิกและการประยุกต์ใช้. กด CRC.
  2. Cifuentes, J. F. (2002). ทฤษฎีความน่าจะเป็นเบื้องต้นเบื้องต้น. มหาวิทยาลัยแห่งชาติโคลัมเบีย.
  3. Daston, L. (1995). ความน่าจะเป็นแบบคลาสสิกในการตรัสรู้. สำนักพิมพ์มหาวิทยาลัยพรินซ์ตัน.
  4. Larson, H. J. (1978). ทฤษฎีความน่าจะเป็นเบื้องต้นและการอนุมานเชิงสถิติ. บรรณาธิการ Limusa.
  5. Martel, P. J. , & Vegas, F. J. (1996). ความน่าจะเป็นและสถิติทางคณิตศาสตร์: การประยุกต์ใช้ในการปฏิบัติการทางคลินิกและการจัดการสุขภาพ. Ediciones Díaz de Santos.
  6. Vázquez, A. L. , & Ortiz, F. J. (2005). วิธีการทางสถิติในการวัดอธิบายและควบคุมความแปรปรวน. เอ็ด. มหาวิทยาลัยกันตาเบรีย.
  7. Vázquez, S. G. (2009). คู่มือคณิตศาสตร์สำหรับการเข้าถึงมหาวิทยาลัย. กองบรรณาธิการของการศึกษา Ramon Areces SA.