Rule of Sturges คำอธิบายการใช้งานและตัวอย่าง



กฎ Sturges เป็นเกณฑ์ที่ใช้ในการกำหนดจำนวนคลาสหรือช่วงเวลาที่จำเป็นในการแสดงกราฟิกของชุดข้อมูลสถิติ กฎนี้ถูกประกาศใช้ในปี 1926 โดยนักคณิตศาสตร์ชาวเยอรมันเฮอร์เบิร์ตสเตอร์เจส.

Sturges เสนอวิธีการง่าย ๆ ตามจำนวนตัวอย่างที่อนุญาตให้ค้นหาจำนวนชั้นเรียนและแอมพลิจูดพิสัย กฎ Sturges ใช้กันอย่างแพร่หลายโดยเฉพาะในพื้นที่ของสถิติโดยเฉพาะเพื่อสร้างฮิสโตแกรมความถี่.

ดัชนี

  • 1 คำอธิบาย
  • 2 แอปพลิเคชัน
  • 3 ตัวอย่าง
  • 4 อ้างอิง

คำอธิบาย

กฎ Sturges เป็นวิธีเชิงประจักษ์ที่ใช้กันอย่างแพร่หลายในสถิติเชิงพรรณนาเพื่อกำหนดจำนวนคลาสที่ต้องมีอยู่ในฮิสโทแกรมความถี่เพื่อจำแนกชุดของข้อมูลที่แสดงตัวอย่างหรือประชากร.

โดยทั่วไปกฎนี้จะกำหนดความกว้างของคอนเทนเนอร์กราฟิกคือฮิสโตแกรมความถี่.

เพื่อสร้างกฎเฮอร์เบิร์ตสเตอร์เจสของเขาถือว่าเป็นแผนภาพความถี่ในอุดมคติซึ่งประกอบด้วยช่วง K ซึ่งช่วงเวลา ith มีตัวอย่างจำนวนหนึ่ง (i = 0, ... k - 1) ซึ่งแสดงเป็น:

จำนวนตัวอย่างนั้นถูกกำหนดโดยจำนวนวิธีที่สามารถแยกชุดย่อยของชุดได้ นั่นคือโดยสัมประสิทธิ์ทวินามแสดงดังต่อไปนี้:

เพื่อทำให้นิพจน์ง่ายขึ้นเขาใช้คุณสมบัติของลอการิทึมในทั้งสองส่วนของสมการ:

ดังนั้น Sturges ยอมรับว่าช่วงเวลาที่เหมาะสมที่สุดคือ k โดยการแสดงออก:

นอกจากนี้ยังสามารถแสดงเป็น:

ในการแสดงออกนี้:

- k คือจำนวนคลาส.

- N คือจำนวนการสังเกตทั้งหมดของตัวอย่าง.

- บันทึกเป็นลอการิทึมสามัญของฐาน 10.

ตัวอย่างเช่นในการสร้างฮิสโตแกรมความถี่ที่แสดงตัวอย่างแบบสุ่มของความสูงของเด็ก ๆ 142 คนจำนวนช่วงเวลาหรือคลาสที่การแจกแจงจะมี:

k = 1 + 3,322 * * * * เข้าสู่ระบบ10 (N)

k = 1 + 3,322* * * * บันทึก (142)

k = 1 + 3,322* * * * 2.1523

k = 8.14 ≈ 8

ดังนั้นการกระจายจะอยู่ในช่วงเวลา 8.

จำนวนช่วงเวลาควรเป็นจำนวนเต็มเสมอ ในกรณีที่ค่าเป็นทศนิยมจะต้องทำการประมาณจำนวนเต็มที่ใกล้ที่สุด.

การใช้งาน

กฎของสเตอร์จิสส่วนใหญ่ถูกนำไปใช้ในสถิติเพราะมันจะทำให้การแจกแจงความถี่ผ่านการคำนวณจำนวนชั้น (k) เช่นเดียวกับความยาวของแต่ละคนยังเป็นที่รู้จักกันในนามแอมพลิจูด.

แอมพลิจูดคือความแตกต่างระหว่างขีด จำกัด บนและล่างของคลาสหารด้วยจำนวนคลาสและแสดง:

มีกฎเชิงประจักษ์มากมายที่อนุญาตให้ทำการแจกแจงความถี่ อย่างไรก็ตามกฎ Sturges มักใช้กันทั่วไปเนื่องจากมันใกล้เคียงกับจำนวนคลาสซึ่งโดยทั่วไปมีค่าตั้งแต่ 5 ถึง 15.

ด้วยวิธีนี้ให้พิจารณาค่าที่แสดงถึงกลุ่มตัวอย่างหรือประชากรอย่างเพียงพอ นั่นคือการประมาณไม่ได้แสดงถึงการจัดกลุ่มมากและไม่ทำงานกับจำนวนของคลาสที่มากเกินไปที่ไม่อนุญาตให้สรุปตัวอย่าง.

ตัวอย่าง

มันเป็นสิ่งจำเป็นในการทำฮิสโตแกรมความถี่ตามข้อมูลที่กำหนดให้สอดคล้องกับอายุที่ได้รับจากการสำรวจของผู้ชายที่ออกกำลังกายในโรงยิมท้องถิ่น.

ในการกำหนดช่วงเวลาคุณต้องรู้ว่าขนาดของตัวอย่างหรือจำนวนการสังเกตคืออะไร ในกรณีนี้คุณมี 30.

จากนั้นใช้กฎ Sturges:

k = 1 + 3,322 * * * * เข้าสู่ระบบ10 (N)

k = 1 + 3,322* * * * บันทึก (30)

k = 1 + 3,322* * * * 1.4771

k = 5.90 ≈ 6 ช่วงเวลา.

จากช่วงเวลาจำนวนแอมพลิจูดที่สิ่งเหล่านี้จะสามารถคำนวณได้ นั่นคือความกว้างของแต่ละแท่งที่แสดงในฮิสโตแกรมความถี่:

ขีด จำกัด ล่างถือเป็นค่าต่ำสุดของข้อมูลและขีด จำกัด สูงสุดคือค่าสูงสุด ความแตกต่างระหว่างขีด จำกัด บนและล่างเรียกว่าช่วงหรือเส้นทางของตัวแปร (R).

จากตารางเรามีว่าขีด จำกัด บนคือ 46 และขีด จำกัด ล่าง 13; ด้วยวิธีดังกล่าวแอมพลิจูดของแต่ละชั้นจะเป็น:

ช่วงเวลาจะประกอบด้วยขีด จำกัด บนและล่าง ในการกำหนดช่วงเวลาเหล่านี้ให้เริ่มนับจากขีด จำกัด ล่างรวมกับแอมพลิจูดที่กำหนดโดยกฎ (6) ดังนี้:

จากนั้นจะคำนวณความถี่สัมบูรณ์เพื่อกำหนดจำนวนคนที่สอดคล้องกับแต่ละช่วงเวลา ในกรณีนี้มันคือ:

- ช่วงเวลา 1: 13 - 18 = 9

- ช่วงเวลา 2: 19 - 24 = 9

- ช่วงเวลา 3: 25 - 30 = 5

- ช่วงเวลา 4: 31 - 36 = 2

- ช่วงเวลา 5: 37 - 42 = 2

- ช่วงเวลา 6: 43 - 48 = 3

เมื่อเพิ่มความถี่สัมบูรณ์ของแต่ละชั้นสิ่งนี้จะต้องเท่ากับจำนวนตัวอย่างทั้งหมด ในกรณีนี้ 30.

ต่อจากนั้นคำนวณความถี่สัมพัทธ์ของแต่ละช่วงเวลาหารความถี่สัมบูรณ์ของช่วงเวลานี้ด้วยจำนวนการสังเกตทั้งหมด:

- ช่วงเวลา 1: fi = 9 ÷ 30 = 0.30

- ช่วงเวลา 2: fi = 9 ÷ 30 = 0.30

- ช่วงเวลา 3: fi = 5 ÷ 30 = 0.1666

- ช่วงเวลา 4: fi = 2 ÷ 30 = 0.0666

- ช่วงเวลา 5: fi = 2 ÷ 30 = 0.0666

- ช่วงเวลา 4: fi = 3 ÷ 30 = 0.10

จากนั้นคุณสามารถสร้างตารางที่สะท้อนข้อมูลและไดอะแกรมจากความถี่สัมพัทธ์ที่สัมพันธ์กับช่วงเวลาที่ได้รับดังที่เห็นในภาพต่อไปนี้:

ด้วยวิธีนี้กฎ Sturges อนุญาตให้กำหนดจำนวนคลาสหรือช่วงเวลาที่ตัวอย่างสามารถแบ่งได้เพื่อสรุปตัวอย่างข้อมูลผ่านการเตรียมตารางและกราฟ.

การอ้างอิง

  1. Alfonso Urquía, M. V. (2013) การสร้างแบบจำลองและการจำลองเหตุการณ์ไม่ต่อเนื่อง UNED,.
  2. Altman Naomi, M. K. (2015) "การถดถอยเชิงเส้นอย่างง่าย" วิธีธรรมชาติ .
  3. Antúnez, R. J. (2014) สถิติทางการศึกษา UNID ดิจิทัล.
  4. Fox, J. (1997) การวิเคราะห์การถดถอยเชิงประยุกต์ตัวแบบเชิงเส้นและวิธีการที่เกี่ยวข้อง สิ่งพิมพ์ SAGE.
  5. อุมแบร์โตLlinás Solano, C. R. (2005) สถิติเชิงพรรณนาและการแจกแจงความน่าจะเป็น มหาวิทยาลัยนอร์ท.
  6. Panteleeva, O. V. (2005) พื้นฐานความน่าจะเป็นและสถิติ.
  7. O. Kuehl, M. O. (2001) การออกแบบการทดลอง: หลักการทางสถิติของการออกแบบและการวิเคราะห์การวิจัย บรรณาธิการของ Thomson.