Rule of Sturges คำอธิบายการใช้งานและตัวอย่าง
กฎ Sturges เป็นเกณฑ์ที่ใช้ในการกำหนดจำนวนคลาสหรือช่วงเวลาที่จำเป็นในการแสดงกราฟิกของชุดข้อมูลสถิติ กฎนี้ถูกประกาศใช้ในปี 1926 โดยนักคณิตศาสตร์ชาวเยอรมันเฮอร์เบิร์ตสเตอร์เจส.
Sturges เสนอวิธีการง่าย ๆ ตามจำนวนตัวอย่างที่อนุญาตให้ค้นหาจำนวนชั้นเรียนและแอมพลิจูดพิสัย กฎ Sturges ใช้กันอย่างแพร่หลายโดยเฉพาะในพื้นที่ของสถิติโดยเฉพาะเพื่อสร้างฮิสโตแกรมความถี่.
ดัชนี
- 1 คำอธิบาย
- 2 แอปพลิเคชัน
- 3 ตัวอย่าง
- 4 อ้างอิง
คำอธิบาย
กฎ Sturges เป็นวิธีเชิงประจักษ์ที่ใช้กันอย่างแพร่หลายในสถิติเชิงพรรณนาเพื่อกำหนดจำนวนคลาสที่ต้องมีอยู่ในฮิสโทแกรมความถี่เพื่อจำแนกชุดของข้อมูลที่แสดงตัวอย่างหรือประชากร.
โดยทั่วไปกฎนี้จะกำหนดความกว้างของคอนเทนเนอร์กราฟิกคือฮิสโตแกรมความถี่.
เพื่อสร้างกฎเฮอร์เบิร์ตสเตอร์เจสของเขาถือว่าเป็นแผนภาพความถี่ในอุดมคติซึ่งประกอบด้วยช่วง K ซึ่งช่วงเวลา ith มีตัวอย่างจำนวนหนึ่ง (i = 0, ... k - 1) ซึ่งแสดงเป็น:
จำนวนตัวอย่างนั้นถูกกำหนดโดยจำนวนวิธีที่สามารถแยกชุดย่อยของชุดได้ นั่นคือโดยสัมประสิทธิ์ทวินามแสดงดังต่อไปนี้:
เพื่อทำให้นิพจน์ง่ายขึ้นเขาใช้คุณสมบัติของลอการิทึมในทั้งสองส่วนของสมการ:
ดังนั้น Sturges ยอมรับว่าช่วงเวลาที่เหมาะสมที่สุดคือ k โดยการแสดงออก:
นอกจากนี้ยังสามารถแสดงเป็น:
ในการแสดงออกนี้:
- k คือจำนวนคลาส.
- N คือจำนวนการสังเกตทั้งหมดของตัวอย่าง.
- บันทึกเป็นลอการิทึมสามัญของฐาน 10.
ตัวอย่างเช่นในการสร้างฮิสโตแกรมความถี่ที่แสดงตัวอย่างแบบสุ่มของความสูงของเด็ก ๆ 142 คนจำนวนช่วงเวลาหรือคลาสที่การแจกแจงจะมี:
k = 1 + 3,322 * * * * เข้าสู่ระบบ10 (N)
k = 1 + 3,322* * * * บันทึก (142)
k = 1 + 3,322* * * * 2.1523
k = 8.14 ≈ 8
ดังนั้นการกระจายจะอยู่ในช่วงเวลา 8.
จำนวนช่วงเวลาควรเป็นจำนวนเต็มเสมอ ในกรณีที่ค่าเป็นทศนิยมจะต้องทำการประมาณจำนวนเต็มที่ใกล้ที่สุด.
การใช้งาน
กฎของสเตอร์จิสส่วนใหญ่ถูกนำไปใช้ในสถิติเพราะมันจะทำให้การแจกแจงความถี่ผ่านการคำนวณจำนวนชั้น (k) เช่นเดียวกับความยาวของแต่ละคนยังเป็นที่รู้จักกันในนามแอมพลิจูด.
แอมพลิจูดคือความแตกต่างระหว่างขีด จำกัด บนและล่างของคลาสหารด้วยจำนวนคลาสและแสดง:
มีกฎเชิงประจักษ์มากมายที่อนุญาตให้ทำการแจกแจงความถี่ อย่างไรก็ตามกฎ Sturges มักใช้กันทั่วไปเนื่องจากมันใกล้เคียงกับจำนวนคลาสซึ่งโดยทั่วไปมีค่าตั้งแต่ 5 ถึง 15.
ด้วยวิธีนี้ให้พิจารณาค่าที่แสดงถึงกลุ่มตัวอย่างหรือประชากรอย่างเพียงพอ นั่นคือการประมาณไม่ได้แสดงถึงการจัดกลุ่มมากและไม่ทำงานกับจำนวนของคลาสที่มากเกินไปที่ไม่อนุญาตให้สรุปตัวอย่าง.
ตัวอย่าง
มันเป็นสิ่งจำเป็นในการทำฮิสโตแกรมความถี่ตามข้อมูลที่กำหนดให้สอดคล้องกับอายุที่ได้รับจากการสำรวจของผู้ชายที่ออกกำลังกายในโรงยิมท้องถิ่น.
ในการกำหนดช่วงเวลาคุณต้องรู้ว่าขนาดของตัวอย่างหรือจำนวนการสังเกตคืออะไร ในกรณีนี้คุณมี 30.
จากนั้นใช้กฎ Sturges:
k = 1 + 3,322 * * * * เข้าสู่ระบบ10 (N)
k = 1 + 3,322* * * * บันทึก (30)
k = 1 + 3,322* * * * 1.4771
k = 5.90 ≈ 6 ช่วงเวลา.
จากช่วงเวลาจำนวนแอมพลิจูดที่สิ่งเหล่านี้จะสามารถคำนวณได้ นั่นคือความกว้างของแต่ละแท่งที่แสดงในฮิสโตแกรมความถี่:
ขีด จำกัด ล่างถือเป็นค่าต่ำสุดของข้อมูลและขีด จำกัด สูงสุดคือค่าสูงสุด ความแตกต่างระหว่างขีด จำกัด บนและล่างเรียกว่าช่วงหรือเส้นทางของตัวแปร (R).
จากตารางเรามีว่าขีด จำกัด บนคือ 46 และขีด จำกัด ล่าง 13; ด้วยวิธีดังกล่าวแอมพลิจูดของแต่ละชั้นจะเป็น:
ช่วงเวลาจะประกอบด้วยขีด จำกัด บนและล่าง ในการกำหนดช่วงเวลาเหล่านี้ให้เริ่มนับจากขีด จำกัด ล่างรวมกับแอมพลิจูดที่กำหนดโดยกฎ (6) ดังนี้:
จากนั้นจะคำนวณความถี่สัมบูรณ์เพื่อกำหนดจำนวนคนที่สอดคล้องกับแต่ละช่วงเวลา ในกรณีนี้มันคือ:
- ช่วงเวลา 1: 13 - 18 = 9
- ช่วงเวลา 2: 19 - 24 = 9
- ช่วงเวลา 3: 25 - 30 = 5
- ช่วงเวลา 4: 31 - 36 = 2
- ช่วงเวลา 5: 37 - 42 = 2
- ช่วงเวลา 6: 43 - 48 = 3
เมื่อเพิ่มความถี่สัมบูรณ์ของแต่ละชั้นสิ่งนี้จะต้องเท่ากับจำนวนตัวอย่างทั้งหมด ในกรณีนี้ 30.
ต่อจากนั้นคำนวณความถี่สัมพัทธ์ของแต่ละช่วงเวลาหารความถี่สัมบูรณ์ของช่วงเวลานี้ด้วยจำนวนการสังเกตทั้งหมด:
- ช่วงเวลา 1: fi = 9 ÷ 30 = 0.30
- ช่วงเวลา 2: fi = 9 ÷ 30 = 0.30
- ช่วงเวลา 3: fi = 5 ÷ 30 = 0.1666
- ช่วงเวลา 4: fi = 2 ÷ 30 = 0.0666
- ช่วงเวลา 5: fi = 2 ÷ 30 = 0.0666
- ช่วงเวลา 4: fi = 3 ÷ 30 = 0.10
จากนั้นคุณสามารถสร้างตารางที่สะท้อนข้อมูลและไดอะแกรมจากความถี่สัมพัทธ์ที่สัมพันธ์กับช่วงเวลาที่ได้รับดังที่เห็นในภาพต่อไปนี้:
ด้วยวิธีนี้กฎ Sturges อนุญาตให้กำหนดจำนวนคลาสหรือช่วงเวลาที่ตัวอย่างสามารถแบ่งได้เพื่อสรุปตัวอย่างข้อมูลผ่านการเตรียมตารางและกราฟ.
การอ้างอิง
- Alfonso Urquía, M. V. (2013) การสร้างแบบจำลองและการจำลองเหตุการณ์ไม่ต่อเนื่อง UNED,.
- Altman Naomi, M. K. (2015) "การถดถอยเชิงเส้นอย่างง่าย" วิธีธรรมชาติ .
- Antúnez, R. J. (2014) สถิติทางการศึกษา UNID ดิจิทัล.
- Fox, J. (1997) การวิเคราะห์การถดถอยเชิงประยุกต์ตัวแบบเชิงเส้นและวิธีการที่เกี่ยวข้อง สิ่งพิมพ์ SAGE.
- อุมแบร์โตLlinás Solano, C. R. (2005) สถิติเชิงพรรณนาและการแจกแจงความน่าจะเป็น มหาวิทยาลัยนอร์ท.
- Panteleeva, O. V. (2005) พื้นฐานความน่าจะเป็นและสถิติ.
- O. Kuehl, M. O. (2001) การออกแบบการทดลอง: หลักการทางสถิติของการออกแบบและการวิเคราะห์การวิจัย บรรณาธิการของ Thomson.