เครื่องหมายของชั้นเรียนสำหรับสิ่งที่รับใช้มันถูกนำไปใช้และตัวอย่าง
แบรนด์ระดับ, หรือที่เรียกว่าจุดกึ่งกลางคือค่าที่อยู่ในกึ่งกลางของคลาสซึ่งแสดงถึงค่าทั้งหมดที่อยู่ในประเภทนั้น โดยพื้นฐานแล้วเครื่องหมายคลาสใช้สำหรับการคำนวณพารามิเตอร์บางอย่างเช่นค่าเฉลี่ยเลขคณิตหรือค่าเบี่ยงเบนมาตรฐาน.
จากนั้นเครื่องหมายคลาสคือจุดกึ่งกลางของช่วงเวลาใดก็ได้ ค่านี้ยังมีประโยชน์อย่างมากในการค้นหาความแปรปรวนของชุดข้อมูลที่จัดกลุ่มไว้ในคลาสแล้วซึ่งจะช่วยให้เราเข้าใจว่าศูนย์เหล่านี้ค้นหาข้อมูลที่ห่างไกลจากจุดศูนย์กลางได้อย่างไร.
ดัชนี
- 1 การแจกแจงความถี่
- 1.1 มีกี่คลาสที่ต้องพิจารณา?
- 2 คุณจะได้รับอย่างไร?
- 2.1 ตัวอย่าง
- 3 มีไว้เพื่ออะไร??
- 3.1 ตัวอย่าง
- 4 อ้างอิง
การแจกแจงความถี่
เพื่อให้เข้าใจว่าแบรนด์ของคลาสคืออะไรแนวคิดของการแจกแจงความถี่จึงเป็นสิ่งจำเป็น เมื่อได้รับชุดข้อมูลการแจกแจงความถี่คือตารางที่แบ่งข้อมูลดังกล่าวเป็นหมวดหมู่จำนวนหนึ่งที่เรียกว่าคลาส.
ตารางนี้แสดงจำนวนขององค์ประกอบที่เป็นของแต่ละชั้นเรียน หลังเรียกว่าความถี่.
ในตารางนี้เป็นส่วนหนึ่งของข้อมูลที่เราได้รับจากข้อมูลที่เสียสละเพราะแทนที่จะมีค่าส่วนบุคคลของแต่ละองค์ประกอบเรารู้เพียงว่ามันเป็นของคลาสดังกล่าว.
ในทางกลับกันเราได้รับความเข้าใจที่ดีขึ้นของชุดข้อมูลเนื่องจากด้วยวิธีนี้มันง่ายที่จะชื่นชมรูปแบบที่จัดตั้งขึ้นซึ่งอำนวยความสะดวกในการจัดการข้อมูลดังกล่าว.
ต้องพิจารณากี่คลาส?
ในการสร้างการแจกแจงความถี่อันดับแรกเราต้องกำหนดจำนวนคลาสที่เราต้องการใช้และเลือกการ จำกัด คลาสของพวกเขา.
ทางเลือกของจำนวนชั้นเรียนที่ควรใช้สะดวกโดยคำนึงถึงว่ามีจำนวนชั้นเรียนขนาดเล็กที่สามารถซ่อนข้อมูลเกี่ยวกับข้อมูลที่เราต้องการศึกษาและมีขนาดใหญ่มากสามารถสร้างรายละเอียดมากเกินไปซึ่งไม่จำเป็นต้องมีประโยชน์.
ปัจจัยที่เราต้องคำนึงถึงเมื่อเลือกจำนวนคลาสที่ต้องใช้มีหลายประเภท แต่ในบรรดาสองสิ่งนี้โดดเด่น: อันดับแรกคือการคำนึงถึงจำนวนข้อมูลที่เราต้องพิจารณา ที่สองคือการรู้ว่าขนาดคือช่วงของการกระจาย (นั่นคือความแตกต่างระหว่างการสังเกตที่ใหญ่ที่สุดและเล็กที่สุด).
หลังจากกำหนดคลาสแล้วเราจะนับจำนวนข้อมูลที่มีอยู่ในแต่ละคลาสต่อไป หมายเลขนี้เรียกว่าความถี่ของคลาสและเขียนแทนด้วย fi.
ดังที่เราได้กล่าวไปแล้วก่อนหน้านี้เรามีว่าการแจกแจงความถี่จะสูญเสียข้อมูลที่มาจากข้อมูลหรือการสังเกตแต่ละอย่าง ดังนั้นจึงมีการค้นหาค่าที่แสดงถึงคลาสทั้งหมดที่เป็นของมัน ค่านี้เป็นแบรนด์ของคลาส.
คุณจะได้รับอย่างไร?
เครื่องหมายคลาสเป็นค่ากลางที่คลาสแสดงถึง มันได้มาจากการเพิ่มขีด จำกัด ของช่วงเวลาและหารค่านี้สอง สิ่งนี้เราสามารถแสดงทางคณิตศาสตร์ดังนี้:
xผม= (ขีด จำกัด ล่าง + ขีด จำกัด บน) / 2.
ในนิพจน์นี้ xผม หมายถึงเครื่องหมายของคลาส ith.
ตัวอย่าง
รับชุดข้อมูลต่อไปนี้ให้การแจกแจงความถี่ตัวแทนและรับ classmark ที่สอดคล้องกัน.
เนื่องจากข้อมูลที่มีค่าตัวเลขสูงสุดคือ 391 และน้อยที่สุดคือ 221 เราจึงมีช่วงที่ 391 -221 = 170.
เราจะเลือก 5 คลาสทั้งหมดมีขนาดเท่ากัน วิธีหนึ่งในการเลือกชั้นเรียนมีดังนี้:
โปรดทราบว่าแต่ละข้อมูลอยู่ในคลาสพวกเขาจะแยกจากกันและมีค่าเดียวกัน อีกวิธีในการเลือกชั้นเรียนคือการพิจารณาข้อมูลเป็นส่วนหนึ่งของตัวแปรต่อเนื่องซึ่งสามารถเข้าถึงมูลค่าที่แท้จริง ในกรณีนี้เราสามารถพิจารณาคลาสของแบบฟอร์ม:
205-245, 245-285, 285-325, 325-365, 365-405
อย่างไรก็ตามวิธีการจัดกลุ่มข้อมูลนี้สามารถนำเสนอความคลุมเครือบางอย่างที่มีเส้นขอบ ตัวอย่างเช่นในกรณีของ 245 คำถามที่เกิดขึ้น: มันเป็นของชั้นเรียนที่เป็นที่หนึ่งหรือที่สอง??
เพื่อหลีกเลี่ยงความสับสนเหล่านี้จึงมีการจัดทำจุดสูงสุด ด้วยวิธีนี้ชั้นแรกจะเป็นช่วงเวลา (205,245) ครั้งที่สอง (245,285) และอื่น ๆ.
เมื่อมีการกำหนดคลาสเราจะทำการคำนวณความถี่และเรามีตารางต่อไปนี้:
หลังจากได้รับการแจกแจงความถี่ของข้อมูลแล้วเราจะดำเนินการค้นหาเครื่องหมายคลาสของแต่ละช่วงเวลา ผลเราต้อง:
x1= (205+ 245) / 2 = 225
x2= (245+ 285) / 2 = 265
x3= (285 + 325) / 2 = 305
x4= (325+ 365) / 2 = 345
x5= (365+ 405) / 2 = 385
เราสามารถแสดงสิ่งนี้ได้ด้วยกราฟิคต่อไปนี้:
มีไว้เพื่ออะไร??
ดังที่ได้กล่าวไว้ก่อนหน้าคลาสมาร์กใช้งานได้ดีมากในการค้นหาค่าเฉลี่ยเลขคณิตและความแปรปรวนของกลุ่มข้อมูลที่ถูกจัดกลุ่มเป็นคลาสอื่นแล้ว.
เราสามารถกำหนดค่าเฉลี่ยเลขคณิตเป็นผลรวมของการสังเกตที่ได้ระหว่างขนาดตัวอย่าง จากมุมมองทางกายภาพการตีความของมันเปรียบเสมือนจุดสมดุลของชุดข้อมูล.
การระบุชุดข้อมูลทั้งหมดด้วยตัวเลขเดียวอาจมีความเสี่ยงดังนั้นเราจึงต้องคำนึงถึงความแตกต่างระหว่างจุดสมดุลนี้กับข้อมูลจริงด้วย ค่าเหล่านี้เรียกว่าค่าเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตและด้วยค่าเหล่านี้เราพยายามกำหนดว่าค่าเฉลี่ยเลขคณิตของข้อมูลแตกต่างกันไปเท่าใด.
วิธีที่พบมากที่สุดในการหาค่านี้ก็คือความแปรปรวนซึ่งเป็นค่าเฉลี่ยของกำลังสองของการเบี่ยงเบนจากค่าเฉลี่ยเลขคณิต.
ในการคำนวณค่าเฉลี่ยเลขคณิตและความแปรปรวนของชุดข้อมูลที่จัดกลุ่มในคลาสเราใช้สูตรต่อไปนี้ตามลำดับ:
ในนิพจน์เหล่านี้ xผม คือแบรนด์ระดับ i-th fผม แสดงความถี่ที่สอดคล้องกันและ k จำนวนคลาสที่ข้อมูลถูกจัดกลุ่ม.
ตัวอย่าง
จากการใช้ข้อมูลที่ได้จากตัวอย่างก่อนหน้านี้เราสามารถขยายข้อมูลของตารางการแจกแจงความถี่ได้อีกเล็กน้อย คุณจะได้รับต่อไปนี้:
จากนั้นเมื่อแทนที่ข้อมูลในสูตรเราได้ทิ้งไว้ว่าค่าเฉลี่ยเลขคณิตคือ:
ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานคือ:
จากนี้เราสามารถสรุปได้ว่าข้อมูลต้นฉบับมีค่าเฉลี่ยเลขคณิตเท่ากับ 306.6 และค่าเบี่ยงเบนมาตรฐานเท่ากับ 39.56.
การอ้างอิง
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. สถิติเชิงพรรณนา บรรณาธิการ Esic.
- Jhonson Richard A.Miller และ Freund ความน่าจะเป็นและรัฐบุรุษสำหรับวิศวกรการศึกษาของ Pearson.
- Miller I & Freund J. ความน่าจะเป็นและรัฐบุรุษสำหรับวิศวกร Reverte.
- Sarabia A. Jose Maria, Pascual Marta หลักสูตรขั้นพื้นฐานของสถิติสำหรับ บริษัท
- Llinás S. Humberto, Rojas A. Carlos สถิติเชิงพรรณนาและการแจกแจงความน่าจะเป็นบรรณาธิการสากล