เครื่องหมายของชั้นเรียนสำหรับสิ่งที่รับใช้มันถูกนำไปใช้และตัวอย่าง



แบรนด์ระดับ, หรือที่เรียกว่าจุดกึ่งกลางคือค่าที่อยู่ในกึ่งกลางของคลาสซึ่งแสดงถึงค่าทั้งหมดที่อยู่ในประเภทนั้น โดยพื้นฐานแล้วเครื่องหมายคลาสใช้สำหรับการคำนวณพารามิเตอร์บางอย่างเช่นค่าเฉลี่ยเลขคณิตหรือค่าเบี่ยงเบนมาตรฐาน.

จากนั้นเครื่องหมายคลาสคือจุดกึ่งกลางของช่วงเวลาใดก็ได้ ค่านี้ยังมีประโยชน์อย่างมากในการค้นหาความแปรปรวนของชุดข้อมูลที่จัดกลุ่มไว้ในคลาสแล้วซึ่งจะช่วยให้เราเข้าใจว่าศูนย์เหล่านี้ค้นหาข้อมูลที่ห่างไกลจากจุดศูนย์กลางได้อย่างไร.

ดัชนี

  • 1 การแจกแจงความถี่
    • 1.1 มีกี่คลาสที่ต้องพิจารณา?
  • 2 คุณจะได้รับอย่างไร?
    • 2.1 ตัวอย่าง
  • 3 มีไว้เพื่ออะไร??
    • 3.1 ตัวอย่าง
  • 4 อ้างอิง

การแจกแจงความถี่

เพื่อให้เข้าใจว่าแบรนด์ของคลาสคืออะไรแนวคิดของการแจกแจงความถี่จึงเป็นสิ่งจำเป็น เมื่อได้รับชุดข้อมูลการแจกแจงความถี่คือตารางที่แบ่งข้อมูลดังกล่าวเป็นหมวดหมู่จำนวนหนึ่งที่เรียกว่าคลาส.

ตารางนี้แสดงจำนวนขององค์ประกอบที่เป็นของแต่ละชั้นเรียน หลังเรียกว่าความถี่.

ในตารางนี้เป็นส่วนหนึ่งของข้อมูลที่เราได้รับจากข้อมูลที่เสียสละเพราะแทนที่จะมีค่าส่วนบุคคลของแต่ละองค์ประกอบเรารู้เพียงว่ามันเป็นของคลาสดังกล่าว.

ในทางกลับกันเราได้รับความเข้าใจที่ดีขึ้นของชุดข้อมูลเนื่องจากด้วยวิธีนี้มันง่ายที่จะชื่นชมรูปแบบที่จัดตั้งขึ้นซึ่งอำนวยความสะดวกในการจัดการข้อมูลดังกล่าว.

ต้องพิจารณากี่คลาส?

ในการสร้างการแจกแจงความถี่อันดับแรกเราต้องกำหนดจำนวนคลาสที่เราต้องการใช้และเลือกการ จำกัด คลาสของพวกเขา.

ทางเลือกของจำนวนชั้นเรียนที่ควรใช้สะดวกโดยคำนึงถึงว่ามีจำนวนชั้นเรียนขนาดเล็กที่สามารถซ่อนข้อมูลเกี่ยวกับข้อมูลที่เราต้องการศึกษาและมีขนาดใหญ่มากสามารถสร้างรายละเอียดมากเกินไปซึ่งไม่จำเป็นต้องมีประโยชน์.

ปัจจัยที่เราต้องคำนึงถึงเมื่อเลือกจำนวนคลาสที่ต้องใช้มีหลายประเภท แต่ในบรรดาสองสิ่งนี้โดดเด่น: อันดับแรกคือการคำนึงถึงจำนวนข้อมูลที่เราต้องพิจารณา ที่สองคือการรู้ว่าขนาดคือช่วงของการกระจาย (นั่นคือความแตกต่างระหว่างการสังเกตที่ใหญ่ที่สุดและเล็กที่สุด).

หลังจากกำหนดคลาสแล้วเราจะนับจำนวนข้อมูลที่มีอยู่ในแต่ละคลาสต่อไป หมายเลขนี้เรียกว่าความถี่ของคลาสและเขียนแทนด้วย fi.

ดังที่เราได้กล่าวไปแล้วก่อนหน้านี้เรามีว่าการแจกแจงความถี่จะสูญเสียข้อมูลที่มาจากข้อมูลหรือการสังเกตแต่ละอย่าง ดังนั้นจึงมีการค้นหาค่าที่แสดงถึงคลาสทั้งหมดที่เป็นของมัน ค่านี้เป็นแบรนด์ของคลาส.

คุณจะได้รับอย่างไร?

เครื่องหมายคลาสเป็นค่ากลางที่คลาสแสดงถึง มันได้มาจากการเพิ่มขีด จำกัด ของช่วงเวลาและหารค่านี้สอง สิ่งนี้เราสามารถแสดงทางคณิตศาสตร์ดังนี้:

xผม= (ขีด จำกัด ล่าง + ขีด จำกัด บน) / 2.

ในนิพจน์นี้ xผม หมายถึงเครื่องหมายของคลาส ith.

ตัวอย่าง

รับชุดข้อมูลต่อไปนี้ให้การแจกแจงความถี่ตัวแทนและรับ classmark ที่สอดคล้องกัน.

เนื่องจากข้อมูลที่มีค่าตัวเลขสูงสุดคือ 391 และน้อยที่สุดคือ 221 เราจึงมีช่วงที่ 391 -221 = 170.

เราจะเลือก 5 คลาสทั้งหมดมีขนาดเท่ากัน วิธีหนึ่งในการเลือกชั้นเรียนมีดังนี้:

โปรดทราบว่าแต่ละข้อมูลอยู่ในคลาสพวกเขาจะแยกจากกันและมีค่าเดียวกัน อีกวิธีในการเลือกชั้นเรียนคือการพิจารณาข้อมูลเป็นส่วนหนึ่งของตัวแปรต่อเนื่องซึ่งสามารถเข้าถึงมูลค่าที่แท้จริง ในกรณีนี้เราสามารถพิจารณาคลาสของแบบฟอร์ม:

205-245, 245-285, 285-325, 325-365, 365-405

อย่างไรก็ตามวิธีการจัดกลุ่มข้อมูลนี้สามารถนำเสนอความคลุมเครือบางอย่างที่มีเส้นขอบ ตัวอย่างเช่นในกรณีของ 245 คำถามที่เกิดขึ้น: มันเป็นของชั้นเรียนที่เป็นที่หนึ่งหรือที่สอง??

เพื่อหลีกเลี่ยงความสับสนเหล่านี้จึงมีการจัดทำจุดสูงสุด ด้วยวิธีนี้ชั้นแรกจะเป็นช่วงเวลา (205,245) ครั้งที่สอง (245,285) และอื่น ๆ.

เมื่อมีการกำหนดคลาสเราจะทำการคำนวณความถี่และเรามีตารางต่อไปนี้:

หลังจากได้รับการแจกแจงความถี่ของข้อมูลแล้วเราจะดำเนินการค้นหาเครื่องหมายคลาสของแต่ละช่วงเวลา ผลเราต้อง:

x1= (205+ 245) / 2 = 225

x2= (245+ 285) / 2 = 265          

x3= (285 + 325) / 2 = 305

x4= (325+ 365) / 2 = 345

x5= (365+ 405) / 2 = 385

เราสามารถแสดงสิ่งนี้ได้ด้วยกราฟิคต่อไปนี้:

มีไว้เพื่ออะไร??

ดังที่ได้กล่าวไว้ก่อนหน้าคลาสมาร์กใช้งานได้ดีมากในการค้นหาค่าเฉลี่ยเลขคณิตและความแปรปรวนของกลุ่มข้อมูลที่ถูกจัดกลุ่มเป็นคลาสอื่นแล้ว.

เราสามารถกำหนดค่าเฉลี่ยเลขคณิตเป็นผลรวมของการสังเกตที่ได้ระหว่างขนาดตัวอย่าง จากมุมมองทางกายภาพการตีความของมันเปรียบเสมือนจุดสมดุลของชุดข้อมูล.

การระบุชุดข้อมูลทั้งหมดด้วยตัวเลขเดียวอาจมีความเสี่ยงดังนั้นเราจึงต้องคำนึงถึงความแตกต่างระหว่างจุดสมดุลนี้กับข้อมูลจริงด้วย ค่าเหล่านี้เรียกว่าค่าเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตและด้วยค่าเหล่านี้เราพยายามกำหนดว่าค่าเฉลี่ยเลขคณิตของข้อมูลแตกต่างกันไปเท่าใด.

วิธีที่พบมากที่สุดในการหาค่านี้ก็คือความแปรปรวนซึ่งเป็นค่าเฉลี่ยของกำลังสองของการเบี่ยงเบนจากค่าเฉลี่ยเลขคณิต.

ในการคำนวณค่าเฉลี่ยเลขคณิตและความแปรปรวนของชุดข้อมูลที่จัดกลุ่มในคลาสเราใช้สูตรต่อไปนี้ตามลำดับ:

ในนิพจน์เหล่านี้ xผม  คือแบรนด์ระดับ i-th fผม แสดงความถี่ที่สอดคล้องกันและ k จำนวนคลาสที่ข้อมูลถูกจัดกลุ่ม.

ตัวอย่าง

จากการใช้ข้อมูลที่ได้จากตัวอย่างก่อนหน้านี้เราสามารถขยายข้อมูลของตารางการแจกแจงความถี่ได้อีกเล็กน้อย คุณจะได้รับต่อไปนี้:

จากนั้นเมื่อแทนที่ข้อมูลในสูตรเราได้ทิ้งไว้ว่าค่าเฉลี่ยเลขคณิตคือ:

ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานคือ:

จากนี้เราสามารถสรุปได้ว่าข้อมูลต้นฉบับมีค่าเฉลี่ยเลขคณิตเท่ากับ 306.6 และค่าเบี่ยงเบนมาตรฐานเท่ากับ 39.56.

การอ้างอิง

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. สถิติเชิงพรรณนา บรรณาธิการ Esic.
  2. Jhonson Richard A.Miller และ Freund ความน่าจะเป็นและรัฐบุรุษสำหรับวิศวกรการศึกษาของ Pearson.
  3. Miller I & Freund J. ความน่าจะเป็นและรัฐบุรุษสำหรับวิศวกร Reverte.
  4. Sarabia A. Jose Maria, Pascual Marta หลักสูตรขั้นพื้นฐานของสถิติสำหรับ บริษัท
  5. Llinás S. Humberto, Rojas A. Carlos สถิติเชิงพรรณนาและการแจกแจงความน่าจะเป็นบรรณาธิการสากล