שיעור 12- טווח שכיח חציון
נושא השיעור-טווח שכיח וחציון
המושגים שכיח וחציון הם מדדים סטטיסטיים המתארים את מרכזיות הנתונים בהתפלגות. הם מספקים מידע שונה מהממוצע וחשובים במיוחד כאשר יש לנו נתונים עם ערכים קיצוניים או התפלגות לא סימטרית.
שכיח :
-
השכיח הוא הערך שמופיע הכי הרבה פעמים בקבוצת נתונים.
-
ייתכנו מקרים שבהם יש יותר משכיח אחד (התפלגות רב-שכיחית) או אף לא שכיח כלל (אם כל הערכים מופיעים פעם אחת בלבד).
-
השכיח שימושי במיוחד עבור נתונים קטגוריים (למשל, צבעים, סוגי מוצרים) וגם עבור נתונים כמותיים.
חציון :
-
החציון הוא הערך האמצעי בקבוצת נתונים מסודרת.
-
הוא מחלק את הנתונים לשני חצאים שווים: חצי מהנתונים קטנים ממנו, וחצי מהנתונים גדולים ממנו.
-
כאשר יש מספר זוגי של נתונים, החציון הוא הממוצע של שני הערכים האמצעיים.
-
החציון שימושי במיוחד כאשר יש לנו נתונים עם ערכים קיצוניים (outliers), מכיוון שהוא פחות מושפע מהם מאשר הממוצע.
ההבדל בין שכיח לחציון:
-
השכיח מתייחס לתדירות ההופעה של ערך מסוים, בעוד החציון מתייחס למיקום הערך האמצעי בסדרת נתונים.
-
השכיח יכול להתאים גם לנתונים שאינם מספריים (קטגוריים), בעוד החציון מתאים רק לנתונים מספריים שניתן לסדר אותם.
טווח :
הטווח הוא ההפרש בין הערך הגבוה ביותר לערך הנמוך ביותר בקבוצת נתונים. הוא מדד לפיזור הנתונים.
-
אם יש לנו קבוצת נתונים עם טווח גדול, זה אומר שהנתונים מפוזרים מאוד, וייתכן שהשכיח והחציון לא מייצגים בצורה טובה את מרכז ההתפלגות.
-
אם יש לנו קבוצת נתונים עם טווח קטן, זה אומר שהנתונים מרוכזים סביב המרכז, והשכיח והחציון יכולים לתת תמונה טובה של המרכז.
דוגמה:
נניח שיש לנו את קבוצת הציונים הבאה: 60, 70, 70, 80, 90, 100
-
שכיח: 70 (מופיע פעמיים)
-
חציון: (70 + 80) / 2 = 75
-
טווח: 100 – 60 = 40