תוֹכֶן
מחליף הוא ערך בערכת נתונים שהוא רחוק מהערכים האחרים. מחיקים יכולים להיגרם כתוצאה משגיאות ניסוי או מדידה, או על ידי אוכלוסייה בעלת זנב ארוך. במקרים הקודמים, יכול להיות רצוי לזהות מחיצים ולהוציא אותם מהנתונים לפני ביצוע ניתוח סטטיסטי, מכיוון שהם יכולים לזרוק את התוצאות כך שלא ייצגו במדויק את אוכלוסיית המדגם. הדרך הפשוטה ביותר לזהות מחיצים היא בשיטת הרבעון.
מיין את הנתונים בסדר עולה. לדוגמה קח את מערך הנתונים {4, 5, 2, 3, 15, 3, 3, 5}. ממוין, קבוצת הנתונים לדוגמה היא {2, 3, 3, 3, 4, 5, 5, 15}.
מצא את החציון. זה המספר בו מחצית נקודות הנתונים גדולות יותר ומחציתן קטנות יותר. אם יש מספר שווה של נקודות נתונים, ממוצעים השניים האמצעיים. עבור קבוצת הנתונים לדוגמה, נקודות האמצע הן 3 ו -4, כך החציון הוא (3 + 4) / 2 = 3.5.
מצא את הרבעון העליון, Q2; זו נקודת הנתונים בה 25 אחוז מהנתונים גדולים יותר. אם מערך הנתונים הוא שוויוני, הממוצע של 2 הנקודות סביב הרבעון. עבור קבוצת הנתונים לדוגמה, זהו (5 + 5) / 2 = 5.
מצא את הרבעון התחתון, Q1; זו נקודת הנתונים בה 25 אחוז מהנתונים קטנים יותר. אם מערך הנתונים הוא שוויוני, הממוצע של 2 הנקודות סביב הרבעון. עבור הנתונים לדוגמה, (3 + 3) / 2 = 3.
מחסרים את הרבעון התחתון מהרביעון הגבוה כדי לקבל את טווח הבין-רבעון, IQ. עבור קבוצת הנתונים לדוגמה, Q2 - Q1 = 5 - 3 = 2.
כפל את הטווח הבין רבעוני ב -1.5. הוסף זה לרביעון העליון וחסר אותו מהרביעון התחתון. כל נקודת נתונים שנמצאת מחוץ לערכים אלה היא מתמר מתון. עבור קבוצת הדוגמאות, 1.5 על 2 = 3; לפיכך 3 - 3 = 0 ו- 5 + 3 = 8. אז כל ערך הנמוך מ -0 ומעלה מ -8 יהיה מתווך עדין. המשמעות היא ש -15 מצביעים על מתן חילוץ קל.
הכפל את טווח הרבעון ב -3. הוסף את זה לרביעון העליון וחסר אותו מהרבעון התחתון. כל נקודת נתונים שנמצאת מחוץ לערכים אלה היא ממציא קיצוני. עבור קבוצת הדוגמאות, 3 x 2 = 6; לפיכך 3 - 6 = –3 ו- 5 + 6 = 11. כך שכל ערך הנמוך מ- –3 או יותר מ –11 יהיה מתחלף קיצוני. המשמעות היא ש -15 מסמכות כמתווך קיצוני.