תוֹכֶן
היכולת לחשב את הערך הממוצע או הממוצע של קבוצת מספרים חשובה בכל תחומי החיים. אם אתה פרופסור המקצה ציוני אותיות לציוני בחינות ומעניק באופן מסורתי ציון B- לציון אמצע החפיסה, ברור שאתה צריך לדעת איך נראית אמצע החבילה מספרית. אתה צריך גם דרך לזהות ציונים כמחליפים, כך שתוכל לקבוע מתי למישהו מגיע A או A + (מחוץ לציונים המושלמים, ברור), כמו גם מה ראוי לציון כושל.
מסיבות זה ומצדדים קשורים, נתונים מלאים על ממוצעים כוללים מידע על מידת ההתקבצות סביב הציון הממוצע של הניקוד באופן כללי. מידע זה מועבר באמצעות סטיית תקן ובקשר, את שונות של מדגם סטטיסטי.
מדדי שונות
כמעט ודאי שמעת או ראית את המונח "ממוצע" המשמש בהתייחסות לסט של מספרים או נקודות נתונים, וכנראה שיש לך מושג למה זה מתרגם בשפה יומיומית. לדוגמה, אם קראת שהגובה הממוצע של אישה אמריקאית הוא בערך 5 4 ", אתה מיד מסיק ש"ממוצע" פירושו "טיפוסי", וכי כמחצית מהנשים בארצות הברית גבוהות יותר מזה בעוד כמחצית הם קצרים יותר.
מבחינה מתמטית, ממוצע וממוצע הם בדיוק אותו הדבר: אתה מוסיף את הערכים בערכה ומחלק את מספר הפריטים בערכה. לדוגמה, אם קבוצה של 25 ציונים במבחן של 10 שאלות נעה בין 3 ל -10 ומוסיפים עד 196, הציון הממוצע (הממוצע) הוא 196/25, או 7.84.
החציון הוא ערך נקודת האמצע בסט, המספר שמחצית הערכים נמצאים מעל ומחצית הערכים נמצאים מתחת. זה בדרך כלל קרוב לממוצע (הממוצע) אבל הוא לא אותו הדבר.
נוסחת שונות
אם אתה מגלגל עיניים סט של 25 ציונים כמו אלה שלמעלה ואינך רואה כמעט דבר מלבד ערכים של 7, 8 ו -9, זה הגיוני אינטואיטיבי שהממוצע צריך להיות סביב 8. אבל מה אם אתה רואה כמעט שום דבר מלבד ציונים של 6 ו -10 ? או חמש ציונים של 0 ו -20 ציונים של 9 או 10? כל אלה יכולים לייצר את אותו הממוצע.
שונות היא מדד להרחבה של הנקודות במערך הנתונים על הממוצע. כדי לחשב את השונות ביד, אתה לוקח את ההבדל האריתמטי בין כל אחת מנקודות הנתונים לממוצע, מרובע אותן, מוסיף את סכום המשבצות ומחלק את התוצאה באחת פחות ממספר נקודות הנתונים בתשחץ. דוגמא לכך ניתנת בהמשך. אתה יכול גם להשתמש בתוכנות כגון Excel או אתרים כמו טבלאות מהירות (ראה משאבים לאתרים נוספים).
השונות מצוינת על ידי σ2, "sigma" יווני עם אקספקטנט של 2.
סטיית תקן
סטיית התקן של מדגם היא פשוט השורש הריבועי של השונות. השימוש בכיכרות הסיבה כאשר שונות המחשוב היא שאם אתה פשוט מצרף את ההבדלים האינדיבידואליים בין הממוצע לכל נקודת נתונים פרטנית, הסכום הוא תמיד אפס מכיוון שחלק מההבדלים הללו הם חיוביים וחלקם שליליים, והם מבטלים זה את זה . ריבוע כל מונח מבטל את החסרונות האלה.
דוגמת שונות וסטיית תקן
נניח שמקבלות לך 10 נקודות נתונים:
4, 7, 10, 5, 7, 6, 9, 8, 5, 9
מצא את הממוצע, את השונות ואת סטיית התקן.
ראשית, הוסף את 10 הערכים ביחד וחלק ב- 10 כדי לקבל את הממוצע (הממוצע):
70/10 = 7.0
כדי להשיג את השונות, יש לרבוע את ההבדל בין כל נקודת נתונים לממוצע, הוסף אלה יחד ולחלק את התוצאה ב- (10 - 1), או 9:
9 + 0 + 9 + . . . + 4 = 36
σ2= 36/9 = 4.0
סטיית התקן σ היא רק השורש הריבועי של 4.0, או 2.0.