תוֹכֶן
כאשר מדענים, כלכלנים או סטטיסטיקאים מבצעים תחזיות על בסיס תיאוריה ואז אוספים נתונים אמיתיים, הם זקוקים לדרך למדידת השונות בין ערכים חזויים ומדודים. הם מסתמכים בדרך כלל על השגיאה הממוצעת בריבוע (MSE), שהיא סכום הווריאציות של נקודות הנתונים הבודדות בריבוע ומחולק במספר נקודות הנתונים מינוס 2. כאשר הנתונים מוצגים בתרשים, אתה קובע את ה- MSE על ידי לסיכום הווריאציות בנקודות הנתונים של הציר האנכי. בתרשים x-y זה יהיו ערכי ה- y.
מדוע לרבוע את הווריאציות?
הכפלת השונות בין הערכים החזוי והנצפה משפיעה על שתי השפעות רצויות. הראשון הוא להבטיח שכל הערכים חיוביים. אם ערך אחד או יותר היו שליליים, סכום כל הערכים יכול להיות קטן באופן לא מציאותי וייצוג גרוע של השונות בפועל בין ערכים חזויים וצפויים. היתרון השני של ריבוע הוא מתן משקל רב יותר להבדלים גדולים יותר, מה שמבטיח שערך גדול עבור MSE מסמן וריאציות נתונים גדולות.
אלגוריתם מניות לחישוב לדוגמא
נניח שיש לך אלגוריתם שמנבא את מחירי המניה מסוימת על בסיס יומי. ביום שני זה צופה כי מחיר המניה יהיה 5.50 $, ביום שלישי 6.00 $, יום רביעי $ 6.00, יום חמישי 7.50 $ ושישי 8.00 $. בהתחשב ביום שני כיום 1, יש לך קבוצה של נקודות נתונים המופיעות כך: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) ו- (5, 8.00). המחירים בפועל הם כדלקמן: יום שני 4.75 $ (1, 4.75); יום שלישי 5.35 דולר (2, 5.35); יום רביעי 6.25 דולר (3, 6.25); יום חמישי 7.25 דולר (4, 7.25); ושישי: 8.50 $ (5, 8.50).
הווריאציות בין ערכי ה- y של נקודות אלה הן 0.75, 0.65, -0.25, 0.25 ו- -0.50 בהתאמה, כאשר הסימן השלילי מציין ערך חזוי קטן יותר מזה שנצפה. כדי לחשב MSE, אתה מרובע קודם כל ערך וריאציה, שמבטל את סימני מינוס ומניב 0.5625, 0.4225, 0.0625, 0.0625 ו- 0.25. סיכום ערכים אלה נותן 1.36 וחילוק במספר המדידות מינוס 2 שהוא 3, מניב את ה- MSE שמתגלה כ- 0.45.
MSE ו- RMSE
ערכים קטנים יותר עבור MSE מצביעים על הסכמה קרובה יותר בין תוצאות חזויות ונצפות, ו- MSE של 0.0 מצביע על הסכמה מושלמת. עם זאת חשוב לזכור שערכי הווריאציה בריבוע. כאשר נדרשת מדידת שגיאה שנמצאת באותן יחידות כמו נקודות הנתונים, סטטיסטיקאים לוקחים את שגיאת ממוצע הריבוע (RMSE). הם משיגים זאת על ידי נטילת השורש הריבועי של השגיאה המרובעת הממוצעת. לדוגמא לעיל, ה- RSME יהיה 0.671 או כ -67 סנט.