תוֹכֶן
כשאתה מבצע ניסוי שנותן סדרה של ערכים נצפים שברצונך להשוות ביחס לערכים תיאורטיים, ה- סטיית שורש-ממוצע-ריבוע (RMSD) או שגיאת שורש-ממוצע-ריבוע (RMSE) מאפשרת לך לכמת השוואה זו. אתה מחשיב RMSD על ידי מציאת השורש הריבועי של השגיאה הממוצעת בריבוע.
נוסחת RMSD
עבור סדרת תצפיות, אתה מחשיב שגיאה בריבוע ממוצע על ידי מציאת ההבדל בין כל ערך ניסיוני או נצפה לערך התיאורטי או החזוי, בריבוע כל הבדל, הוספתם וחלוקתו במספר הערכים הנצפים או הערכים החזויים שיש .
זה הופך את הנוסחה RMSD:
{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}ל איקסה ערכים צפויים, איקסo ערכים נצפים, ו n המספר הכולל של הערכים.
שיטה זו של מציאת הבדל (או סטייה), ריבוע של כל הבדל, סיכום וחילוק במספר נקודות הנתונים (כפי שהיית עושה כשאתה מוצא את הממוצע של קבוצת נתונים), ואז לשרש את השורש הריבועי של התוצאה היא מה נותן לכמות את שמו, "סטיית שורש-ממוצע-ריבוע." אתה יכול להשתמש בגישה צעד אחר צעד כזה לחישוב RMSD באקסל, וזה נהדר עבור מערכי נתונים גדולים.
סטיית תקן
סטיית תקן מודד כמה סט נתונים משתנה בתוך עצמו. אתה יכול לחשב אותו באמצעות (Σ (איקס - μ)2 / n)1/2 עבור כל ערך איקס ל n ערכים עם μ ("mu") ממוצע. שימו לב שזו אותה נוסחה עבור RMSD אך במקום לערכי נתונים צפויים וצפו, אתם משתמשים בערך הנתונים עצמו ובממוצע מערך הנתונים, בהתאמה. באמצעות תיאור זה, תוכלו להשוות שגיאת ממוצע שורשית לעומת סטיית תקן.
המשמעות היא שלמרות שיש לה נוסחה בעלת מבנה דומה ל- RMSD, סטיית התקן מודדת תרחיש ניסוי היפותטי ספציפי בו הערכים הצפויים הם כל הממוצע של מערך הנתונים.
בתרחיש היפותטי זה, הכמות בתוך השורש הריבועי (Σ (איקס - μ)2 / n) נקרא שונות, כיצד הנתונים מופצים סביב הממוצע. קביעת השונות מאפשרת לך להשוות את מערך הנתונים להפצות ספציפיות שהיית מצפה שהנתונים ייקחו על סמך ידע קודם.
מה RMSD אומר לך
RMSD נותן דרך ספציפית ומאוחדת לקבוע כיצד טעויות בהבדל הערכים הצפויים מהערכים שנצפו לניסויים. ככל ש- RMSD נמוך יותר, תוצאות הניסוי מדויקות יותר לתחזיות תיאורטיות. הם מאפשרים לך לכמת כיצד מקורות טעויות שונים משפיעים על תוצאות הניסוי שנצפו, כגון התנגדות אוויר המשפיעת על תנודת המטוטלת או מתח פני השטח בין נוזל למיכל שלו ומונע את זרימתו.
תוכלו להבטיח כי RMSD ישקף את טווח מערך הנתונים על ידי חלוקתו בהפרש בין הערך הניסיוני המרבי שנצפה למינימום להשיג את סטיית שורש-ממוצע-ריבוע מנורמלית או שגיאה.
בתחום העגינה המולקולרית, בה חוקרים משווים את המבנה התיאורטי המיוצר ממוחשבים של ביו-מולקולות לאלו מהתוצאות הניסיוניות, RMSD יכול למדוד עד כמה תוצאות הניסוי משקפות מודלים תיאורטיים. התוצאות הניסיוניות יותר מצליחות לשחזר את מה שהמודלים התיאורטיים מנבאים, כך ה- RMSD נמוך יותר.
RMSD בהגדרות מעשיות
בנוסף לדוגמא לעגינה מולקולרית, מטאורולוגים משתמשים ב- RMSD כדי לקבוע באיזו מידה מודלים מתמטיים של אקלים מנבאים תופעות אטמוספריות. ביו-אינפורמטיקאים, מדענים החוקרים ביולוגיה באמצעים מבוססי מחשב, קובעים כיצד המרחקים בין עמדות אטומיות של מולקולות חלבון משתנים מהמרחק הממוצע של אותם אטומים בחלבונים המשתמשים ב- RMSD כמדד לדיוק.
כלכלנים משתמשים ב- RMSD כדי להבין עד כמה מודלים כלכליים מתאימים לתוצאות של פעילות כלכלית מדודה או נצפתה. פסיכולוגים משתמשים ב- RMSD כדי להשוות התנהגות נצפית של תופעות פסיכולוגיות או פסיכולוגיות למודלים חישוביים.
מדעני המוח משתמשים בו כדי לקבוע כיצד מערכות מלאכותיות או ביולוגיות מבוססות יכולות ללמוד בהשוואה למודלים של למידה. מדעני מחשבים החוקרים הדמיה וחזון משווים את הביצועים של כמה טוב מודל יכול לשחזר תמונות לתמונות המקוריות בשיטות שונות.