תוֹכֶן
ניסויים בוחנים תחזיות. תחזיות אלה הן לעתים קרובות מספריות, כלומר, ככל שמדענים אוספים נתונים, הם מצפים שהמספרים יתפרקו בצורה מסוימת. נתונים של העולם האמיתי כמעט ולא תואמים בדיוק את התחזיות שהמדענים מבצעים, ולכן מדענים זקוקים לבדיקה כדי לומר להם אם ההבדל בין מספרים שנצפו לצפוי הוא בגלל סיכוי אקראי, או בגלל גורם כלשהו בלתי צפוי שיאלץ את המדען להתאים את התיאוריה הבסיסית . מבחן צ'י-ריבוע הוא כלי סטטיסטי בו מדענים משתמשים למטרה זו.
סוג הנתונים הנדרשים
אתה זקוק לנתונים קטגוריים כדי להשתמש במבחן צ'י-מרובע. דוגמה לנתונים קטגוריים היא מספר האנשים שענו על שאלה "כן" לעומת מספר האנשים שענו על השאלה "לא" (שתי קטגוריות), או מספר הצפרדעים באוכלוסייה שהם ירוקים, צהובים או אפורים ( שלוש קטגוריות). אינך יכול להשתמש במבחן צ'י-מרובע על נתונים רציפים, כמו למשל שנאסף מסקר ששואל אנשים כמה הם גובהם. מסקר שכזה תקבלו מגוון רחב של גבהים. עם זאת, אם חילקת את הגבהים לקטגוריות כמו "מתחת לגובה 6 רגל" ו- "מטר וחצי", אתה יכול להשתמש במבחן צ'י-ריבוע על הנתונים.
מבחן טובת הכושר
מבחן של התאמה טובה הוא מבחן נפוץ, ואולי הפשוט ביותר, המתבצע באמצעות נתון הצ'י-ריבוע. בבדיקת התאמה טובה, המדענית מציעה תחזית ספציפית לגבי המספרים שהיא מצפה לראות בכל קטגוריה של הנתונים שלה. לאחר מכן היא אוספת נתונים בעולם האמיתי - המכונים נתונים נצפים - ומשתמש במבחן הצ'י-ריבוע כדי לראות אם הנתונים שנצפו תואמים את ציפיותיה.
לדוגמה, דמיין שביולוג חוקר את דפוסי הירושה במין צפרדעים. בקרב 100 צאצאים של קבוצת הורים לצפרדע, המודל הגנטי של הביולוגים מוביל אותה לצפות ל 25 צאצאים צהובים, 50 צאצאים ירוקים ו 25 צאצאים אפורים. מה שהיא למעשה מבחינה זה 20 צאצאים צהובים, 52 צאצאים ירוקים ו 28 צאצאים אפורים. האם החיזוי שלה נתמך או שהמודל הגנטי שלה אינו נכון? היא יכולה להשתמש במבחן צ'י-מרובע כדי לגלות.
חישוב נתון הצ'י-ריבוע
התחל בחישוב הסטטיסטיקה הצ'י-ריבועית על ידי הפחתת כל ערך צפוי מערכו הנצפה המקביל וריבוע כל תוצאה. החישוב לדוגמא של צאצאי צפרדע ייראה כך:
צהוב = (20 - 25) ^ 2 = 25 ירוק = (52 - 50) ^ 2 = 4 אפור = (28 - 25) ^ 2 = 9
חלקו עכשיו כל תוצאה בערכה הצפוי המקביל.
צהוב = 25 ÷ 25 = 1 ירוק = 4 ÷ 50 = 0.08 אפור = 9 ÷ 25 = 0.36
לבסוף, הוסף את התשובות מהצעד הקודם.
צ'י-ריבוע = 1 + 0.08 + 0.36 = 1.44
פירוש נתון הצ'י-ריבוע
הנתון הצ'י-ריבועי מספר לך עד כמה היו הערכים הנצפים שלך שונים מהערכים החזוי שלך. ככל שהמספר גבוה יותר, ההבדל גדול יותר. אתה יכול לקבוע אם הערך הצ'י-ריבוע שלך גבוה מדי או נמוך מספיק כדי לתמוך בחיזוי שלך על ידי בדיקה אם הוא מתחת למספר מסוים ערך קריטי על שולחן חלוקה צ'י-מרובע. טבלה זו תואמת לערכים צ'י-ריבועים עם הסתברויות, הנקראים p- ערכים. באופן ספציפי, הטבלה מציגה לך את ההסתברות שההבדלים בין הערכים שנצפו לצפוי שלך פשוט נובעים מקריות אקראית או אם קיים גורם אחר. לבדיקת התאמה טובה, אם ערך ה- p הוא 0.05 ומטה, עליך לדחות את התחזית שלך.
עליך לקבוע את דרגות חופש (df) בנתונים שלך לפני שתוכל לחפש את הערך הצ'י-ריבוע הקריטי בטבלת חלוקה. דרגות חופש מחושבות על ידי חיסור 1 ממספר הקטגוריות בנתונים שלך. ישנן שלוש קטגוריות בדוגמה זו, כך שיש שתי דרגות חופש. מבט על טבלת ההפצה הצ'י-מרובעת הזו אומר לך שעבור 2 דרגות חופש, הערך הקריטי להסתברות של 0.05 הוא 5.99. משמעות הדבר היא שכל עוד הערך הצ'י-ריבוע המחושב שלך הוא פחות מ -5.99, הערכים הצפויים שלך, וכך התיאוריה הבסיסית, תקפים ותומכים. מכיוון שהנתון הצ'י-ריבועי לנתוני צאצאי הצפרדע היה 1.44, הביולוג יכול לקבל את המודל הגנטי שלה.