תוֹכֶן
- שגיאה מסוג 1: דחייה שגויה של השערת האפס
- שגיאה מסוג II: דחייה שגויה של ההשערה החלופית
- קביעת רמת החשיבות
- בחירת מבחן חשיבות
מובהקות סטטיסטית היא אינדיקטור אובייקטיבי לשאלה אם תוצאות המחקר הן "אמיתיות" ומתמטיות מבחינה מתמטית, ולא רק התרחשות מקרית. במבחני המשמעות הנפוצים נוהגים לחפש הבדלים באמצעי ערכת נתונים או הבדלים בשונות של מערכי נתונים. סוג הבדיקה המיושמת תלוי בסוג הנתונים המנותחים. על החוקרים לקבוע עד כמה הם מחייבים את התוצאות - במילים אחרות, כמה סיכון הם מוכנים לקחת בטעות. בדרך כלל החוקרים מוכנים לקבל רמת סיכון של 5 אחוזים.
שגיאה מסוג 1: דחייה שגויה של השערת האפס
••• סקוט רוטשטיין / תמונות / Getty תמונותניסויים נערכים לבחינת השערות ספציפיות, או שאלות ניסיוניות עם תוצאה צפויה. השערת אפס היא כזו שלא מגלה שום הבדל בין שתי קבוצות הנתונים בהשוואה. בניסוי רפואי, למשל, ההשערה האפסית יכולה להיות כי אין הבדל בשיפור בין חולים שקיבלו את תרופת המחקר לבין חולים שקיבלו את הפלצבו. אם החוקרת דוחה בטעות את ההשערה האפסית הזו כאשר היא אכן נכונה, במילים אחרות אם הם "מגלים" הבדל בין שתי קבוצות החולים כאשר באמת לא היה הבדל, אז הם ביצעו שגיאה מסוג I.חוקרים קובעים מראש כמה סיכון לבצע שגיאה מסוג I הם מוכנים לקבל. סיכון זה מבוסס על ערך p מקסימלי שהם יקבלו לפני שידחו את השערת האפס, ונקרא אלפא.
שגיאה מסוג II: דחייה שגויה של ההשערה החלופית
השערה חלופית היא אחת המאתרת הבדל בין שתי קבוצות הנתונים בהשוואה. במקרה של הניסוי הרפואי, היית מצפה לראות רמות שונות של שיפורים בחולים שקיבלו את תרופת המחקר ובחולים שקיבלו את הפלצבו. אם החוקרים לא מצליחים לדחות את ההשערה האפסית כשהם צריכים, או במילים אחרות אם הם "מגלים" שום הבדל בין שני המטופלים כאשר באמת היה הבדל, אז הם ביצעו שגיאה מסוג II.
קביעת רמת החשיבות
כאשר החוקרים מבצעים בדיקה בעלת משמעות סטטיסטית והערך p הנוצר כתוצאה נמוך מרמת הסיכון הנחשבת כמקובלת, תוצאת הבדיקה נחשבת למובהקת סטטיסטית. במקרה זה, נדחית ההשערה האפסית - ההשערה כי אין הבדל בין שתי הקבוצות. במילים אחרות, התוצאות מצביעות על כך שיש הבדל בשיפור בין חולים שקיבלו את תרופת המחקר לבין מטופלים שקיבלו את הפלצבו.
בחירת מבחן חשיבות
ישנן מספר בדיקות סטטיסטיות שונות לבחירה. מבחן t רגיל משווה את האמצעים משתי קבוצות נתונים, כמו נתוני תרופות המחקר שלנו ונתוני פלצבו. מבחן t מזווג משמש לגילוי הבדלים באותה מערך נתונים, כמו מחקר לפני ואחרי. ניתוח חד-כיווני חד-כיווני (ANOVA) יכול להשוות את האמצעים משלוש מערכי נתונים או יותר, ו- ANOVA דו כיוונית משווה את האמצעים של שני מערכי נתונים או יותר בתגובה לשני משתנים עצמאיים שונים, כמו חוזקות שונות של מחקר סמים. רגרסיה לינארית משווה את האמצעים של מערכי הנתונים לאורך שיפוע של טיפולים או זמן. כל מבחן סטטיסטי יביא למדידות בעלות משמעות, או אלפא, בהן ניתן להשתמש כדי לפרש את תוצאות הבדיקה.