תוֹכֶן
- TL; DR (יותר מדי זמן; לא קרא)
- ההגדרה של גודל המדגם
- חישוב גודל המדגם
- סכנות בגודל מדגם קטן
- גודל מדגם ושולי הטעות
גודל המדגם הוא ספירת דגימות או תצפיות בודדות בכל סטטיסטיקה, כגון ניסוי מדעי או סקר דעת קהל. אף שמושג יחסית פשוט, בחירה בגודל המדגם היא קביעה קריטית לפרויקט. מדגם קטן מדי מניב תוצאות לא אמינות, בעוד שמדגם גדול מדי דורש זמן ומשאבים רבים.
TL; DR (יותר מדי זמן; לא קרא)
גודל המדגם הוא ספירה ישירה של מספר הדגימות שנמדדו או תצפיות הנעשות.
ההגדרה של גודל המדגם
גודל המדגם מודד את מספר הדגימות הבודדות שנמדדו או תצפיות ששימשו בסקר או בניסוי. לדוגמה, אם אתה בודק 100 דגימות של אדמה לצורך עדות לגשם חומצי, גודל הדגימה שלך הוא 100. אם סקר מקוון החזיר 30,500 שאלונים שהושלמו, גודל המדגם שלך הוא 30,500. בסטטיסטיקה, גודל המדגם מיוצג בדרך כלל על ידי המשתנה "n".
חישוב גודל המדגם
כדי לקבוע את גודל המדגם הדרוש לניסוי או סקר, החוקרים לוקחים בחשבון מספר גורמים רצויים. ראשון, הגודל הכולל של האוכלוסייה הנחקרת יש לקחת בחשבון - סקר שמחפש להסיק מסקנות לגבי כל מדינת ניו יורק, למשל, יזדקק לגודל מדגם גדול בהרבה מזה שממוקד במיוחד על רוצ'סטר. החוקרים יצטרכו לקחת בחשבון את העניין שולי הטעות, האמינות שהנתונים שנאספו הם בדרך כלל מדויקים; וה רמת ביטחון, ההסתברות ששולי הטעות שלך מדויקים. לבסוף, על החוקרים לקחת בחשבון את סטיית תקן הם מצפים לראות בנתונים. סטיית תקן מודדת כמה פיסות נתונים בודדות שונות מהנתונים הממוצעים שנמדדו. לדוגמה, דגימות אדמה מפארק אחד ככל הנראה יהיו בעלות סטיית תקן קטנה בהרבה בתכולת החנקן שלהם מאשר קרקעות שנאספו ברחבי מחוז שלם.
סכנות בגודל מדגם קטן
יש צורך בגדלים גדולים של מדגמים כדי שהנתון יהיה מדויק ואמין, במיוחד אם יימצאו מיצוי הממצאים לאוכלוסייה גדולה יותר או לקבוצת נתונים. נניח שעשית סקר בנושא פעילות גופנית וראיינת חמישה אנשים, שניים מהם אמרו שהם רצים מרתון מדי שנה. אם אתה לוקח את הסקר הזה כדי לייצג את אוכלוסיית המדינה כולה, אז לפי המחקר שלך, 40 אחוז מהאנשים רצים מרתון אחד לפחות בשנה - אחוז גבוה באופן בלתי צפוי. ככל שגודל המדגם שלך קטן יותר, כך סביר יותר מחריגים - פיסות נתונים חריגות - הן כדי להסיט את הממצאים שלך.
גודל מדגם ושולי הטעות
גודל המדגם של סקר סטטיסטי קשור גם ישירות לשולי הטעות של הסקרים. שולי הטעות הם אחוז המבטא את ההסתברות שהנתונים שהתקבלו הם מדויקים. לדוגמה, בסקר העוסק באמונות דתיות, שולי הטעות הוא אחוז המשיבים שניתן לצפות מהם לספק את אותה התשובה אם הסקר היה חוזר. כדי לקבוע את מרווח השגיאה, חלק 1 לפי השורש הריבועי של גודל המדגם, ואז הכפל ב 100 כדי לקבל אחוז. לדוגמא, לגודל המדגם של 2,400 יש שגיאת שגיאה של 2.04 אחוזים.