תוֹכֶן
כשמדובר במחקרים מדעיים, גודל המדגם הוא שיקול מכריע במחקר איכותי. גודל מדגם, לפעמים מיוצג כ n, הוא מספר פיסות הנתונים הבודדות המשמשות לחישוב סט סטטיסטיקות. גדלים מדגמים גדולים יותר מאפשרים לחוקרים לקבוע טוב יותר את הערכים הממוצעים של הנתונים שלהם ולהימנע משגיאות בבדיקת מספר קטן של דוגמאות לא טיפוסיות.
TL; DR (יותר מדי זמן; לא קרא)
גודל המדגם הוא שיקול חשוב למחקר. גדלים מדגמים גדולים יותר מספקים ערכי ממוצע מדויקים יותר, מזהים מחסלים שיכולים להסיט את הנתונים במדגם קטן יותר ולספק מרווח שגיאה קטן יותר.
גודל המדגם
גודל המדגם הוא מספר פיסות המידע שנבדקו בסקר או בניסוי. לדוגמה, אם אתה בודק 100 דגימות של מי ים עבור שאריות שמן, גודל המדגם שלך הוא 100. אם אתה סוקר 20,000 אנשים בסימני חרדה, גודל המדגם שלך הוא 20,000. לגדלי דגימות גדולים יותר יש את היתרון הברור של אספקת נתונים נוספים לחוקרים לעבוד איתם; אך ניסויים גדולים בגודל מדגם דורשים התחייבויות כספיות וזמן גדולות יותר.
ערך ממוצע וממציגים
גדלי דגימות גדולים יותר מסייעים בקביעת הערך הממוצע של איכות בקרב דגימות שנבדקו - ממוצע זה הוא הממוצע מתכוון. ככל שגודל המדגם גדול יותר, כך הממוצע מדויק יותר. לדוגמה, אם תגלה שבקרב 40 אנשים הגובה הממוצע הוא 5 רגל, 4 אינץ ', אבל בקרב 100 אנשים, הגובה הממוצע הוא 5 רגל, 3 ס"מ, המדידה השנייה היא אומדן טוב יותר של הגובה הממוצע של אינדיבידואל, מכיוון שאתה בודק נושאים משמעותיים יותר. קביעת הממוצע מאפשרת גם לחוקרים להצביע ביתר קלות מחריגים. מקדם מתח הוא פיסת נתונים השונה מאוד מהערך הממוצע ויכול לייצג נקודת עניין למחקר. אז בהתבסס על הגובה הממוצע, מישהו שגובהו 6 רגל, 8 אינץ ', יהיה נקודת נתונים רחוקה.
סכנת הדגימות הקטנות
האפשרות של מחיקים היא חלק ממה שחשוב לגודל המדגם הגדול להיות חשוב. למשל, נניח שאתה סוקר 4 אנשים על השתייכותם הפוליטית, ואחד מהם שייך למפלגה העצמאית. מכיוון שמדובר באדם אחד בגודל מדגם של 4, הסטטיסטיקה שלך תראה ש 25 אחוז מהאוכלוסייה שייכים למפלגה העצמאית, ככל הנראה אקסטרפולציה לא מדויקת. הגדלת גודל המדגם שלך תימנע מסטטיסטיקה מטעה אם קיים אקסלרטור במדגם שלך.
שולי הטעות
גודל המדגם קשור ישירות לסטטיסטיקה שולי הטעות, או עד כמה ניתן לחשב נתון מדויק. לשאלת כן-או-לא, כגון אם יחיד הוא הבעלים של מכונית, אתה יכול לקבוע את מרווח השגיאה לנתון על ידי חלוקת 1 בשורש הריבועי של גודל המדגם והכפלת 100. הסכום הוא אחוז . לדוגמה, לגודל המדגם של 100 יש שגיאת טעות של 10 אחוזים. כאשר מודדים תכונות מספריות עם ערך ממוצע, כגון גובה או משקל, הכפל את הסכום הזה פי שניים מה- סטיית תקן של הנתונים, המודד את מידת הפיזור של ערכי הנתונים מהממוצע. בשני המקרים, ככל שגודל המדגם גדול יותר, כך מרווח השגיאה קטן יותר.