מהם פערים, אשכולות ומוצאים בחישוב מתמטיקה?

Posted on
מְחַבֵּר: Louise Ward
תאריך הבריאה: 11 פברואר 2021
תאריך עדכון: 18 מאי 2024
Anonim
Examples analyzing clusters, gaps, peaks and outliers for distributions | 6h grade | Khan Academy
וִידֵאוֹ: Examples analyzing clusters, gaps, peaks and outliers for distributions | 6h grade | Khan Academy

תוֹכֶן

פעילויות עסקיות, ממשלתיות ואקדמיות כמעט תמיד מחייבות איסוף וניתוח נתונים. אחת הדרכים לייצוג נתונים מספריים היא באמצעות גרפים, היסטוגרמות ותרשימים. טכניקות הדמיה אלה מאפשרות לאנשים לקבל תובנה טובה יותר של בעיות ולתכנן פתרונות. פערים, אשכולות ומחשבים הם מאפיינים של מערכי נתונים המשפיעים על ניתוח מתמטי ונראים בקלות על ייצוגים חזותיים.

חורים בנתונים

פערים מתייחסים לאזורים חסרים במערך נתונים. לדוגמה, אם ניסוי מדעי אוסף נתוני טמפרטורה בטווח של 50 מעלות פרנהייט עד 100 מעלות פרנהייט, אך שום דבר בין 70 ל 80 מעלות, זה ייצג פער במערך הנתונים. לעלילת קו של מערך נתונים זה יהיו סימני "x" לטמפרטורות שבין 50 ל 70 ושוב בין 80 ל 100, אך לא יהיה דבר בין 70 ל 80. חוקרים יכולים לחפור עמוק יותר ולחקור מדוע נקודות נתונים מסוימות לא מופיעות. במדגם שנאסף.

קבוצות מבודדות

אשכולות הם קבוצות מבודדות של נקודות נתונים. עלילות קו, שהן אחת הדרכים לייצג מערכי נתונים, הם קווים עם סימני "x" הממוקמים מעל מספרים ספציפיים כדי לתאר את תדירות ההתרחשות שלהם במערך הנתונים. אשכול מתואר כאוסף של סימני "x" אלה במרווח קטן או בתת נתונים קטנה. לדוגמה, אם ציוני הבחינה עבור כיתה של 10 תלמידים הם 74, 75, 80, 72, 74, 75, 76, 86, 88 ו 73, סימוני ה- "x" ביותר במגרש השורות היו בסגנון 72- מרווח ציונים עד 76. זה ייצג אשכול נתונים. שימו לב שהתדירות עבור 74 ו -75 היא שתיים, אך עבור כל שאר התוצאות, זהו אחד.

בקיצוניות

Outliers הם ערכים קיצוניים - נקודות נתונים שנמצאות באופן משמעותי מחוץ לערכים אחרים במערך נתונים. חלון חיוג צריך להיות פחות או יותר משמעותי מרוב המספרים בערכת נתונים. ההגדרה של "קיצוני" תלויה בנסיבות ובקונצנזוס של האנליסטים המעורבים במחקר. מחיקים עשויים להיות נקודות נתונים גרועות, המכונות גם רעש, או שהם עשויים להכיל מידע חשוב על התופעה הנחקרת ועל מתודולוגיית איסוף הנתונים עצמה. לדוגמה, אם ציוני הכיתה הם ברובם בטווח 70-80, אך מספר ציונים הם בשנות ה -50 הנמוכים, אלה עשויים לייצג מחזורים.

לשים את הכל ביחד

פערים, מחיקים ואשכולות במערכות נתונים יכולים להשפיע על תוצאות הניתוח המתמטי. פערים ואשכולות עשויים לייצג שגיאות במתודולוגיית איסוף הנתונים. לדוגמה, אם סקר טלפוני סוקר רק אזורי שטח מסוימים, כמו מתחמי דיור בעלי הכנסה נמוכה או אזורי מגורים פרבריים יוקרתיים, ולא שטח רוחב רחב של האוכלוסייה, רוב הסיכויים שיהיו פערים ואשכולות בנתונים . מחיקים יכולים להסיט את הערך הממוצע או הממוצע של מערך נתונים. לדוגמה, הערך הממוצע או הממוצע של מערך נתונים המורכב מארבעה מספרים - 50, 55, 65 ו 90 - הוא 65. ללא המתווה 90, לעומת זאת, הממוצע הוא כ 57.