כיצד למצוא את הסנטרואיד בניתוח אשכולות

Posted on
מְחַבֵּר: Judy Howell
תאריך הבריאה: 1 יולי 2021
תאריך עדכון: 9 מאי 2024
Anonim
כיצד למצוא את הסנטרואיד בניתוח אשכולות - מדע
כיצד למצוא את הסנטרואיד בניתוח אשכולות - מדע

תוֹכֶן

ניתוח אשכולות הוא שיטה לארגון נתונים לקבוצות ייצוגיות על סמך מאפיינים דומים. לכל אחד מחברי האשכול משותף יותר עם חברים אחרים באותו אשכול מאשר עם חברי הקבוצות האחרות. הנקודה הייצוגית ביותר בקבוצה נקראת centroid. בדרך כלל, זהו הממוצע לערכי נקודות הנתונים באשכול.

    ארגן את הנתונים. אם הנתונים מורכבים ממשתנה בודד, היסטוגרמה עשויה להתאים. אם מדובר בשני משתנים, גרף את הנתונים במישור קואורדינטות. לדוגמה, אם היית מסתכל על הגובה והמשקל של ילדי בית הספר בכיתה, קם את נקודות הנתונים של כל ילד על גבי גרף, כאשר המשקל הוא הציר האופקי והגובה הוא הציר האנכי. אם מדובר יותר משני משתנים, יתכן ויהיה צורך במטריצות כדי להציג את הנתונים.

    קבץ את הנתונים לאשכולות. כל אשכול צריך להיות מורכב מנקודות הנתונים הקרובים אליו. בדוגמא הגובה והמשקל, קבץ את כל נתוני הנתונים שנראים קרובים זה לזה. מספר האשכולות והאם כל נקודת נתונים צריכה להיות באשכול עשוי להיות תלוי במטרות המחקר.

    לכל אשכול, הוסף את הערכים של כל החברים.לדוגמה, אם מקבץ נתונים כלל את הנקודות (80, 56), (75, 53), (60, 50) ו- (68,54), סכום הערכים יהיה (283, 213).

    חלק את הסכום במספר חברי האשכול. בדוגמה שלמעלה, 283 המחולק בארבעה הוא 70.75, ו 213 מחולק על ידי ארבעה הוא 53.25, כך שהקיבה של האשכול היא (70.75, 53.25).

    קבעו את צנטרידיות האשכול וקבעו אם נקודות כלשהן קרובות יותר לסנטרואיד של אשכול אחר מכפי שהם לאחוזת המגן של האשכול שלהם. אם נקודות כלשהן קרובות יותר לסנטרואיד שונה, הפץ אותן מחדש לאשכול המכיל את הסנטרואיד הקרוב יותר.

    חזור על שלבים 3, 4 ו 5 עד שכל נקודות הנתונים נמצאות באשכול המכיל את הסנטרואיד אליו הן קרובות ביותר.

    טיפים