כיצד לפרש עלילת פיזור

Posted on
מְחַבֵּר: Randy Alexander
תאריך הבריאה: 2 אַפּרִיל 2021
תאריך עדכון: 18 נוֹבֶמבֶּר 2024
Anonim
Statistical Programming with R by Connor Harris
וִידֵאוֹ: Statistical Programming with R by Connor Harris

עלילת פיזור היא כלי אבחון חשוב בארסנל הסטטיסטיקה המתקבל על ידי גרף של שני משתנים זה מול זה. זה מאפשר לסטטיסטיקאי לגלגל את העיניים את המשתנים ולגבש השערת עבודה לגבי מערכת היחסים שלהם. מסיבה זו הוא נמשך בדרך כלל לפני שמתבצע ניתוח רגרסיה. לאחר מכן, הסטטיסטיקאי בוחן את ההשערה באמצעות ניתוח רגרסיה וקובע את הסימן ואת גודל המדויק של הקשר. יתרה מזאת, עלילת פיזור מסייעת בזיהוי מתארים - ערכים המרוחקים בצורה חריגה מרוב הנתונים שבמדגם. ביטול מחיקת עזר מסייע בשיפור מודל הרגרסיה.

    בדוק אם יש קשר שלילי בין שני המשתנים בעלילת הפיזור. אם ערכים נמוכים של המשתנה הראשון תואמים ערכים גבוהים של המשתנה השני, יש מתאם שלילי. במקרה זה, לקו המצוי דרך נקודות הנתונים יש שיפוע שלילי.

    בחן את עלילת הפיזור לקשר חיובי בין המשתנים. אם ערכים נמוכים של המשתנה הראשון בעלילת הפיזור תואמים ערכים נמוכים של השני, והערכים הגבוהים של הראשון תואמים באופן דומה לערכים הגבוהים של השני, למשתנים יש מתאם חיובי. במקרה זה, לקו המצוי דרך נקודות הנתונים יש שיפוע חיובי.

    בדוק את עלילת הפיזור ללא קשר בין המשתנים. אם נקודות הנתונים בעלילת הפיזור מופצות באופן אקראי ללא קשר נראה לעין בין השתיים, אין להן שום מתאם, או מתאם קטן וחסר חשיבות סטטיסטית. במקרה זה, קו שנמשך בנקודות הנתונים הוא אופקי עם שיפוע שווה לאפס.

    התאם קו דרך נקודות הנתונים ובחן את צורתו כדי לאמוד את אופי הקשר בין שני המשתנים. קו ישר מתפרש כקשר ליניארי, צורה מעוקלת מצביעה על קשר ריבועי, וקו ששוכב יחסית שטוח לפני שפתאום הירי למעלה או למטה מתפרש כקשר מעריכי.

    בחן את עלילת הפיזור עבור ממציאים, ערכים שנמצאים רחוק בצורה חריגה מאשכול נקודות הנתונים. מחיקים מעוותים את הקשר בין המשתנים. ביטלו אותם, אך רק אם היעדרם אינו משפיע על ניתוח היחסים בין שני המשתנים.