היתרונות והחסרונות של מודל רגרסיה מרובה

Posted on
מְחַבֵּר: Laura McKinney
תאריך הבריאה: 9 אַפּרִיל 2021
תאריך עדכון: 17 נוֹבֶמבֶּר 2024
Anonim
12 .אופטימיזציה וחיזוי - רגרסיה ליניארית ORANGE
וִידֵאוֹ: 12 .אופטימיזציה וחיזוי - רגרסיה ליניארית ORANGE

תוֹכֶן

רגרסיה מרובה משמשת לבחינת הקשר בין מספר משתנים עצמאיים לבין משתנה תלוי. בעוד שמודלי רגרסיה מרובים מאפשרים לך לנתח את ההשפעות היחסיות של משתנים בלתי תלויים או חיזוי אלה על משתנה התלוי או הקריטריון, קבוצות נתונים מורכבות אלה לרוב יכולות להוביל למסקנות שגויות אם הם לא נותחו כראוי.

דוגמאות לרגרסיה מרובה

סוכן נדל"ן יכול להשתמש ברגרסיה מרובה כדי לנתח את שווי הבתים. לדוגמה, היא תוכל להשתמש כמשתנים עצמאיים בגודל הבתים, גילם, מספר חדרי השינה, מחיר הבית הממוצע בשכונה והקרבה לבתי ספר. לאחר שתתכנן את אלה במודל רגרסיה מרובה, היא תוכל להשתמש בגורמים אלה כדי לראות את היחס שלהם למחירי הבתים כמשתנה הקריטריון.

דוגמה נוספת לשימוש במודל רגרסיה מרובה יכולה להיות מישהו במשאבי אנוש שקובע את שכרם של משרות ניהול - משתנה הקריטריון. משתני החיזוי יכולים להיות ותק של כל מנהלים, מספר שעות העבודה הממוצע, מספר האנשים המנוהלים ותקציב מחלקת המנהלים.

היתרונות של רגרסיה מרובה

ישנם שני יתרונות עיקריים לניתוח נתונים באמצעות מודל רגרסיה מרובה. הראשון הוא היכולת לקבוע את ההשפעה היחסית של משתנה מנבא או יותר לערך הקריטריון. סוכן הנדל"ן יכול היה לגלות כי לגודל הבתים ולמספר חדרי השינה יש מתאם חזק למחיר הבית, בעוד שלקרבת בתי הספר אין שום מתאם, או אפילו מתאם שלילי אם מדובר בעיקר בפרישה. קהילה.

היתרון השני הוא היכולת לזהות מחליקים, או חריגות. לדוגמה, תוך כדי סקירת הנתונים הקשורים למשכורות ההנהלה, מנהל משאבי האנוש יכול היה למצוא שמספר השעות שעבדו, גודל המחלקה ותקציבה, כל אלה היו בעלי קשר מתאים לשכר, בעוד שהוותק לא עשה זאת. לחלופין יכול להיות שכל ערכי החיזוי המפורטים היו מתואמים לכל אחת מהשכר שנבדק, למעט מנהל אחד ששולם יותר מדי לעומת האחרים.

חסרונות של רגרסיה מרובה

כל חסרון של שימוש במודל רגרסיה מרובה מסתכם בדרך כלל בנתונים שמשתמשים בהם. שתי דוגמאות לכך הן שימוש בנתונים לא שלמים והסקת שווא כי מתאם הוא גורם.

למשל, בבחינת מחיר הבתים, נניח שסוכן הנדל"ן הביט על 10 בתים בלבד, שבעה מהם נרכשו על ידי הורים צעירים. במקרה זה, הקשר בין קרבתם של בתי ספר עשוי לגרום לה להאמין שהדבר השפיע על מחיר המכירה של כל הבתים שנמכרו ביישוב. זה ממחיש את החסרונות של נתונים לא שלמים. לו הייתה משתמשת במדגם גדול יותר, היא הייתה יכולה לגלות שמתוך 100 בתים שנמכרו, רק עשרה אחוזים מערכי הבית היו קשורים לקרבה של בתי ספר. אם היא השתמשה בגילאי הקונים כערך מנבא, היא הייתה יכולה לגלות שקונים צעירים יותר מוכנים לשלם יותר עבור בתים בקהילה מאשר קונים מבוגרים.

בדוגמה של משכורות הנהלה, נניח שהיה מקורב אחד שהיה לו תקציב קטן יותר, פחות ותק ועם פחות כוח אדם לנהל אותו אבל עשה יותר מכל אחד אחר. מנהל משאבי אנוש יכול להסתכל בנתונים ולהסיק כי אדם זה משולם בתשלום יתר. עם זאת, מסקנה זו תהיה שגויה אם הוא לא לוקח בחשבון שמנהל זה היה אחראי על אתר החברה והיה לו מערך מיומנויות נחשק ביותר בתחום אבטחת הרשת.