רגרסיה לינארית - הבנת הקשר בין משתנים

רגרסיה לינארית

image

ניתוח רגרסיה לינארית באמצעות SPSS

מבוא

רגרסיה לינארית היא השלב הבא לאחר המתאם. הוא משמש כאשר אנו רוצים לחזות את ערכו של משתנה על סמך ערכו של משתנה אחר. המשתנה שאנחנו רוצים לחזות נקרא המשתנה התלוי (או לפעמים משתנה התוצאה). המשתנה בו אנו משתמשים כדי לחזות את ערכו של המשתנה האחר נקרא המשתנה הבלתי תלוי (או לעיתים משתנה החיזוי). לדוגמה, אתה יכול להשתמש ברגרסיה לינארית כדי להבין אם ניתן לחזות ביצועי בחינה על סמך זמן העדכון; האם ניתן לחזות צריכת סיגריות על בסיס משך העישון; וכן הלאה. אם יש לך שני משתנים או יותר תלויים, ולא רק אחד, עליך להשתמש ברגרסיה מרובה.

מדריך "התחלה מהירה" זו מראה לך כיצד לבצע רגרסיה לינארית באמצעות סטטיסטיקה של SPSS, וכן לפרש ולדווח על התוצאות ממבחן זה. עם זאת, לפני שנכיר לכם את הנוהל הזה, עליכם להבין את ההנחות השונות שעליהן הנתונים שלכם לעמוד בהן כדי שהרגרסיה הליניארית תתן לכם תוצאה תקפה. בהמשך נדון בהנחות אלה.

הנחות

כשאתה בוחר לנתח את הנתונים שלך באמצעות רגרסיה לינארית, חלק מהתהליך כרוך בבדיקה כדי לוודא שניתן לנתח את הנתונים שאתה רוצה לנתח באמצעות רגרסיה לינארית. עליכם לעשות זאת מכיוון שנכון להשתמש רק ברגרסיה לינארית אם הנתונים שלכם “עוברים” שש הנחות הנדרשות לצורך רגרסיה לינארית בכדי לתת לכם תוצאה תקפה. בפועל, בדיקת שש ההנחות הללו רק מוסיפה קצת יותר זמן לניתוח שלך, ומחייבת לך ללחוץ על עוד כמה כפתורים בסטטיסטיקה של SPSS בעת ביצוע הניתוח שלך, כמו גם לחשוב קצת יותר על הנתונים שלך, אבל זה משימה לא קשה.

לפני שנכיר לך את שש ההנחות הללו, אל תתפלא אם בניתוח הנתונים שלך בעצמך תוך שימוש בסטטיסטיקה של SPSS, הפרה אחת או יותר מההנחות הללו (כלומר, לא התקיימה). זה לא נדיר כאשר עובדים עם נתונים בעולם האמיתי ולא עם דוגמאות לספרי לימוד, שלרוב רק מראים לכם כיצד לבצע רגרסיה לינארית כשהכל מסתדר! עם זאת, אל תדאג. גם כאשר הנתונים שלך נכשלים בהנחות מסוימות, לעתים קרובות יש פיתרון להתגבר על זה. ראשית, נסתכל על שש ההנחות הללו:

* הנחה מס '1: יש למדוד את שני המשתנים שלך ברמה הרציפה (כלומר, הם משתני מרווח או יחס). דוגמאות למשתנים רציפים כוללים זמן עדכון (נמדד בשעות), אינטליגנציה (נמדדת באמצעות ציון מנת משכל), ביצועי הבחינה (נמדד מ -0 ל -100), משקל (נמדד בק"ג) וכן הלאה.

* הנחה מס '2: צריך להיות קשר ליניארי בין שני המשתנים. אמנם ישנן מספר דרכים לבדוק אם קיים קשר ליניארי בין שני המשתנים שלך, אך אנו מציעים ליצור מגרש פיזור באמצעות SPSS סטטיסטיקות בו אתה יכול לשרטט את המשתנה התלוי כנגד המשתנה הבלתי תלוי שלך ואז לבדוק באופן ויזואלי את הפיזור כדי לבדוק אם יש ליניאריות. המגרש שלך עשוי להיראות כמו אחד מהדברים הבאים:

מה זה רגרסיה לינארית

אם הקשר המוצג במגרש הפיזור שלכם אינו לינארי, יהיה עליכם לבצע ניתוח רגרסיה לא ליניארי, לבצע רגרסיה פולינומית או “לשנות” את הנתונים שלכם, שתוכלו לעשות באמצעות SPSS Statistics. במדריך המשופר שלנו אנו מראים לך כיצד: (א) ליצור מגרש פיזור לבדיקת לינאריות בעת ביצוע רגרסיה לינארית באמצעות סטטיסטיקה של SPSS; (ב) לפרש תוצאות מפוזרות שונות; ו (ג) לשנות את הנתונים שלך באמצעות נתונים סטטיסטיים של SPSS אם אין קשר ליניארי בין שני המשתנים שלך.

הנחה מס '3: לא אמורים להיות מתארים משמעותיים. מקדם מתח הוא נקודת נתונים נצפתה שיש לה ערך משתנה תלוי השונה מאוד לערך שחזוי משוואת הרגרסיה. מכיוון שכך, מחליף יהיה נקודה על מגרש פיזור שנמצא (אנכית) הרחק מקו הרגרסיה המציין שיש לו שארית גדולה, כפי שהודגש להלן:

חריגות ברגרסיה לינארית

הבעיה עם המממנים היא שהם יכולים להשפיע לרעה על ניתוח הרגרסיה (למשל, להפחית את ההתאמה של משוואת הרגרסיה) המשמשת לחיזוי הערך של המשתנה התלוי (התוצאה) על בסיס המשתנה הבלתי תלוי (מנבא). זה ישנה את התפוקה שמייצרת סטטיסטיקה של SPSS ותפחית את הדיוק החזוי של התוצאות שלך. למרבה המזל, כשאתה משתמש בסטטיסטיקה של SPSS כדי להריץ רגרסיה לינארית על הנתונים שלך, אתה יכול לכלול בקלות קריטריונים שיעזרו לך לאתר מחיצות אפשריות. במדריך הרגרסיה הליניארית המשופרת שלנו, אנו: (א) מראים לך כיצד לאתר מחיצות באמצעות "אבחון casewise", שהוא תהליך פשוט בעת השימוש בסטטיסטיקה של SPSS; ו (ב) לדון בכמה מהאפשרויות העומדות בפניך כדי להתמודד עם מתחרים.

הנחה מס '4: עליכם להיות עצמאים של תצפיות, אותן תוכלו לבדוק בקלות באמצעות נתון Durbin-Watson, שהוא מבחן פשוט להפעלה באמצעות סטטיסטיקה של SPSS. אנו מסבירים כיצד לפרש את התוצאה של נתון דורבין-ווטסון במדריך הרגרסיה הליניארי המשופר שלנו.

הנחה מס '5: הנתונים שלך צריכים להראות הומוצססטיות, וכאן השונות לאורך הקו המתאים ביותר נותרות דומות כשאתה נע לאורך הקו. בעוד אנו מסבירים יותר מה המשמעות של זה וכיצד להעריך את ההומוסססטסטיות של הנתונים שלך במדריך הרגרסיה הליניארית המשופרת שלנו, התבונן בשלושת המפזרים למטה, המספקים שלוש דוגמאות פשוטות: שניים של נתונים שלא מצליחים את ההנחה (המכונה הטרוסצסטיות) ואחד מהנתונים העונים על ההנחה הזו (נקרא homoscedasticity):

הומוסקדסטיות הטרסקדסטיות בגרף רגרסיה לינארית

אמנם אלה עוזרים להמחיש את ההבדלים בנתונים העונים או מפרים את ההנחה של הומוסצסטיות, נתונים בעולם האמיתי יכולים להיות הרבה יותר מבולגנים ולהמחיש דפוסים שונים של הטרוססטסטיות. לפיכך, במדריך הרגרסיה הליניארית המשופרת שלנו אנו מסבירים: (א) כמה מהדברים שתצטרך לקחת בחשבון בעת פירוש הנתונים שלך; ו (ב) דרכים אפשריות להמשיך בניתוח שלך אם הנתונים שלך לא עומדים בהנחה זו.

הנחה מס '6: לבסוף, עליכם לבדוק שהשאריות (שגיאות) של קו הרגרסיה מופצות באופן רגיל (אנו מסבירים מונחים אלה במדריך הרגרסיה הליניארי המשופר שלנו). שתי שיטות נפוצות לבדיקת הנחה זו כוללות שימוש בהיסטוגרמה (עם עקומה נורמלית המופעלת על-גבי הצגה) או עלילת P-P רגילה. שוב, במדריך הרגרסיה הליניארית המשופרת שלנו, אנו: (א) מראים לך כיצד לבדוק הנחה זו באמצעות סטטיסטיקה של SPSS, בין אם אתה משתמש בהיסטוגרמה (עם עקומה נורמלית המועברת) או עלילת P-P רגילה; (ב) להסביר כיצד לפרש דיאגרמות אלה; ו- (ג) לספק פיתרון אפשרי אם הנתונים שלך לא עומדים בהנחה זו.

אתה יכול לבדוק את ההנחות מס '2, # 3, # 4, # 5 ו- # 6 באמצעות נתונים סטטיסטיים של SPSS. יש לבדוק תחילה את ההנחות מס '2, לפני שעוברים להנחות מס' 3, # 4, # 5 ו- # 6. אנו ממליצים לבחון את ההנחות בסדר הזה מכיוון שההנחות מס '3, # 4, # 5 ו- # 6 מחייבות להפעיל תחילה את הליך הרגרסיה הליניארית בסטטיסטיקה של SPSS, כך שקל יותר להתמודד עם אלה לאחר בדיקת ההנחה מס' 2. רק זכרו שאם לא מבצעים נכון את הבדיקות הסטטיסטיות בהנחות אלה, יתכן שהתוצאות שתקבלו בעת ביצוע רגרסיה לינארית אינן תקפות. זו הסיבה שאנחנו מקדישים מספר חלקים במדריך הרגרסיה הליניארי המשופר שלנו כדי לעזור לך להשיג את זה נכון. תוכלו ללמוד יותר על התוכן המשופר שלנו בכללותו בדף התכונות שלנו: סקירה כללית, או ליתר דיוק, ללמוד כיצד אנו עוזרים בבדיקת הנחות בדף התכונות שלנו: הנחות.

איך מריצים רגרסיה לינארית ב-SPSS

לצורך הדוגמה והתרגות הורידו את הקובץ הבא:
קובץ תרגול להורדה

קובץ נתונים לניתוח סטטיסטי - אקדמיקל ACADEMYKAL

בקובץ קיימים נתונים דמוגרפים רבים שיעזרו לנו לעשות ניתוחים סטטיסטיים שונים, נתמקד כרגע בהרצת רגרסיה לינארית

מדריך רגרסיה לינארית ב-SPSS

תפתחו את הקובץ SPSS ולחצו:

Analyze > Regression > Linear

רגרסיה לינארית SPSS חלון הכנסת הנתונים


יפתח חלון הבא:

רגרסיה לינארית SPSS חלון הכנסת משתנים

בחלון שנפתח יש לבחור משתנה תלוי ובלחיצה על כפתור statistics button in spss להכניס אותו לרגרסיה לאחר מכן יש לבחור משתנים המסבירים ובלחיצה על כפתור statistics button in spss להכניסם לרגרסיה גם. לצורך הדוגמה בחרנו במשתנה תלוי (מוסבר) שכר ומשתנים בילתי תלויים (מסבירים) גיל מין ושנות לימוד. לאחר בחירת המשתנים יש ללחוצ על כפתור statistics button ok spss


הסבר של פלט SPSS - רגרסיה לינארית

הצהרה על הבעיה

רגרסיה לינארית SPSS חלון הכנסת משתנים רגרסיה לינארית SPSS חלון הכנסת משתנים

טבלת Model Summary

טבלה זו מציגה את ערכי R ו- R2. ערך R מייצג את המתאם הפשוט והוא 0.395 (העמודה "R"), מה שמצביע על דרגה גבוהה של מתאם. ערך ה- R2 (העמודה "ריבוע R") מצביע על כמה מהשונות הכוללת במשתנה התלוי, מחיר, ניתן להסביר על ידי המשתנה הבלתי תלוי, הכנסה. במקרה זה ניתן להסביר 15.6% שזה נמוך מאוד.


טבלת ANOVA

הטבלה הבאה היא טבלת ANOVA, המדווחת עד כמה משוואת הרגרסיה מתאימה לנתונים (כלומר, חוזה את המשתנה התלוי) והיא מוצגת להלן:

טבלה זו מצביעה על כך שמודל הרגרסיה מנבא היטב את המשתנה התלוי. כיצד אנו יודעים זאת? התבונן בשורת "רגרסיה" ועבור ל"סיג ". טור. זה מצביע על המשמעות הסטטיסטית של מודל הרגרסיה שהופעל. כאן, p <0.0005, שהוא פחות מ- 0.05, ומציין כי בסך הכל, מודל הרגרסיה מנבא באופן סטטיסטי את משתנה התוצאה (כלומר, הוא מתאים להתאים).


טבלת Coefficients

טבלת מקדמים מספקת לנו את המידע הדרוש כדי לחזות את המחיר מההכנסה, כמו גם לקבוע אם ההכנסה תורמת באופן סטטיסטי למודל (על ידי התבוננות בעמודה "סיג."). יתר על כן, אנו יכולים להשתמש בערכים בעמודה "B" בעמודה "מקדמים לא סטנדרטיים", כמוצג להלן:

להציג את משוואת הרגרסיה כ:

wage=-121519+35361(schyears)+58074(sex)+37637(national)

במילים אחרות כל שנת לימוד מוסיפה 35361 ש'ח גבר מרוויח 58074 ש'ח יותר מאשה ויהודים מרוויחים 37637 ש'ח יותר מאחרים. ניתן לראות כי כל התוצאות מובהקות (sig=0.000)
החותך עם הציר y הינו -121519

{ניתוח סטטיסטי}

מאמרים נוספים

image

ניתוח סטטיסטי

סטטיסטי F

image

ניתוח סטטיסטי

קרונבך אלפא

image

ניתוח סטטיסטי

סטטיסטיקה תיאורית

image

ניתוח סטטיסטי

ניתוח שונות חד כיווני

image

ניתוח סטטיסטי

ניתוח שונות דו כיווני

image

ניתוח סטטיסטי

anova

image

ניתוח סטטיסטי

בדיקות מהימנות

image

ניתוח סטטיסטי

מתאם פירסון

image

ניתוח סטטיסטי

Chi-square (מבחן חי בריבוע)

image

ניתוח סטטיסטי

t-test (מבחן t)

image

ניתוח סטטיסטי

CRONBACH'S ALPHA (קרונבך אלפא)

image

ניתוח סטטיסטי

ניתוח שונות

image

ניתוח סטטיסטי

SPSS, STATA, EXCEL

התאמות נגישות באתר
שינוי צבע טקסט
שינוי צבע רקע
שינוי צבע כותרות
הגדלה והקטנת הגופן
שינוי מרווח בין שורות
שינוי מרווח בין אותיות
icon

השאירו פרטים

ואנו נחזור אליכם בהקדם