ניתוח שונות

ניתוח שונות - Analysis of Variance (ANOVA)
מהו ניתוח השונות (ANOVA)?
ניתוח השונות (ANOVA) הוא כלי ניתוח המשמש בסטטיסטיקה המפצל משתנות מצטברת שנצפתה שנמצאת בתוך מערך נתונים לשני חלקים: גורמים שיטתיים וגורמים אקראיים. לגורמים השיטתיים יש השפעה סטטיסטית על מערך הנתונים הנתון, ואילו הגורמים האקראיים אינם. אנליסטים משתמשים במבחן ANOVA כדי לקבוע את ההשפעה שיש למשתנים עצמאיים על המשתנה התלוי במחקר רגרסיה.
שיטות הבדיקה t ו- z שפותחו במאה העשרים שימשו לניתוח סטטיסטי עד שנת 1918, אז יצר רונלד פישר את ניתוח שיטת השונות. ANOVA נקראת גם ניתוח פישר של שונות, והיא הרחבה של מבחני ה- t- וה- z. המונח התפרסם בשנת 1925, לאחר שהופיע בספרו של פישר, "שיטות סטטיסטיות לעובדי מחקר." זה הועסק בפסיכולוגיה ניסיונית והתרחב בהמשך לנושאים מורכבים יותר.
הנוסחה ל- ניתוח שונות - ANOVA היא:
כאשר:
F=מקדם של ניתוח שונות
MST=ממוצע סכום הריבועים עקב טיפול
MSE=ממוצע סכום הריבועים עקב שגיאה
מה חושף ניתוח השונות?
מבחן ה- ANOVA הוא הצעד הראשוני בניתוח גורמים המשפיעים על מערך נתונים נתון. לאחר סיום הבדיקה, אנליסט מבצע בדיקות נוספות על הגורמים השיטתיים התורמים באופן מדיד לחוסר העקביות של מערך הנתונים. המטפל משתמש בתוצאות הבדיקה של ANOVA במבחן f כדי לייצר נתונים נוספים המתאימים למודלי הרגרסיה המוצעים.
מבחן ה- ANOVA מאפשר השוואה של יותר משתי קבוצות בו זמנית כדי לקבוע אם קיים קשר ביניהם. התוצאה של נוסחת ה- ANOVA, סטטיסטיקת F (נקראת גם יחס ה- F), מאפשרת ניתוח של קבוצות נתונים מרובות כדי לקבוע את השונות בין דגימות בתוך דגימות.
אם לא קיים הבדל ממשי בין הקבוצות שנבדקו, שנקראת השערת האפס, התוצאה של נתוני יחס ה- F של ה- ANOVA תהיה קרובה ל 1. תנודות בדגימה שלה עשויות לעקוב אחר התפלגות פישר F. זוהי למעשה קבוצה של פונקציות חלוקה, עם שני מספרים אופייניים, הנקראים דרגות החופש של המונה ומכנות דרגות החופש.
נקודות חשובות
ניתוח השונות, או ANOVA, הוא שיטה סטטיסטית המפרידה בין נתוני השונות שנצפו לרכיבים שונים לשימוש בבדיקות נוספות.
ניתוח שונות חד כיווני משמש לשלוש קבוצות נתונים או יותר, כדי להשיג מידע על הקשר בין המשתנים התלויים והבלתי תלויים.
אם לא קיימת שונות שונות בין הקבוצות, יחס ה- F של ה- ANOVA אמור להיות שווה קרוב ל -1.
דוגמה לשימוש ב- ANOVA
חוקר עשוי, למשל, לבחון סטודנטים ממכללות מרובות בכדי לבדוק אם סטודנטים מאחת המכללות עולות באופן עקבי על תלמידים מהמכללות האחרות. ביישום עסקי, חוקר מו"פ עשוי לבדוק שני תהליכים שונים של יצירת מוצר כדי לראות אם תהליך אחד טוב יותר מהשני מבחינת יעילות עלות.
סוג בדיקת ANOVA המשמשת תלוי במספר גורמים. זה מיושם כאשר נתונים צריכים להיות ניסיוניים. ניתוח השונות נעשה אם אין גישה לתוכנה סטטיסטית המביאה לחישוב ANOVA ביד. זה פשוט לשימוש ומתאים ביותר לדגימות קטנות. עם הרבה עיצובים ניסויים, גדלי הדגימה צריכים להיות זהים עבור שילובי רמת הגורמים השונים.
ANOVA מועיל לבדיקת שלושה משתנים או יותר. זה דומה t-test (מבחן-t) דו-מדגמיות מרובות. עם זאת, התוצאה היא פחות שגיאות מסוג I ומתאימה למגוון בעיות. ANOVA מקבצת הבדלים על ידי השוואה בין האמצעים של כל קבוצה וכוללת הפצת השונות למקורות מגוונים. זה מועסק עם נבדקים, קבוצות מבחן, בין קבוצות ותוך קבוצות.
ניתוח שונות חד כיווני לעומת ניתוח שונות דו כיווני
ישנם שני סוגים של ANOVA: חד כיוונית (או חד כיוונית) ושני כיוונים. חד כיווני או דו כיווני מתייחס למספר המשתנים העצמאיים בניתוח בדיקת השונות שלך. ניתוח שונות חד כיווני מעריך את ההשפעה של גורם יחיד על משתנה התגובה היחיד. זה קובע אם כל הדגימות זהות. ניתוח שונות החד-כיוונית משמשת לקביעת האם יש הבדלים מובהקים סטטיסטית בין האמצעים של שלוש קבוצות עצמאיות או יותר (לא קשורות).
ניתוח שונות דו כיווני היא הרחבה של ניתוח שונות חד כיוונית. בכיוון אחד יש לך משתנה עצמאי אחד המשפיע על משתנה תלוי. עם ניתוח שונות דו כיווני, ישנם שני עצמאים. לדוגמה, ניתוח שונות דו כיוונית מאפשרת לחברה להשוות את תפוקת העובדים על בסיס שני משתנים עצמאיים, כגון שכר ומערך מיומנות. הוא משמש כדי להתבונן באינטראקציה בין שני הגורמים ובודק את ההשפעה של שני גורמים בו זמנית.
{ניתוח סטטיסטי}