נושא הפרוייקט
מספר פרוייקט
מחלקה
שמות סטודנטים
אימייל
שמות מנחים
ניתוח נתונים להבנת גדודית פולשת בתירס
Data Analysis to Predict Fall Armyworm Spread
תקציר בעיברית
נושא הפרויקט הוא ניתוח נתונים אגרוטכניים וגאוגרפיים להבנת השפעת המזיק 'גדודנית פולשת' (Spondoptera frugiperda) המכונה גד"פ על גידולי התירס בישראל. הגד"פ היא מזיק המצוי בדר"כ באזורים טרופיים וסובטרופיים כמו במדינות בדרום אמריקה, באפריקה ועוד. הגד"פ תועדה לראשונה בישראל בשנת 2018 ומסתמן כי לטיפוס המזיק הקיים בארץ יש העדפה לדגנים ובמיוחד לתירס מתוק. הגד"פ גורמת כיום לנזק משמעותי לגידולי התירס בישראל ונזקים אלו נצפים לאורך כל שלבי הגידול. נכון להיום, האמצעי היחיד להפחתת אוכלוסיות הגד"פ ונזקיה, נעשה כריסוס תגובתי בתכשיר כימי ייעודי, כאשר יש זיהוי של הגד"פ בשטח, זאת ללא ידע מעמיק על הקשרים או ההשפעה של הגורמים האגרוטכניים והגאוגרפיים וכיו"ב. מגבלה זו, מהווה אבן נגף משמעותית, הפוגעת באיכות הייבול ובכמותו ואף מקשה על החלקאים להיערך להיקף העלויות, בהתאם למאפייני החלקה,היקף הריסוסים, מחיר התכשירים ויישומם בהתאם למאפייני החלקה. מטרת הפרויקט הנה לאפיין ולאבחן את המידע האגרוטכני והגאוגרפי, העומד לרשות החקלאי, ושלהם השפעה על הימצאות הגד"פ בשדה. בעזרת טכניקות עיבוד נתונים מתקדמות ומודלים של למידת מכונה (Machine-Learning), נוכל לחזות את מספר הריסוסים הנדרשת לכל חלקה על פי הגורמים הנ"ל. תהליך המחקר המורכב התבצע בעזרת שימוש בשפת התוכנה Python. ביצוע תהליכי ETL – שכללו איסוף וריכוז נתונים ממספר מקורות מידע אודות נגיעות המזיק, תנאי מזג האוויר, מאפייני קרקע ושיטות עיבוד חקלאות. לאחר מכן בוצע עיבוד ראשוני של הנתונים שנאספו ששילב טיפול בערכים חסרים, התייחסות לחריגים, שינוי משתנים לפי הצורך והוספת נתונים מחושבים. בהמשך, למטרות מידול, בוצעו מבחני VIF כדי לבחון היתכנות למולטיקוליניאריות בין המשתנים תוך המרת משתנים קטגוריאליים לייצוגים מספריים. כדי לטפל בבעיה נבחרו מודלים רלוונטיים של למידת מכונה. בפרויקט נעשה שימוש במודלים של Random Forest ו – Linear Regression. במהלך השימוש במודלים הנ"ל חולקו הנתונים לסטים של אימון ובחינה אשר סיפקו דרך להערכה של ביצועי המודל באמצעות טכניקות של Cross Validation ומדדים כמו MSE, Accuracy and Precision. לאור המדדים שנאספו וכדי לשפר את המודל, בוצעו תהליך אופטימיזציה של ההיפרפרמטרים של המודל כדי לשפר את ביצועיו, כאשר את המודל הטוב ביותר בחיזוי כמות הריסוסים שתדרש בחלקה כנגד הגד"פ שמרנו כדי להבין מהם הגורמים המשפיעים ומהי עוצמת השפעתם ובאמצעותו ניתן יהיה לקבל החלטות בהתאם. המחקר חשף קשרים שונים, בצורה שתאמה ברובה להנחות המקדימות לגבי עוצמת המתאמים לפני הניתוח, אשר הצביעו על השפעות אפשריות של גורמים אגרוטכניים וגאוגרפיים בשדות השונים אשר חלקם ניתנים לשליטה ולהתאמה. המשתנים הבולטים שנמצאו כמשפיעים על כמות הריסוסים כנגד הגדודנית הפולשת היו - מועד הריסוס הראשון' כנגד גד"פ, ו-'מועד זריעת התירס' לסוגיו, כמו גם קשר חזק לעונת הגידול של התירס ולייעודו, המתקשרת לנתונים נוספים כמו 'כיוון הרוח' ו'מהירות הרוח' שהופיעו כממצאים ראויים לציון, שעשויים לתמוך בהשערה כי שדות שכנים תורמים להתפשטות המזיק. לסיכום, ממצאי המחקר סיפקו תובנות חשובות לגבי הדינמיקה המורכבת בין המזיק החדש לבין גידולי התירס לסוגיו בישראל. ממצאים אלו עשויים לסלול את הדרך להבנה מעמיקה יותר של הגורמים המשפיעים, אשר יאפשרו לקבל החלטות מושכלות ולבצע התאמות ממוקדות, כדי למתן את השפעות המזיק ולהפחית מהוצאות הגידול, שעלו משמעותית, עקב הופעת הגד"פ בישראל ב2018. עם זאת, אנו סבורים כי יש מקום לפרויקט המשך שבו תאסף כמות גדולה יותר של נתוני חלקות, כולל מדדי כמות היבול ושיעורי הפחת, אשר יוכלו לייצג באופן מיטבי יותר את המצב בפועל ולדייק את יכולת החיזוי.
תקציר באנגלית
Data Analysis to Predict Fall Armyworm Spread