נושא הפרוייקט
מספר פרוייקט
מחלקה
שמות סטודנטים
אימייל
שמות מנחים
ניתוח נתוני עתק לחיזוי תפוצת מקרופמינה בכותנה
Big Data Analysis to predict Macrophomina Phaseolina Spread in Cotton
תקציר בעיברית
נושא המחקר מתמקד בביצוע ניתוח נתוני עתק להבנת מקרופומינה בכותנה, ובאופן ספציפי בכותנת פימה. כיום, פטריית המקרופומינה מהווה איום משמעותי על גידולי כותנה, וגורמת לנזקים. הפתוגן תוקף את השורשים והגבעולים של צמחי הכותנה, מה שמוביל לריקבון שורשים ולנקבי גזע שפוגעים בבריאות הצמח. נגיעות מקרופומינה מפחיתות את תפוקת הכותנה, וגורמות להפסדים כלכליים לחקלאים. יתר על כן, המחלה יכולה לשרוד באדמה במשך מספר שנים, מה שמוביל לפגיעה ארוכת טווח בייצור הכותנה ומקשה על יישום אסטרטגיות ניהול יעילות. מטרת הפרויקט הינה להשיג הבנה מקיפה לגורמים להתפרצות המחלה בגידולי כותנה, לזהות דפוסים או מתאמים פוטנציאליים במערכים גדולים, ולפתח אסטרטגיות יעילות למניעה ובקרה. נכון להיום, תחום המחקר של מקרופומינה בכותנה מתמודד עם אתגרים בשל המורכבות ונפח הנתונים הזמינים, דבר שמקשה על מיצוי תובנות יקרות ערך. בפרויקט זה, ניסינו לטפל בבעיה הנ״ל על ידי מינוף טכניקות מתקדמות של ניתוח ביג דאטה, כגון אלגוריתמים של למידת מכונה ומודליי חזוי, ובכך לשפר את ההבנה של הגורמים להתפרצות המחלה ואת אסטרטגיות ניהולה בייצור כותנה. תהליך המחקר החל באיסוף וביצועי תהליכי ETL של מערכי נתונים גדולים ממספר מקורות, המכילים מידע על גידולי כותנה. במהלך הפרויקט נתקלנו באתגרים כמו בעיות באיכות הנתונים, בחירת תכונות ומורכבות המודל. עם זאת, אתגרים אלה טופלו באמצעות עיבוד מקדים של נתונים, הנדסת תכונות ובחירת אלגוריתמים מתאימים. השתמשנו במגוון טכניקות feature selection כדי לחלץ רק את המידע רלוונטי ממערך הנתונים. לאחר מכן, אלגוריתמים שונים של למידת מכונה, כגון עצי החלטה, וXGBoost יושמו לפיתוח מודלי חיזוי. מודלים אלה אומנו והוערכו באמצעות טכניקות כמו cross validation ומדדי ביצועים. ברגע שהתקבל מודל חסין, הוא יושם כדי לאפשר חיזוי וקבלת החלטות. מחקרינו זיהה גורמים פוטנציאליים, חלקם ניתנים לשליטה וחלקם לא, שעלולים להיות קשורים להתרחשות והתפשטות מקרופומינה ובתקווה, באמצעות ידע זה, חקלאים יכולו לנקוט באמצעי מניעה ובקרה במקרים מסויימים. לסיכום, פרויקט זה מדגיש את הפוטנציאל של ניתוח נתוני עתק במחקר מקרופומינה בכותנה. תהליך המחקר, המודלים והיישום שנעשו בשפת Python מספקים מסגרת חשובה לניהול מחלות משופר בייצור כותנה. עם זאת אנו חושבות שיש מקום לפרויקט המשך בו יבחנו מערכי נתונים גדולים יותר וכן כאלה שמכילים תיעוד על עוצמת מחלת המקרופומינה. אנו מקוות שהתוצאות והממצאים של פרויקט הנוכחי יתרמו במידה מסויימת לקבלת החלטות מושכלות עבור חקלאים, אגרונומים וקובעי מדיניות, ויקלו על ההגנה והאופטימיזציה של גידולי כותנה תוך הפחתת ההשפעות השליליות של מקרופומינה.
תקציר באנגלית
ETL, Machine-Learning, Agriculture, Decision-Trees, Big-Data