נושא הפרוייקט
מספר פרוייקט
מחלקה
שמות סטודנטים
אימייל
שמות מנחים
שיפור קבלת החלטות באמצעות דפוסים טמפורלים
Improving decision making using TIRPs
תקציר בעיברית
מקבלי ההחלטות עושים שימוש במידע טמפורלי של אוכלוסיות על מנת לקבל תובנות על העולם שלהם. לדוגמא, רופא שמקבל נתוני מטופל הנאספים לאורך זמן שהותו בבית החולים למשל לחץ דם, סוכר ועוד. על מנת להבין את הנתונים ולהשוות למקרי עבר, ניתן למצוא קווי דימיון בין המטופל למטופלים בעלי התנהגות דומה בנתוניהם. כדאי לשפר את תהליך זה נוכל לעשות שימוש באלגוריתם המוצא דפוסים נפוצים בקרב האוכלוסיה. אנחנו רוצים לשפר את תהליך מציאת הדפוסים ולעשות שימוש נכון בהם על מנת לסייע למקבלי ההחלטות. אנחנו נסתכל על תהליך שזה משני כיוונים, למידת מכונה וויזואליזציה. ראשית, תהליך מציאת הדפוסים הינו תהליך ארוך של ניסוי ותהייה שמתבסס על שינוי פרמטרי אלגוריתם כריית הדפוסים. המטרה היא להשיג דפוסים שהם משמעותיים לנו מבחינת הנתונים. בנוסף, זמן מציאת הדפוסים לעיתים הוא אספקט קריטי עבור מקבלי ההחלטות. כרייה שמסתיימת מהר אינה תניב בהכרח דפוסים טובים או תמצא דפוסים בכלל, וכרייה ארוכה תניב דפוסים ארוכים שאינם בעלי משמעות גדולה. נרצה שבהינתן מאגר נתונים טמפורלי והינתן סט פרמרטים עבור האלגוריתם, נוכל לתת אינדקציה מסוימת לגבי כמות הזמן שיקח לאלגוריתם למצוא דפוסים ולגבי כמות הדפוסים אותו ימצא. שנית, קבלת החלטות בשימוש מידע טמפורלי יעילה יותר כאשר ישנה הפרדה ברורה לשתי קבוצות באוכלוסיה המכילות דפוסים שונים. כדאי להציג את הדפוסים הללו, נציע שיטה לייצוג ויזואלי המאפשרת לבצע חקר אישי באוכלוסיה. שיטה זו תאפשר לראות עבור כל יישות באוכלוסיה מסוימת כיצד הדפוסים הנפוצים של האוכולסיה בו הוא נמצא נראים במידע הטמפורלי שלו.
תקציר באנגלית
Decision makers use temporal data in order to get a better understanding of their study population. For example, a doctor receives a patient’s data gathered over his stay in the hospital, including blood pressure, glucose count, etc. To better understand the new data, it is often compared to past cases. Frequent patterns are found across the population using a frequent pattern mining algorithm. We want to improve the process of finding frequent patterns and make good use of them to better help the decision makers. We can do that in 2 ways: machine learning and visualization methods. Firstly, the process of finding frequent patterns is a process of trial and error that relies on changing the parameters of the mining algorithm. The goal is to achieve patterns that hold true meaning to the data and the decision-maker. In addition, mining time is often a critical aspect for the decision-maker. A fast mining algorithm might result in finding less important patterns or any patterns at all, while a slow mining algorithm might find long meaningless patterns. Given a temporal dataset and a parameter set for the algorithm, we want to create a methodology that estimates how long it will take to mine patterns as well as estimate how many patterns it will find. Secondly, coming to a decision regarding a population is better when there is a clear separation of 2 outcome groups containing rather different patterns. To visualize the found patterns, we propose a novel solution for visualizing population data. This solution will show how frequent patterns form in each of the entities’ temporal data in the population.