נושא הפרוייקט
מספר פרוייקט
מחלקה
שמות סטודנטים
אימייל
שמות מנחים
אישכול של תהליכי טיפול בהפריה חוץ גופית וויזואליזציה של הקבוצות השונות
clustering of IVF treatment processes and visualization of the different groups
תקציר בעיברית
הפריה חוץ גופית (IVF) היא אחד הטיפולים הנפוצים ביותר מבין טיפולי פוריות מתקדמים. במסגרת טיפול הפוריות מתבצע גירוי שחלתי להגדלת מספר הזקיקים הבוגרים, לאחר מכן מתבצעת שאיבת ביציות מגוף האישה בשילוב עם תאי הזרע, המופרות בתנאי מעבדה. לאחר מכן, העובר מוחזר לרחם תוך מתן טיפול הורמונלי תומך. על פי נתונים משנת 2020, כ-15% מהזוגות יתקלו במצבים של ניסיון להיכנס להריון, ושיעור ההצלחה של טיפולי הפריה חוץ גופית עומד על כ-30%. ישנם מספר פרוטוקולים לטיפול בהפריה חוץ גופית, אך הרופאים מתקשים להחליט על פרוטוקול אופטימלי עבור מטופל ספציפי. מטרת הפרויקט שלנו היא ליצור כלי לרופאים ולסייע להם בבחירת מסלולי טיפול שיגדילו את סיכויי ההצלחה להשגת הריון מוצלח. במהלך עבודתנו בפרויקט, קיבלנו נתונים ממחלקת הפריה חוץ גופית של בית החולים אסותא, הכוללים מעל 20 טבלאות נתונים עם כ-120 עמודות. נתונים אלו מתארים מידע רפואי של כ-20 אלף מחזורי טיפול. הנתונים היו ברמת מורכבות גבוהה ואחת המטרות העיקריות הייתה להבין את הנתונים, לארגן אותם ולנקות אותם כך שישמשו אותם לניתוח במורד הזרם. באופן הגיוני חילקנו את הנתונים לחמישה שלבים במחזור הטיפול: מידע רקע לפני תחילת הטיפול, שלב הטיפול התרופתי (פרוטוקול נבחר), שלב ההפריה, שלב החזרת העובר ושלב התוצאות. לאחר מכן אנו מקבצים נתונים מכל שלב באופן עצמאי כדי למצוא קבוצות אופטימליות המבדילות את המטופלים זה מזה. כמו כן בנינו כלי ויזואליזציה המציג את תוצאות האשכולות ואת קצבי המעבר בין אשכולות. ההדמיה היא דינמית כך שהמשתמש יכול להתמקד באשכול ספציפי ולהוסיף שכבות נוספות של מידע כמו ההתפלגות של תכונות וסיכויי הצלחה של אותו אשכול. באמצעות הכלי שלנו, המטפל יכול להשתמש בזה לסקירה ברמה גבוהה של מסלולי טיפול שונים, ויכול גם להשתמש בו כמערכת תומכת החלטות לבחירת הפרוטוקול האופטימלי עבור מטופל בודד.
תקציר באנגלית
In vitro fertilization (IVF) is one of the most common treatments among advanced fertility treatments. As part of the fertility treatment, ovarian stimulation performed to increase the number of mature follicles, then eggs are extracted from the woman's body, combined with the sperm cells, and fertilized under laboratory conditions is made. After that, the fetus is returned to the uterus, while providing supportive hormonal treatment. According to data from 2020, about 15% of couples will encounter conditions of trying to get pregnant, and the success rate of IVF treatments is about 30%. There are several IVF treatment protocols, but doctors have difficulty deciding on an optimal protocol for a specific patient. The goal of our project is to create a tool for doctors and assist them in choosing treatment paths that will increase the chances of success for achieving a successful pregnancy. During our work on the project, we received data from the IVF department of Assuta Hospital, including over 20 tables of data with about 120 columns. This data describes medical information of about 20 thousand treatment cycles. The data was at a high level of complexity and one of the main goals was to understand the data, organize it and clean it so it be used for downstream analysis. We logically divided the data into five stages in the treatment cycle: Background information before starting treatment, Medication stage (selected protocol), Fertilization stage, Embryo retrieval stage, and Results stage. Then we cluster data from each stage independently to find optimal groups that differentiate the patients from each other. We also built a visualization tool that shows the results of the clustering and the transition rates between clusters. The visualization is dynamic such that the user can focus on a specific cluster and add additional layers of information like distributions of features and rates of different outcomes. Using our tool, the care provider can use that for a high-level overview of different treatment paths, and can also use it as a decision support system for choosing the optimal protocol for an individual patient.