נושא הפרוייקט

מספר פרוייקט מחלקה שמות סטודנטים אימייל שמות מנחים

אבטחה ופרטיות בבעיות למידה

Security and Privacy in Multi Arm Bandit Problems

תקציר בעיברית

הפרויקט נוגע בבעיית 'מולטי ארם בנדיט' תחת הגבלות של תקציב ופרטיות. המטרה היא לקבל החלטות באופן אופטימלי בסבבי הימור, תוך צמצום ה'חרטה' ושמירה על פרטיות. אנחנו מכוונים לפיתוח אסטרטגיה לאליס להשקיע את התקציב שלה באפקטיביות ולקבל החלטות טובות. בפתרון שלנו אנו נעזרים בשני סבבים "מזויפים" על מנת ללמוד על הפרמטר אותו משערכים, כאשר אליס לומדת מסבבים אלו אבל לא מהמרת. בסבב השלישי היא מהמרת ומשחקת. איב צריכה להחליט עצמאית. הפרויקט מעריך אסטרטגיות שונות בהתבסס על הפרס והחרטה המצטברת. משווה את הגישה לפתרון לפתרון הקלאסי ומנתח את ההשפעה של תקציב במהלך הסבבים. אנחנו מדגישים את השקלול בין הגבלות תקציב, בחירת מכונות, חרטה מצטברת ותוצאות. זה נותן תובנות על קבלת החלטות באופן אפקטיבי, בצורה חסויה תחת הגבלות תקציב ועוזר לפתח אסטרטגיות אופטימליות יותר לסיטואציות דומות.

תקציר באנגלית

This project addresses the Multi-Armed Bandit (MAB) problem with a limited budget constraint to be private. The aim is to optimize decision-making in gambling rounds while minimizing regret and doing so in privacy.

We target the development of a strategy for Alice to allocate her budget effectively and make informed decisions in privacy.

Method of Solution: By introducing two "fake" rounds to learn about the true parameter