נושא הפרוייקט
מספר פרוייקט
מחלקה
שמות סטודנטים
אימייל
שמות מנחים
חיזוי מתחמי ענישה על בסיס כתבי אישום
Predicting length of punishment based on indictments
תקציר בעיברית
השילוב של כלי בינה מלאכותית (AI) עם מסמכים משפטיים כדי לסייע במשימות עיבוד שפה טבעית (NLP) צובר תאוצה הן באקדמיה והן בתעשייה. הוצאת מידע ממסמכים משפטיים, במיוחד עבור פסקי דין, היא משימה מכרעת במערכת המשפט. עם זאת, מדובר בתהליך עתיר משאבים וגוזל זמן שלעיתים מוביל להחלטות לא עקביות. כדי להתמודד עם אתגרים אלו, טכניקות מיצוי מידע אוטומטיות הממנפות בינה מלאכותית יכולות להפחית באופן משמעותי את המאמץ והזמן הנדרשים לניתוח כמויות גדולות של טקסטים משפטיים, ולאפשר לאנשי מקצוע וחוקרים משפטיים להתמקד בניתוח וקבלת החלטות ברמה גבוהה יותר. בהקשר של שיטת המשפט בישראל, בה נהוגים הן המשפט המקובל והן המשפט האזרחי, שופטים שופטים לשיקוליהם שלושה היבטים: הערך החברתי שנפגע מהפשע, מידת הפגיעה בערך החברתי ומדיניות הענישה שננקטה. . בעוד ששני ההיבטים הראשונים מסתמכים על פרשנותו של השופט, מדיניות הענישה כוללת חיפוש אחר פסקי דין דומים. כדי למצוא פסקי דין דומים למקרה נתון, יש לזהות אירועים מרכזיים מפסקי דין דומים כדי לייעד את מדיניות הענישה במקרים כאלה. חילוץ אוטומטי של אירועים מרכזיים מפסקי דין מציע שני יתרונות משמעותיים. ראשית, נפח המסמכים המשפטיים הוא עצום ומתרחב ללא הרף, מה שהופך את החילוץ הידני לבלתי מעשי. אוטומציה יכולה לייעל את התהליך ולאפשר לאנשי מקצוע משפטיים להתמקד במשימות ברמה גבוהה יותר. שנית, חילוץ אוטומטי משפר את הדיוק והעקביות של אחזור מידע, וממזער שגיאות, השמטות וחוסר עקביות שיכולים להתרחש עם סקירה ידנית. עם זאת, חילוץ אוטומטי של אירועי מפתח מציבה אתגרים משלה. היעדר נתונים מתויגים לתיקים פליליים, הקשורים ספציפית לאירועים המשפיעים על ענישה, מעכב את הפיתוח של מודלים כלליים. יתר על כן, מגוון התיקים הפליליים מחייב אירועי מפתח מותאמים אישית לכל סוג פשע. מורכבות השפה העברית מציבה אתגרים גם בשל המבנים הלשוניים הייחודיים, המורפולוגיה העשירה ותבניות ההטיה, הצמידה ודפוסי היווצרותה הנרחבים. מאמר זה מציג את התוצאות הראשוניות של כלי למידת מכונה שנועד לזהות אירועים מרכזיים מפסקי דין פליליים ישראלים. הכלי נועד להקל על השוואה בין מקרים שונים על סמך האירועים העיקריים שלהם. כדי לטפל במחסור בנתונים מתויגים, נבחר מודל מתודולוגי של כמה יריות, שאינו דורש כמות גדולה של נתונים מתויגים. התרומות העיקריות של מחקר זה כוללות זיהוי אירועים מרכזיים בפסקי דין פליליים בישראל המשפיעים על קבלת החלטות בענישה, הדגמת יעילותו של הכלי בחילוץ אירועים מרכזיים מפסקי דין ספציפיים לתחום (כגון, תיקים הקשורים לסמים ולנשק), ומתן ראשוני. עדות ליעילות הכלי באיתור פסקי דין פליליים דומים בעברית.
תקציר באנגלית
The integration of artificial intelligence (AI) tools with legal documents to aid natural language processing (NLP) tasks is gaining momentum in both academia and industry. Extracting information from legal documents, especially for judgments, is a crucial task in the legal system. However, this is a resource-intensive and time-consuming process that sometimes leads to inconsistent decisions. To address these challenges, automated information extraction techniques leveraging artificial intelligence can significantly reduce the effort and time required to analyze large amounts of legal texts, allowing legal professionals and researchers to focus on higher-level analysis and decision-making. In the context of the legal system in Israel, where both common law and civil law are practiced, judges consider three aspects for their consideration: the social value damaged by the crime, the degree of damage to the social value and the punishment policy adopted. . While the first two aspects rely on the judge's interpretation, the sentencing policy involves a search for similar judgments. To find similar judgments for a given case, one must identify key events from similar judgments in order to designate the punishment policy in such cases. Automatic extraction of key events from judgments offers two significant advantages. First, the volume of legal documents is huge and constantly expanding, making manual extraction impractical. Automation can streamline the process and allow legal professionals to focus on higher level tasks. Second, automated extraction improves the accuracy and consistency of information retrieval, and minimizes errors, omissions, and inconsistencies that can occur with manual review. However, automatically extracting key events poses its own challenges. The lack of labeled data for criminal cases, specifically related to events that affect sentencing, hinders the development of general models. Furthermore, the variety of criminal cases requires customized key events for each type of crime. The complexity of the Hebrew language also poses challenges due to the unique linguistic structures, the rich morphology and the patterns of inflection, conjugation and its extensive formation patterns. This article presents the initial results of a machine learning tool designed to identify key events from Israeli criminal judgments. The tool is designed to facilitate comparison between different cases based on their main events. To address the lack of labeled data, a few-shot methodological model was chosen, which does not require a large amount of labeled data. The main contributions of this study include identifying key events in criminal judgments in Israel that influence sentencing decisions, demonstrating the tool's effectiveness in extracting key events from domain-specific judgments (such as cases related to drugs and weapons), and providing an initial. Evidence of the effectiveness of the tool in locating similar criminal judgments in Hebrew.