
למידת מכונה (Machine Learning) היא תת תחום של בינה מלאכותית (AI) המתמקדת במתן אפשרות למחשבים ללמוד ולהסתגל באמצעות ניסיון. למידת מכונה מתבצעת עלי ידי מתן גישה למחשבים לנתונים מתוייגים המאפשרים להם לזהות דפוסים בתוך הנתונים הללו, במקום להסתמך על הוראות מתוכנתות מראש.
זה מאפשר למכונות לפתור בעיות מבלי להיות מתוכנתות לכך במפורש, ולקבל החלטות מדויקות ואמינות יותר מאלה שמתקבלות על ידי בני אדם (בתחומים מסוימים).
איך עובדת למידת מכונה?
תהליך למידת המכונה (משין לרנינג) כולל הזנת כמויות גדולות של נתונים לתוך אלגוריתם המאפשר לו לזהות דפוסים ויחסים בין קלטים ופלטים. לאחר מכן האלגוריתם משתמש בדפוסים האלה כדי לקבל תחזיות או החלטות.
לדוגמה, נזין לתוך האלגוריתם של מכונה מליוני תוצאות בדיקות דם של מטופלים, נגדיר לה מצבי חולי ומצבים אופטימליים והיא תתחיל זהות דפוסים ולהשתפר בכך ולבסוף היא תוכל לזהות מצבי חולי ביעילות גבוהה הרבה יותר מצוות פרופסורים מיומן שראה אלפי חולים. מה הסיבה? המכונה רואה מאות אלפי חולים ביום! ולכן תוך זמן אימון מסויים יהיה לה ניסיון מצטבר של אלפי רופאים.
סוגי למידת מכונה
דורון בסון ואלמוג כהן מבית התוכנה קורל טכנולוגיות מסבירים על הסוגים השונים של למידת המכונה. כדי שהמכונה תוכל ללמוד מהנתונים ולהתפתח אנחנו צריכים לאמן אותה, כלומר לכתוב מטא אלגוריתם שיתגמל אותה על תוצאות רצויות ויעניש אותה על תוצאות לא מתאימות וכך היא תדע מה לחפש. בהמשך לדוגמא הקודמת, נזין למכונה מליוני תוצאות בדיקות דם של המון מצבים רפואיים שונים ונחזק אותה כשהיא מוצאת בדיקת דם חדשה תואמת ונעניש אותה אם היא נכשלת בזיהוי.
שלושה סוגי למידת מכונה עיקריים:
למידה מונחית (Supervised Learning) )
למידה מונחית היא סוג של למידת מכונה שבה האלגוריתם שבו המודל מאומן באמצעות נתונים מתוייגים לביצוע תחזיות או סיווגים. המטרה של למידה מונחית היא ללמוד את הקשר בין תכונות הקלט (הידועות גם כמשתנים בלתי תלויים) לבין תווית הפלט (הידועה גם כמשתנה תלוי). ניתן לחלק אלגוריתמי למידה מונחים לשתי קטגוריות עיקריות: רגרסיה וסיווג. אלגוריתמי רגרסיה מנבאים ערכים מתמשכים, כמו מחירי מניות, ואילו אלגוריתמי סיווג מנבאים ערכים נפרדים, כגון זיהוי של אובייקט בתמונה.
למידה מונחית כוללת מספר שלבים:
- איסוף הנתונים ועיבוד מוקדם
- פיצול הנתונים למערכי נתונים של הדרכה ובדיקה
- אימון המודל באמצעות מערך ההדרכה שבנינו
- הערכת המודל באמצעות מערך נתוני הבדיקה
- כיוונון המודל לשיפור ביצועים
גורם מפתח להצלחת הלמידה המונחית הוא האיכות והכמות של הנתונים המתוייגים. ככל שהנתונים יהיו יותר ויותר מגוונים, כך המודל יתפקד טוב יותר. חשוב גם שיהיה מערך נתונים מאוזן, כלומר כל המחלקות מיוצגות באותה מידה (באחוזים) בנתונים.
אלגוריתמים של למידה מונחית
כמה אלגוריתמים נפוצים בלמידה מונחית כוללים רגרסיה לינארית, רגרסיה לוגיסטית, עצי החלטה, יערות אקראיים, מכונות וקטורים תומכים (SVM) ורשתות עצביות מלאכותיות. לכל אלגוריתם יש את החוזקות והחולשות שלו, ובחירת האלגוריתם תלויה בבעיה הדורשת פתרון ובסוג הנתונים שבהם נעשה שימוש.
למידה בלתי מונחית (Unsupervised Learning)
למידה בלתי מונחית היא סוג של למידת מכונה שבה האלגוריתם מאומן ללא נתונים מתוייגים. בניגוד ללמידה מונחית, שבה לנתונים יש תוויות מוגדרות מראש, בלמידה בלתי נוחית, המטרה היא למצוא דפוסים ויחסים בנתונים ללא הדרכה חיצונית. זה מאפשר לאלגוריתם לגלות מבנים חדשים בנתונים ולהציג לנו תובנות חדשות. ישנן מספר גישות נפוצות ללמידה בלתי מונחית, כולל ניתוח אשכולות, הורדת מימד וזיהוי אנומליות. ניתוח אשכול כרוך בקיבוץ נקודות נתונים דומות יחד, בעוד הורדת מימד מפחיתה את מספר המשתנים במערך הנתונים כדי להקל על תצוגת הנתונים והבנתם. זיהוי אנומליות משמש לזיהוי נקודות נתונים השונות מהנורמה ועשויות להעיד על בעיה או הזדמנות לחקירה נוספת. למידה בלתי מונחית נמצאת בשימוש נרחב ביישומים רבים, כגון פילוח שוק, ניתוח התנהגות וזיהוי חריגות במערכי נתונים גדולים (כמו חברות אשראי). למידה בלתי מונחית שימושית גם ביישומים שבהם נתונים מתוייגים אינם זמינים, כגון בעיבוד שפה טבעית (NLP), שבה ממש מסובך להגדיר את הקטגוריות של נתוני השפה. ללמידה בלתי מונחית יש יתרונות רבים, כולל היכולת להתמודד עם כמות גדולה של נתונים, גילוי תובנות חדשות והפחתת העלות של תיוג ידני (הכולל תשתיות שרתים ובניית אלגוריתמים). עם זאת, ללמידה בלתי מונחית יש כמה חסרונות, כמו הקושי להעריך את התוצאות, האפשרות לגלות דפוסים חסרי משמעות והצורך בפרשנות. נציין רק שלעולם כשלעצמו אין בעיות, והבעיות צצות רק כשיש התנגשות בין הרצונות שלנו להתנהלות העולם ולכן המכונה יכולה לזהות דפוסים מעולים ויפים שלא עוזרים לנו לפתור שום בעיה.
למידת חיזוק (Reinforcement Learning))
למידת חיזוק (RL) הוא תת-תחום של למידת מכונה המתמקדת בלמידה באמצעות אינטראקציה. הוא שואב השראה מהדרך שבה בעלי חיים ובני אדם לומדים מהתנסויותיהם. בלמידת חיזוק, סוכן לומד על ידי נקיטת ולות בסביבה וקבלת משוב בצורה של תגמולים או עונשים. המטרה של הסוכן היא למקסם את התגמול שהוא מקבל לאורך זמן. ניתן להשתמש באלגוריתמי למידת חיזוק כדי להכשיר סוכנים לבצע מגוון רחב של משימות, כגון משחק, שליטה ברובוטים או אופטימיזציה של תיקים פיננסיים בשוק ההון. רעיון הבסיסי מאחורי למידת חיזוק הוא מודל האינטראקציה בין הסוכן והסביבה כתהליך החלטה מרקובי (MDP).
בתהליך החלטה מרקובי, הסוכן בוחר פעולות על סמך מצבו הנוכחי, והסביבה עוברת למצב חדש ומספקת לסוכן פרס. ניתן לחלק את אלגוריתמי למידת חיזוק לשתי קטגוריות: שיטות מבוססות ערכים (value-based) ושיטות מבוססות מדיניות (policy-based). שיטות מבוססות ערכים, כמו אלגוריתם Q-learning. Q-learning הוא אלגוריתם למידת חיזוק, נטול מודלים, המשמש ללימוד הפעולה הטובה ביותר לנקוט במצב נתון. ערך ה-Q מייצג את התגמול הצפוי עבור נקיטת פעולה מסוימת במצב נתון, והוא מתעדכן על סמך התגמול הנצפה וערך ה-Q המקסימלי המשוער עבור המצב הבא.
האלגוריתם מנסה למצוא את המדיניות האופטימלית שממקסמת את התגמול המצטבר הצפוי, באמצעות ניסוי וטעייה ועדכון ערכי ה-Q בהתבסס על התגמולים הנצפים וערכי ה-Q המקסימליים של המצב הבא. התהליך נמשך עד שמגיעים להתכנסות או למספר מרבי של איטרציות.
שיטות מבוססות מדיניות, כמו אלגוריתם REINFORCE.
REINFORCE הוא אלגוריתם למידת חיזוק המשמש ללימוד מדיניות. REINFORCE מבוסס על אופטימיזציה של עליית שיפועים, כאשר פרמטרי המדיניות מתעדכנים בכיוון של הגדלת התגמול המצטבר הצפוי. האלגוריתם מורכב משני שלבים עיקריים: דגימה ולמידה. בשלב הדגימה, המדיניות משמשת ליצירת רצף של מצבים, פעולות ותגמולים, המכונה אפיזודה. בשלב הלמידה, הפרמטרים של המדיניות מתעדכנים בהתאם לאפיזודה, על ידי חישוב שיפוע התגמול המצטבר הצפוי ביחס לפרמטרי המדיניות ושימוש בעליית שיפוע לעדכון הפרמטרים.
האלגוריתם מכוון מדיניות, כלומר הוא מעדכן את המדיניות בהתבסס על תוצאות הפעולות שננקטו בהתאם למדיניות הנוכחית. התהליך נמשך עד שמגיעים להתכנסות או למספר מרבי של איטרציות. אחד האתגרים העיקריים בלמידת חיזוק הוא חקר מול ניצול (exploration versus exploitation). סוכן חייב לאזן בין חקירת פעולות ומצבים חדשים העשויים להוביל לתגמול גבוה יותר לבין ניצול הידע הנוכחי שלו כדי למקסם את התגמול.
פשרה זו מטופלת בדרך כלל באמצעות טכניקות אפסילון תאב הבצע (epsilon-greedy exploration) או דגימת תומפסון (Thompson sampling).
שימושים בלמידת מכונה (ML)
סיווג תמונה (Image classification)
סיווג תמונה היא משימה בתחום הראייה הממוחשבת (computer vision) שבה אלגוריתם מאומן לזהות ולסווג אובייקטים או ישויות בתמונה על סמך התכונות החזותיות שלהם.
עיבוד שפה טבעית (Natural language processing)
עיבוד שפה טבעית (NLP) הוא תחום של מדעי המחשב, בינה מלאכותית ובלשנות העוסק באינטראקציות בין מחשבים לשפות אנושיות (טבעיות).
NLP עוסק בניתוח, הבנה והפקה של השפות שבהן משתמשים בני אדם כדי ליצור אינטראקציה זה עם זה.
NLP מאפשרת למחשבים לעבד, להבין וליצור שפה אנושית, מה שמאפשר לבצע משימות כמו זיהוי דיבור, תרגום מכונה, ניתוח סנטימנטים, סיווג טקסט ומענה לשאלות.
סדרות עתיות (Time series forecasting)
חיזוי סדרות עתיות, הוא תהליך של שימוש בנתונים היסטוריים כדי לחזות ערכים עתידיים של סדרת זמן, כגון מחירי מניות, מכירות או דפוסי מזג אוויר. חיזור סדרות עתיות נעשה על ידי ניתוח דפוסים בנתונים ושימוש במודלים סטטיסטיים לביצוע תחזיות עתידיות. חיזוי סדרות עתיות נפוץ בתחומים רבים, כולל פיננסים (אלגותריידינג וזיהוי ריסק ארביטראז'), כלכלה ומטאורולוגיה, כדי לקבל החלטות מושכלות המבוססות על מגמות עתידיות.