כיצד אנו מבררים את משמעותם של מושגים מופשטים כדוגמת "נקמה" או "דיכאון" ומזהים את ביטוים בטקסט כתוב?

במימון משרד הביטחון, פותחה באוניברסיטת בן-גוריון מתודולוגיה חדשנית לחילוץ משמעותם של מושגים באמצעות "אינטליגנציה וובית" (Web Intelligence). ממצאים ראשונים של המתודולוגיה עתידים להיות מוצגים בכנס שיתקיים ב-31 באוגוסט בטורונטו, שבקנדה: The 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology

פרופ' יאיר נוימן, מהמחלקה לחינוך באוניברסיטה, עומד בראש צוות רב תחומי, המפתח את המתודולוגיה. במסגרת זו נבדקה היכולת לזהות באופן אוטומטי דיכאון בטקסטים. המערכת נבדקה, על מספר קבצי נתונים ובהם למעלה מ- 1000 פניות של אנשים לאתר פופולארי לבריאות הנפש בארה"ב.

נמצא שהמערכת שיפרה בעשרה אחוזים את דיאגנוזת הדיכאון בטקסט. יתירה מכך, המערכת נבדקה גם על קובץ בלוגים עצום וזיהתה את 1000 הפוסטים המדוכאים ביותר. מתוכם 100 המדוכאים ביותר על פי שיפוט המערכת ו-100 המדוכאים פחות על פי שיפוט המערכת, הועברו לשיפוטם של ארבעה פסיכולוגים מומחים. נמצא שהמערכת זיהתה בהצלחה של קרוב ל 80% את הפוסטים שהפסיכולוגים תארו כמדוכאים.

פרופ' נוימן טוען שזהו שלב ראשון בהחדרתן של טכנולוגיות עיבוד מידע לניתוח פסיכולוגי מאסיבי של נתונים. למערכות מסוג זה עשוי להיות ערך רב למגוון יישומים אזרחיים ומודיעיניים כאחד.