פרוייקט השו"ת - זוכה פרס ישראל בספרות

שרת החינוך, יולי תמיר, הודיעה היום על זכייתו של פרוייקט השו"ת (השאלות והתשובות), בפרס ישראל בתחום הספרות התורנית לשנת תשס"ז

, כ"ד בשבט תשס"ז

שרת החינוך יולי תמיר, הודיעה היום (יום שני), כי הזוכה בפרס ישראל בתחום הספרות התורנית לשנת תשס"ז הוא פרויקט השו"ת (השאלות והתשובות) מאוניברסיטת בר אילן. יו"ר הועדה פרופ' אברהם שטיינברג, וחבריה הרב יעקב אריאל  הרב ד"ר רצון ערוסי,
יועץ השרה לפרסי ישראל פרופ' דב גולדברגר והממונה על פרסי ישראל גב' חיה הורביץ.

נימוקי הועדה למתן הפרס: פרוייקט השו"ת מכיל כיום את המאגר האלקטרוני הגדול בעולם של הספרות התורנית, יחד עם תוכנת חיפוש ייחודית שאין דומה לה. המאגר כולל טקסטים מוקלדים ומוגהים מארון הספרים היהודי והינו מהפרוייקטים הגדולים ביותר ביהדות שנעשו בשנים האחרונות. הטקסטים הנכללים בו מכסים אלפי שנות יצירה החל מספרות חז"ל: תלמוד בבלי וירושלמי, ספרות המדרש ועוד, עם ספרות הפרשנות, ההלכה והמנהג של הראשונים, וכלה בספרות השאלות והתשובות הכוללים כ-100,000 פסקי הלכה המשתרעים על פני כאלף שנים מכל רחבי העולם. צוות פרוייקט השו"ת יצר במשך 40 שנה, את המהפכה הזאת, המשתקפת ב-3 נקודות ייחודיות: 1. שילוב הספרות התורנית עם טכנולוגיות מתקדמות ביותר. 2. פתיחת הספרות התורנית לעשרות אלפי בתי אב ברחבי העולם. 3. זמינות ונגישות קלה ונוחה לנכסי הספרות התורנית לדורותיה. על כל אלה מצאה ועדת השופטים את פרויקט השו"ת ראוי לפרס ישראל בתחום של ספרות תורנית – יוצרים לשנת התשס"ז.

פרוייקט השו"ת – תולדות הפרוייקט

פרוייקט השו"ת מכיל כיום את המאגר האלקטרוני הגדול בעולם של הספרות התורנית, יחד עם תוכנת חיפוש ייחודית שאין דומה לה. המאגר כולל טקסטים מוקלדים ומוגהים מארון הספרים היהודי והינו מהפרוייקטים הגדולים ביותר ביהדות שנעשו בשנים האחרונות. הטקסטים הנכללים בו מכסים אלפי שנות יצירה החל מספרות חז"ל: תלמוד בבלי וירושלמי, ספרות המדרש ועוד, עם ספרות הפרשנות, ההלכה והמנהג של הראשונים, וכלה בספרות השאלות והתשובות הכוללים כ-100,000 פסקי הלכה המשתרעים על פני כאלף שנים מכל רחבי העולם. הנפח הכולל מגיע ל-160 מליון מילים. הפרוייקט שהפך להיות לכלי העזר החשוב והמקצועי ביותר לספרות התורנית לדורותיה, החל לפני 40 שנה, והתקדם לממדיו הנוכחיים לאחר השקעה עצומה בפיתוח אלגוריתמים מיוחדים, הקלדה והגהה של הטקסטים. בעזרת תוכנת חיפוש ייחודית ניתנת למשתמש נגישות מידית ומדוייקת לחומר העצום הנמצא בו, תוך שניות מועטות בלבד.

מטרותיו של הפרוייקט הינן בניית מאגר נתונים טקסטואלי שיקיף את מכלול הספרות התורנית הקלאסית על דורותיה מתקופת חז"ל ועד לתקופת הפוסקים בני זמננו, והפצתו לכל בית יהודי בכל רחבי תבל.

לידתו של פרוייקט השו"ת באמצע שנות השישים ביוזמתו של פרופ' אביעזרי פרנקל ממקימי המחלקה למתמטיקה ולמדעי המחשב באוניברסיטת בר– אילן ואיש מכון ויצמן למדע. המחשבים של אותם הימים שימשו בעיקר כמכונות חישוב גדולות, והניסיונות לרתום אותן לפעילות הקשורה במדעי הרוח היו נדירים. גם הטיפול המקובל בטקסטים התבסס בעיקר על מפתוח וסיווג לפי נושאים שהתבצע בצורה ידנית. היה זה רעיון מהפכני לאגור בזיכרון המחשב את הטקסט המלא תוך פיתוח אינטנסיבי של כלים לחיפוש מילים או ביטויים מורכבים. הרעיון היה כל כך מפתיע וחדשני עד כדי כך שיוזמי הפרוייקט התקשו בתקופה הראשונה לגייס תקציבים מינימליים לפיתוחו, ובקשותיהם נדחו על סמך ביקורת הבודקים שסברו כי עצם הגישה של הטקסט המלא בטעות ייסודה. מיותר לציין כי דווקא השיטות הידניות עברו מזמן מן העולם, ולעומתן שיטת הטקסט המלא מתקבלת כיום כמובנת מאליה, בעיקר בגלל ההתפתחות הטכנולוגית המדהימה שלא רבים ידעו לחזותה מראש.

בשלביו הראשונים של הפרוייקט הוחלט להתמקד בספרות השאלות והתשובות (שו"ת) החובקת זמן ומרחב (מתקופת חתימת התלמוד ועד לימינו אלו ובכל תפוצות הגולה). מאז ומעולם פנו יהודים בכל אתר ואתר לרב שבקהילתם כדי לקבל את עצתו, כמעט בכל תחום. רבות מהשאלות שנשאלו והתשובות שנענו נאספו לקבצים שחלקם נשאר ככתבי יד, חלקם הודפס, הופץ ברבים והפך לבסיס לפוסקים אחריהם. שות"ים אלו מהווים מאגר אדיר של מידע רבני, היסטורי, סוציולוגי וכלכלי המשקף תקופה של יותר מאלף שנים בחיי העם היהודי בכל מקום שהוא. נוכח ההיקף הגדול של החומר הוקמה ועדה מדעית מייעצת שתפקידה היה לקבוע את סדר העדיפות בקליטת הספרים במאגר הפרוייקט בהתאם לחשיבותם, היקפם ונגישותם.

למעלה מארבעים שנה, ארכה ברציפות פעילות הקליטה. כיום מכיל בסיס הנתונים עשרות אלפי תשובות ופסקי דין הכלולים במאות ספרים שנכתבו ע"י מחברים רבים ממדינות רבות, מהמאה העשירית ועד היום. בנוסף לכך הועלתה על המחשב חלקה הגדול של הספרות היהודית הבסיסית כמו התנ"ך, התלמוד הבבלי והירושלמי, המפרשים השונים, הרמב"ם, השולחן ערוך, מדרשי הלכה ואגדה ועוד, כשהנפח הכולל מגיע ל-160 מליון מילים. עבודת הקליטה כללה גם מערך של הגהות כפולות והצלבות שנועדו להבטיח אמינות מרבית לטקסטים המקוריים.

מתחילת העבודה ברור היה שיש צורך בכלים לשוניים ממוכנים היעילים לטיפול בשפה העברית. זאת עקב האופי המיוחד של השפה העברית – הדלה בשורשים ובערכים מילוניים, אך עתירה בנטיות עם אפשרות ליצירת אלפי מילים שונות הקשורות כולן לאותו שורש. בתחום זה עסק פרופ' יעקב שויקה מהמחלקה למתמטיקה ולמדעי המחשב באוניברסיטת בר–אילן, ואשר עמד בראש הפרוייקט שנים רבות. בעבודתו החלוצית פותח מרכיב לשוני משוכלל, המאפשר מצד אחד אנליזה ממוכנת של מילים עבריות, ומצד שני תהליך של סינטיזה, דהיינו, אפשרות לייצר את כל המילים שאפשר לקבלן ע"י צירוף אותיות וכן שימוש וכינויים למילה נתונה לפי כללי הדקדוק והמורפולוגיה.

במקביל לקליטת הנתונים הוחל בהקמת מערכת תכניות מחשב. התוכניות הראשוניות נכתבו ב-1966 ושימשו במשך שנים רבות כשלד של מערכת מעשית ראשונה לאחזור מידע מטקסטים עבריים מלאים. במרוצת השנים, הורחבו התכניות והותאמו להתפתחויות הטכנולוגיות ע"י מספר צוותים של מתכנתים. בגרסה הראשונית, שיטת העבודה הייתה האצווה (batch), כאשר זמן הסבב בניסוח השאילתא ועד לקבלת התוצאות המסודרות מהמחשב ארך מספר ימים. בשנת 1979 פותחה גרסה אינטראקטיבית ראשונה שקיצרה את זמן ההמתנה אחרי מסירת השאילתא, בהתאם למורכבותה, לעשרות שניות בלבד. שיכתוב זה של התוכנה כלל פיתוח אלגוריתמים חדשים ומקוריים שנתנו מענה לדרישות המחמירות לגבי זמן העיבוד. באותה עת שוכנה כל המערכת במחשב המרכזי בבר – אילן. בתחילת שנות השמונים פותחו כלים שאפשרו התקשרות לפרוייקט השו"ת המרכזי בעזרת מסופים ודרך קווי טלפון רגילים. שיטת התקשרות זו, שנראית טבעית היום בעידן האינטרנט, גרמה אז התפעלות רבה, בעיקר כאשר היא בוצעה גם ממרחק, מארה"ב ועוד. המהפכה שחולל המחשב האישי ככלי בעל כוח עיבוד, לא פסחה על פרוייקט השו"ת. פיתוחו באותה עת של התקליטור (CD-ROM) כאמצעי אחסון בעל קיבולת עצומה, הוביל, החל משנת 1990, לגרסה חדשה של מערך התכניות. אלה שוכתבו מן המסד עד הטפחות; כל הקבצים במערכת, טקסטים, מילונים, קונקורדנציות, קבצי עזר דקדוקיים ואחרים, נדחסו כדי להתאים את נפחם הכולל לקיבולת של תקליטור ועוד היד נטויה. כיום המערכת מתפקדת על כל מחשב אישי בצורה בלתי תלויה. בדומה לרוב המערכות המודרניות, היא כתובה ב ++C ועובדת תחת WINDOWS ומופעלת דרך ממשק גראפי נוח וקל לשימוש. מיותר לציין שבגרסה הנוכחית (מספר 14) הזמן הנדרש לקבלת תשובה הינו שניות ספורות. בסה"כ הושקעה בפרוייקט עבודה בהיקף של למעלה מ-300 שנות אדם.
בקרת האיכות עמדה תמיד בראש סולם העדיפויות. כבר בתחילתו של הפרוייקט בוצע ניסוי השוואתי בין החיפוש הממוכן לבין החיפוש הידני המקובל. נבחרו כמאה נושאים, במשפט עברי, בהיסטוריה ובתחומים אחרים. נושאים אלה הוזנו כשאילתות למחשב ובמקביל נמסרו לקבוצת חוקרים מחוץ לפרוייקט. אלה נתבקשו לאתר כל תשובה

רלוונטית תוך שימוש בכל האמצעים המקובלים (עיון במפתחות, אנציקלופדיות וספרי – עזר). ניתוח התוצאות הראה שהחיפוש הידני, שארך כמובן חודשים רבים, הניב רק כ-80% מהתוצאות שאותרו בשניות ספורות באמצעות המחשב. בפרוייקט שוקדים על בקרה מתמדת על תקינותם של הטקסטים עצמם ומושקעים מאמצים אדירים למניעת שיבושים ולו הקלים ביותר. כמו כן מסתמכים על הערותיהם ובקשותיהם של אלפי משתמשים. על בסיס זה בוצעו תיקונים ושיפורים משמעותיים. בפרוייקט מצטברים מכתבי תודה רבים ממשתמשים מרוצים, אשר מצאו לנכון להביע את הערכתם בכתב.

יש לציין גם את אחד מהחידושים הגדולים שפותחו בתקליטור בשנים האחרונות בראשותו של פרופ' יעקב שפיגל - הקישורים (Hypertext) בין המאגרים השונים. ישנם היום למעלה מ-350,000 קישורים בין המאגרים השונים, הפותחים צוהר חדש בפני החוקרים והלומדים.

כיום התקליטור של פרוייקט השו"ת חובק עולם ונמצא בשימוש קבוע של מאות אלפי בתי אב בכל רחבי העולם. חוקרים רבים מתחומים שונים בלשון העברית, משפטים, היסטריה, סוציולוגיה, חינוך, בלשנות, רפואה, כלכלה, פולקלור וכמובן גם הלכה ומנהגי ישראל, פרסמו מאות מאמרים המסתמכים על מידע שהופקו ממאגרי הפרוייקט וציינו זאת במאמריהם.

במבט מסכם ניתן לומר שראשיתו של הפרוייקט בחזון ובאמונה שהמחשבים יחרגו ממסגרתם הצרה של האוניברסיטאות, מוסדות המחקר וצבאות העולם ויהפכו לכלי השווה לכל נפש. זאת, בתוספת העבודה האדירה שהושקעה והרצון להתגבר על כל המכשולים, הביאו לתוצאה המקווה – זמינות נכסי מורשת ספרות התורנית לדורותיה לכל דורש.