מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

על מנועי חיפוש וארון הספרים היהודי

מדע והלכה נתפסים לפעמים כאוקסימורון. התפיסה הזו מבטאת שילוב של אטימות, התנשאות וחוסר הבנה. דוד שלי הוא איש מעניין. לדוד שלי, ראש ישיבה בעברו ורופא בהווה, חזות חרדית. בין הוראה בישיבה ולימודי הרפואה הוא עשה גם תואר בפיזיקה ובאיזה חלק עלום בחייו הוא גם עלה בסולם הדרגות ונדמה לי שגם קיבל עיטור מסויים עליו הוא לא מדבר. באירוע כזה או אחר שאל אותו פוליטיקאי בכיר (שאחר כך הפך נשיא) איך זה שכרופא ואיש מדע בנו של איש מדע (אביו הוא פרופסור לפיזיקה) הוא גם אדם מאמין ועוד אחד כזה – חרדי – הרי מדע והלכה הם תרתי דסתרי. התשובה של דוד שלי, מן הסתם בתוספת נופך סיפורי, הייתה "מי שלא מבין איך דת מסתדרת עם מדע כנראה שאינו מבין כלום בדת או שאינו מבין במדע ובמקרה הזה הוא כנראה לא מבין באף אחד מהם".

ברשימה זו נתאר את מנועי החיפוש דרך פרוייקט השו"ת – אחד מסיפורי ההצלחה של שילוב דת ומדע. (פורסם לראשונה ובשינויים קלים בגיליון 89 של כתב העת 'גלילאו', ינואר 06')

עידן המידע החל למעשה עם התפתחות המחשבים – הרבה לפני הולדת האינטרנט. היכולת לאחסן כמות אדירה של נתונים בדיסקים מקומיים יצרה את הצורך במנועי חיפוש וכך, עוד בשנות השישים, נולדו מנועי חיפוש יעודיים. השאפתני שבהם, והיחיד שעדיין פועל, משתכלל ונמכר עד ימינו אלה ממש, כבר עשרות שנים, הוא פרויקט השו"ת של אוניברסיטת בר-אילן. פרוייקט השו"ת, שהיה פרי שילוב של מחקר אקדמי ורצון להציג תוצאה בת-שימוש, שתועיל גם בתחום הדתי, היה גם הראשון בו אלגוריתם החיפוש היה מבוסס על אינדקסים של טקסט מלא – בדיוק כמו גוגל ושאר מנועי החיפוש המודרניים.
הסיפור של פרוייקט השו"ת הוא סיפור של מפעל החיים של פרופ' אביעזרי פרנקל מהמלקה למדעי המחשב ומתמטיקה שימושית במכון וויצמן ופרופ' יעקב שוויקה מהמחלקה למתמטיקה ומדעי המחשב באוניברסיטת בר אילן.

נחוצות מספר מילות רקע ביחס לאיחזור מידע, ל"ארון הספרים היהודי" בכלל ולספרות השו"ת בפרט.

איחזור מידע

איחזור מידע הוא הענף במדעי המחשב העוסק באיחסון מסמכים (מאמרים, תקצירים, מכתבים, כתבות, מיזכרים והיום גם קובצי תמונות, וידאו ואודיו) על גבי אמצעי מדיה דיגיטליים ובמציאת (כלומר – איחזור) מסמכים מסויימים מתוך אוסף מסמכים עצום הנמצא על תקליטור, על הדיסק הקשיח של המחשב ,זכרונות נשלפים, או מפוזר ברחבי הרשת. כמו בספריה רגילה כך גם בספריה דיגיטלית, איחסון המידע צריך להתבצע בצורה כזו שפעולת האיחזור תהיה מדוייקת ומהירה והמסמכים שמתקבלים כתוצאה משאילתה יהיו המסמכים הרלוונטיים למשתמש. מנועי החיפוש המוכרים כמו יאהו וגוגל הם כלים המבצעים את איחזור המידע הנמצא ברשת האינטרנט, אך כאמור, בעיית איחזור המידע הייתה קיימת עשרות שנים לפני שרשת האינטרנט חדרה לכל בית והמחקר באיחזור מידע ומנועי חיפוש החל בראשית שנות השישים.

ספרות השו"ת

בתחילת שנות השישים השתעשע פרופ' פרנקל ברעיון לנצל את המחשב על מנת להפוך את ארון הספרים היהודי לנגיש יותר. הרעיון היה לאפשר חיפוש בספרות השו"ת הענפה וכך לאתר את כל המקורות העוסקים בנושא מסויים. שותי"ם, או ספרי שאלות ותשובות, הם אוסף עצום ומקיף של דיונים בנושאים מחיי היום-יום של הקהילה והיחידהיהודיים במשך יותר מאלף שנים. שו"ת הוא קובץ תשובות מפורטות שמפרסם רב חשוב כמענה לשאלות אותן קיבל בדואר או על ידי שליחים. השאלות והתשובות נכתבו בדרך כלל בעברית מתובלת בארמית והופצו בכל הארצות בהם ישבו יהודים מארצות המזרח, ארץ ישראל, ארצות אירופה ואמריקה. מספר כותבי השותי"ם מוערך ב-1800; קיימים 3500 קבצי שו"ת מודפסים ועוד רבים אחרים שלא זכו לדפוס או אבדו ובסך הכול כמעט מיליון מסמכים, רובם ארוכים ומפורטים. העניין בספרות השו"ת אינו נחלת רבנים המחפשים תקדימים לשאלות משפטיות-הלכתיות-דתיות אלא משותף גם לכלכלנים, משפטנים, הסטוריונים ואנשי מדעי החברה המוצאים בשאלות המופיעות בשותי"ם מקור אותנטי לאורח החיים של יהודים בתפוצות השונות, ובתשובות – את היחס הפרגמטי של הממסד הרבני לבעיותיהם של הפרט והקהילה. השאלות והתשובות מהוות עדות אמינה לבעיות (ופתרונות) דתיות, כלכליות, משפטיות, דתיות, פילוסופיות, לשוניות, תרבותיות ופולקלוריסטיות שליוו חיי שיגרה, מלחמות, פוגרומים ודרמות לאומיות כמו גם רגעי אושר ועצב פרטיים של לידה, מוות וחולי.

ועוד קצת על ההיסטוריה של איחזור המידע

מערכות איחזור המידע הראשונות היו מבוססות על מילות מפתח ותיאורים מקוצרים שהיו מייצגים כל מסמך. עשרות עובדים היו עוסקים בקריאת החומר ולכל מסמך היו בוחרים כמה מילות מפתח שייצגו את המסמך ומוסיפים תיאור קצר של תוכן המסמך (למשל, מאמר זה גופו יכול להיות מאונדקס תחת אוסף מילות המפתח: 'איחזור מידע, פרוייקט השו"ת של אוניסרסיטת בר אילן, דת ומדע, מנועי חיפוש' והתיאור הקצר 'סיפורו של פרוייקט השו"ת תוך סקירה תמציתית של תולדות מנועי החיפוש'). מילות המפתח והתיאורים היו נשמרים באינדקסים המפנים למסמך המקורי. בהינתן שאילתה, היה מנגנון החיפוש משווה את מילות השאילתה אל מילות המפתח ותיאורי המסמכים ובכך מוצא את המסמכים הרלוונטיים, או לפחות מנסה. אינדוקס שכזה הוא עבודת פרך אשר מלבד שעות (או אולי שנות) העבודה המושקעות בבנייה ידנית של האינדקסים, הוא חסר תוחלת נוכח כמויות המידע שמוסיפות להצטבר עם הזמן. בבנייה ידנית של האינדקס הייתה גם בעיה של אחידות הקיטלוג וצריך היה לסמוך על בוני האינדקסים שיקצו לכל מסמך את מילות המפתח הנכונות ושהתיאור המקוצר של תוכן המסמך אכן יתפוס את עיקר התוכן במסמך. מפתיע ככל שיהיה, אפילו ענקית החיפוש יאהו עבדה כך עד לפני שנים ספורות, לפני שקרסה נוכח כמויות המידע העצומות שהתוספו לרשת מידי יום ואל מול היעילות האלגנטית של גוגל.

כבר בשנות השישים הבינו שוויקה ופרנקל את הבעייתיות שבבנייה ידנית של אינדקסים ופיתחו את שיטת הטקסט המלא. בשיטת הטקסט המלא מיוצג כל מסמך על ידי סך כל המילים המופיעות בו, מלבד כמה מילים שכיחות במיוחד, ולא רק על ידי מספר מילות מפתח שנבחרו בקפידה כזו או אחרת. היעילות בשיטת הטקסט המלא גלומה בבנייה אוטומטית של האינדקסים על פי כל המילים המופיעות במסמך. תפישה מהפכנית זו, שזכתה לזילזול אקדמי על גבול העוינות, לא רק שהייתה חידוש גמור בתחום איחזור המידע אלא הייתה כמעט בלתי נתפשת ובלתי אפשרית בתקופה בה מהירות העיבוד הייתה כה נמוכה, שטח האיחסון היה יקר ואחזקת דיסק של כמה מגה-ביטים (!) הייתה פרוייקט שהצריך משאבים פיננסיים של גופי ענק.

פרופ' יהושע בר-הלל, לוגיקן מהבולטים והמשפיעים בפילוסופים של הלשון ואחד מחלוצי הבלשנות החישובית, אף כתב במאמרו 'האוטומציה של חיפוש בספרים' על ההכרח שבבנייה ידנית של אינדקסים: "…ללא ההנחה של שימוש אוניברסלי בשפה מדעית מוגדרת ונשלטת היטב, כל גישה להשוואה ישירה של שאילתה אל מול טקסט חופשי מקורי היא בהכרח גישה אוטופית ובלתי מתקבלת על הדעת". גישת הטקסט החופשי, אותה אימצו פרנקל ושוויקה, הייתה לכן מהפכנית כמעט מכל בחינה ונוגדת כל פרדיגמה מקובלת. במאמר חגיגי במלאת שבעים שנה לפרופ' פרנקל מספר שוויקה שגם לאחר כעשור של מחקר, ואף לאחר שהציגו תוצאות מוכחות, זרק בו עמית מאוניברסיטה אמריקאית מובילה אש וגופרית וטען בלהט שזה "בלתי אפשרי, טיפשי, אבסורדי, מועד לכישלון ובכלל שעטנז וערבוב של מין בשאינו מינו…". אנקדוטה נוספת שמבהירה את השאפתנות ואת קושי הטכנולוגי, דווקא, שעמד אל מול הפרוייקט השאפתני מספרת על פגישה של פרנקל עם ג'ייקוב רבינו (Jacob Rabinow) , אחד הממציאים המבריקים, החתום על מאות פטנטים ביניהם ממיין מכתבים אוטומטי ומזהה תווים – מעין סורק אופטי המזהה אותיות. בפגישה ניסה פרנקל לשכנע את ריינבו לבנות לו "מכונה שתקרא טקסטים עבריים ותזין אותם למחשב" על מנת לייעל את תהליך קידוד ספרי השו"ת לפורמט דיגיטלי (מכשיר זה ידוע היום בשם סורק וממיר לטקסט). לאחר מספר חודשים קיבל פרנקל תשובה שבניית מכונה כזו אפשרית. "הראשונה תעלה לך מיליון דולר אבל השנייה רק חצי מיליון" – סכומים אסטרונומיים באותם הימים. "אני אשמח להזמין את השנייה", ענה פרנקל.

כיום, לאחר ארבעים שנה, כאשר כל מנועי החיפוש המובילים עובדים בשיטת הטקסט המלא ובונים את האינדקסים בצורה אוטומאטית, נראה פרוייקט השו"ת כמובן מאליו – בזמנו, ועד למחצית שנות השמונים, נתפש הפרוייקט כשיגעון בלתי אפשרי.

שיטת הטקסט המלא והאינדוקס האוטומטי הפכו, אמנם, לטכניקה המובילה באיחזור מידע, אך הציגו בפני המפתחים מספר בעיות הקשורות לשפה כמודל, להבנת שפה ולעיבוד שפה כמו גם בעיות בסטטיסטיקה.

בר הלל הגדיר יפה את הבעייתיות בהתאמת שאילתה ממוקדת למסמכים ספציפיים. דרך ההצג של שאלה שונה מאדם לאדם ולפיכך גם השאילתות שינסחו שני אנשים יהיו שונות. יש להניח שקיים שוני גדול גם בין דרך הביטוי של המומחה – כותב המסמך, לבין ההדיוט, שמחפש את המידע. אחד יחפש מידע על "איך פועל מנוע חיפוש" ושני ינסה להבין את "דרך הפעולה של מערכות לאיחזור מידע". זה גם זה מחפשים, למעשה, אותו מידע עצמו ולשניהם יכול להתאים אותו מסמך אשר בו לא תופיע אף אחת מהשאילתות כלשונה אלא למשל "איחזור מידע הוא הפרקטיקה והמדע של חיפוש מידע במסמכים, חיפוש המסמכים עצמם … מנועי חיפוש כמו גוגל הם בין המנגנונים המוכרים ביותר של איחזור המידע…" (מתוך וויקיפידה האנגלית, הערך information retrieval, תרגום שלי, א.צ.).
בר הלל טען שמחשב לא יכול לבצע את ההתאמה הזו מכיוון שבני אדם מתנסחים באופנים שונים לחלוטין. אחד האתגרים שעמדו בפני החוקרים של איחזור המידע היה "הבנה" של משפטים שונים והבאתם לצורה סטנדרטית ובת השוואה. הסטנדרטיזציה מושגת באמצעות הבאת המילים לשורש או לצורה בסיסית ואחידה (stemming) ורק אז הכנסתן לאינדקס. כך המלה 'חיפוש' הופכת ל'חפש' ו'מסמכים' הופכת ל'מסמך' ובכך מתבצעת האחדה מסויימת של הטקסטים השונים. פישוט המילים באנגלית קל באופן יחסי – הסיומות ing ו- ed מורדות וצורות מיוחדות הופכות לבסיס על פי אוסף מוגבל של כללים. sit, sat, sitting ו- seated הופכים כולם לצורת היסוד sit. בעברית המצב מסובך הרבה יותר בשל תופעת השירשור, ובשל חוסר ברמזים כתובים לצורת ההגייה הפונטית של המלה ולמשמעותה. המלה 'וכשפגשתיהו' היא הטיה וצירוף של כמה מילים ומילות יחס: ו-כאשר-אני-פגש(תי)- אותו' או המלה 'מטה' שיכולה להיקרא כמיטה (בכתיב חסר), כמטה-מקל, כחיווי כיוון – למטה (בניגוד ללמעלה) או אפילו כפועל המציין הטייה בגוף שלישי, זמן הווה ("החיזבאללה מטה את יובלי החצבני"). מכשול המורפולוגיה העברית הופך לבעיה קריטית ביצירת אינדקס עיברי וכך החלו שוויקה ופרנקל בפיתוח מנתחים מורפולוגיים שהובילו בין היתר לפיתוח תוכנות ניקוד אוטומטיות. לאחר שהומר הטקסט המקורי לצורה בסיסית ולאחר שהומרו גם מילות השאילתה לצורתן הבסיסית נותר "רק" למצוא מהם המסמכים המתאימים ביותר לשאילתה ולהחזיר אותם למשתמש.

קיימות כיום כמה עשרות מטריקות – שיטות מדידה והשוואה, למציאת ההתאמה או הרלוונטיות של מסמך לשאילתה. שתי השיטות הבסיסיות והנפוצות יותר הן 'דימיון קוסינוסי' (cosine similarity) ו- IDF-TF. דימיון קוסינוסי הוא למעשה הזווית בין שני וקטורים – הווקטור המכיל את כל מילות המסמך והווקטור (המלא) המכיל את מילות השאילתה. חישוב הקוסינוס של הזווית שיוצרים שני הווקטורים האלה מהווה מדד לדמיון בין המסמך לשאילתה – ככל שהזווית קטנה יותר, המסמכים דומים אחד לשני. במקרה התיאורטי בו השאילתה היא בדיוק המסמך כולו נקבל התאמה של מאה אחוז וזווית של אפס מעלות מאחר ששני הווקטורים זהים. אחת הבעיות בשיטה זו היא החשיבות השווה שמקבלות כל המילים במסמך, דבר שאינו משקף נכונה את המציאות הטקסטואלית.

IDF-TF (term frequency-inverse document frequency – שכיחות ביטוי לעומת שכיחות מסמכים הפוכה) היא גישה שונה בתכלית לחישוב רלוונטיות של מסמך לשאילתה. ההנחה העומדת בבסיס שיטה זו היא שבכל מסמך יש מילים חשובות יותר וחשובות פחות – לאמור, בכל מסמך קיימות מילות מפתח. בשיטת הIDF-TF מילים שונות מקבלות חשיבות שונה על פי שכיחותן במסמך לעומת שכיחותן במסמכים אחרים בקורפוס. מילים שמופיעות מספר גבוה של פעמים במסמך מסויים אבל נפוצות מאוד גם במסמכים רבים אחרים אינן מייצגות נאמנה את המסמך. לעומת זאת, מלה המופיעה מספר פעמים במסמך מסויים אך כמעט שאיננה מופיעה במסמכים אחרים היא כנראה מילת מפתח במסמך ולכן כאשר מלה כזו מותאמת למלה שמופיעה בשאילתה עולה הרלוונטיות של המסמך. נניח שאנו מחפשים מסמכים על פרוייקט השו"ת. דרך סבירה לניסוח השאילתה היא 'פרוייקט השו"ת של אוניברסיטת בר אילן'. המילים פרוייקט השו"ת אכן מופיעות מספר רב של פעמים בכתבה זו וסביר להניח שכמעט אינן מופיעות במסמכים אחרים (מלבד, כמובן, אלה העוסקים בפרוייקט השו"ת) ולכן מסמך זה יקבל ניקוד רלוונטיות גבוה לשאילתה. שיטה זו משקפת את הייררכיית החשיבות של מילים במסמך ומְחקה את השיוך הידני של מילות המפתח, אך עושה זאת באופן אוטומאטי ולכן מהירה יותר, יעילה יותר וניתנת לבחינה אובייקטיבית ללא תלות במתייג-כותב אינדקסים כזה או אחר.

שער למסכת כתובות

פרוייקט השו"ת – הדור הבא

פרוייקט השו"ת של אוניברסיטת בר אילן חיבר בין אוצר ספרים קדום לבעייה המודרנית של איחזור המידע. את הפתרונות המהפכניים שהציעו מפתחי פרוייקט השו"ת לפני מספר עשורים מיישמים כיום מנועי החיפוש הגדולים. ועם זאת – איחזור המידע הולך ומסתבך ואנו שבים לטבוע בים המידע. הדור הבא של מנועי החיפוש ידמה לשו"ת במשמעותו המקורית – שאלות ותשובות. השאילתה – צרור המילים אותו מקליד המשתמש על מנת לאחזר את המסמכים הרלוונטיים, יוחלף בשאלה בשפה טבעית, ומנוע השו"ת, כלומר מנועהחיפוש המשודרג (שיכונה להלן, מנוע תשובות לשאלות או תל"ש על מנת למנוע בלבול עם פרוייקט השו"ת), יאחזר תשובות מדוייקות במקום אוסף מסמכים. תחום המחקר העוסק במנועים העונים לשאלות הוא תת-תחום של איחזור מידע הנקרא: מענה לשאלות (, question answering QA). כיום, אם נרצה לדעת כמה קלוריות יש בביג-מק נקליד את השאילתה "כמה קלוריות יש בביג מק", מנוע החיפוש יתעלם מהמלה 'כמה' מאחר שהיא שכיחה במיוחד ואז יחזיר לנו אוסף מסמכים שעוסקים בביג-מק ובקלוריות. אנו נאלץ לקרוא את המסמכים על מנת לגלות שחלקם מספרים על כך שבביג-מק יש הרבה קלוריות אבל לא בהכרח מספקים את המספר המבוקש. במערכות תל"ש פשוט נשאל "כמה קלוריות יש בביג מק?" ונקבל תשובה מספרית מדוייקת במקום אוסף מסמכים. כבר קיימים מספר מנועים מוגבלים המאפשרים זאת. הידוע שבהם הוא AskJeeves.com, אך גם גוגל וחברות אחרות מפתחות מנועים לטיפול בשאלות. כך דרכה של טכנולוגיה – ספרות השו"ת הענפה נועדה לענות על צרכים מסוימים. השואל, שלא היתה לו נגישות פיזית או אינטלקטואלית למקורות המידע, היה שואל את הסמכות הרוחנית וזו הייתה מנפקת מכתב תשובה שהיווה גם תקדים משפטי לשאלות של אחרים. עם השנים תפחה ספרות השו"ת והכילה אלפי כרכים, ושוב היה המחפש האומלל אובד עצות מול נפח המידע העצום. כאן באה הטכנולוגיה לעזרה וסיפקה מנועים לאיחזור מידע. המנועים מקבלים שאילתה ומחזירים רשימת מסמכים רלוונטיים. מנועים אלה הופכים בתורם למערכות תל"ש , כלומר לספקי תשובות לשאלות ספציפיות ובכך יושלם מהלך מעגלי של יחסים בין צרכן המידע למי שמספק אותו. מערכות התל"ש עדיין אינן מפותחות דיין והתשובות שהן מספקות נעות לעתים על גבול הגיחוך, אבל התקדמות בהחלט ניכרת ושאלות סגורות כבר נענות בצורה סבירה.

והיכן נפגשים פרוייקט השו"ת ומערכות התל"ש? בכנס האגודה הישראלית לבלשנות חישובית (ISCOL) שנערך לפני כשנה, באוניברסיטת בר-אילן דווקא – מחווה לפרופסור שוויקה עם פרישתו, הציגו חוקרים ממכון לב – המכון הגבוה לטכנולוגיה בירושלים, מערכת מבוססת על פרוייקט השו"ת של בר אילן שאמורה היתה לענות לשאלות בנושאי הלכה שהוצגו בשפה טבעית. המערכת שהוצגה לא השיגה תוצאות מרשימות אך סימנה את ההתפתחות העתידית ואת השילוב בין פרוייקט השו"ת (של בר אילן) לתל"ש (QA). התוצאות הכמעט מביכות אינן צריכות לרפות את ידי החוקרים. ארון הספרים היהודי הוא אגוז קשה במיוחד לפיצוח מבחינת עיבוד השפה שבו, שכן הוא מכיל טקסטים בעברית וארמית בשלבי התפתחות שונים שנכתבו במשך אלפי שנים ובאזורי עולם שונים – כל טקסט משקף תרבות שונה ושלב התפתחות לשונית שונה. האם מערכות תל"ש חייבות לדמות הכרה ובינה "אמיתית" כדי לספק תשובות סבירות, או אולי גם כאן הסטטיסטיקה וכמה אלגוריתמי למידה יספיקו? אולי בעוד מספר שנים יהיה את מי (או את מה) לשאול.

קישורים נוספים:
מאמר של אביעזרי ל"סיכום" פרוייקט השו"ת (המאמר בפורמט PS).
– פרוייקט השו"ת והוגיו זכו בינתיים בפרס ישראל. בבלוג היגיון בשיגעון כותב זאב גליל רשימה על שערוריית הפרס ממנו (כמעט?) נושל פרופסור שוויקה – מי ראוי לקבל את הפרס על מפעל השו"ת.

(פורסם בשינויים כאלו ואחרים בגיליון 89 של 'גלילאו ' – כתב עת למדע ומחשבה.)

5 תגובות עבור “לכל שאלה תשובה – פרויקט השו"ת ומציאת מידע בעידן הדיגיטלי”

  1. למידע נוסף. הכנסו לאתר הבא
    [כאן הייתה כתובת לאתר בשם ג'ודאיזם-שופ. הכתובת נמחקה על ידי. א.צ.]
    אתר מומלץ
    ניתן גם לעיין בקטגוריית "מאמרים" – עדיין בבניה.

    בברכה
    יוני בזק
    מנהל האתר

    יוני

  2. יוני – אהבתי את העובדה שאתה כותב "אתר מומלץ" על האתר המסחרי שלך. ברשותך – מחקתי את הלינק. הייתי שוקל להשאיר אותו אם באמת היה ניתן לעיין בקטגוריית המאמרים, רק שהיא בכלל לא קיימת. בשביל לסיים בביקורת בונה, תרשה לי להמליץ לך להשיג גם מעצב לאתר, כרגע הוא נראה כמו ווב מינוס 2.

    אורן

  3. אני ראיתי בכתבה הזה על סורק שממיר טקסט מודפס לדיגיטלי, איפוא ניתן לרכוש זאת

    משה

  4. טוב, כיום זה לא בדיוק סורק אלא תוכנה שמגיעה כמעט עם כל סורק. הטכנולוגיה נקראת OCR:
    http://en.wikipedia.org/wiki/Optical_character_recognition
    ויש מגוון תוכנות, חלקן טובות יותר וחלקן טובות פחות. בהצלחה.

    אורן

  5. More posts of this quilaty. Not the usual c***, please

    Kaedon

להוספת תגובה