זו ערימה ספונטנית של לינקים שהצטברו לי פתאום – רובם ככולם שייכים למגדל השן – נפוליון דיינמייט ומערכות המלצה, בלשנות חישובית מול עיבוד שפה טבעית וכהנה. השילוב של הלינקים האלה (הרבה קריאה) הופך לדיון על מהות המחקר החישובי-בלשני ואפילו מהות המחקר האקדמי (אל מול ה"תעשייה"). די מעניין, אם תשאלו אותי.
צרת הלינקים של השבוע התחילה מקריאה מונחית בקולקטיב שם שיחרר ירדן ערימת לינקים משובבת (שאין לי זמן לקרוא. ארררררג!). אחת ההפניות הייתה למאמר א-ר-ו-ך בניו-יורק-טיימס -מגזין שדן בהבטים שונים ומוזרים של מערכות המלצה אוטומטית (recommender systems) ומשתמש בנפוליון דיינמייט להמחשת הבעייתיות במערכות שכאלו. גאש!
אני לא יכול להתאפק מלהביא כאן שני ציטוטים שמופיעים לקראת סוף הכתבה. הראשון והמפתיע הוא של פטי מייס, פרופסור ב-MIT ומחלוצות המחקר על מערכות המלצה:
there’s something slightly antisocial — “narrow-minded” — about hyperpersonalized recommendation systems. Sure, it’s good to have a computer find more of what you already like. But culture isn’t experienced in solitude. We also consume shows and movies and music as a way of participating in society. That social need can override the question of whether or not we’ll like the movie.
[עוד על פטי מייס ועל הסיפור העצוב על פיירפליי - מערכת ההמלצה שלה שהקדימה את זמנה כתבתי במוזיקה גחלילית]
הציטוט השני הוא הנועל את הכתבה. הוא לא מפתיע כלל ואולי אף טריוויאלי אבל אנו כחוקרים נוטים, לפעמים, לשכוח ממנו:
human beings are very quirky and individualistic, and wonderfully idiosyncratic, And while I love that about human beings, it makes it hard to figure out what they like.
ואז, בעודי מנסה לעשות קצת מחקר, שלח לי עמרי (תודה) לינק לדִיוּנוֹן הזה בבלוג של דניאל למיר, פרופסור למדעי המחשב מאוניברסיטת קוויבק: Recommender Systems: Where are we heading?
שיטוט קצר בבלוג שלא הכרתי מצא את הפוסט המעניין הבא (לא קשור למערכות המלצה): Why I'm nor working on world hunger שדן קצת בגישות שונות למחקר - הבעיה הגדולה והמייאשת לעומת הפכּים הקטנים וחסרי החזון (לפחות לכאורה).
ולאן שייכות מערכות ההמלצה? במבט ראשון נראה שאל הפכּים התעשייתיים וחסרי החזון אבל למעשה גלומות שם תובנות קוגניטיביות מרגשות (ע"ע נפוליון דיינמייט). יהיה דיון בתגובות. אולי.ואם כבר בלוגים מהשכונה החישובית/עיבודית ואפרופו המשפט הסוגר את הכתבה ב-NYT - האל דאום חוזר מדממה ממושכת עם פוסט שאני התחלתי לכתוב ונתקעתי: Supplanting vs Augmenting Human Language Capabilities שם הוא משווה בין שתי הגישות ברובוטיקה - חיקוי אנושי (הומנואידים) לעומת רובוטים תומכי פעולה לבין בעיות בעיבוד שפה טבעית. האסימון הלא פורמלי שלי:
למרות שהמונחים עיבוד שפה טבעית (natural language processing) ובלשנות חישובית (computational linguistics) משמשים בערבוביה, אני נוטה להשתמש במונח בלשנות חישובית כשאני מתייחס למחקר החישובי-קוגניטיבי-בלשני שמנסה להבין את עיבוד השפה האנושי ואילו במונח עיבוד שפה טבעית אני משתמש לתיאור המחקר שעוסק בפיתרון בעיות ספציפיות הקשורות לעיבוד שפה בלי קשר לאופן בו אדם היה מבצע את הפעולה (למותר לציין שבלשנות חישובית נראית לי עסק מרתק בהרבה מהינדוס פיתרונות). אין לי מושג אם החלוקה הסמנטית הזו שאני מציע היא מקובלת או הגיונית. אנא עיזרו לאורן הנבוך לגבש דעה מוצקה.ואם אחרי שקראתם את הכתבה במגזין של ה-NYT עוד נשאר לכם זמן, אז הנה לקט קטעים נבחרים מנפוליון דיינמייט (9 דקות אבל מספיקה דקה להתרשמות כללית):

מסכימה איתך בקשר להבחנה בין CL ל-NLP, וגם הויקיפדיה מסכימה איתך. אבל אני לא בטוחה שיש הסכמה כללית בעניין.
אידיוסינקרטית
נובמבר 25th, 2008
לגבי האבחנה: גם אני נוטה להסכים, אבל חייב לציין שלא ראיתי שום פרסום שעונה לקריטריון הזה של "בלשנות חישובית" באף אחד מהכנסים/כתבי העת המרכזיים בתחום בשנים האחרונות. נראה שבאמת כל אנשי מדעי המחשב עברו לעסוק בעיבוד שפה טבעית, והשאירו את השם בלשנות חישובית מסיבות היסטוריות.
או שאולי ההגדרה שלי ל"מחקר קוגניטיבי כמותי בלשני שמנסה להבין את עיבוד השפה האנושי" הוא קצת מחמיר מדי — ומתאים למשל לעבודות מסוג זה:
http://scholar.google.co.il/scholar?hl=en&lr=&safe=off&q=masked+priming+transposition&btnG=Search
מה ההגדרה שלכם למחקרים העונים על ההגדרה הנ"ל? האם ראיתם מחקר שעונה על ההגדרה הזאת באיזשהו מקום פרסום רלוונטי (= שיש סיכוי שתפרסמו בו) בשנים האחרונות?
יואב
נובמבר 25th, 2008
אני חושב שבWWW יש מאמרים קצת פחות עיבודיים-פורמאליים.
בהגדרה קצת פחות נוקשה – כלומ אם נגדיר CL כמחקרים שמעמתים את המודל החישובי עם המודל הקוגניטיבי או מנסים לעשות עיבוד בעזרת מודלים קוגניטיביים – נוכל למצוא עבודות שכאלו.
באופן אישי אני מחבב את ראדה מיכלצ'ה (או איך שמשעתקים את השם שלה לעברית) שיש לה נטייה קוגניטיבית (אבל התוצאות לא תמיד משהו: http://www.cs.unt.edu/~rada/papers.html ). אני חושב שגם נעמי (אל חדד) וגם רג'ינה נוטות מעט לכיוון הקוגניטיבי. גם את המחקר שלי על language transfer (שבטעות יסודי, אבל היו לו תוצאות מעניינות) אפשר לשייך ל-CL.
וכמובן לעבודות שלכם על תצורות בעברית אפשר למשוך לכיוון הקוגניטיבי, כלומר לקחת מעבר לסתם בעייה של עיבוד מורפולוגי.
אורן
נובמבר 26th, 2008
[...] על מערכות המלצה והתחרות של נטפליקס בנפוליון דיינמייט ובעיית הרעב העולמי ובמוזיקה גחלילית. SHARETHIS.addEntry({ title: "נטפליקס – אוכלים [...]
נטפליקס - אוכלים סרטים (בקטנה)
יוני 29th, 2009