מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

לפני שבועיים התקיים באופסלה, שוודיה כנס ה-ACL (Association for Computational Linguistics) ובצמוד לו ה-CoNLL (Computational Language Learning). בגדול אפשר להגדיר את הכנס כשיעמום. הריגוש הגדול נרשם בדרך לכנס כשאחרי שעתיים נחת המטוס שוב בבן גוריון ("תקלה קלה במערכת החשמל"). נחיתה שגרמה לפיספוס הקונקשן, ביזבוז לילה בהונגריה ופיספוס של החצי הראשון של גמר המונדיאל ושל חצי היום הראשון של הכנס. מלבד זאת עבר הכנס ללא אירועים מיוחדים. ובכל זאת – שליחנו בשוו\בדיה מדווח על כמה מאמרים מעניינים, מתחבט בחשיבותה של הקהילה האקדמית ומביא לכם כמה תמונות* (אופסלה, סטוקהולם**).


יש הסוברים כי כנסים אקדמיים מטרתם שמיעת הרצאות והחלפת דעות. כמובן שזו טעות. כנסים מטרתם שיווק עצמי ויצירת קשרים. החלפת דעות היא רק אחד הכלים בארסנל – משני בחשיבותו לשתיית בירה משותפת. ובכן, בזירת הבירה נרשמה אכזבה רבתי. תוסיפו לזה את אופסלה – עיר אקדמית משמימה עד מוות, גל חום ששטף את סקנדינביה נטולת המזגנים ואת השיעמום הצפוי מכנס ענק וטכני ברובו וקבלו סוג של שירות מילואים. חום כבד, הפגישה השנתית עם האנשים המוכרים וימים מעולפים נגררים בלי תכלית מוגדרת. איך (בערך) שר מאיר אריאל – "בחדר מחכים לי חום ותה, פילחי תפוח וסיגריה וסיפור חזק וטוב… נפלו עוד ארבע חמש סיגריות  ופתאום נגמר לי כאן השיר… לילה קצר עבר על כוחותינו באופסלה".

סיכום ביניים מיקצועי – שלוש שיחות ארוכות וחשובות עם פוטנציאל מחקרי/שת"פי (כולן עם ישראלים עמם אני נפגש גם בארץ). שתי שיחות שלח לחמך קלושות עם חוקרים מחו"ל. אכזבה רבתי מהברזתה של ליליאן לי המעולה שהייתה אמורה להעביר את ההרצאה המוזמנת (ואני הייתי אמור להתקרצץ עליה בקשר לפוסט-דוק).

קהילה

אחת התובנות אותם רוכש בעמל תלמיד הדוקטורט היא חשיבותה של הקהילה. לאוניברסיטה מגיע סטודנט חדור אידיאליים ותשוקת מחקר. רוממות החופש האקדמי בגרונו והוא משוכנע שכל מה שהוא צריך הוא לעשות מה שבא לו. לחקור את מה שמעניין אותו. ואז, בין דחיה לדחיה הוא מגלה שהמחקר לא מתקיים בוואקום אלא בקהילה. המאמר צריך להיות ממוען לקהילה מסויימת, הן תוכנית והם סיגנונית. ואז להתגמש ולהיתפתל. או למצוא את הקהילה המתאימה שלא תמיד קיימת. במובן זה השיעמום שלי מה-ACL הוא די צפוי. אבל במקרה שלי עוד לא ממש מצאתי את הקהילה הנכונה. והשם (שטוב משמן טוב) בקהילה הוא קריטי עד למאוד בבואך לחפש פוסט-דוק או משרה. ענייני הקהילה האקדמית וחסרונה דורשים פוסט נפרד, אולי תרומה למדריך המפוכח לתלמיד המחקר.

לזכות  קברניטי ה-ACL נציין שגם הם מודעים לשיממון שהכנס משרה ולכן בשנים האחרונות מנסים לרענן קצת את השורות, לקבל גם מאמרים קצת שונים והשנה אפילו דיברו באריכות על שינוי שיטת הקבלה . כמעט ימות משיח. השינוי מתחיל מבפנים ויגיע, אולי, בעוד עשור.

הרגע המרגש – הצגתי את המאמר של דמיטרי ז"ל. המאמר עצמו אלגנטי מאוד עם אלגוריתם שמשלב גרפים ואיחזור מידע מבוסס תבניות על מנת להעריך גדלים מסתוריים: Extraction and approximation of numerical attributes from the web.  כרגיל אצל דמיטרי, התוצאות הן לא פחות ממרשימות. הקדשתי גם כמה דקות לדבר על דמיטרי ועל המחקר שלו באופן כללי. אני חייב לציין שזה היה קשה (נפשית) ממה שחשבתי. אחרי המושב ניגשו אלי כמה אנשים שהכירו את דמיטרי ואת העבודות שלו וזה היה מנחם משהו.

ומה בכל זאת היה לנו

באופן כללי, סכמטי ולגמרי סובייקטיבי אני אחלק את הכנס לשלושה תחומים עיקריים. פרסינג (parsing), איחזור מידע ושימוש אינטליגנטי (IR, summarization, entailment) ואחרים. מביני דבר מספרים שהפרסינג היה די משעמם למרות כמה מאמרים חזקים. באופן מסורתי, האל דאום (השלישי!) נוהג לספק סקירה של המאמרים שעניינו אותו בכנסים. הסקירה שלו בא תבוא, אני מניח, והיא כנראה תהיה שונה לגמרי מהסקירה שתובא להלן ותורכב בעיקר מהפרינג'.

ביאטה קלבנוב הציגה מאמר נאה שמשתמש במודל תורת-משחקימי כדי לתאר שימוש חוזר במטאפורות על יריבים פוליטיים (השאלה המרכזית היא למה יריבים פוליטיים משתמשים באותה מטאפורה למרות שהיא נתבעה על ידי צד אחד ואימוץ המטפורה על ידי הצד השני משחק, לכאורה, לידיים של טובע המטאפורה):
A Game theoretical model for metaphorical bergaining
אסוציאציה – מאמר/שיחה של בורחס על עושר מטאפורי אינסופי שנבנה על מספר מצומצם מאוד של מטאפורות. המאמר הבורחסי מופיע בספר מלאכת השיר.

בגזרת ה-entailment (המצאה ישראלית מבית בר אילן שהפכה ללהיט מחקרי ולתחום בפני עצמו), מלבד מאמרים נאים של יהונתן ברנט ושל שחר מירקין, משך את תשומת ליבי דווקא מאמר-פוסטר של האיש רב השמות כריסטיאן דנסקו-ניקולסקו-מיציל (עם ליליאן לי). מה שנחמד במאמר הוא השימוש במושג המרתק של negative polarity items – מושג בלשני טהור, על מנת לפתור בעייה הנדסית של הסקת מסקנות מסוג מסויים (downward entailing operators). השילובים האלו של בלשנות אמיתית במחקר הטכני (NLP) הם נדירים ומשובבים. מלבד זאת, NPI הם קבוצת ביטויים חביבה עלי במיוחד, למשל בשום שרוכי נעליים. אה, והמאמר מכיל גם התחכמות מעניינת על יציר תביטויים כאלו באופן מלאכותי, טריק ליליאני אופיני:  Don't have a clue? Unsupervised learning of downward entailing operators.

מאמר נוסף שאהבתי, מעט יותר מיינסטרימי הוא של זורניצה קוזרבה (Zornitsa Kozareva) ואדוארד הובי:  Learning arguments and supertypes of semantic relations using recursive patterns. המאמר מציע אלגוריתם ללמידת יחסים סמנטיים, זה לא חדש, אבל הוא משתמש בזרע (seed) יחיד לתהליך המינכהוזני של ה-bootstrappingוזה כבר מעניין כי תהליך כזה, אלגנטי ומגניב בעיקרון, נוטה להכניס למערכת רעש בלתי נשלט. אגב, היה שווה לשמוע את זורניצה ולו בשל האיזכור של מאמר אחר שלה מה-NAACL. המאמר הזה עבר לי מתחת לרדאר ובעיקרון הוא עוסק הערכה של הפרודוקטיביות של 'זרעים' (שכאמור, יש להם נטיה להצמיח גידולי פרא): Not all seeds are equal: measuring the quality of text mining seeds.

ועדיין בבמיינסטרים, אם כי בפרבריו – מאמר של הקולגות עמרי אבנד ורועי רייכרט שעושים unsupervised pos tagging ,תוך שימוש בפרסר לא סטנדרטי (ומעניין) ותוך הישענות על תורת הטיפוסים (prototypes) הקוגניטיבית: Improved unsupervised POS induction through prototype discovery.

הקורא חד העיין ורגיש הלב כבר שם לב שההעדפות שלי נוטות למאמרים שמערבים קצת רגש, כלומר תובנות מתחומים אחרים ולא רק מדווחים על איזה טוויק אלגוריתמי ששיפר תוצאה קודמת בפרומיל – מה שאני מכנה ביומרה – מאמרים עם שאר רוח. לכן הזוכה הגדול (שאכן זכה בפרס המאמר הסטודנטיאלי הטוב ביותר) הוא: Extracting Social Networks from Literary Fiction, של אלסון, דמס ומק-אוון. במאמר הם בונים מעין רשת חברתית של דמויות מקלסיקות של המאה ה-19. הרשת החברתית בנויה על סמך ניתוח (אוטומטי, כן?) של דיאלוגים בין הדמויות. זה מגניב. אבל מגניב מזה הוא השימוש שהם עושים בגרף החברתי על מנת להפריך תאוריות ספרותיות מקובלות שמנתחות את תופעת העייור (אורבניזציה) כפי שהיא משתקפת ביחסי הדמויות בקלסיקות תקופתיות. זה מה שאני קורא מאמר עם השלכות מעשיות. הקץ להנדסה! ריתמו את האלגוריתמיקה לטובת מדעי הרוח!

—-

*את המצלמה שכחתי בבית ואתם זוכים להנות ממצלמת הסלולרי (nokia 5800). לא רעה בצילומי חוץ רבי תאורה. נוראית לצילומי פנים. עמכם הסליחה.
**בניגוד לאופסלה המשמימה***, הארכיפלגו הסטוקהולמי דווקא מגניב על שלל המוזאונים, הקניונים המפוארים (לא שמעו על המיתון העולמי?!) והקסבה הימי-ביניימית של העיר העתיקה .
***הקתדרלה הגדולה של אופסלה דווקא מעניינת והמעוניינים הסינמטיים יוכלו להתחקות בעיר על עקבותיו של אינגמיר ברגמן אוייב הכנסיה****.
****(*****)לפי מאמר שלו שהופיע באסופה עולם בדים של הלגה קלר [מזיכרון].
*****לא יכולתי להתאפק מלהוסיף עוד הערה עטורת כוכביות.

7 תגובות עבור “ACL CoNLL 2010 – פרינג' מדעי ועל הצורך בקהילה”

  1. מדהים , קראתי את הכל (אני חושב)ולא הבנתי את רוב המילים! פשוט הרגשה מרתקת. מתוך הנחה שכל הכתוב כאן אמת ולא סוג של פארודיה זה מרתק כמו לגלות שבט נידח ביערות האמזונס שמדבר שפה משלו שאף אחד (אני) לא מבין.

    משה

  2. מה שמשה אמר.
    כמו חולה ורניקה הפוך הבנתי רק את מילות הקישור.
    ועדיין (כמו שמשה אמר) היה מרתק.

    אבנר

  3. הכל אמת, נשבע בנקיטת חפץ.
    אני מבין שחלק מהמושגים המקצועיים נראים קריפטיים למי שלא מבין בתחום – אבל שום דבר שויקיפדיה לא יכולה לפתור.

    אבל ברצינות – דווקא חשבתי שחלק ניכר יהיה מובן גם לקורא ההדיוט. מה שאומר שאני נמצא בבועה.

    אורן

  4. בהמשך לשיחתנו האחרונה, הצחיק אותי מאוד המשפט "השילובים האלו של בלשנות אמיתית במחקר הטכני". "בלשנות אמיתית", LOL.
    הטענה שלי היתה שסמנטיקה ו-NLP הם שונים עד כדי חוסר יכולת לתקשר, נחמד לראות שזה לא תמיד ככה.

    ולגבי הבועה, אני חושבת שאין הרבה מה לעשות. או שאתה כותב *הרבה מאוד*, או שחלקים ממה שכתבת נשארים סתומים.

    דולי

  5. […] אורן סיכם את כנס ACL האחרון בצורה מעניינת מאוד, ולפחות החצי הראשון של הרשומה קריא גם למי שלא בקיאים בתחום. הוא המליץ על מאמר מסקרן מאוד: "במאמר הם בונים מעין רשת חברתית של דמויות מקלסיקות של המאה ה-19 […] על סמך ניתוח (אוטומטי, כן?) של דיאלוגים בין הדמויות […] על מנת להפריך תאוריות ספרותיות מקובלות שמנתחות את תופעת העייור (אורבניזציה) כפי שהיא משתקפת ביחסי הדמויות בקלסיקות תקופתיות. זה מה שאני קורא מאמר עם השלכות מעשיות. הקץ להנדסה! ריתמו את האלגוריתמיקה לטובת מדעי הרוח!". כתבנו ייצא לבדוק הכצעקתה. […]

    התשובה הדגשית לחופשת קיץ « דגש קל

  6. וואו, איזה פינגבאק ארוך.

    איתמרק

  7. […] לבלשנות חישובית) של שנה שעברה זכה בפרס מאמר שבחן תאוריות ספרותיות על קשרים חברתיים בתקופת המעבר לערים ת… (ויש גם הסתייגות מאירה של האל דאום […]

    מדעי המחשב בשימוש מדעי החברה והרוח

להוספת תגובה