מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

אחד מבקש מהחבר המתכנת שלו שילווה לו 1000 שקל. "אין בעיה," עונה המתכנת, "אבל קח 1024. שיהיה עגול". הבדיחה הזו, בדיחה ממוחשבת, אם תרצו, קורעת מתכנתים אבל זוכה להרמת גבה מתמיהה אצל אחד האדם – דוגמא לכך שגם הוּמוֹרוֹגרפיה היא עניין של גאוגרפיה. בכלל, הומור הוא דבר חמקמק. "יש דברים שלא צוחקים עליהם!" הייתה אמא אומרת כשסיפרתי בדיחות שואה או בדיחות שחורות אחרות. "לא מצחיק," היא הייתה קובעת נחרצות ומנסה לבלוע את הצחקוק כשסיפרתי בדיחה גסה. הטבע המעורפל וההקשרים הפסיכולוגיים של ההומור הפכו את ההומור הממוחשב לגימיק סקסי – מדע שקל למכור להמונים – שהרי מי לא מבין בדיחה עסיסית או אירוניה דקה?

בYNET מופיעה ידיעה על הפיתוח של מחשב עם חוש הומור. טוב, עיון מדוקדק מעלה שעוד לא בדיוק פיתוח וגם לא ממש הומור ובכל זאת – סיבה טובה לכתוב קצת על הומור מלאכותי.

הגישה המתקדמת ביותר להומור מלאכותי נמצאת (איך לא) בספרות המדע הבדיוני דווקא. הליצן התורן הוא מייק – מחשב העל מ'עריצה היא הלבנה' של היינלין. בוקר אחד מתעורר מייק מלא מודעות עצמית ומבקש ממנואל (מני), המתכנת שמתחזק אותו, שילמד אותו את סוד ההומור. משך העלילה כולה מקיימים מנו ומייק תהליך של למידה מונחית (supervised learning) אבל גם בסוף תהליך הלמידה נשאר ההומור של מייק ילדותי משהו ומתמצה בהנפקת צ'ק משכורת בסה"כ $10,000,000,000,000,185.15 או בשינוי הטמפרטורה במשכן הנשיאות מִקור קיצוני לחום בלתי נסבל וחוזר חלילה – דברים שגם מחשב נטול הומור עושה לא פעם עקב באגים מסוגים שונים. להיינלין הרבה רעיונות מעניינים אבל מה שנוגע אלינו זו הכריכה של חוש הומור עם מודעות – מייק רוצה (ומסוגל) לפתח חוש הומור רק אחרי שפיתח מודעות.

הפוגה קומית:

What happens to liars after they die?-
-They lie still

בדיחה ממוחשבת?!

Isn’t it Ironic, don’t you think?

לפני כעשור, באופן בלתי תלוי, ניסו כמה חוקרים יפנים לפתח מודל חישובי לזיהוי אירוניה – משימה שאפתנית משהו – בייחוד לאור העובדה שגם בני אדם (יפנים בעיקר?) כושלים שוב ושוב בזיהוי אירוניה. המודל שהציעו היפנים הוא פשוט – משפט אירוני הוא משפט עובדתי המכיל דיווח הסותר את המציאות ושגם הדובר וגם השומע מודעים לסתירה ומודעים לכך שהשני מודע לסתירה (ההגדרה הזו היא די גרועה אבל נלך עם זה, צריך להתחיל מאיזו הגדרה פשוטה וגסה).
הנה דוגמא יבשושית משהו (תאשימו את היפנים) – "כן, באמת יום מצויין לפיקניק" (נאמר כשגשם זלעפות מתחיל לרדת על זוג מתפקנק).

כל מה שנשאר לעשות עכשיו הוא למדל את הידע על העולם, למדל את מערכת האמונות (beliefs) של הדוברים (היינו איך הם תופסים את העולם), למדל את המציאות במצב נתון ולנתח את האמירה החשודה באירוניה. אם האמירה סותרת את המערכת האמונות של שני המשוחחים אזי זו אמירה אירונית. אין פשוט מזה. היפנים הציעו תחשיב לוגי שממדל את כל הפרמטרים האלו ויאללה לעבודה. נדמה לי שאף אחד מן החוקרים היפנים לא המשיך למימוש המודל והרי לכם הפער בין תיאוריה מתמטית למציאות (אם כי אקירה אוצומי [Akira Utsumi] פרסם עוד כמה מאמרים המזהים אירוניה בצורה קצת פחות שאפתנית. עינת רובינשטיין כתבה על שימוש בLSA לזיהוי סוגים מסויימים של אירוניה. גילוי נאות – רק רפרפתי על המאמרים האלו).

למעשה, בלי לקרוא לילד בשמו (לפחות כך אני זוכר) הציעו היפנים מודל של 'מודעות'. מודל מאוחד שמאגד מודל לייצוג של העולם, מודל לייצוג מערכת האמונות – הידע על העולם, ומודל ידע מסדר שני – 'מה אני יודע ומה פלוני חושב שאני יודע (כלומר מה אני חושב שפלוני חושב שאני יודע)' הוא בעצם מודל של מודעות (עולם-אני-האחר והבנה של קיומו של פער בין השלושה).

מקור הידיעה של וינט הוא מאמר ב-New Scientist שם מספרים על מדען רוסי, איגור סוסלוב שמו, שפיתח מודל חישובי שמסביר את האבולוציה של ההומור. בשביל לקרוא את הכתבה המלאה ב'ניו-סינטיסט' צריך לרכוש מינוי (כמובן שאין לי, אם יש כאן מישהו עם גישה הוא מוזמן לעשות קופי+פייסט) ובכל זאת, גם מחלקיק הכתבה הזמין ניכר שבוינט פיספסו את כל הרעיון. המודל עליו מספרים ב-NS לא מצריך מודעות וזה ה-חידוש במודל של סוסלוב. [צריך לסייג ולומר שבאופן כללי, מושג המודעות ביחס למחשב הוא חמקמק כשקע ברומטרי. בינה מלאכותית משוכללת ו'מודעת' ככל שתהיה עדיין תקודד בביטים וקיטעי קוד של תנאי if ולולאות for ואלו – אין בהם לא קסם ולא מודעות].

מודעות זה כואב – אולי עדיף בלי

המודל של סוסלוב פשוט עוד יותר (כל-כך פשוט עד שאני מאוכזב שלא חשבתי עליו בעצמי). בגדול, טוען סוסלוב שהומור הוא הדרך של המוח האנושי להתגבר על טעויות בשליפת המידע מהמוח. כאשר למילה שתי משמעויות ואנו שולפים את המשמעות הלא נכונה מתקבלת בדיחה. באופן דומה – כאשר נשלפת מילה בעלת צליל דומה ומשמעות שונה אנחנו צוחקים.

'טעות בזיהוי' היא הגדרה די שטוחה ומצומצמת של הומור וגם סוסלוב עצמו לוקח את המודל שלו בערבון מוגבל "בסך הכל מין טריק שכזה," הוא אומר. מאידך, הוא מתייחס לרעיון ברצינות גדולה וטוען שהמודל יכול לסייע בבעיית האבחנה (disambiguation) בה נתקלים בתרגום ממוחשב. האמת שלא בדיוק ברור לי איך זה עוזר עם בעיית הדיסאמביגואציה אבל לפני שאני מכה בפעמון החרטא והספין כדאי שאקרא איזה מאמר אמיתי – כזה שלא מפורסם בעיתונות הפופולרית (אז איפה? תוספת מאוחרת: הנה, באדיבות יובל, המאמר המקורי של סוסלוב – חלקו טכני אבל חלקו קריא גם להדיוטות).

אגב, גם באוניברסיטה של אדינבורו פיתחו מודל פרמיטיבי להומור ממוחשב. "איזה רוצח מועשר בסיבים תזונתיים?" שואל המחשב האדינבורי וגם עונה: סיריאל קילר. בדיחת קרש, אבל לא רע בשביל מחשב.

פרטים נוספים על סוסלוב והמודל ההומור אפשר לקרוא גם בדיילי טלגרף (ושוב, מי שמניח את היד על המאמר מה-NS שיזרוק לי איזו עצם).

18 תגובות עבור “מחשב עם חוש הומור? LOL (משהו על הומור מלאכותי)”

  1. מפי הסוס(לוב):
    מאמר מתורגם שלו והפניות למאמרים קודמים:
    http://arxiv.org/abs/0711.2270

    יובל

  2. תודה יובל. ברשותך הוספתי את הלינק גם בגוף הפוסט.

    אורן

  3. האמת היא שכבר לפחות 20 שנה עוסקים בפיתוח תוכנות עם הומור. ההומור שהצליחו לפתח עד עכשיו הוא לרוב הומור ילדותי ורק היבט צר אחד של הומור (משחקי מילים של שתי שורות). אף אחד עוד לא הצליח לפתח בדיחות של ממש עם התחלה, אמצע וסוף. בעייה נוספת היא שהתוכנה (כתלות במאגר הנתונים שהיא מבוססת עליו) יכולה להפיק מאוד בדיחות אבל רק בודדות יהיו מצחיקות, והן אלו שאתה קורה בכתבות. בכל מקרה, לתוכנה אין שום דרך לדעת אם בדיחה מסוימת מצחיקה או לא, ונדרש שיפוט של בני אדם כדי לקבוע את זה.

    גיל

  4. אני חושבת שיש כמה סוגי בדיחות, או הומור. הסוג הראשון ואולי הפשוט ביותר לזיהוי ממוחשב הוא משחק המילים. הומור אסוציאטיבי, שמתייחס למצבים חברתיים (למשל, מילואים) הוא יותר קשה להבנה – לפעמים אפילו ע"י בני-אדם. למשל – אני לא הבנתי את הבדיחה שלך על התרגיל הצבאי (לפני כמה פוסטים).
    הומור תלוי מצב קשה לפעמים להעביר מתרבות לתרבות (ספר לבריטי בדיחה על מרוקאי) או מתת-תרבות אחת לאחרת (ממתכנת לפילוסוף).
    ציניות וסקרקאזם הם סוג אחר של הומור, שכפי שהיפנים הבחינו, הוא תלוי זמן ומצב גם יחד. "איזה יום מוצלח לפיקניק" יכול להיות מובן לשני פנים (או לשני יפנים?).
    אני בטוחה שאם אני אחשוב קצת אני אמצא עוד קטגוריות הומור, אבל אני חייבת ללכת.

    Neta

  5. נטע, זו בדיוק הבעייה של תוכנות מחשב שמדמות הומור. אין שום הגדרה שתהיה מקובלת על כל האנשים למה זה הומור. מעבר לכך, מחקרים מראים שרק אחוז קטן מאוד ממה שאנחנו צוחקים ממנו או תופסים מצחיק מקורו בבדיחות. רוב הזמן אנשים צוחקים כשהם בחברת אנשים אחרים, כשזורקים כל מיני הערות שמתאימות לסיטואציה החברתית הסםפציפית. את זה אף מחשב לא יכול לחקות.

    גיל

  6. הרעיון המקורי של אוצומי (מהמאמר משנת 2000) הוא לכן מעניין אם כי מאוד שאפתני ולא ישים.
    בניגוד לניסיונות ההומור המסורתיים שגיל מדבר עליהם ונדמה לי שגם סוסלוב, אוצומי ממש ניסה למדל את הסיטואציה. רק שלמדל סיטואציה ספציפית זה לא הכי מסובך (וגם לא פשוט) בעוד למדל את ה"עולם" זה (בינתיים) על גבול הבלתי אפשרי.

    לגבי סוגים שונים – כל מי שעוסק בתחום מתחיל עם מבוא שמקטלג את ההומור/אירוניה לסוגים שונים ואז תוקף אותם אחד אחד. אפילו אוצומי השאפתן בחר להתמקד במה שהוא מכנה אירוניה של סיטואציה.

    שניכם כמובן צודקים עד למאוד.

    אורן

  7. עוד ירחק היום בו יהיה משהו דמוי האל המפלצתי והחכם של ארתור סי. קלארק מאודיסאה בחלל. המחשבים של היום עם הליבה הכפולה של אינטל עדיין די טיפשים לעומת הרובוטים עם המוח הפוזיטרוני של אסימוב…
    ואם אני באת מרחיקה לכת ראו את מר. דאטה האנדרואיד החביב ממסע בין כוכבים הדור הבא שניסה כל חייו להיות אנושי ולהבין מהו הומור ולנסות להבין מהי בדיחה טובה. ולמרות שהוא היה מאוד משוכלל הוא לא הצליח להיות ספונטני, חופשי ומשוחרר כמו בן אנוש פשוט.
    אז מה אתם מצפים ממחשב של אינטל?? אבל לא אשבור את רוחכם מדעי המוח הולכים ומתקדמים וזה אומר שכדאי לכם לקרוא גם קצת את הספרים של ד"ר דניאל גולמן ואת הספר האחרון של ד"ר ראסטאק שניהם מתמחים בתחומים שדווקא יובילו אתכם לתשובה הנכונה.

    רחל

  8. כתוספת לביבליוגרפיה, הנה פרוייקט שמטרתו ליצור פירושים מצחיקים לראשי תיבות קיימים.

    דוגמאות מהמאמר:

    ACM – Association for Computing Machinery
    ! Association for Confusing
    Machinery
    FBI – Federal Bureau of Investigation
    ! Fantastic Bureau of
    Intimidation

    (יש עוד, לקראת הסוף, בפונט אחר).

    במימון של האיחוד האירופי! אני מעריץ את הבחור הזה.

    המאמר: http://acl.eldoc.ub.rug.nl/mirror/P/P05/P05-3029.pdf

    אתר הפרוייקט:
    http://haha.itc.it/

    ויש גם Workshop שלם:
    http://haha.itc.it/FAWCHindex.html

    יואב

  9. (ממתינה לאישור? מה זה זה?)

    יואב

  10. "ממתינה לאישור":
    כשכותבים תגובה עם יותר מלינק אחד אז התגובה לא מפורסמת מייד אלא עוברת למודרציה כי היא חשודה כספלוג לקידום אתרים. סליחה על אי הנוחות.

    צ'מע – לקבל מימון זו אומנות. לקבל מימון על בדיחה זו כבר ממש אומנות.
    למרות שעוד לא קראתי את המאמר של סוסלוב – נראה שהוא בעצם עושה מה שכולם עושים כבר שנים – שינויי קונטקסט ודימיון בהגייה. זה רק מדגים את הסקסיות של הנושא וכמה קל להגיע איתו לאנשים/עיתונים. (בהזדמנות אני אקרא את המאמר ואוכל את הכובע אל מול הגאונות החדשנית).

    אורן

  11. לפני כמה שנים ישבתי בהרצאה שנושאה היה "איך לכתוב הצעות מחקר שימומנו ע"י הNSF" (מקביל לBSF, אבל בארה"ב). בין השאר, המרצה נתן עצה – לחשוב על ראשי תיבות קליטים וחביבים לפרויקט. לדוגמא: SoSAFE – Southern San-Andreas Fault Evaluation לפרויקט שמטפל בהערכת סיכוני רעידות אדמה בדרום קליפורניה (ציניות? מאמריקאים?).
    לא מזמן השתתפתי בקורס שבו כל משתתף היה צריך להציע נושא לפרוייקט, והצעתי פרוייקט שנשא את ראשי התיבות SNOT. מה אומר ומה אדבר – זה עבד! כולם צחקו והפרוייקט שלי נבחר ברוב קולות*.

    בנושא קטגוריות ההומור – אכן, ניסיתי להצביע על כך שהומור זו מילת תיאור למגוון רחב של מצבים שגורמים לנו לצחוק או לחייך, ולכן לגרום למחשב "להבין" הומור זו משימה סיזיפית. קודם שיבין מה שמדברים אליו…

    * SNOT = Surveying Normal Ocean Transparency

    Neta

  12. אני מתבייש לאמר שצחקתי מרוב הבדיחות. ככה זה שאתה תוצר של לימודי הוראת מדעי מחשב.

    guy_o

  13. טוב, צ'מע – אני הבאתי כאן את היותר מוצלחות – אלו שבכל זאת יש בהן משהו.

    ואם כבר, הנה עוד פרוייקט מעניין על computational humor בראשות ראדה מיהלסי (?!) וכמה מאמרים נוספים בעניין:
    http://lit.csci.unt.edu/index.php/Computational_humour

    אורן

  14. שאלה: מה עושה איש בלי יד
    תשובה: הולך לחנות יד שנייה

    ניצן

  15. שאלה: למה לזברה יש פסים
    תשובה: כי היא ברכה מהכאלה

    ניצן

  16. שאלה: כלב ואיש נכנסו לאוטובוס
    האיש שאל את הנהג אם מותר להכניס כלבים לאוטובוס הנהג
    אומר אסור מותר מותר אסור למה הכוונה
    תשובה: כלב אסור שהוא חסום בפה מותר וכלב מותר שאין מחסום לפה אסור

    ניצן

  17. You have shed a ray of sunshine into the forum. Tnkhas!

    Candid

  18. yRfoRi lavltpqtzert

    uhaqxbgvu

להוספת תגובה