מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

לפני כמעט שנה כתבתי על עלילות יוליוס קיסר והכבשה. תזכורת: בניסיון לתרגום הביטוי veni, vidi, vici מלטינית לעברית פלט גוגל "באתי, ראיתי אני כבשה". מצחיק ומביך, לא? כתבתי אז על אלגוריתם התרגום ואיך סדרה של צעדים סטטיסטיים גרמה לשיבוש – שיבוש מביך פחות מזה שנראה במבט ראשון, ובציטוט מהפוסט:

זה מוזר מעט (רק מעט) פחות כשמבינים שלא מדובר בכבשה (בעעעעעעעע, sheep) אלא בהטיית עבר במין נקבה של השורש כ.ב.ש. (conquered)…
טוב, אז אנחנו כבר באותו שדה סמנטי, כלומר עוסקים בנצחונות וכיבושים אבל מה עם ההטיה המוזרה וחסרת ההקשר (וההסכמה, agreement) "אני כבשה"? כלומר אם מדובר בגוף ראשון ("באתי", "ראיתי", "אני") אז למה הפועל בגוף שלישי "[היא] כבשה"? ושאלה שניה – למה החליט המתרגם שמדובר כאן בהטיית נקבה ("באתי", "ראיתי" הם נייטרליים)?

כאמור, את ההסברים האלגוריתמיים אפשר לקרוא בפוסט המקורי. הנושא המעניין שלא נדון שם הוא לא הביצועים המוזרים של התוכנה אלא דווקא הביצועים המוזרים של הקורא הנבון. בפוסט הזה אני מתמקד בגורם האנושי ומשער השערות בלשניות-קוגניטוביות באשר לטעות.

את ההשערות האלו, העליתי כבר אז באזני יובל מהדגשים הקלים ובאזני אחותי שנחרו בבוז, הציעו הסברים אלטרנטיביים והצביעו על פגמים (מדומים!) בתאוריה שלי. מאחר ואני לא זוכר (הדחקתי) את הביקורות, אני פורש את התיאוריה בפני הקוראים הנאמנים. אם יש לכם מה לומר – ברינג איט און.

 

ראשית חכמה – הקדמה קוגניטיבית – priming (הא! משחקי המילים)

בפסיכולוגיה הקוגניטיבית, priming או הטרמה פירושו (מויקיפדיה העברית):

הפעלה חלקית של ייצוגים או אסוציאציות בזיכרון, לפני ביצוע פעולה או משימה. לדוגמה, בניסויים שנערכו, התבקשו נבדקים לקבוע אם מחרוזת אותיות מסוימת היא מילה תקנית בשפה נמצא, כי זמן הקביעה למילה 'אחות' התקצר אם קדמה לה חשיפה למילה כגון 'רופא'. הטרמה היא הפעלה זמנית של סכמה קוגניטיבית.

כלומר, המילה 'צבא' מהווה הטרמה למילים כמו 'מלחמה', 'ניצחון', 'הפסד', 'כיבוש' וכו' ולכן בהינתן המילה 'צבא' המוח יזהה (יפרש/יקלוט/יצרף) את המילה 'מלחמה' לפני שיזהה את המילה 'מסעדה'. נחזור לדאחקה על התרגום של גוגל. האפקט הקומי שהפך את התרגום לויראלי (בחוגים מסויימים) נובע, כמובן, מההיכירות המוקדמת עם הביטוי הלטיני ותרגומו העברי אל מול האקראיות בתרגום של גוגל. היינו סלחניים בהרבה אם התרגום היה "באתי ראיתי היא ניצחה". היינו מרימים גבה אלגוריתמית ופוטרים את זה בהסבר יבשושי על ,תרגום מכונה סטטיסטי שמבוסס על עצי גזירה לעומת כזה המבוסס על תבניות. אבל כיבשה?! נו באמת.

ההכירות עם הביטוי המקורי והציפיה לתרגום סביר ומוכר לא יוצרת רק את האפקט הקומי אלא יוצרת  גם הטרמה (אנחנו מצפים ל"באתי, ראיתי, ניצחתי", או ל"באתי ראיתי, כבשתי"). ועם ההטרמה באה גם המוזרות הקוגניטיבית. למרות שיש  הפעלה של השדה הסמנטי ה"מלחמתי", אנחנו קוראים את המשפט המגוחך והלא סביר "באתי ראיתי אני כיבשה" (בלי י') במקום את המשפט המגוחך והסביר יותר "באתי, ראיתי, אני כבשה (conquered)".

לכיבשה יש יתרון על הכיבוש. "באתי, ראיתי, אני כבשה" הוא משפט חסר משמעות, אבל הוא תקין תחבירית (בדיוק כמו אותם רעיונות חומסקיאניים ירוקים חסרי צבע). התקינות הדיקדוקית, כך נראה, מועדפת על ידי הקוראים (כלומר על ידי מנגנוני העיבוד של המוח) על פני מנגנון ההטרמה, וזאת למרות שהטרמה היא פעילות מוחית אינסטינקטיבית ולא מודעת לעומת תקינות דיקדוקית שמצריכה מאמץ קוגניטיבי רב יותר (אני לא משוכנע בחלק האחרון של המשפט).

המדגם הלא מייצג של אנשים שפגשתי קראו כולם כיבשה (וכך כנראה קרא כל מי שהעביר את בשורת הבדיחה). אף אחד, מלבד הבלשנים (החישוביים) לא עצר אחרי דקותיים ואמר "רגע, זה בעצם כבשה ולא כיבשה". התקינות הדיקדוקית ביטלה לחלוטין את אפקט הפריימינג*, אפילו במחיר יצירת משפט מופרך סמנטית. בעיניי זה די מדהים. ואם אני לא טועה זו גם תובנה בלשנית-קוגניטיבית חדשה**.

——-

 

*עמרי מעיר שאולי המילה כיבשה שייכת גם היא לשדה הסמנטי של מלחמה.  כיבשה כמטאפורה לפחדנות.

** טוב, אולי לא כל כך חדשה. בדיוק מצאתי את המאמר הלא חדש הזה שיכול להיות מאוד רלוונטי. אבל הוא ארוך ומרוטש ולא הספקתי לקרוא את כולו ולהחליט אם הוא תומך בתיאוריה או שהתיאוריה סותרת אותו: Automatic Access of the Meanings of Ambiguous Words in Context: Some Limitations of Knowledge-Based Processing
(PDF של 3.2 מגה, Cognitive Psychology, 1982)

ויש כמובן הסבר נוסף ופחות מרעיש – הפריימינג לא מתבטל לחלוטין אבל המרה של "באתי ראיתי אני כבשה" למשפט המוכר דורשת יותר מדי צעדים (באתי, ראיתי, אני כבשה ← באתי, ראיתי, אני כבשהתי ← באתי, ראיתי,  אני כבשתי) ולכן, למרות הפריימינג, הנתיב המהיר של המוח מעדיף את המשפט חסר המשמעות אך התקין תחבירית על הכיבשה. ברגע שהתקבל משפט סביר מספיק (אני כיבשה?!), נזנחים מסלולי העיבוד/פרשנות המקבילים (אני-היא-כבשה/ניצחה).

 

20 תגובות עבור “הכיבשה שכבשה: יוליוס קיסר cognitively revisited”

  1. "אם הוא תומך בתיאוריה או שהתיאוריה סותרת אותו" –
    אתה גדול.

    The Vidi

  2. אני די בטוח שמה שגרם אצלי לקריאה כיבשה ולא כבשה זה ה"אני".
    אני לא יודע אם אפשר לקרוא לזה הטרמה, זה כנראה לא בדיוק זה, אבל המילה "אני" הרבה יותר קרובה ל"ניצחתי". תחבירית הביטוי "באתי ראיתי אני כבשה הוא שלושה משפטים שונים כך שלפחות לי אין שום ציפייה שהמשפט השלישי יהיה קשור לאיזה שהיא הטרמה של השניים הראשונים.

    וחוץ מזה שגוגל sucks, הם עשו את buzz, את גוגל פלוס, ועוד המון המון פאדיחות שאף אחד לא זוכר וגוגל יותר מכולם היו רוצים לשכוח. זה שהם יודעים לעשות מנוע חיפוש מעולה (טוב, גם שרת מייל לא רעבכלל). לא הייתי קונה מהם מכונה תרגום משושמת…
    http://eincyclopedia.wikia.com/wiki/%D7%9E%D7%9B%D7%95%D7%A0%D7%94_%D7%AA%D7%A8%D7%92%D7%95%D7%9D

    מהגג

  3. התרגום הנוכחי מלטינית הוא:

    "באתי, ראיתי, אני צבר"

    כשנותנים לו לבחור שפה, הוא דווקא בוחר מסלובנית ואז התרגום יוצא "וריד, לראות, טיפש"

    חנן כהן

  4. the vidi –
    תהיתי מי יעלה על הנכלוליות במשפט הזה (והייתי צריך לנחש מאיזה תחום הוא יבוא).

    מהגג –
    הטרמה היא לא מודעת כל שאני לא בטוח ששיקולים כמו "אלו שלושה משפטים נפרדים ולא קשורים" תופסים כאן. מה גם שהם קשורים, בהינתן שאתה מכיר את הביטוי המקורי.
    אבל אני בהחלט חושב שיש ל'אני' השפעה חזקה והוא בעצם מכתיה התאם (תחבירי) בין הנושא להטיית הפועל וזו בדיוק הטענה בפוסט – התאם תחבירי גובר על פריימינג.
    (אגב, עם כל זה, גוגל מספקים את אחד המתרגמים המהירים והטובים בשוק).

    חנן –
    זו כנראה בדיחה פנימית של איזה גוגלר שנחשף לבדיחה הויראלית.

    אורן

  5. חנן –
    הנה צילומסך של התרגןם המכובש: http://www.sciencefriction.net/blog/wp-content/uploads/2011/03/veniViDiViciSmall1.png
    (מהפוסט המקורי)

    אורן

  6. אני קוראת עכשיו את הספר של דניאל כהנמן, ולפי מה שהבנתי משם, גם הטרמה וגם תקינות דקדוקית לא מצריכים מאמץ קוגניטיבי מודע (הפעלת מערכת 2) אלא מטופלים על ידי מערכת 1. אולי ההבדל הוא שלהטרמה יש אפקט קצר-מועד בעוד שתקינות דקדוקית תקפה תמיד? חומסקי חומסקי חומסקי.

    אגב, הספר מעניין ומדכא כאחד.

    Neta

  7. נטע –
    לא אמרתי שתקינות דיקדוקית היא בהכרח פעולה מודעת אלא שהיא כנראה דורשת מאמץ קוגניטיבי רב. למשל, אם נהיה חומסקיאנים קיצונים ונניח שהמוח בונה עץ גזירה ובוחר את המסתבר ביותר – הרי זו פעולה חישובית די מסובכת.
    כמובן שאפשר לומר שהתאם מין-גוף-הטיה פועל במסלול מהיר מאוד ולא מצריך עץ גזירה בכלל (ביחוד אם, כמו שהעיר המהגג, קיימת המילה אני שמהווה סוג של "פריימינג" דיקדוקי).
    ומה זאת אומרת תקפה תמיד? מערכת התקינות הדיקדוקית לא מופעלת כשאני בוחן בעיון ציור סוראליסטי (לא תקין "סמנטית") של דאלי.

    אולי תכתבי פוסט אורח על הספר של כהנמן?

    אורן

  8. דיסקליימר: אני לא בלשנית. המונחים שאני משתמשת בהם הם בסבירות גבוהה לא נכונים, וזה יכול לגרום קצר תקשורתי, אז אני אנסה להבהיר את כוונתי:

    הרעיון של כהנמן הוא שיש לנו בראש 2 מערכות, אחת שפועלת אוטומטית כל הזמן ואחראית על הרבה מההחלטות והתגובות שלנו (1+1=?), ושניה שדורשת יותר מאמץ (17*23=?). פעולות של מערכת 1 לא דורשות מאיתנו מאמץ מיוחד, וזה כולל למשל להחליט אם משפט הוא דיקדוקית נכון, או איזה קו יותר ארוך בציור למטה.
    >—-<

    לעומת זאת מערכת 2 נכנסת לפעולה כשמשהו "מעיר" אותה – משהו יוצא דופן או שדורש מאמץ נוסף. למשל, הזיהוי של "באתי, ראיתי, אני כבשה" כמשפט תקין במובן הצמרירי קורה כתוצאה של פעולת מערכת 1, ואילו ההערכה שמשהו כאן לא בסדר והחיפוש אחר ההסבר הלוגי הוא של מערכת 2. רוב האנשים מתעצלים להפעיל את מערכת 2 ולכן הם לא יקשרו את הכבשה הצמרירית עם הכיבוש המשחית, אלא רק יצחקו לעצמם על גוגל הלא-יוצלחים. בכל מקרה, הפעלת מערכת 1 היא "זולה" קוגניטיבית.

    ב"תקפה תמיד" התכוונתי שאין לה הגבלת זמן, כמו להטרמה. מה שנשמע לי נכון היום יהיה כך גם מחר, אבל כבשה מזכירה לי היום צמר ומחר היא תזכיר לי אחו.

    בתשובה להצעתך, אם לא הייתי ממש עסוקה בעזיבת פאריז וחזרה לארץ בעוד כמה שבועות, אולי הייתי מספיקה לסיים את הספר ולכתוב עליו פוסט. כלומר, לא כרגע, אולי יותר מאוחר?

    Neta

  9. (הקו השני לא יצא, בטח בעיית קוד הטמל)

    Neta

  10. אישית, אני מכיר רק את "באתי, ראיתי, נצחתי", ולא את "כבשתי", לכן "אני כבשה" נראה לי ממש מוזר. מענין אם "באתי, ראיתי, אני נצח" היה נראה מוזר באותה מידה.

    חוץ מזה, האסוציאציה הראשונה שלי היתה אחרת לגמרי: לפני בטח 30 שנה קראתי תרגום היתולי למונחי מחשב. video ram היה "קריאת הקרב המפורסמת של המצביא הביזנטי מרקוסילוס, ומשמעה 'כבשים ראיתי' "

    מודי תולשששש

  11. אהלן, הגעתי בטעות. נהניתי מאד לקרוא, תענוג צחקתי בקול רם מול המסך. עדיין, אני לא חושב שיש לפריימינג קשר הדוק למה שיש פה. מה שיש פה זה השפעה של ניתוח התחביר (ושל הניסיון לחזות את המילה הבאה תוך קריאת משפט) על פארסינג פונולוגי – בעברית אנחנו מתמודדים עם ש שמאלית מול ימנית למשל ואנחנו בוחרים לקרוא כך או כך לפי ההקשר הקצר ביותר – המילה כמו במילה שרות או ההקשר הקצר כמו
    שר האוצר מול שר במקלחת.
    גוגל מצחיק כתמיד, אבל אם מפרגנים לו בהקשר ארוך הוא לפעמים לא ערימת זבל. נ.ב. כהנמן גאון, אבל בבלשנות הוא לא מבין.

    רועיצ

  12. נטע –
    רשמתי ואני זוכר. אני אציק.

    מודי-
    למען האמת גם אני הכרתי את "באתי, ראיתי ניצחתי" ולא 'כבשתי'. אבל גם 'ניצחתי' מהווה פריימינג ל'כבשתי' (אותה רשת סמנטית) וגם בירור קצר (למשל ויקיפדיה) מראה ששני הביטויים נפוצים. גם גילול שלהם מראה מספר די דומה (וגדול) של תוצאות.

    רועיצ-
    תודה. אני מסכים שיש כאן כנראה ניתוח תחביר. מה שמפליא הוא שזה גובר על פריימינג למרות שהמשפט התחבירי חסר כל היגיון.
    אגב, הייתי מפרגן לכהנמן גם ידע בבלשנות.

    אורן

  13. המשפט "אני עז" הוא בעל משמעות בעברית, כך ש"אני כבשה" (מהסוג שמצטופף עם העיזים בדיר) יכול להיות באותה משמעות.
    זאת ועוד: "באתי, ראיתי" לא עושה מסגור למלחמות ו/או כיבושים. אלה מילים נפוצות שמתאימות לרוב השדות הסמנטיים.

    אפרת

  14. אפרת –
    כמה נקודות:
    1. ברור לגמרי שבמחינת גוגל (אלגוריתם) ה'כבשה' זה השורש כ.ב.ש בהטיית עבר נקבה ולא כיבשה שעושה בעעעעע.
    2. מעולם לא נתקלתי ב'אני כבשה' כביטוי כך שאולי פרשנות מקילה מאפשרת אותו אבל זה לא בדיוק מסתדר. הסבירות שהביטוי 'אני עז' יגרום לתרגום vici כ'אני כבשה' היא אפס והסיכוי (בהקשר הזה) לפריימינג עז-כיבשה הוא אפס.
    3. ובכל אופן, הנקודה היא שלא ה"באתי, ראיתי" עושים את ההטרמה אלא ההקדמה "נסה לתרגם את veni,vidi,vici". מי שלא הבין את ההקדמה גם לא יצחק מהתרגום המוזר כי מבחינתו זה בהחלט תרגום אפשרי (הוא הרי לא יודע לטינית).

    אורן

  15. אורן,
    התקבולת "אני כבשה"/"אני עז" לא מסבירה את האלגוריתם, אבל לדעתי כן יכולה להסביר למה, כדבריך, אף אחד, מלבד הבלשנים (החישוביים) לא עצר אחרי דקותיים ואמר "רגע, זה בעצם כבשה ולא כיבשה".
    כמו כן אני רוצה לציין שאני לא בלשנית, וכן שמבחינתי ההטרמה היא ספציפית ל"באתי, ראיתי ניצחתי". גם אם גוגל היה מתרגם "כבשתי" הייתי מתבלבלת.

    אפרת

  16. אני כרגיל אגיב הכי עוף טרופי וממש לא אכנס לכל הדיון המעמיק (או שמא מע-אלק-מיק D:), אני רק רוצה להעיר של-Agreement יש מונח בעברית והוא הֶתְאֶם.

    אילן, נו, שוין, בלשן

  17. תודה אילן.
    (ויש לך מושג איך מוסיפים בנוחות ניקוד בלינוקס?)

    אורן

  18. […] הסברתי את הטעות הסטטיסטית שגרמה לתרגום המשובש, בפוסט הכבשה שכבשה – יוליוס קיסר cognitively revisited – אני מנסה להסביר את הטעות האנושית שגורמת לרוב […]

    יוליוס קיסר, הכבשה ומעמד האישה

  19. התרגום מסלובנית השתפר בינתיים ל "הווריד של טיפש יכול לראות".
    פואטי משהו.
    מלטינית זה נותן תרגום נכון (עובד גוגל כלשהו???)

    רפי

  20. […] ואני, נאיבי שכמותי, חשבתי שהסינים דווקא מחמשים את האיראנים.  גוגל-טרנסלייט, שהיה החשוד המיידי להפקת התרגום הזה, צולח יפה את המשוכה הספציפית הזו (והנה עוד הצעה לחיסכון לשוקן) . מאידך, גוגל-טרנסלייט כושל בכל אספקט אחר של תרגום הפיסקה הזו (והרבה אחרות): […]

    איפה המהדיר? מעין מכתב לעמוס שוקן

להוספת תגובה