לפני כחודש התבשרנו שדובר סורי רישמי אישר שחיל האוויר הפציץ מתקן גרעיני. אחרי יום ארוך של בירורים ומסע לחצים סורי החליט האו"ם להפיל הכל על הש.ג.: המתורגמן - במקרה דנן. אני לא מאמין בזה. אפילו לא לרגע. זו דרכו של האו"ם למנוע משבר (שהרי סוריה שאיבדה מתקן גרעיני היא סוריה מושפלת, כלומר תאבת נקם. עדיף שסוריה תחשוב שהעולם חושב שזו הייתה סתם חווה חקלאית נטושה).
בארץ שיכללו את השיטה ועכשיו מאשימים את המחשב. כן, זה לא החומר האנושי אלא המחשב שדופק לנו את היחסים הבין-לאומיים. אנטישמי המחשב הזה. את הקטע הסרוק הבא שלח לי יואב (הקליקו על התמונה לפתיחה בחלון חדש):

למען האמת אני חושב שזו פיקציה – אגדה אורבנית. או שמישהו הסתלבט על צביקה ברוט, כתבנו בכנסת, או שצביקה עצמו חמד לו לצון. יואב חושב שזה יכול להיות אמיתי. אם זה אמיתי זה מביך עוד יותר.
ולמה פיקציה?
פיקציה. אחת הבעיות בתרגום ממוחשב (תרגום אוטומטי, תרגום מכונה, machine translation, יו ניים איט) היא דיסאמביגואציה (disambiguation) – כלומר אבחנה בין משמעויות שונות של אותה מילה. המחשב – יצור די טיפש בסך הכל לא מבין דקויות עדינות של משמעות וכל מה שאפשר לעשות זה להתייחס לקונטקסט המילולי. המילה branch משמעותה ענף או סניף, תלוי בהקשר. בתרגום מעיברית המצב קשה עוד יותר בגלל היעדר הניקוד שמוסיף משמעויות שונות. המילה 'מטה' למשל יכולה להיות שם העצם 'מיטה' בכתיב חסר, יכולה להיות שם העצם מקל, מפקדה (מטה הכוחות המשולבים), החוויית כיוון (למטה) או פועל (הסורים מטים את יובלי החצבני) ועוד היד נטויה (חה חה).
המחשב "מפצח" את הקונטקסט המילולי באחת משתי שיטות השיטה הסטטיסטית (SMT – Statistical Machine Translation) או לפי חלקי דוגמאות ותבניות (EBMT – Example Based MT) – בגדול, בשני המקרים מזהה המחשב חלקים ידועים ובודק מה מתאים אליהם בהסתברות הגבוהה ביותר.המחשב, לכן, עושה טעויות תרגום משעשעות אבל מאוד אופייניות.
ועכשיו נחזור לידיעה של כתבנו בכנסת.
1. "האם ביקורך בישראל שינה את יחסך לאיזור לטוב או לרע?" תורגם ל"האמא שלך ביקרה בישראל והיא ישנה במיטה". אז נכון שהמילה 'האם' יכולה להיות גם מילת השאלה וגם the mother, ונכון שהמילה 'שינה' יכולה להיות משם הפעולה 'לשנות' (changed) ויכול להיות גם מלשון לישון (sleep) בהינתן קונטקסט, הסיכוי שמחשב יעשזה בילבול סטטיסטי שכזה הוא קיים אבל די נמוך.
2. אבל החלק במוזר ביותר הוא שירבוב המילה מיטה. אין מצב בעולם שתוכנת תרגום תכניס מילה אקראית שכזו בשביל להשלים את הקונטקסט. ההכנסה של המילה מיטה מצביעה על מעורבות של מתווך אנושי בסיפור – מישהו עם דימיון גדול שרצה לתפור סיפור.
שימו לב לדימיון הפונטי בין המילים bad ו-bed. במשפט המקורי "האם ביקורך בישראל שינה את יחסך לאיזור לטוב או לרע?" מופיעה המילה 'לרע' שיכולה, כמובן, להתרגם ל-bad. אבל איך ה-bad הפך ל-bed – זה כבר מעשה ידי אדם – מישהו עם אוזן רגישה ואסוציאטיבית. מחשבים הם אמנם טיפשים אבל יש טעויות שהם לא עושים – אין להם אסוציאציות שכאלה.
3. עכשיו נניח שקיימת תוכנה כה עלובה שתירגמה בצורה כזו – אפילו הלא יוצלחים של קבוצת אנשי התקשורת (או הפוליטיקאים או משרד החוץ) היו מסוגלים להבין את המילה mother שפתאום צצה לה ולהבין שמשהו השתבש. (אם ההולנדים הזמינו אותם למפגש עם שר החוץ כנראה שהם לא חבורת ילדים איזוטרית והבנת אנגלית של הית ספר יסודי בוודאי יש להם).
4. בנוסף – אם הסיפור היה אמיתי היינו מצפים לקבל כמה פרטים עסיסיים כמו מהי התוכנה בה השתמשו ומיהם אותם 'אנשי תקשורת' מוצלחים.
5. "הוודקה טובה אבל הבשר רקוב": אגדה אורבנית שקשורה לתרגום מכונה היא על מערכת תרגום אנגלית-רוסית. המערכת תרגמה מאנגלית לרוסית (ובחזרה, כדי לבחום את התוצאה) את המשפט מהברית החדשה: "הן הרוח חפצה אבל הבשר רפה" (the spirit is good but the flesh is weak) והתרגום שהתרקבל גורם לישו להתגעגע לצלב - "הוודקה טובה אבל הבשר רקוב". המשפט המקורי, אגב, מתאים מאוד למצב התרגום הממוחשב - הן הרוח רוצה אבל המחשב רפה.
6. ועכשיו סיפור אמיתי. לפני כמה שנים הסתובב ברשת אימייל שהאיץ באנשים לנסות את מערכת התרגום של אלטה-ויסטה (נדמה לי). השעשוע היה כדלקמן: אם כתבתם משהו כמו "I like drinking warm milk" ותרגמתם לספרדית ואז בחזרה לאנגלית וחוזר חלילה עשר פעמים, היה מתקבל משפט כמו "I love your hot mother’s breasts" (המשפטים הם מזיכרון אבל בהחלט משקפים את רוח הדברים). נראה לי שהמקור העלום של כתבנו בכנסת פשוט החייה את הסיפור הישן ועשה עליו מין פולו-אפ. זה מה שכתבים עושים לא?!
ונקנח בעוד סיפור אישי על הולדתן של אגדות אורבניות מאובקות. בשירות הסדיר, כשהייתי בצמ"פ (צוות-מחלקה-פלוגה) התחלף הקשנ"ר (קצין שיריון ראשי). כמיטב המסורת הגיע הקשנ"ר אל הגדוד כדי לעשות מסלול סיום בו הוא יפקד על טנק: יירה, ישמיד ואף יסתער על מטרות דמה מלאות בסולר – בקיצור יחדש את עלומיו כקדם. אין כמו ריח הנפלם על הבוקר ואכן שעת השין נקבעה ל-0800. אני וחבר בדיוק חזרנו משמירת הלילה, ישובים על המיטות בחדר המשמר ומחכים לשמוע את היריות שיסמנו את תחילת התרגיל. כלום. שקט. הדקות נוקפות, השקט רועם והתותחים שותקים. באווירת נונסנס אופיינית למי שירד ממשמרת לילה אמרתי לחבר שבטח התרגיל מתעכב כי הקשנ"ר החטייאר בטח שם קפלס"ט שנראה כמו VRC במקום ג'נטקס* ולכן הוא לא היה מחובר למערכת הקשר ולא יכל לתקשר עם הצוות ולהתחיל את התרגיל. בדיוק נכנסו לחדר עוד קבוצת שומרים, שמעו את התיאוריה וכשתמהו על הדבר הנהן להם החבר במרץ כזה שאי אפשר היה לערער על הסיפור. המעשה פרח לו ונשכח כמו מעשיות מטופשות רבות אחרות. אבל תם ולא נשלם סיפור הקשנ"ר. כחצי שנה אחר-כך בקו ברמת הגולן ישבנו בשקם בדחקיה המקובלת (עוד משתמשים במילה הזו?) וקצין לא מוכר – מישהו מחטיבה אחרת בכלל סיפר, כבקיא ורגיל וממתיק סוד, שבמסלול הפרידה חבש הקשנ"ר קפלסט במקום ג'נטקס…
את השם של הקשנ"ר אף אחד לא זוכר אבל במילואים, פעם בכמה שנים מגיע עוד מישהו ומספר את הסיפור על הקשנ"ר. שמעתי שהקשנ"ר במשלחת להולנד.
*אילו פורומים מוזרים יש ברשת הזו. באמת צריך לסגור את האינטרנט.

סיפור יפה על הקשנ"ר. עוד לא יצא לי לשמוע אותו.
במקרה של התרגום זה סיפור שכנראה התרחש במציאות, מאחר שאחד הקוראים בslashdot טדח לודע עם משרד החוץ ההולנדי את הנכונות שלו.
מרק ק.
נובמבר 15th, 2007
הסיפור אמיתי. הנה מקור מול "תרגום" באתר ice:
http://www.ice.co.il/article.asp?pgId=112580&catId=2
אותו סיפור בבלוג של יעל סלע שפירו:
http://www.notes.co.il/yaelsela/38144.asp
לאור הטקסט המקורי - יש כאן לדעתי "טלפון שבור" בידיעות אחרונות - או של כתבנו בכנסת, או המגיה, או העורך….
יובל
נובמבר 15th, 2007
כנראה שהיה סיפור מסויים שגרם לאיזה קצר דיפלומטי אבל נראה לי שבדרך לעיתון הסיפור נופח קצת. אחרת באמת אין לי הסבר לאיך השתרבבה לשם המיטה.
או שאני צריך לאכול את הכובע וגם מעט הקרדיט שנתתי לתוכנות תירגום (ולמי שמפתח אותן) ולעיתונאים היה מוגזם. והעיתונאים - אוי לבושה! אני רוצה שמות…
ולרווחת הקוראים - הנה הפוסט והתגובות בסלאשדוט:
http://politics.slashdot.org/article.pl?sid=07/11/09/1656208&from=rss
בסלאשדוט זה מתוייג גם כמתיחה (hoax), ושימו לב לתגובה הזו שם http://politics.slashdot.org/comments.pl?sid=355777&cid=21301541 שמפנה גם לYNET וטוענת שהמילה bed היא סתם שגיעט קטיו ולא חלק מהתרגום. בוינט, אגב, מצויין שהתוכנה היא בבילון ושהכתב החכם הוא יעקב אייכלר (לא מכיר).
אם כבר סקפטיות - האם אפשר לסמוך על המגיב בסלאשדוט שטוען שהשגרירות ההולנדית אישרה את הסיפור? והנה לינק ישיר לתגובה של אותו מגיב, שגם הוא טוען שהסיפור נופח ועם הזמן נוספו לו פרטים: http://politics.slashdot.org/comments.pl?sid=355777&cid=21300221
יש הפניה גם לעתון הולנדי שמדווח על הסיפור, אני מבין קצת הולנדית וברור שגם שם יש אי דיוקים אם הם לא נפלו בפח בדיוק כמו עיתונאים אחרים. בכל אופן, החלק המעניין והאירוני בדיווח בהולנדית הוא שההולנדים דחו את הביקור לא כי הם נעלבו ולא בגלל משבר דיפלומטי אלא כי רמת האנגלית של העיתונאים לא מספקת בשביל לקיים סיור בהולנד ולבקר באוניברסיטאות וההולנדים סבורים ששימוש במתורגמנים הורס את הספונטניות והקשר הבין-אישי…
ובקיצור, בשביל לדעת את האמת צריך להרים טלפון להולנדים ולברר אם יש בסיפור שמץ של אמת ואם כן - מה. אבל אני מעדיף לבזבז את הזמן על בלוגינג (או על עבודה) במקום על תחקיר עיתונאי.
אורן
נובמבר 15th, 2007
שמעו חבר'ה לא נעים לי מהחבר'ה במשרד החוץ… מה אנגלית תקנית זה לא חלק מתוכנית הלימודים שלהם? למה בדיוק מכשירים את הצוערים, העוזרים ושאר עגבניות? ואם זה באמת ברווז עיתונאי יקום הכתב המהולל ויאמר ניפחתי בשביל הסקופ והחבר'ה שלא ישעמם להם כשהם פותחים את העיתון בבוקר.
ולשרת החוץ גברת ציפי ליבני: עד מתי לא תלמדי את הלקח? אנגלית שפה רשמית תקנית. וביחסי חוץ בחיי שלא מכניסים אמהות וקרובי משפחה. צריך גם מה שנקרא אינטלגנציה רגשית. ולכנסת ה - 17 אין את זה אבל ממש אין. נא לקרוא לפני בבילון וכל השאר את הספרים של ד"ר דניאל גולמן. הם תורגמו לעברית לנוחיות עובדי משרד החוץ. ולכתבינו בכנסת - נא להיות יותר רציני בדרך אל הסקופ הבא אל תזלזל באינטלגנציה של הקוראים שלך ולא בהולנדים מספיק עשינו להם סמטוכה עם הספינה של יס….
רחל
נובמבר 17th, 2007
תגידי, רחל, מה בדיוק הקשר לאינטליגנציה רגשית?
בכל תגובה את משחילה את "דר" דניאל גולמן" וזה מתחיל להיראות כמו קידום מכירות. או שמתפתחת כאן כת גולמן ואני לא שמעתי עליה?
אגב, הפאשלה כאן (אם הייתה) לא הייתה של צוערים או של משרד החוץ (יש להם מספיק פאשלות מביכות משלהם) אלא של קבוצת עיתונאים.
אורן
נובמבר 18th, 2007
אגדות אורבניות שהתחילו בהלצות זה נהדר, במיוחד אם אתה שותף לדבר הסוד של מי שהפיץ את זה.
ידידה שלי בפורום אלכוהול כלשהוא נשאלה למה ייגרמייסטר אינו כשר (התשובה - כי אין הכשר רשמי מהחברה המייצרת ומשגיחי כשרות גם לא אוהבים את הצלב על המדבקה). היא מיד נתנה תשובה סרקאסטית ומופרכת על ארוע שבו שעט עדר חזירים בטעות לתוך המפעל ונפצע מהמכונות ומאז אכב החשש משאריות דם חזירים אוסרים על המשקה באולמות חתונות. (זה היה יותר מצחיק במקור אומרים לי)
שנה אח"כ היא רואה אנשים בפורום אחר מסבירים בלהט את הסיפור לשואל חדש כאילו היה הדבר אמת ידועה והיסטריה היסטורית לאמיתה. אנשים לא יודעים לראות סרקאזם כשהוא פוגע להם בין העיניים…
עירא
דצמבר 3rd, 2007
סיפור גדול. וכמעט דומה אם כי לא כל כך מוצלח - כבר קרה לי שהסברתי למישהו שמשהו לא כשר כי יש בו מלא חזירונים קטנים ומקפצים והוא שאל אותי - מה באמת (או שאמר לי שזה לא נכון).
אורן
דצמבר 3rd, 2007
[…] עוד משהו קטן על תרגום ממוחשב: ואת אמא שלך גם. SHARETHIS.addEntry({ title: "של מי היוזמה הזו?", url: […]
תרגום ממוחשב או עריכה רשלנית
מרץ 18th, 2008