מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

על מבטאים, כנסים וערוצים רועשים.

נפתח בצחוקים על השכבות החלשות.

למה בכלל לדבר אנגלית דווקא? במדור 'השראה' בכלכליסט כותב שיזף רפאלי  מה סוד כוחה של האנגלית (שמועברת לטיפול בדגש קל שישפכו עליה את זעמם).  אבל העיתוי מסתדר לי מצויין עם סיכום כנס ה-ACL. השנה קיבלתי החלטה לא להשחית את זמני על הרצאות של סינים. כשגזען שכמותי אומר סינים מתכוון הוא מתכוון לכל סוגי האסייתיים מהמזרח הרחוק. הסיבה לזה היא שאני פשוט לא מצליח להבין מילה ממה שהם אומרים (באנגלית). המושג broken english מקבל אצלם משמעות חדשה. האנגלית שלהם לא שבורה אלא מרוסקת, כתושה וכתותה.  וזה לא רק התחביר אלא גם, בעיקר, המבטא. תוסיפו לזה שקפים עם עומס וויזואלי שיכול לגרום להלם קרב ותקבלו חצי שעה של בהייה תוך מאמץ קוגניטיבי שנידון לכישלון. בעבר הייתי מתאמץ. היום אני כבר למוד תבוסות ויודע שאין לי סיכוי. אני מעדיף לחכות עד שיגמרו לפתח את המתרגם הסימולטני – עניין של שנה-שנתיים. או עשר.

הערה: זה טוב יפה לצחוק על שינים סינים והאנגלית שלהם, אבל כידוע, גם לנו היו כמה שרים בכירים שנשמעים כמו בוראט (וברשת מסתובבים גם כמה סרטונים בהם אני מדבר אנגלית ומי שרוצה לינק שימצא לבד):

בקיצור – אין יותר הרצאות של סינים (ולא של עמיר פרץ). חרם. וזה חבל. כי בכנסים במדעי המחשב (עיבוד שפה)  יש כחמישים אחוז אסייתיים (איך זה בתחומים אחרים? התגובות לרשותכם ). מה שאומר שחצי מהכנס הופך מראש ללא רלוונטי.  משיחות אקראיות עם קולגות מרחבי העולם עלו תובנות דומות. חלקם לא נכנסים להרצאות של סינים וחלקם נכנסים ועובדים על הלפטופ, יודעים מראש שקל יותר לפצח את האניגמה מאת המבטא של הדובר.  כאמור, חבל.

וכאן מגיעות כמה תהיות  עמוקות מני ים:

1. מה אפשר לעשות? (נניח, לחייב אותם למסור את התמליל מראש ולהפיק כתוביות כמו באופרה).
2. מה זו האנגלו-צנטריות הזו? אם חמישים אחוז מהדוברים בכנס הם סינים (כבר שנים אומרים לנו שהם משתלטים על העולם) – אז מה פתאום מחייבים אותם לדבר אנגלית ולא סינית. הסתייגויות: א) 50% הם לא סיניים אלא אסייתיים. והם לא מדברים שפה משותפת. אפילו הסינים לא חולקים שפה משותפת. ב) הפניה חוזרת לרשימה שלונקקה מהשראה עם התאוריות המוזרות שלה.
3. למה באמת הפכה האנגלית ללינגואה פרנקה? (פוליטיקה, השפעה כלכלית, וכו' הם החשודים המיידיים והנכונים)  האם באמת יש במבנה של האנגלית משהו קל יחסית ללימוד? או מבנים דיקדוקיים שמאפשרים העברה יחסית נקיה של מסר למרות רעש בדמות טעויות דקדוק והגייה?
4. כששינים סינים [עם כינור גדול] מדברים אנגלית במבטא סיני – האם הם מבינים אחד את השני טוב יותר מנניח, איטלקי שמקשיב להם?

ערוץ רועש, קידוד מקור, קידוד ערוץ

הנקודה השלישית הזו גורמת לי להרהר בערוץ הרועש ותאוריות של קידוד מקור וקידוד ערוץ. אני נכנס כאן לשדה מוקשים בלי מפה. הפסקה הבאה היא איזור הדימדומים של הספקולציות הפרועות (אני לא מבין מספיק בבלשנות או בשפות, גם לא בתורת האינפורמציה).  האם המבנים הדיקדוקיים, המורפולוגיה והפונטיקה של האנגלית מאפשרים קידוד יעיל כך שגם כשהמסר עובר ב"ערוץ רועש" (כלומר דיקדוק משובש ומבטא מוזר) ניתן לפענח אותו בקלות יחסית.  ותהייה נוספת בעקבות #4 – איך התפלגויות רעש שונות (כלומר מבטאים שונים, למשל סיני, קוריאני או עברי) משפיעות על הקושי בפיענוח. כאן אני חוזר לרעיון דומה לזה שכתב שיזף רפאלי בכלכליסט. הוא דיבר על "הגמישות והנוחות שלה [של האנגלית, א.צ.] לבריות". האנגלית, הוא כותב " יותר מכל שפה אחרת, האנגלית תמיד היתה מוכנה להתגמש, "לרדת אל העם", לעטות בלויי סחבות". אני חושב שהוא מתכוון במובן הסוציולוגי. אני לוקח את זה לכיוון הבלשני-קוגניטיבי (אבל אני לא מדבר על מבנים דיקדוקיים "קלים" ללימוד אלא על מבנים ופונטיקה קלים לפיענוח). כמובן שסביר להניח שכמוהו-כמוני – גם אני מדבר שטויות.

אהמ… הפסקה הקודמת שנכתבה כלאחר יד  נראית לי פתאום נורא מעניינת. האם יש עבודות ומחקרים בכיוון הזה? האם זה כיוון מופרך מיסודו? בין המשיבים יוגרל פוסט חינם.

נספחים:
1. בפינת טקבק למטקבק, אני חייב לצטט את הטוקבק (#7) המקושקש הבא אנגלית היא שפה דמוקרטית (בחיי, לא נגעתי):

"לדעתי האנגלית היא שפה "דמוקרטית". היא מייצגת תרבות ושפע, כח והשפעה וגם תפיסה פוליטית מדינית וחופש מעריצות דתית. הכינוי "לינגווה פראנקה" – השפה הכנה, ניתן לאנגלית באירופה עוד במאות ה-16, וה-17 משום שהאנגלית הייתה חופשיה מהכבלים שהכנסיה הקתולית הטילה על ההשכלה והאינטלקטואלים. זו גם הסיבה לדעיכתה של השפה הלטינית מול עלייתה של השפה האנגלית ככלי לביטוי רעיונות חופשיים ומחקרים מדעיים החופשי מכבלי הכנסייה. התעצבות המשטר הדמוקרטי בארה"ב ובבריטניה רק חיזק את מעמד השפה החופשית הדמוקרטית – זו שלא כפתה את עצמה בכוח, בניגוד לרוסית ולסינית שלימודן נכפה בכוח על תלמידי הטריטוריות שבתחום הכיבוש וההשפעה של אותן מעצמות".
פחחחחחחחח.

2. ביפן לא עובדים רק על המבטא אלא על האינטונאציה. זו של ברק אובמה:

3. במבצע: פינוקי בריות כתבתי על מבטאים, דיאלקטים, חוקים דיקדוקיים ושינויים בהם.

42 תגובות עבור “סינית אני מדברת אליך”

  1. תשובה ראשונה, אוף דה טופ אוף מיי הד (אני מדבר רק על הצד הלשוני כמובן), היא שהמורפולוגיה הענייה של האנגלית בוודאי עזרה לה. מערכת הנטייה של השם היא מגוחכת (יחיד, רבים, שייכות. זהו), וחוץ משתיים-שלוש מוספיות של פעלים, הכל נוצר בתחביר (פעלי עזר בעיקר). אלה גם הטעויות הנפוצות בקרב הלא-דוברים – התאם של מספר בין נושא לנשוא.
    לגבי 4, אין לי ספק שכן. הטעויות מושפעות מאוד משפת המקור. יתרה מזאת – לדעתי (ואני חושב שדיברנו על זה באיסקול) דובר סינית יבין יותר טוב את האנגלית הרצוצה של האיטלקי מאשר את האנגלית הילידית של האמריקאי.

    יובל

  2. במידה מסויימת, ניתן למדוד את רמת הקושי של שפות, באופן המתקרב לאובייקטיבי. אני מניח שביותר מאופן אחד, אבל מחקר אחד שזכור לי (ותעדבו אותי באמשכם מרפרנס), דיבר על קצב ההתקדמות בלימודי קריאה\כתיבה. בגילאים מסויימים יש פער של עד שנה, שנה וחצי בין ילדים שלומדים קרוא וכתוב באנגלית וכאלו שלומדים בשפות אירופאיות אחרות, למשל ספרדית. לרעת האנגלית.
    המונח הרלוונטי כאן הוא "עומק אורתוגרפי". הפער שבין היצוג הגרפי של השפה הכתובה, ואופן ההבעה. בשפות 'רדודות', יש העתקה חד-חד ערכית בין הייצוג לאופן הביטוי. ברמת הפונמות, כמובן. אנגלית די מורכבת מהבחינה הזאת. למשל – Women. מאיפה ילד (או דובר זר) שלומד את השפה אמור לדעת שמדובר באופן ההגייה הספציפי והמוזר של המילה? אז כן, אנגלית קשה יותר משפות אחרות.

    ומהבחינה הזאת, עברית לא מנוקדת (שבעולם שמחוץ לבית ספר יסודי או ספרי ילדים היא העברית היחידה) – עמוקה יותר מים המלח.

    אסף

  3. נו טוב, את ההבדל אפשר (לנסות) לסכם כך:
    בספרדית אתה רואה מילה כתובה חדשה וישר יודע איך להגות.
    בצרפתית אתה רואה מילה חדשה ולוקח לך לפעמים שניה-שתיים לדעת איך להגות.
    באנגלית אתה רואה מילה חדשה ולא בהכרח יודע איך להגות.
    בעברית אתה רואה מילה כתובה מוכרת ולעתים קרובות לא יודע איך להגות.

    יובל

  4. לצערי, כמתרגל אין לי ברירה אלא לנסות ולהבין את הסטודנטים הסינים שלי (ואגב, הבעיה היא בעיקר ספציפית עם סינים, לפחות בקרב הסטודנטים שלי – איכשהו הקוריאנים והיפנים מדברים הרבה יותר ברור. אבל יכול להיות שזה עניין של כמה שנים הם בילו כבר בקנדה. אבל גם כשמדובר באנגלית רצוצה, יש משהו במבטא הסיני, לעומת היפני למשל, שהופך אותו לבלתי מובן בעליל.)
    דבר מעניין שהבחנתי בו הוא שכשאני מדבר עם ישראלים במבטא ה-faux-צפון-אמריקאי שלי (למשל, בכנסים או בקבוצה מעורבת), הרבה יותר קשה להם להבין אותי מאשר כשאני עובר למבטא יותר ישראלי.
    אגב, אחד המבטאים הכי בלתי נסבלים ביקום הוא ההודי. יש לו ניגון שהוא כל כך לא אנגלית שאי אפשר להבין כלום ממה שהם אומרים, אפילו אם האנגלית עצמה שלהם ללא דופי.

    דובי

  5. במסגרת הדוקטורט הייתי בהשתלמות של כמה חודשים בצרפת במעבדה בינלאומית (בגדול במעבדה היו ראש מעבדה גרמני וסטודנטים מצרפת, ביילרוס, איטליה, סין, טורקיה וכמובן – אני) שכולם יודעים אנגלית וצרפתית והמסקנה שלי היתה שהיתרון הגדול של האנגלית זה שקל להגות אותה ולהבין אותה גם אם לא מדברים הכי מדוייק.
    הבעיה עם הצרפתית היתה שהתנועות כל כך קרובות אחת לשנייה שלפעמים למישהו שלא מבין את הההגייה המדוייקת – פשוט בלתי אפשרי להבין למה הוא התכוון, ומילים שנשמעות בדיוק אותו הדבר למישהו מבחוץ
    חוץ מזה אני חייבת לציין שגם הלא ישראלים שם אמרו שהמבטא הישראלי הכבד שיש לי (למרות שהוא מכוער לאללה) הוא מאוד נוח להבנה יחסית לשפות אחרות.

    mip

  6. […] אורן צור כתב פוסט מרתק ובו הרהורים על תקשורת בכנסים- איך והאם לנסות להבין מבטאים, האם יש אופי למבטאים, למה כולם מדברים אנגלית ועוד. […]

    29.7.2010 « מה אני קוראת

  7. @mip, זו כנראה פיקציה. בניבים מסוימים של אנגלית יש 22 תנועות, וגם הניב הפופולרי-בינלאומית מבחין בין כ-9-12 תנועות. לצורך העניין, המון ישראלים לא מבחינים (בשמיעה ובהגייה) בין sit ו-seat, או בין roll ו-role, או בין but ו-bat, או אפילו man ו-men. הבדלים שיכולים להיות קריטיים למדי. אז אולי זה לא נורא כמו צרפתית, אבל זה דווקא חסרון בולט של אנגלית ולא יתרון.

    יובל

  8. מצטער אבל כל התשובות כאן הן פחחח.

    השפה המשותפת השתנתה במהלך ההיסטוריה כמה פעמים. כמעט תמיד ניתן לראות שזה נבע מנסיבות היסטוריות של עוצמה של המדינה שזו היתה השפה שלה.

    במקרה של אנגלית הוליווד, והמצאת האינטרנט "תפסו" טרמפ על הדומיננטיות הקודמת של האנגלית.

    לגבי קושי של שפות מנסיון אישי של לימוד סינית רוסית ואנגלית כשפות זרות, לכל שפה יש את הקושי המיוחד שלה.

    ארן

  9. בטיול שלי לטאיוון נתקלתי גם בקושי לקלוט את המבטא של דוברי הסינית, אבל אחרי כמה זמן התרגלתי, ואז האנגלית שלהם נשמעה לי ברורה כמו אנגלית של כל אדם שזו אינה שפת האם שלו.

    הופתעתי לגלות כמה המבטא שלי אינו ברור, כאשר גם פה קרה תהליך דומה, האנשים שהייתי איתם התרגלו למבטא שלי, וכשדיברתי עם זרים, נזכרתי כל פעם מחדש שאני לא מובן.

    בהמשך ליובל:
    בסינית אתה רואה את המילה בהקשר שלה, ובכל זאת שני אנשים שונים יקראו אותה אחרת. נראה לי שהיא מנצחת בשפות קשות.

    עידו

  10. יובל:
    Roll ו-Role?
    מה ההבדל?

    אורי

  11. אורי – roll היא פשוט "רול", אבל role נשמעת יותר כמו "רו-אול" (rowl?). נו, לא לימדו אותך בבי"ס שכשמילה נגמרת ב-e אז התנועה האחרונה נשמעת כמו שם האות ולא כמו הצליל ה"רגיל" שלה? (תחשוב sit לעומת site)

    דובי

  12. הממ. היתה לי תחושה שדוברים זהירים לא מעגלים את סוף התנועה ב-roll (כלומר, שאצלם זה לא דיפתונג). אם מריאם-ובסטר לא מסכים, מי אני שאחלוק עליו. אז הנה, חוסר-הילידות יכול לתת גם חיוביים-שגויים בזיהוי הבדלים.
    ובימים האחרונים מתחוללת מהומת אלוהים בלנגוואג' לוג סביב האם pen ו-pin נהגים אחרת או לא, ואם כן אז איפה.

    יובל

  13. יופי של פוסט, אורן.
    א. לאחרונה הייתי בסדנה בת יומיים שנתן בעבודה שלי מומחה יליד סקוטלנד. אחרי שעה בערך התחלתי להבין אותו (אמנם זה קל יותר ממה שתיארת – רק מעתקי הגאים). ההשערה שלי – בהינתן מספיק זמן ומוטיבציה ניתן להבין את רוב הסינים.
    ב. בעקבות כנס SIGIR שהיה סוער למדי, יש דיון האם בכלל פורמט המצגות של כנסים מועיל למדע: http://mobblog.cs.ucl.ac.uk/2010/07/26/sigir-research-vs-reality/ (בסוף ובתגובות).
    ג. קריאת הערך Lingua Franca
    http://www.answers.com/topic/lingua-franca שכנעה אותי שהגורם החברתי/מעמדי משמעותי כאו יותר מהגורם הבלשני – עשרות שפות שימשו כשפה משותפת בהיסטוריה, קלות כקשות.
    ד. חלק שלישי של תורת האינפורמציה הוא תורת קצב-עיוות (?)
    http://www.answers.com/topic/rate-distortion-theory-1
    הדנה בקשר בין קצב העברת המידע לקלקול שלו. זה רלבנטי כאן כי אפשר להגדיר אולי את מידת העיוות בהרצאה שנותן סיני או ישראלי ולפיו לחשב את שיעור ההבנה.

    יובל אחר

  14. לגבי התהיה עם הפונט הקטן, אז אני חושב ששפה עם עמידות לרעשים צריכה להיות מלאה ביתירות, ממש כמו שתקן שידור צריך להיות מנופח בקודים לתיקון שגיאות כדי להתגבר על רעשי ערוץ. כלומר, אולי המבנה הדקדוקי שלה לא נקבע לפי תחיליות / סופיות אלא לפי מלים (או מיליות, למרות שזה פחות טוב), שהרווח ביניהם מאפשר להם להיות מובנים יותר). ואולי המלים הדקדוקיות האלו צריכות להיות כאלו שיש מרחק פונולוגי גדול ביניהם. ובוודאי שאפשר לחשוב על עוד דוגמאות כאלו. העניין הוא שיתירות היא משהו שאף שפה לא אוהבת. אני לא חושב שאנגלית היא יוצאת דופן בעניין הזה.

    אורן (2)

  15. חבר'ה, יש לכם מקרה אחד, ואתם מנסים להסיק מסקנות כלליות על פיו. זה לא עובד ככה. הסיבה שאנגלית היא הלינגווה פראנקה היא היסטורית/פוליטית. כדי להראות יתרונות של האנגלית על שפות אחרות, אי אפשר לנתח את האנגלית לבדה, אלא להראות שמבין כל השפות הפוטנציאליות, לה יש הכי הרבה מתכונה X, ואחרי זה להסביר למה דווקא תכונה X היא הכי רלוונטית לשפה גלובלית.
    אבל לא תצליחו, כי זה לגמרי לא עניין של שפה, אלא של כוח. האימפריה הבריטית שלטה בעולם בתקופה קריטית בהתפתחות המערכת הגלובלית, וגם אחרי שירדה מגדולתה, מי שהחליף אותה הייתה אומה דוברת אנגלית אחרת. זה הכל.

    דובי

  16. אררררררגגגגג##$&#. כתבתי כאן תגובה ארוכה ומפורטת לאסף ויובל (ודומה למה שכתב אורן 2) והיא לא נשמרה.

    ובכל זאת, דובי כמובן צודק בקשר לתקפות המדעית. אבל זה מוציא את הכיף מלעסוק בספקולציות. כנל גם ארן. אי מניח שכולם (חוץ משיזף רפאלי) מסכימים שהאנגלית קיבלה את מעמדה בעזרת חניתות (או חניתות כלכליות). אבל זה הסבר קצת שטוח ובעיקר משעמם מבחינה בלשנית. כלומר לא כיף. מה שאני מציע (או "מציע") כאן הוא פריימוורק לבחינת קלות ההבנה של שפות שונות כשהן מדוברות על ידי דוברים שונים. כאמור, הפריימוורק הזה קצת פרוע ואני חייב להודות שגם לא הגדרתי אותו היטב, אם כי עלו כאן בתגובות כמה רעיונות.

    אורן

  17. ואני לא יכולה שלא לתהות למה הסינים/ישראלים/ערבים/עמיר פרץ/אחר שאנגלית לא שפת אמו לא משתמשים במתורגמן. בסיטואציות רשמיות זה נראה לי כמו פתרון אלגנטי בהרבה מאשר לגמגם בשפה שאת לא שולטת בה.

    העלמה עפרונית

  18. מזדהה לחלוטין וגם אני מזמן הפסקתי ללכת להרצאות של מלוכסנים(אם כבר פוליטיקלי קורקט אז עד הסוף..) בכנסים. השנה נכנס מתמודד חדש לזירה, וגם הספרדים (או ליתר דיוק ספרדיות) מתגלות במקרים רבים כאתגר לא קטן (די מפתיע).

    מקרה הסינים בכנסים שונה למדי ממקרה אמיר פרץ. הסינים הנ"ל לרוב מסוגלים לתקשר היטב באנגלית כתובה. הם מבינים היטב ומסוגלים לנסח טקסטים בהירים וקוהרנטיים בנושאים מורכבים (בד"כ). המעבר לדיבור והבנת דיבור הוא זה שקשה להם. אמיר פרץ פשוט לא יודע אנגלית.

    הביטוי "עמוק יותר מים המלח" הוא מעניין.

    יואב

  19. אורן, ניסיתי למצוא מחקרים שמודדים קושי אובייקטיבי של שפות. עוד לא מצאתי כאלה. לא בדיוק. יש מאמר בשם "Measuring the complexity of writing systems", המגיע מהשדה שלך, דווקא, ומציע אלגוריתם ופרמטרים.
    ממבט מהיר, לא רק שהעבודה חלקית מאוד (רק מערכת הכתב, כנראה ללא מורפולוגיה ושאר מאפייני שפה טבעית), אלא שברגע שיש לך יותר מפרמטר מדידה אחד, איך ניתן להשוות בין שתי שפות, ללא סט משקלות ראוי? ואיך מוצאים את הסט הזה, ללא מדידה אמפירית?

    אסף

  20. לגבי הטענה שאין הבדל בין קושי של שפות, זה עלה בשולי פוסט קודם על דקדוק אוניברסלי וטל איתגר אותי למצוא מראי מקום ראויים. הצלחתי חלקית.

    בעניין קידוד, זה לא נראה לי סביר רק מטעמים תיאורטיים (כל השפות קשות באותה מידה בלה בלה), מה שלא אומר כלום. נראה לי שמארק ליברמן ישמח לבדוק את זה לעומק.

    איתמרק

  21. איתמר,
    למיטב הבנתי מזרימת הטיעונים בתגובתך שם (דגש קל, 2010), הרפרנס היחיד שאתה מביא להוכחת הטענה הוא בנוגע לכריסטופר. מצטער, זה לא משכנע.
    אם מסקנות הנוירופסיכולוגיה הן מפוקפקות לעתים, אז להסיק מכריסטופר זה עניין בעייתי עוד יותר. הנוירופסיכולוגיה מנסה להסיק מהפתולוגי אל הבריא. ולוגית, בתנאים מסויימים, הטיעונים שלהם מסתדרים. אם כי יש שגם על זה יחלקו (למשל שמעתי טענה שבתחום הדיסלקציה מסקנות הנוירופסיכולוגיה עכבו את המחקר, ובלבלו אותו).
    כאן אתה מנסה לעשות את ההפך. להסיק מתוך העל-אנושי על האנושי. לא קראתי את המאמר המקורי, ויתכן שהוא מבסס שם את הטיעון באופן משכנע ולוגי, אבל על פניו, מדובר בערך בדבר השקול לנסיון להבין איך אנשים שוחים מצפיה בסירות מירוץ, או איך אנשים משחקים שח-מט, מצפייה בכחול-עמוק.
    אלו לא בהכרח אותם מנגנונים. הטיעון (לפחות בצורתו השטחית, כאמור) לא מחזיק מים.

    ועדיין, בנסיון למצוא רפרנסים לכאן או לשם, שלחתי שאילתה לפרופסורית אצלה למדתי על רכישת שפה אצל תינוקות. היא ענתה שבמידה רבה, השאלה עצמה (אם יש שפות קשות יותר או פחות) היא חסרת משמעות. שפות משתנות כל הזמן, ולפחות בתיאוריה, אם שפה קשה יותר ללימוד, היא תתאים עצמה לצרכי הדוברים. הם הרי ממילא משנים אותה כל הזמן. אז שפות ישאפו להיות פשוטות במידת האפשר (ומאידך כמובן ישאפו לכיוונים אחרים. זה לא סותר).
    אני לא בטוח שאני מקבל את טענתה שהשאלה היא חסרת משמעות. מדובר הרי בשאלה אמפירית. ניתן לבחון פרמטרים כאלו או אחרים, ולראות מתי ילדים מגיעים לרמות שליטה מסויימות. אפשר גם להשוות קבוצות של שפות. אולי שפות SOV קלות יותר למערכת הקוגניטיבית משפות SVO? כאמור, אלו שאלות אמפיריות. ניתן לבדוק אותן, ולראות מה התשובה. יתכן בהחלט שהתשובה היא "אין הבדל". אני לא מצאתי מאמרים כאלה, וגם הפרופסור לא מודעת לקיומם.

    אסף

  22. - יש לנו כבני אדם נטיה לראות רק סיבה אחת לתוצאה כלשהי ולראות בעובדה א' גורם לג' סתירה לעובדה שב' גורם לג', מה שלגמרי לא הכרחי.
    מאוד יכול להיות שגם א' וגם ב' גורמים לג'. בחזרה לנושא שלנו, העובדה שיש סיבות פוליטיות כלכליות וצבאיות להשתלטות לינגואה פרנקה אין פירושה שלקלות השפה אין משקל בעניין. מין ניסיון פשרה שכזה.

    עוד נקודה היא שאני חושב שקלות של שפה היא יחסית לשפת האם של הלומד, למשל לדובר עברית ערבית אמורה להיות מאוד קלה ולקוראני סינית. הקושי הוא במעבר בין משפחות שפות. לא יכולתי להתאפק מלהביא את החיקוי של ישעיהו לאיך שנשמעת שפה לא שמית ("לעגי שפה" הוא קורא לזה): "צו לצו צו לצו, קו לקו קו לקו זעיר שם, זעיר שם", ישעיהו כ"ח 10.

    – עניין אחד שאני חושב שתורם לקלות של האנגלית הוא העובדה שאין בה מינים לשמות עצם כך שאין צורך ללמוד עבור כל מילה את המגדר שלה (זה גם ככה בסינית וככל שאני יודע אין עוד אף שפה בה זה ככה).

    – דוברי סינית מאזורים שונים של סין אמנם לא יכולים לתקשר בע"פ זה עם זה אבל הכתב שלהם אחיד לגמרי בכל הרפובליקה והקשר בין הציורים המוזרים שלהם לרעיונות מופשטים נראה להם מאוד מיידי ופשוט והם מאוד מתקשים להאמין שזרים לא מצליחים להבין אותו.

    אני רוצה להציע מדד יחסית מספרי לקושי של שפה: כמות הזמן שחולפת מאז שאדם מבוגר ממוצע מהגר למדינה עד שהוא מגיע לרמה שבה הוא מגיע לרמה מוסכמת כלשהי, נניח קריאת עיתון. במדינות מהגרים כמו ישראל וארה"ב זה קורה הרבה והשפה משתנה מהר מאוד כדי לקבל ציונים גבוהים יותר במבחן הזה, דוגמא לכך היא ההבדלים בין האנגלית של הממלכה האם לזו של העולם החדש או ההבדלים שבין העברית של ביאליק לזו שלנו, לעומת זאת האוניברסיטאות בסין מלאות בזרים שאפתנים (בעיקר בחוגים למנהל עסקים) ששוברים את השיניים והקונספציות בניסיון לקלוט את עומק הפער התרבותי בין המערב לסין וברובם נשארים ב"כיתות לעולים חדשים" גם אחרי 5 ו6 שנים. אחד מהם ברגע של גילוי לב הודה בפני שלעולם לא יגיעו לרמה של מתבגר סיני. את הצד השני של המטבע הזה אתה חוטף בקושי שלנו, הלבנים, להבין את הסינית המאונגלזת.

    – ואם כבר פשטות ורוחב שימוש, ההימוד שלי לשפה שתחליף את האנגלית היא הספרדית או הערבית.

    מהגג

  23. מהנסיון שלי כישראלי שחי באוסטרליה אני לא מסכים עם הטענה שאנגלית היא קלה יותר או סלחנית יותר משפות אחרות. למרות שהמבטא שלי הוא טוב למדי יחסית לישראלים האחרים פה, רבים (בייחוד ילדים) לא מבינים אותי. אפילו אשתי לא מבינה לעתים קרובות. הצרות האחרות הן שבאנגלית יש המון מלים שבעיניך יש להן אותה המשמעות ובעיניהם זה דבר אחר לגמרי. בשבילה jumper, sweater, pull-over, cardigan הם דברים שונים לגמרי, ואם אני טועה, היא לא יודעת על מה אני מדבר.

    גם מלות היחס בעיתיות. אם תאמר on במקום in לא יבינו אותך.

    מודי תולשששש

  24. מודי – גם אשתי לא תמיד מבינה אותי למרות ששנינו ילידי הארץ ומדברים בינינו בברית ללא בעיה…

    מהגג

  25. על שפות קשות (ואנגלית)
    1. השאלה איזו שפה קשה יותר היא מעניינת בפני עצמה אבל לא קשורה באופן ישיר וזו נקודה קריטית.
    למה אני מתכוון – התיאוריה שהפרחתי (ואולי היא מופרכת) היא שאולי יש שפות אותן לשומע הלא מיומן קל יותר לפענח (ואפילו אם הדובר לא מיומן). אני אתן דוגמא מאוד שיטחית.
    בשפה L1 יש רק שתי מילים: 'אאאאאאאאאה', ו'זזזזזזזזזזזזה'. בשפה L2 גם יש רק שתי מילים: 'אאאאאאאאאאה' ו'איאיאיאיאיאיאי'. עכשיו, נניח שאני לא דובר ילידי של אף אחת מהשפות ולכן יש לי מבטא נוראי ומזעזע. עדיין, אם אדבר בשפה L1 יהיה קל להבין למה התכוונתי כי 'אאאאאה' שונה מאוד מ'זזזזזזזה', כלומר גם אם אני המבטא שלי נשמע כמו 'אייייייי' ו'סססססססססה'. לעומת זאת, אם אדבר בשפה L2 במבטא קלוקל, יהיה קשה לדעת לאיזו מילה התכוונתי. במובן הזה 'קושי' של שפה דווקא יכול (אולי) להביא לקלות בפיענוח.
    למעשה זה נעשה כל הזמן בשידורים דיגיטליים אליהן ומוספים ביטים מלאכותיים כדי להבדיל בצורה מובהקת יותר בין "מילים" ובכך לאפשר לקולט (הסלולרי או הממיר של הכבלים) לפענח את השידור למרות שיבוש במבטא (כלומר השראות מגנטיות וכו').
    כאמור, אין לי מושג אם תופעה כזו קיימת בשפות טבעיות אבל נראה לי מעניין.

    2. אולי כך משתמע מהפוסט, אבל אנגלית היא רק נקודת המוצא לרעיון הזה (בגלל הטענות של רפאלי בכלכליסט), אבל בהחלט יכול להיות שדווקא שפות אחרות קלות יותר לפיענוח.

    3. יכול גם להיות שקלות הפיענוח היא לא קשורה לשפה באופן מוחלט אלא לזוג (ששפה,מבטא).

    4. מהגג – הקושי בלימוד שפות (או הקלות) הוא תחום שמתעסקים בו הרבה בבלשנות מעשית. השפה הנלמדת נקראת inter language, והטענה היא ששפת המקור משפיעה על הinter language. זה נקרא language transfer אם שפת המקור עוזרת ללימוד (כי הן שפות קרובות) וlanguage interference, אם שפת המקור מפריעה ללימוד. בחינת ההשפעה הזו נקראת contrastive analysis, אבל, וכאן האבל הגדול, אין הסכמה בין החוקרים לגבי האופן למדוד את מידת ההשפעה. אבל כאמור (ע"ע 1) זו שאלה אחרת (וראויה לפוסט בפני עצמו).

    אורן

  26. כמה דברים:
    – אין קשר משפחתי בין סינית וקוריאנית. אם לדובר קוריאנית קל ללמוד סינית, זה בעיקר בגלל פונולוגיה דומה.
    – באנגלית יש מין, למשל בכינויי גוף. בשמות עצם באמת אין. גם בסינית אין, אם כי יש מאייכים (נו, איך אומרים classifier בעברית), אבל כאלה יש במידה מועטה גם באנגלית. ויקיפדיה נותנת רשימת שפות חסרות-מין, לא על כולן אני יכול להעיד מנסיון.
    – אני מכיר מספר דוברי סינית (הן מנדרינית והן קנטונזית) שמכירים בכך שהסימנים שלהם יכולים להיות מאוד מופשטים.

    הלאה.
    אורן,
    1. מעניין שאני דווקא הייתי מעריך ההיפך. מבחינתי בשפה L1 אפשר לטעות יותר בקלות אם אתה לא מסוגל לבטא ז' כמו שצריך (מה שנשמע מופרך, אבל היי, מי היה מאמין שישנן שפות שלא מבדילות בין ר' ובין ל'). אבל זו כמובן היתה דוגמה מלאכותית מאוד.
    3. אז דרך נוספת לנסח את השאלה היא: מהם המאפיינים השונים של שפה_i ושל מבטא_j כך שהצירוף (שפה_i,מבטא_j) יהיה הקשה ביותר להבנה, ואיפה על הסקאלה ייכנס הצירוף (שפה_i,מבטא_i).

    איתמרק

  27. איתמר –
    לגבי 1: למה – גם אם אתה לא יכול לבטא ז, עדין ס, ז', ש או אפילו ד' מובדלות מאות מא'.
    2. זה יפה לשאול מה עם הזוג A=(שפה i, מבטא i). זו שאלה של מתמטיקאי. התשובה המיידית והתאורתטית היא שנדרוש שA יהווה את הזוג הקל ביותר לפיענוח (כלומר שהמרחק בין מה שנאמר למה שנשמע הוא הקטן ביותר). אבל למעשה אני לא בטוח שזה נכון כי א) תאורטית יכול להיות מבטא עם "רעש" קטן יותר וב)בפועל דוברים ילידיים מוסיפים רעש מערפל בגלל הנוחות שלהם בשפה. למשל e איטלקית (ו החיבור) שנעלמת אחרי מילה שמסתיימת בהברה דומה (לכן "דולצ'ה גבאנה" ולא "דולצ'ה אה גבאנה") או בצרפתית עם s שנעלמת. אפילו בצפר העברי. כל אלו כמובן מקשים על השומע הלא מיומן.

    אורן

  28. אורן:
    אם אני מבין אותך נכון, אתה מדבר על הגדרה של פונקציית ל"פ (לינגואה-פרנקיות).
    ואם אני מבין נכון את פונקציית ל"פ שאתה מציע, אתה מדבר על ממוצע המרחקים בין כל שתי מילים בשפה, וככל שכל שתי מילים אקראיות רחוקות זאת מזאת, הרי שהשפה היא יותר ל"פ מבחינתך.
    עכשיו, כל מה שנשאר זה להגדיר אופרטיבית מה הוא מרחק בין שתי מילים, ולמצוא קורפוס של 100-500 המילים הנפוצות ביותר בכל שפה, ואז לחשב את הל"פ שלה.
    במידה מסויימת, זה חישוב שונות של שפה. ככל שהשונות בשפה גדולה יותר, אתה טוען (שוב, אם הבנתי נכון), שהשפה היא יותר ל"פ.

    אסף

  29. ואני כמובן נזכרתי מיד במשפטים הבאים: "זה יפני או סיני?" "יפני מיפן". תמיד היינו גזענים.

    ישי

  30. והדוגמא למבטאים בלתי נסבלים תופסת גם לגבי דוברי אנגלית כשפת אם. קל מאד להבין אמריקאים כי זה מה שנחנו שומעים בדר"כ מילדות. נראה אתכם מבינים מילה ממה שקוקני, דרום אפריקאי או "פייקיס" מדברים. כל מי שראה סנאצ' בלי תרגום מבין בדיוק על מה אני מדבר. והם מדברים אנגלית כשפת אם – הם אפילו לא מבינים אחד את השני… איך אני אמור להבין אותם? DEGS? אה DOGS. ותזהרו כולכם before zee germanz are coming.

    ישי

  31. אסף –
    הייתי נזהר מלקרוא לזה פונקציה ל"פ כי אני מאמין של"פ נהיית כזו בעיקר בגלל הדומיננטיות התרבותית-פוליטית-כלכלית-צבאית של הדוברים.
    בכל אופן, התכוונתי למשהו בסיגנון של מה שאתה אומר, רק שההגדרה של מילים קרובות היא קצת מעורפלת. ברור שזו צריכה להיות קירבה פונולוגית. אבל אולי היא צריכה להיות מאופיינת על ידי רצפי הברות ולא מילים שלמות (ואולי רצפי הברות חוצות מילים). זה קצת בעייתי להגדרה ומהניביון שלי בדברים דומים זה קשה לעבוד עם קורפוס בטקסט. עבודה רצינית תדרוש קורפוס שעבר טרנסליטרציה לאיזה סטנדרט והוא יצטרך להכיל הרבה יותר מ1000 מילים נפוצות (ובעיקר יצטרך להכיל את ההטיות שלהן).

    ישי –
    פרחח. תתקשר במקום להשאיר תגובות בבלוג. אגבף שים לב ללינק ממש בסוף הפוסט שמדבר בדיוק על מבטאים ודיאלקטים. שפה, כידוע, היא דיאלקט עם צבא וצי.
    ואגב, איך קראו לתוכנית עם ה"יפני מיפן"?

    אורן

  32. אורן:
    אני לא בטוח שזה מסובך כל כך. אתה לא צריך בהכרח לעבוד על קורפוסי טקסט אמיתיים, אלא למצוא סטטיסטיקות לגבי X המילים הנפוצות ביותר בכל שפה.
    (כמובן, מסתתרת כאן הנחה מפשטת באשר לפיזור של מילים. לדעתי, אין סיבה להניח שמילים שיש סבירות גבוהה שיופיעו זו בקרבה לזו יהיו שונות במאפייניהן מכל שתי מילים אקראיות בשפה.)
    X המילים הללו, לפי חוק זיף, מהוות אחוז ניכר מאוד של המילים בשפה. לתרגם אותן ל-IPA לא תהיה בעיה, שכן אלו לא מילים בהקשר. זאת רשימה פשוטה.
    עכשיו, צריך עזרה מהפונולוגיסטים בקהל. אני מניח שלגבי כל שני עיצורים או לגבי כל שתי תנועות ניתן להגדיר מרחק. אם כך, אם בכל המילים היתה אותה כמות בדיוק של עיצורים והברות, היה קל לחשב את פונקציית הפלי"פ (פסאודו-לינגואה-פרנקה). מאחר ולא זה המצב, אני קצת תקוע בטיעון שלי. אין לי מושג איך מחשבים מרחק\זווית\וואטאבר בין שני וקטורים שאורכם אינו שווה. אולי אם מציבים אפסים כ"ריפוד" בסוף כל וקטור עד שמגיעים לאורך שווה לכולם.

    אסף

  33. וכמובן, לוותר על שפות עם מורפולוגיה מטורפת, כמו עברית.
    זה חוסך את ההטיות של מילים ספציפיות, לפחות במידה נכרת.

    אסף

  34. אסף: X המילים הנפוצות ביותר בשפה היא הגדרה בעייתית, בגלל הבעיתיות שבהגדרת היחידה "מילה". האם ה הידוע, או בכלל תחיליות משהוכל"ב בעברית הן מילים נפרדות? האם פעלי העזר באנגלית הם מילים נפרדות (כלומר had walked, מילה אחת או שתיים)?

    ובכל מקרה כשסופרים הברות ראוי להפריד בין סוגי המילים השונים. מילות היחס ושאר אלמנטים שהם תחביריים יותר מתוכניים יכניסו הרבה רעש בהשוואה בין השפות השונות.

    יואב

  35. ולהוסיף על הסיבוך ועל מה שאמרתי קודם שהבעיה היא לא מרחק בין "מילים" אלא בין רצפים של הברות – אני מעריך שהמרחק לא תלוי רק ברצף ההברות אלא גם במיקום ההטעמה ובכלל במבנה ההברה(למשל onset-nucleus-coda). כלומר פונולוגיה היא עסק מסובך למידול.

    אורן

  36. יובל

  37. ובשולי החדשות:
    http://www.youtube.com/watch?v=iUCDhvbQFmU&feature=player_embedded
    (סטיב מרטין מנסה ללמוד אמריקאית. מתוך הפנתר הורוד)

    אסף

  38. Dubi: to the best of my knowledge Roll and Role are homophones. Roll is also pronounced Rowl.

    אורי

  39. אורי, דובי –
    תלוי במבטא של הדובר. יש מקומות בארה"ב שמבטאים גם את roll וגם את role כ-rowl.

    אורן

  40. בעניין החניתות, מומלץ הספר "רובים, חיידקים ופלדה" של ג'ארד דיימונד, המציע תיאוריה שמסבירה את השתלטות עמי אירופה על יבשות אחרות (ומכאן של שפות עמי אירופה על שפות אחרות). רוח הטיעונים הזכירה לי את ספרו של גיא דויטשר.

    יובל אחר

  41. A good number of women of all ages Juicy Moms-to-be can't must resolve

    [התגובה הזו נשארה כי מאוד הצחיק אותי איך היא צצה לה בנונשלנטיות, רומזת לגיקים לשוניים שכמונו מה באמת חשוב בחיים – בחורות. מכל גיל. ורצוי שיהיו ג'וסי. אני כמובן החלפתי את הלינקים…]

    {beachbody coach

  42. Aw, this was a really nice post. In idea I would like to put in writing like this moreover – taking time and precise effort to make an excellent article… however what can I say… I procrastinate alot and under no circumstances appear to get one thing done.

    Teodora Lampi

להוספת תגובה