מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

בשבת האחרונה פרסמו במוסף הארץ את רשימת "טובי המוחות – עשרה מדענים צעירים ומבטיחים מתארים את הישגיהם השנה". את הרשימה סוגר יהונתן ברנט דוקטורנט למדעי המחשב באוניברסיטת תל אביב. ברנט מספר שם על המחקר שלו בבלשנות חישובית ועל הניסיונות להפריך את תאוריית הדיקדוק האוניברסלי (/גנרטיבי) של חומסקי.
כבר מזמן רציתי לכתוב כמה מילים על חומסקי ומתנגדיו. הרשימה בהארץ נותנת כאן את הדחיפה.

(לפני חומסקי, נפצח בגילוי נאות. לא יצא לי לקרוא שום פרסום שלו [של יהונתן] בנושא. אני חושב שפגשתי את יהונתן באיזו סדנה ושם גם שמעתי את המנחה שלו, איתן רופין, מרצה [בחסד עליון. למרות השעה המאוחrת והעייפות אחרי עשר הרצאות קודמות הוא ריתק את השומעים במופע סטנד-אפ]. למען האמת גם לא יצא לי לקרוא פירסומים של רופין בנושא שפה).

דיקדוק אוניברסלי גנרטיבי

אם נסגוד לאל ההשטחה ונצמצם את הטיעון החומסקיאני לכמה משפטים אז הלוגיקה היא כזו:
1. שפה היא משהו מורכב מאוד ומגוון עד בלי די.
2. רק בני אדם מבינים שפה.
3. כל בני האדם מבינים שפה.
4. ילדים קטנים מצליחים להשתלט על השפה.
5. ילדים מצליחים ללמוד שפה בעזרת מספר מאוד קטן של דוגמאות – 'דלות הגירוי' (poverty of stimuli), קרא לזה חומסקי.
6. התאוריה המתמטית של הלמידה החישובית (PAC וכו') מוכיחה שלא ניתן ללמוד ממספר כל כך קטן של דוגמאות.

מסקנה: לבני אדם יש במוח חלק מיוחד שאחראי בלעדית על לימוד שפה (מה זאת אומרת חלק במוח? לא משנה כרגע). החלק הזה הוא לא אותו חלק שאחראי על למידה באופן כללי. החלק הזה במוח הוא ירושה גנטית – מעין רכיב חומרה מיוחד ללמידת שפה.

החומרה מגיעה מוכנה מהמפעל וכל מה שנותר לרך הנולד והגדל זה להתאים את הפרמטרים לשפת האם, כלומר לעשות כמה קינפוגים של התוכנה. החומרה הזו, המשותפת לכל בני האדם באשר הם, מכוּנה 'עקרונות' (principles) או 'דיקדוק אוניברסלי'. מאחר והמנגנון מאפשר יצירה של משפטים חדשים היא מכוּנה גם דיקדוק גנרטיבי (=דקדוק יוצר). התאוריה בכללותה מכונה גם עקרונות ומשתנים, רק שכמובן שבאנגלית זה נשמע יותר טוב: principles and parameters.

התאוריה החומסקיאנית כבשה את העולם האקדמי באלגנטיות שלה והשפיע עמוקות על הפילוסופיה של הלשון, הבלשנות, הפסיכולוגיה ומדעי המחשב. בזכותה הפך נועם חומסקי לאחד האקדמאים המצוטטים ביותר בכל הזמנים, אם לא למצוטט ביותר (הוא לבטח בטופ-10). הוא גם הפך לאחד המדענים המרואיינים ביותר בתקשורת – התגלמות האינטלקטואל הפוטוגני. זו היוקרה האקדמית עם לוּק פרופסורי קלאסי: שיער אפור מסודר ברישול, הסוודר הניצחי וארון הספרים הגדול ברקע. כמובן שהדעות הפוליטיות הלא קונוונציונאליות שלו תורמות גם הן להילה האינטלקטואלית. ההגמוניה של חומסקי הייתה כה דומיננטית עד שמי שהעז לפקפק הושתק בבוז. וכאן נכנסים לתמונה טובי המוחות, או לפחות ברנט – שעולה על בריקדות ובריש גלי, מעל דפי העיתון לאנשים חושבים, קורא תיגר על חומסקי ותורתו:

"אם נוכיח שתוכנת מחשב, בלי שום מידע לשוני ראשוני, תצליח ללמוד את המבנה של השפה – מתוך מספר מוגבל של משפטים שמזינים אותו יצליח המחשב לייצר הרבה מאוד משפטים אחרים – זה יסתור את הטענה שהשפה היא רכיב מולד", הוא מסביר.

חוששני שהטיעון הגורף הזה הוצא מהקשרו או שוכתב על ידי הכתב. תוכנה כזו, לכל היותר, תוכיח ששפה היא לא בהכרח רכיב מולד. אבל העובדה שקשה לסתור את חומסקי לא אומרת שהוא צדק. אפילו חומסקי כבר לא מסכים עם חומסקי.

שפה – מה זה, למי זה ומאיפה זה בא?

אבל, כמו שמסביר יהונתן עצמו, בשנים האחרונות נשמעים יותר ויותר קולות הדורשים רוויזיה בתיאוריה החומסקיאנית. זה לא מפתיע. בייחוד לאור העובדה שהתאוריה עומדת על כרעי תרנגולת. אולי הבעיה הראשונהשל התיאוריה היא שההפרכה המוחלטת שלה היא כמעט בלתי אפשרית. אבל מלבד הטיעון הזה שהוא בעיקרו מתודי, אפשר (ורצוי) לפקפק בהנחות היסוד, בעיקר בהנחת דלות הגירוי. האמנם ילדים נחשפים למעט מאוד גירויים? האם צלילי שפה כמעט בלתי פוסקים שנשמעים סביבם במשך שנים, חלקם מופנה אליהם ישירות וחלקם מופנה ישירות במטרה ללמד – האם זו דלות הגירוי? זה נראה יותר כמו עושר לא מבוטל של גירויים. אבל גם אם נודה בדלות הגירוי הקפיצה אל המסקנה החומסקיאנית אינה מתבקשת – מי אמר שהגירוי הלשוני דל יותר מכל גירוי אחר – כלומר בני אדם הם "מערכות לומדות" והם לומדים דברים שונים מגרויים שחומסקי מחשיב כדלים – אם כך, למה להפריד ולטעון שיש למוח האנושי רכיב מיוחד ללימוד שפה, ככזה הוא מיוחד לבני אדם, ורכיב אחר ללימוד כללי – רכיב שמשותף גם לשימפנזים (שחושבים על שפה או על פרישה או גם וגם).

השאון העמום של מורת הרוח המתגלגלת והמתגברת לא הותירה את חומסקי אדיש. אחרי ארבעים שנה של הגמוניה מוחלטת – ארבעים שנה של זלזול ובוז לכל המפקפקים נאלץ גם חומסקי להתמודד עם הביקורת. ההתמודדות שלו הייתה אמיצה אם-גם מתפתלת. במאמר The Faculty of Language: What Is It, Who Has It, and How Did It Evolve?
שפורסם במגזין Science ב-2002 פרט חומסקי את התאוריה לפרוטות, כלומר לפרטים. וכך הולך הפילפול: המכניזם ללמידת שפה בעצם מחולק לשני חלקים אותם הוא מכנה 'יכולת למידת השפה במובן הרחב' ו'יכולת למידת השפה במובן הצר'. מנגנון השפה בכללותו אינו ייחודי לבני אדם הם מודים. המנגנון הצר, לעומת זאת – קיים רק אצל בני אנוש. אבל בכך לא תם המהפך המחשבתי: יכולת הלמידה במובן הצר, ייחודית לבני אדם ככל שתהיה, לא התפתחה אבולוציונית לצורכי תקשורת דווקא אלא בשל צרכים אחרים. ניווט למשל.
אולי זה לא מהפך מלא של 180 מעלות, אבל יש כאן לפחות 179. ספרתי. אז מה נשאר מהדיקדוק האוניברסלי? לא הרבה. בשביל חומסקי זה יותר בכיוון של ללכת עם ולהרגיש בלי. כלומר להיפך – ללכת בלי ולהרגיש עם.

ואי אפשר לשלח אתכם לדרככם בלי ראיון קצר עם חביב התקשורת והקהל – האינטלקטואל האולטימטיבי – נועם חומסקי. הפעם זה עלי ג'י בראיון שמדגים דיקדוק מרהיב ואת חשיבותה של היכולת האנושית לתקשר:

הולך טוב עם :
1. the Sound of Silence כתבתי שם על השקט שבין המילים ועל המנגנונים הסטטיסטיים הפשוטים המשמשים ילדים ללימוד שפה – מנגנונים משותפים לכל פעולות הלמידה ולא רק ללמידת שפה.
2. בז'ורנל Trends in Cognitive Science פורסם ב-2004 המאמר המפשר Universal Grammar, Statistics or Both? (המאמר קל לקריאה ולא מצריך ידע מדעי קודם).

25 תגובות עבור “ספר הדיקדוק האוניברסלי”

  1. [...] כאן « נער חדש [...]

    גם-שם » רוצים רוויזיה

  2. רשומה יפה ומעניינת. תודה!

    יחזקאל

  3. אחח, עלי עלי…

    מעניין לדעת.

    תום

  4. למרות ששמעתי על חומסקי לא פעם (וגם למדתי מדעי המחשב), זו פעם ראשונה שאני נתקל באיזשהו הסבר קצר וברור של הטענות העיקריות שלו.
    אסייג ואומר שייתכן שבגלל הצמצום שנקטת או חוסר הרקע שלי, לא הבנתי מה העניין. ואחרי ההסתייגות, טענת הדקדוק האוניברסלי נשמעת מגוחכת ממש.
    ראשית, עושה רושם שהתיאוריה מצמצת את הגדרת השפה לקובץ של אותיות, מילים וחוקי דקדוק ישימים (זו הגישה של מדעי המחשב למיטב זכרוני). למרות שזו בהחלט הגדרה שימושית ועוזרת (שוב, מדעי המחשב), היא מפספסת מרכיבים רבים בשפה כתקשורת – הבעות פנים, תנועות גוף, קונטקסט, נימת קול. כל המרכיבים האלה הם חלק מהגירוי שמקבל תינוק (ולא מקבל מחשב), ובפירוש תורמים לפירוש ולמידת השפה המילולית (תשאל כל מתרגם).
    נתיב ברור להפרכה שקפץ לי מייד לראש הוא מחקר על ילדים שננטשו/הוזנחו עם מעט קשר עם בני אדם אחרים (פול אוסטר עסק בזה בספרו הטרילוגיה הניו יורקית). אם הילדים הללו פיתחו יכולות שפה (גם אם לא שפה ממש – למשל, ניתן היה ללמד אותם שפה מהר גם בגיל מאוחר יחסית) בהעדר גורם מלמד, זה מחזק את טענת חומסקי. אם הם לא פיתחו יכולות כאלו – זה מחליש את טענתו.

    ענבר שני

  5. ענבר –
    הגישה שאת מכירה ממדעי המחשב היא בדיוק ההגדרה הזו של חומסקי וההיררכיה שאת בטח מכירה משם היא אותה הררכיה (דקדוקים חסרי הקשר, דקדוקים רגולריים וכו').

    הגישה הזו של חומסקי, גם אם היום (כאן ועכשיו) היא מעוררת גיחוך בנוגע לטענות החזקות שלה על מוח וגנטיקה, היא עדיין אלגנטית ומעניינת להסבר כללי על סוגים של שפות פורמליות ולכן היא משמשת במדעי המחשב.
    הנה ויקיפדיה על ההררכיה של חומסקי: http://en.wikipedia.org/wiki/Chomsky_hierarchy

    אגב, הלינק למאמר של חומסקי מציג רק את האבסטרקט של המאמר. הגישה המלאה ל-science אפשרית רק למנויים (כלומר משלמים, או דרך אוניברסיטה). מי שירצה את המאמר המלא (12 עמודים) שישלח לי מייל ואשלח או או שאעלה אותו על השרת של הבלוג.

    אורן

  6. [...] מי שהתעניין קצת בלימודים שלי (כן, כל השלושה), אורן צור כותב כמה מילים על חומסקי ומתנגדיו. תפסיקו להסתכל עלי ככה, זה [...]

    The Daily Dolly » ארכיון » The Daily Dolly 3/01/2008

  7. אני לא כל כך מבין את מבנה הטענה של צח סולן/איתן רופין/יהונתן ברנט. למה זה שתוכנת מחשב שמצליחה ללמוד "מבנה של שפה" בלי "ידע לשוני" מצליחה ללמוד ליצור משפטים סותרת את התיאוריה של חומסקי? הרי האלגוריתם שלהם כן מכיל ידע: הם מייצגים משפטים כגרף, ומכווצים מסלולים לפי כל מני יוריסטיקות. זה ידע פרופר. (והמבנה המתקבל לא כל כך שונה מעצים…). גם המנגנון שחומסקי מציע לא הרבה יותר מורכב מזה. [ושלא ישתמע חלילה שאני תומך במינימליזם של חומסקי, כן?]

    בנוסף, המאמר (היחיד) של ברנט מוסיף על גבי השיטה הראשונית עוד היוריסטיקה: לחתוך משפטים במילות יחס, ורק אח"כ לבצע את כיווץ המסלולים בגרף. זה האמ-אמא של הידע הלשוני, וזה הגיע בצורה לגמרי לא unsupervised. [לא שאני מתנגד לכאלו שיטות, זה דווקא די מגניב, אבל אי אפשר להגיד שזה מלמד משהו על תהליך רכישת השפה].

    ובנוסף, איך לעזעזל קרה שמכל (מעט) האנשים בארץ שעוסקים בעיבוד שפה טבעית, כתבו על *היחיד* שאני לא מכיר??

    יואב

  8. יואב –
    אז זהו שלא הכרתי אף מאמר של ברנט כך שהיה לי קשה להגיב לשיטה (אם כי חשדתי שמה שהם לא עושים – הם משתמשים בידע מוקדם שמקודד לתוך האלגוריתם).
    מילות יחס זה באמת האמ-אמא של הידע הלשוני, וגם אם הם לומדים אותן בצורה אוטומאטית – אז הם בטח משתמשים בכמויות עצומות של דטא כך שאין כאן שום דלות גירוי.
    אבל, צ'מע – נחכה לCICLing או לACL ונראה – אולי הם ישלפו איזה שפן…

    אורן

  9. ענבר – הטענה היא שיכולת רכישת דקדוק קיימת רק אצל ילדים עד גיל מסוים ואז היא מתנוונת (אצל רובנו). לדוגמא נאבוקוב (סופר רוסי במקור) מעולם לא הסכים שייראינו אותו בעל-פה, כי הוא דיבר אנגלית רצוצה במבטא כבד, למרות שהכתיבה שלו היתה מצוינת. גם אני מרגישה שההתבטאות שלי באנגלית מדוברת היא פחות נכונה דקדוקית ופחות עשירה מהכתיבה (ואני גרה בארץ דוברת אנגלית).

    סטיבן פינקר נותן דוגמא בספרו "אינסטינקט השפה" שעוסקת במשפחה באנגליה בלי יכולת לבנות משפטים נכונים דקדוקית. זו כנראה תכונה גנטית, וניתן לעקוב אחרי ענפי המשפחה השונים ולראות למי יש ולמי אין אותה. הנקודה היא שמנגנון למידת דקדוק הוא כנראה נפרד ממנגנוני למידה אחרים (כמו רכישת אוצר מילים). סטיבן פינקר הוא חומסקאי, למיטב ידיעתי.

    Neta

  10. (ב CICLing לא יהיו הפתעות. לא שזה אומר הרבה)

    וכמה מחשבות לגבי אלגוריתמי לימוד לא מונחים: אני חושב שכמה שהאלגוריתם יותר "לא מונחה", ככה הוא למעשה מכיל הרבה יותר ידע מוקדם. אלגוריתם למידה מונחה רואה דוגמאות + תויות, ואמור להסיק מסקנות. לעומתו, אלגוריתם לא מונחה רואה דוגמאות בלי תויות, ואמור להסיק מהן מסקנות. הוא עדיין אלגוריתם, אז צריך להגיד לו מה לחפש, וגם קצת איך. ה"להגיד לו מה לחפש" הזה נמצא שם גם באלגוריתמים המונחים (אלו התויות) וגם בלא מונחים. ה"גם קצת איך" יכול להיות מאד כללי כשהלמידה מונחית, אבל חייב להיות מלא ידע מוקדם כשמדובר באלגוריתם לא מונחה. אחרת איך תצפה שהוא בכלל יעשה משהו? מחשב לא יכול ללמוד דברים בלי שאמרו לו מה ואיך ללמוד נקודה.

    ולדוגמה, נניח שאני רוצה אלגוריתם שמזהה מילות קישור באופן אוטומטי. אז אני יכול לנסח את האלגוריתם הלא מונחה הבא: "חפש מילים נפוצות שמופיעות בשכיחות גבוהה בין מילים שמופיעות בד'כ בסוף משפט לכאלו שמופיעות בד'כ בתחילת משפט". וזה כנראה יעבוד מצויין. וזה כנראה יעבוד גם בקורפוס "דל גירוי" יחסית.

    *אבל* אני מספק כאן המון ידע לגבי השפה. למשל: (1) שיש כל מני סוגים של מילים עם תפקידים שונים (2) שסדר המילים במשפט הוא קבוע יחסית וחשוב (3) שמילות קישור הן נפוצות. (4) שמילות קישור משמשות לחיבור חלקי משפט .

    אפשר היה להציע אלגוריתם שמניח פחות ידע. למשל כזה שאומר לו "הנה מילת קישור. תמצא לי מילים דומות". זה כמובן לא יעבוד. נצטרך להגדיר מה זה דומות.. ואז: "הנה מילה. תמצא לי מילים שמופיעות בקונטקסטים דומים". לא חושב שאפשר לרדת ליותר "לא מונחה" מזה. אבל גם כאן גלום המון ידע (שמילים מחולקות לקבוצות ושמילים מאותה קבוצה נוטות להופיע באותם הקשרים, וזה שבכלל יש הקשרים למילים, שזה נובע מזה שיש למילים סידור עדיף מסויים וכו' וכו').

    או בקיצור: אלגוריתמי למידה לא מונחים הם מגניבים מאד אבל כנראה שלא יכולים להוכיח או להפריך שום דבר לגבי עקרון המולדות של השפה.

    יואב

  11. נאה.

    נקודה די עקרונית: ב"דלות הגירוי" מדובר במיוחד על גירויים שליליים. איש אינו טורח מיוזמתו לתת לילד דוגמאות למשפטים לא נכונים. הילדים עצמם טועים אמנם, אבל רק במגוון מצומצם מאד של דרכים.

    ליואב (גם כן צורה לתקשר): האלגוריתם של רופין (במקורו לפחות) מכיל ידע בלשני מועט מאד. (זה שהוא בנוי בצורה כלשהי, גרפים וכו', ובכך אפשר לומר שהוא מכיל מידע כלשהו, זה נכון לכל אלגוריתם). הוא הרבה יותר גמיש מהמנגנון שחומסקי משער שמצוי במוחנו. חומסקי מניח שבסיסו של התחביר קיים, צריך רק לקבוע פרמטרים מסוימים וצורות תחביריות שאפשר לחשוב עליהן בתאוריה לא ייתכנו כלל.

    עקרונית, אין סתירה – יכול להיות שבמוח יש מנגנון אחד, ואילו במחשב, שבכל זאת יש לו יתרונות מסוימים על המוח האנושי, ייתכן אלגוריתם אחר. עם זאת, גם אני זוכר במעומעם שרופין דיבר בהרצאה על הפרכה ממש של גישת חומסקי, ואולי זו לא המצאה של הכתב.

    דודי

  12. בניסוח אחר, הויכוח הוא האם מנגנון למידת השפה האנושי הוא מנגנון ייעודי, שיכול ללמוד רק שפה אנושית, או מנגנון למידה כללי שיכול, אולי בהתאמות קלילות, ללמוד כל מיני דברים, כמו זה של רופין.

    דודי

  13. בקשר לסעיף מספר 6 בתיאור הדוקטרינה של חומסקי, אני חושב שחומסקי לא ביסס את הטיעון שלו על framework של למידה חישובית מודרנית (כמו PAC), אלא על צורה הרבה יותר נאיבית של למידה שבה לאחר מספר דוגמאות סופי, הלומד לומד במלואו את הדקדוק. הטענות שלא באשר לאי הלמידות של השפה ממספר הדוגמאות שאליהם נחשף הלומד (טיעון דלות הגירוי) מתבססות על הדרישות הנוקשות האלה על איכות הלמידה.
    באותו כנס אמור הייתה הרצאה של שלום לפין שסיפר על עבודתו בה הוא מנסה לתקוף את דלות הגירוי ע"י הצגת רכישת דקדוק באופן רך יותר (PAC או אולי גם מודלים אחרים), שבגדול רק דורשים שבהינתן ללומד מספיק דוגמאות, הוא יצליח להתקרב לדקדוק הנכון בהסתברות גבוהה.

    עמרי

  14. דודי –
    זו באמת נקודה עקרונית מאוד – החלוקה בין דוגמאות חיוביות שניתנות להכביר לדוגמאות שליליות שלא ניתנות (כלומר לא מתוייגות ככאלה על ידי ההורים).
    ויש גם נקודת המשך – הילדים טועים טעויות די אופייניות (בד"כ הכללת יתר) וההורים מתקנים אותם, כלומר יש כאן למידה סופר-מונחית ושואפת לאופטימיזציה על ידי תיקון כמעט מידי של טעויות.

    עמרי (שלום לך, או כמו שאמר דודי לעיל – "גם זו דרך לתקשר") – זה לא הפריימוורק של PAC בצורה הדוקה בעיקר כי קשה מאוד לכמת את כמות(ואיכות) הגירויים. אבל יצא לי לקרוא כמה מאמרים שמתייחסים לPAC כאל מסגרת כוללת – כלומר מעין הוכחה שצימצום טעויות ניתן רק באמצעות הגדלת מספר הגרויים וכן משתלבת ההנחה (המופרכת?) של דלות הגירוי – אין מספיק גירויים כדי לאפשר צימצום של הטעויות למינימום הנדרש.

    אורן

  15. עם ובלי קשר, תופעה מעניינת בהקשר המולדות של ידע שפה היא ביטויים קוניונקטיביים ואילוצים תחביריים לגביהם (ובעברית, "משפטים שמכילים את המילים 'או' ו/או 'ו' "). בניגוד להרבה מאד מבנים תחביריים שלומדים באופן מפורש כשלומדים שפה חדשה, המבנים האלו כמעט ולא מוזכרים, בטח שלא בהרחבה, ועדיין בדרך כלל מאד ברור למי שלומד את השפה איך משתמשים בהם, כלומר איך הם אמורים להראות ומה האילוצים שצריכים להשמר.

    האם הידע הזה ייעודי לשפה או שהוא יותר מוכלל ובעצם מתייחס לאופן בו אנחנו מקטלגים דברים? לא יודע. אבל כך או כך יש כאן תופעה מעניינת, וזה בהחלט מעיד לדעתי על משהו מולד.

    יואב

  16. יש לי מעין השערה לגבי ביטויים קוניוקטיביים אצל בני אדם –
    בני אדם תופסים אותם בצורה טובה כי המחסנית הקוגניטיבית מוגבלת, כלומר מספר הקוניוקציות במשפט הוא די קטן אחרת נוצר עומס קוגניטיבי מאוד גדול שיוצר בעיות של סקופינג ואמביגואציה. האורך הקצר מאפשר למידה נכונה ויעילה. כלומר האלמנט המולד הוא פשוט מגבלה קוגניטיבית.

    אני זוכר שלפני כמה שנים היה בTREK איזה מסלול QA של רשימות (נדמה לי) כלומר למצוא תשובות לשאלות שהתשובה עליהן היא רשימה (באיזה ארצות עובר הנילוס? לאילו מדינות דגל בכחול, אדום ולבן? מי היו נשיאי ארה"ב בין השנים 1914 ל1945? או מהם הסינגלמאלטים מההילנדס?) אני זוכר שזה לא היה טרק פשוט. אבל זה אומר שמחשב מתקשה בניתוח רשימות שכאלו והבנה איפה נגמרת הרשימה ומתחילה קוניוקציה אחרת. למה זו משימה קשה? אולי כי השאלות הצריכו הרכבה של תשובות ארוכות מקוניוקציות באורכים משתנים ומרשימות.

    נ.ב. ניסיתי להוסיף אופציה לקבלת אימיל על תגובות לפוסט. אני לא יודע אם סימנת את זה, אבל יש לי חשד שזה לא עובד טוב . סימנת? קיבלת?

    אורן

  17. יש כאן לדעתי יותר ממגבלה קוגניטיבית, זה ברמה של אילוצים תחביריים, הם די מורכבים.

    אני מתכוון ל coordination of likes.
    ברוב המוחלט של המקרים אסור לחבר שני ביטויים מסוגים שונים (*"צעקתי ותפוח"), אבל לפעמים מותר ("אני חנון וגאה בזה") אבל גם אז יש אילוצים (*"אני גאה ובזה וחנון"). בקיצור, עסק מורכב. מהמעט שניסיתי ללמוד, נראה שכל התיאוריות התחביריות מתקשות בנקודה הזו, ונראה שכל אלו שדגמתי הציעו הסברים די הזויים ומאד מסורבלים (ובפרט המינימליזם של חומסקי, שמתקשה כאן מאד). ועדיין: נראה שלאנשים אין שום בעיה להבין את המבנים האלו, לדעת מה חוקי ומה לא, וגם בשפה שהיא לא שפת האם שלהם, בלי שאף אחד לימד אותם את זה. אני לא מתבסס כאן על כלום, אבל יש לי תחושה שטועים פחות בזה מאשר ב-number agreement, למשל, למרות ששם יש חוקים ברורים מאד.

    מעניין.

    לגבי הרשימות: פעם, בתחילת התואר השני, ניסיתי לעבוד על זה קצת. לא על הטרק, על התופעה (ואז גיליתי שהסימון של מבני קוניונקציה ב-WSJ הוא, איך נאמר, רעוע למדי, אז ויתרתי פחות או יותר. אולי עוד אחזור לזה יום אחד. מה שכן, אני זוכר שהיו שם כמה תופעות מעניינות לגבי אילוצי סדר, גם כשמדובר בביטויים שהם כן מאותו הסוג. היית מצפה (כלומר אני ציפיתי) ש, נאמר "כלב וחתול" יופיע בערך באותה התדירות של "חתול וכלב". וזה באמת עובד בהרבה מקרים. אבל נסה לחפש בגוגל "england and hong kong" לעומת "hong kong and england"…).

    ולגבי האופצייה לקבלת דוא"ל: (א) ראיתי תיבת סימון, והנחתי שהיא אולי לזה, אבל לא ראיתי את הכיתוב שמסביר אותה. אולי עדיף שיהיה באותה השורה.. (ב) הוא כרגע שגוי (אימיילך) (ג) עכשיו סימנתי, נראה מה יהיה.

    יואב

  18. אולי אלו פשוט NGRAMS?
    זה נשמע לי מאוד פשטני אבל זה מה שעולה לי בראש. לא אנגרמים פשוטים של מילים כי ברור שרוכש שפה לא רכש סטטיסטיקות על כל הקוניוקציות אבל שילוב של כמה רמות? מצד שני – אנגרמים של מבני תכוניות נשמע לי קצת מורכב…
    זה באמת מעניין.

    ב-number agreement אמנם יש כללים ברורים אבל הם שרירותיים לחלוטין וברגע שמחליטים שהקפדה על הכללים האלו היא לא בראש סדר העדיפויות אז פשוט לא שמים על זה. אני מניח שאם תשאל את הטועה הממוצע הוא ידע להגיד שזה נכון שהוא אמר "חמש שולחנות" אבל הוא יודע ששולחן זה זכר (או שאני אופטימי מדי?).

    אישתי, לעומת זאת, מקפידה לטעות ולומר "בשבוע שעברה". עולה חדשה, מותר לה. אבל כשאני מתעקש ושואל למה היא טועה בזה היא אומרת ש'שבוע' נגמר בצליל 'אה' שבד"כ מסמן נקבה.

    אורן

  19. יש להבדיל בין יכולת מולדת לרכוש שפה, לבין העקרונות האוניברסליים המשותפים לכל השפות, לכאורה, שגם הם מולדים. היום כבר נעשים מחקרים שמנסים למצוא מכנה משותף בטיפולוגיה עשירה של שפות, כלומר עקרונות "אוניברסליים" סטטיסטיים למעשה:
    Optimality Theory.

    מעניין יהיה לקרוא את הדוקטורט של יהונתן ברנט. אני חושבת שזה חוזר לויכוח הישן על ממשק אדם-מכונה. כרציונליסט, חומסקי ימשיך לטעון שמחשב אף פעם לא ידע שפה כפי שאדם יודע אותה. אני איתו, האמת.

    היילני

  20. היילני-
    1. אמת שברשימת הפוסט-פונד יש תכנון גם לפוסט על אופטימליטי תאורי. אני לא ממש מומחה, אבל לפי מה שאני מכיר אלו יותר עקרונות אל התפתחות (אבולוציה) של שפה, לא?
    2. נראה לי שדווקא כרציונליסט אפשר לטעון שיגיע יום ומחשב יוכל לשלוט בשפה כמו בן אדם. אולי ייקח יותר זמן להבין את מנגנוני הייצוג במח, אבל ברגע שאלו יפוצחו זה הכל עניין של מידול ההקשרים הנכונים.
    3. אני לא יודע אם אני רציונליסט ואני גם לא יודע אם אני מאמין שיבוא יום ומחשב ידע שפה. אני בהחלט מקווה שלא יבוא יום כזה – שנוכל עדיין להאמין שכבני אדם יש בנו משהו מיוחד.

    אורן

  21. [...] שלו בדבר הדיקדוק הגנרטיבי על ההנחה של דלות הגירוי (ספר הדקדוק האוניברסלי). גם אם נחלוק על ההנחה הזו של דלות הגירוי ונניח שגם אצל [...]

    היכל התהילה של הכישלונות המדעים - על פירסום אקדמי של ניסויים שנכשלו

  22. [...] סברות רבות לפיהן לכל שפה יש אבחנה בין שמות עצם לפעלים; רקורסיביות; חלוקה תחבירית לצירופים שונים (צירוף שמני, צירוף פעלי [...]

    אוונס ולוינסון: 2 דקדוק 2 אוניברסלי « דגש קל

  23. [...] סברות רבות לפיהן לכל שפה יש אבחנה בין שמות עצם לפעלים; רקורסיביות; חלוקה תחבירית לצירופים שונים (צירוף שמני, צירוף פעלי [...]

    אוונס ולוינסון: 2 דקדוק 2 אוניברסלי « דגש קל

  24. גיליתי היום דרך גיגול את הבלוג, כבר בתחילת דרכו של חומסקי יצא נגדו בחריפות ז'אן פיאז'ה. כנס לבלוג שלי, כתבתי כמה דברים נגד חומסקי, נראה לי שכיום היחידים שעוד מקבלים את ההיפוטיזות חסרות כל ביסוס מעולם אלו מהחוגים ה(ד)גנרטיביים.

    יאיר שימרון

  25. Twitter API rate limit for this account has been exceeded. This will be rest in 3m 23s. Wth? That's what my twitter is saying-.- wth?

    MILTON

להוספת תגובה