מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

[הערת מקפצה: הפוסט הזה פורסם לראשונה ב-15.1.08 אבל עכשיו, עם פרוץ הQERTA (מפתחי הרובוטוקבק) ועד שיהיה לי זמן לכתוב פוסט ענייני, הוא רלוונטי מתמיד.]

'פייר מנאר, מחברו של דון קיחוטה' הוא סיפור קצר ומבריק של חורחה לואיס בורחס (אחד מני רבים. סיפורים רבים, לא בורחסים). נזכרתי בסיפור הזה בעקבות הפוסט הזה בבְּלָאג של XKCD (הפוסט נקרא robot9000-and-xkcd-signal-attacking-noise-in-chat, אל תבהלו מהשם, עוד נגיע גם לזה). בתזמון משעשע זה יוצא בדיוק יום אחרי אישור חוק הטוקבקים בוועדת השרים, אבל נחזור לקיחוטה, כלומר אל פְּייר מְנַאר שחזר לקיחוטה. מנאר בן המאה העשרים לוקח על עצמו פרוייקט שאפתני – לכתוב מחדש את דון קישוט. מילה במילה. בדיוק. בלי לסור ימין ושמאל.

הוא לא ביקש לכתוב 'דון קיחוטה' נוסף – זו משימה קלה – אלא את דון קיחוטה עצמו, אותו ולא ספר אחר. למותר להוסיף שהוא לא חשב על העתקה מוכנית של המקור, האמביציה שלו, הראוייה להתפעלות הייתה ליצור דפים שיהיהו זהים מילה במילה, משפט במשפט עם דפיו של מיגל דה סרוונטס…
השיטה שנקט בהתחלה הייתה פשוטה יחסית: להכיר היטב את השפה הספרדית, לשוב ולקבל את האמונה הקתולית, להילחם נגד המאורים או נגד התורכים, לשכוח את תולדותיה של אירופה משנת 1602 והלאה ועד 1918, להיות מיגל דה-סרוונטס. פייר מנארד שקל את השיטה הזו אך דחה אותה משום היותה קלה מדי… ליהפך לסרוונטס באופן כלשהו, ולהגיע לדון קיחוטה, זה נראה בעיניו פחות קשה – ועל כן מעניין פחות – מלהישאר פייר מנארד ולהגיע לדון קיחוטה דרך ניסיונותיו של פייר מנאר.
(מתוך 'פייר מנאר, מחברו של דון קיחוטה', גן השבילים המתפצלים, הקיבוץ המאוחד.)

בעברית קוראים לזה הפוך על הפוך (אין לי מושג איך קוראים לזה בספרדית, או אפילו באנגלית). הסיפור הקצר הזה דן במלאכת הכתיבה ולא פחות מכך במלאכת הקריאה, והתלות בקונטקסט התרבותי, אבל לכאן רלוונטית דווקא הכתיבה.

ובכן, מה לפייר מנאר ולסינון חכם של תגובות? רנדל בXKCD טוען כך:

When social communities grow past a certain point (Dunbar’s Number?), they start to suck. Be they sororities or IRC channels, there’s a point where they get big enough that nobody knows everybody anymore. The community becomes overwhelmed with noise from various small cliques and floods of obnoxious people and the signal-to-noise ratio eventually drops to near-zero — no signal, just noise.This has happened to every channel I’ve been on that started small and slowly got big.

אחרי סקירה קצרה של פתרונות מקובלים והסבר על החסרונות והייתרונות שלהם הוא מציע (ומיישם) את הפיתרון הבא – robot9000: אנשים יורשו לומר רק תוכן מקורי – לא בהכרח שימושי אבל העיקר שיהיה מעניין. הרובוט (-9000) בודק האם משפט שנזרק לחלל הצ'אט כבר נאמר בעבר ומאשר אותו רק אם הוא משפט מקורי. לא עוד ‘lol’, ‘yea rite’, ‘morning sucks’ סמיילים מנותקים וכיוצא באלו. זה רעיון מעניין אם-גם לא נטול בעיות ורנדל הוא הראשון להודות בזה. בסוף הפוסט הוא מוסיף רשימת שאלות/התנגדויות אפשריות והתייחסות אליהן.
מה שיפה בפיתרון של רנדל זו האלגנטיות שלו (וזה שלטענתו זה עובד יופי) וגם זה שבעצם אפשר להתאים אותו לפורומים שונים – לא רק צ'אטים אלא גם טוקבקים ואולי פורומים. בקלות אפשר גם להגביל/להגדיל את גודל החלון ולמנוע חזרה בתוך אותו פתיל, באותה שיחה וכו'.

אפשר גם לנסות לקחת את זה שלב נוסף הלאה – למה לסנן רק מחרוזות זהות – מה עם מחרוזות עם תוכן זהה עד כדי מילה נדרפת או שינוי מבני (פסיבי-אקטיבי, זמן)? מה עם מחרוזות קרובות עד כדי מרחק עריכה מסויים? או אולי לבצע מודרציה אוטומטית לפי איזו וואריאציה של תוספת האינפורמציה (information gain, אקא Kullback-Leibler divergence, אקא אנטרופיה יחסית) בכל תגובה?
כל זה לא באמת קשור לחוק הטוקבקיסטים של חסון, אבל סינון תגובות שכזה יעלה את רמת הדיון ויסנן הרבה מהזבל החוצה וכך גם חסון ושאר ניבחרינו בכנסת יֵצְאו ולפחות חצי תאוותם בידם. יש הרבה דרכים להיות נאצי של תגובות. חלקן מעניינות מבחינה תאורטית ואם מישהו רוצה להרים את הכפפה אני אשמח לעזור, לייעץ ולבאס.

וכאן אני חוזר לפייר מנאר ולמגבלות המוח המלאכותי. מה על אמירות זהות שמופיעות בקונטקסט שונה – הפוך על הפוך, אירוניה ותופעות לשוניות מתוחכמות ומסובכות כגון אלו שמעשירות ומפרות את השיח והופכות אותו למעניין ורב רבדים, האם יש דרך לזהות (ולאשר) תגובות שכאלו? מסופקני. בטח לא היום. אולי מחר. כן, תבואו שוב מחר.

הולך טוב עם:
1. גבינות קשות ובשרים קרים.
2. גם עם הפוסט הזה: טוקבקים – שהמחשב יפקח עליהם בעצמו, שמציע מודרציה אחרת של טוקבקים.
3. הקוד של הרובוט (Perl). כתב דן בּוֹגר המכונה זיגדון (Dan Boger - zigdon).

8 תגובות עבור “פייר מנאר וסינון חכם של תגובות”

  1. גבינות קשות יחד עם בשרים קרים נשמע מצוין אך לא כשר…

    Neta

  2. נטע – שימי לב לסדר: קודם גבינות קשות ואז (אחרי ששטפת את הפה עם טרפנטין וספרת עד 371) הבשרים. כשר אבל מסריח (הגבינות, כלומר).

    אורן

  3. אפשר לפרש שזה הולך עם גבינות קשות ןבשר, שתי התוספות אינן צריכות להיות יחד. אחד עכשיו והשני בעוד 6 שעות.(אחרי גבינות קשות צריך לחכות 6 שעות ואני מניח שספירתך האיטית אורכת כך)

    א

  4. [...] נוספת ומעניינת על פייר מנאר: פייר מנאר וסינון חכם של תגובות  מאת אורן [...]

    במקום תה » ארכיון הבלוג » מה אני קוראת- גרסת הדיוידי

  5. Try airweb.cse.lehigh.edu/2005/mishne.pdf

    גלעד

  6. אני אוהב את הרעיון של דלישס.
    המלצות חברתיות: ראה מה אהבו החברים שלך.

    זה פותר שתי בעיות: אחד – תוכן איכותי זה לא עניין מספרי – מה שמעניין אותי לא בהכרח מעניין אותך ומאמר מעולה בפסיכולוגיה עשוי להיפסל על ידי עורך מתחום הסטטיסטיקה.
    ובעיה שניה – מנגנון ההמלצות והטוקבקים סובל מגסות רוח ומבריונות שאופייניים למקומות בלי היכרות. אתה לא נדרש להזדהות ולכן לא אכפת לך מה חושבים עליך. אם ביית חושב שאמא שלך והילדים העתידיים שלך יקראו את זה כשיגגלו את השם שלך היית בטוח מתנסח קצת יותר טוב. וגם נרגע לפני שאתה כותב משהו.
    אולי בעצם לזה חסון התכוון.

    mehageg

  7. יצא לך לקרוא סיפור מד"ב קצר בשם "פילים עגומים" מאת ספיידר רובינסון? (הסיפור יצא במסגרת אסופת סיפורים זוכי הוגו).

    הסיפור עוסק בעולם בו יש שיטה "נאצית" שכזו של הקפדה על זכויות יוצרים.
    כשמישהו כותב יצירה, המחשב בודק האם היצירה דומה במשהו ליצירה כלשהי שפורסמה בעבר. ואם כן, היצירה נפסלת ונאשמת בהעתקה.

    סיפור מעניין, שעוסק בנושאים שהעלית כאן

    melquiadess

  8. לא יצא לי לקרוא את זה. למעשה אני כמעט ולא קורא מדע בדיוני. אף פעם לא ממש נכנסתי לזה למרות שהמעט שקראתי דווקא היה די טוב.

    אבל תודה על ההמלצה. אני אחפש.

    ולטובת המחפשים – הנה מצאתי את זה כאן: http://www.spiderrobinson.com/melancholyelephants.html

    אורן

להוספת תגובה