מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

'פייר מנאר, מחברו של דון קיחוטה' הוא סיפור קצר ומבריק של חורחה לואיס בורחס (אחד מני רבים. סיפורים רבים, לא בורחסים). נזכרתי בסיפור הזה בעקבות הפוסט הזה בבְּלָאג של XKCD (הפוסט נקרא robot9000-and-xkcd-signal-attacking-noise-in-chat, אל תבהלו מהשם, עוד נגיע גם לזה). בתזמון משעשע זה יוצא בדיוק יום אחרי אישור חוק הטוקבקים בוועדת השרים, אבל נחזור לקיחוטה, כלומר אל פְּייר מְנַאר שחזר לקיחוטה. מנאר בן המאה העשרים לוקח על עצמו פרוייקט שאפתני – לכתוב מחדש את דון קישוט. מילה במילה. בדיוק. בלי לסור ימין ושמאל.

הוא לא ביקש לכתוב 'דון קיחוטה' נוסף – זו משימה קלה – אלא את דון קיחוטה עצמו, אותו ולא ספר אחר. למותר להוסיף שהוא לא חשב על העתקה מוכנית של המקור, האמביציה שלו, הראוייה להתפעלות הייתה ליצור דפים שיהיהו זהים מילה במילה, משפט במשפט עם דפיו של מיגל דה סרוונטס…
השיטה שנקט בהתחלה הייתה פשוטה יחסית: להכיר היטב את השפה הספרדית, לשוב ולקבל את האמונה הקתולית, להילחם נגד המאורים או נגד התורכים, לשכוח את תולדותיה של אירופה משנת 1602 והלאה ועד 1918, להיות מיגל דה-סרוונטס. פייר מנארד שקל את השיטה הזו אך דחה אותה משום היותה קלה מדי… ליהפך לסרוונטס באופן כלשהו, ולהגיע לדון קיחוטה, זה נראה בעיניו פחות קשה – ועל כן מעניין פחות – מלהישאר פייר מנארד ולהגיע לדון קיחוטה דרך ניסיונותיו של פייר מנאר.
(מתוך 'פייר מנאר, מחברו של דון קיחוטה', גן השבילים המתפצלים, הקיבוץ המאוחד.)

בעברית קוראים לזה הפוך על הפוך (אין לי מושג איך קוראים לזה בספרדית, או אפילו באנגלית). הסיפור הקצר הזה דן במלאכת הכתיבה ולא פחות מכך במלאכת הקריאה, והתלות בקונטקסט התרבותי, אבל לכאן רלוונטית דווקא הכתיבה.

ובכן, מה לפייר מנאר ולסינון חכם של תגובות? רנדל בXKCD טוען כך:

When social communities grow past a certain point (Dunbar’s Number?), they start to suck. Be they sororities or IRC channels, there’s a point where they get big enough that nobody knows everybody anymore. The community becomes overwhelmed with noise from various small cliques and floods of obnoxious people and the signal-to-noise ratio eventually drops to near-zero — no signal, just noise.This has happened to every channel I’ve been on that started small and slowly got big.

אחרי סקירה קצרה של פתרונות מקובלים והסבר על החסרונות והייתרונות שלהם הוא מציע (ומיישם) את הפיתרון הבא – robot9000: אנשים יורשו לומר רק תוכן מקורי – לא בהכרח שימושי אבל העיקר שיהיה מעניין. הרובוט (-9000) בודק האם משפט שנזרק לחלל הצ'אט כבר נאמר בעבר ומאשר אותו רק אם הוא משפט מקורי. לא עוד ‘lol’, ‘yea rite’, ‘morning sucks’ סמיילים מנותקים וכיוצא באלו. זה רעיון מעניין אם-גם לא נטול בעיות ורנדל הוא הראשון להודות בזה. בסוף הפוסט הוא מוסיף רשימת שאלות/התנגדויות אפשריות והתייחסות אליהן.
מה שיפה בפיתרון של רנדל זו האלגנטיות שלו (וזה שלטענתו זה עובד יופי) וגם זה שבעצם אפשר להתאים אותו לפורומים שונים – לא רק צ'אטים אלא גם טוקבקים ואולי פורומים. בקלות אפשר גם להגביל/להגדיל את גודל החלון ולמנוע חזרה בתוך אותו פתיל, באותה שיחה וכו'.

אפשר גם לנסות לקחת את זה שלב נוסף הלאה – למה לסנן רק מחרוזות זהות – מה עם מחרוזות עם תוכן זהה עד כדי מילה נדרפת או שינוי מבני (פסיבי-אקטיבי, זמן)? מה עם מחרוזות קרובות עד כדי מרחק עריכה מסויים? או אולי לבצע מודרציה אוטומטית לפי איזו וואריאציה של תוספת האינפורמציה (information gain, אקא Kullback-Leibler divergence, אקא אנטרופיה יחסית) בכל תגובה?
כל זה לא באמת קשור לחוק הטוקבקיסטים של חסון, אבל סינון תגובות שכזה יעלה את רמת הדיון ויסנן הרבה מהזבל החוצה וכך גם חסון ושאר ניבחרינו בכנסת יֵצְאו ולפחות חצי תאוותם בידם. יש הרבה דרכים להיות נאצי של תגובות. חלקן מעניינות מבחינה תאורטית ואם מישהו רוצה להרים את הכפפה אני אשמח לעזור, לייעץ ולבאס.

וכאן אני חוזר לפייר מנאר ולמגבלות המוח המלאכותי. מה על אמירות זהות שמופיעות בקונטקסט שונה – הפוך על הפוך, אירוניה ותופעות לשוניות מתוחכמות ומסובכות כגון אלו שמעשירות ומפרות את השיח והופכות אותו למעניין ורב רבדים, האם יש דרך לזהות (ולאשר) תגובות שכאלו? מסופקני. בטח לא היום. אולי מחר. כן, תבואו שוב מחר.

הולך טוב עם:
1. גבינות קשות ובשרים קרים.
2. גם עם הפוסט הזה: טוקבקים – שהמחשב יפקח עליהם בעצמו, שמציע מודרציה אחרת של טוקבקים.
3. הקוד של הרובוט (Perl). כתב דן בּוֹגר המכונה זיגדון (Dan Boger - zigdon).

4 תגובות עבור “פייר מנאר וסינון חכם של תגובות”

  1. גבינות קשות יחד עם בשרים קרים נשמע מצוין אך לא כשר…

    Neta

  2. נטע - שימי לב לסדר: קודם גבינות קשות ואז (אחרי ששטפת את הפה עם טרפנטין וספרת עד 371) הבשרים. כשר אבל מסריח (הגבינות, כלומר).

    אורן

  3. אפשר לפרש שזה הולך עם גבינות קשות ןבשר, שתי התוספות אינן צריכות להיות יחד. אחד עכשיו והשני בעוד 6 שעות.(אחרי גבינות קשות צריך לחכות 6 שעות ואני מניח שספירתך האיטית אורכת כך)

    א

  4. […] נוספת ומעניינת על פייר מנאר: פייר מנאר וסינון חכם של תגובות  מאת אורן […]

    במקום תה » ארכיון הבלוג » מה אני קוראת- גרסת הדיוידי

להוספת תגובה