מדע בזיוני

מעניין. אולי זה אפילו נכון.

הבלוג של אורן צור-

אורן הוא:
-עוד קורבן של הסטטיסטיקה
-נכשל במבחן טיורינג

בהן צדקי שמייקל ג'קסון מעניין את עכוזי כשלג דשנות השמונים. זה היה די מדהים לראות את התאום המושלם בו עבר העולם מסיקור המהפכה המדוכאת באיראן לנהי ומספד על חובב היָלְדוּת והילדים. אבל למען האמת אם כבר לזרוק את האיראנים לבור השיכחה לטובת הדחקה בידורית, בעיניי, החדשות המרעישות של סוף השבוע הן בכלל בענייני סרטים. כנראה שיש זוכה בתחרות של נטפליקס (NETFLIX) . התחרות הזו, הדינמיקה שלה והתוצאות עוד ילמדו בבתי ספר למנהל עסקים כמו גם בסדנאות אלגוריתמיקה.

על נטפליקס כבר כתבתי כאן מספר פעמים. נטפליקס היא אחת החברות הגדולות להשכרת סרטי ווידאו. לפני כמה שנים יצאו בנטפליקס עם הנטפליקס-פרייז – תחרות פתוחה לשיפור אלגוריתם ההמלצה שלהם. הראשון שישפר את האלגוריתם בעשרה אחוז יקבל מליון דולר. התחרות הייתה קשה וצמודה והתחרו בה מתכנתי גראז', פסיכולוגים עם חיבה למחשבים, קבוצות אקדמיות וקבוצות מסחריות. מעבר לאלגוריתם, הדבר המעניין ביותר היה שיתוף הפעולה בין הקבוצות השונות. לתחרות היה פורום פעיל בהם פירסמו [חלק] מהקבוצות את האלגוריתמים שלהם, ניתחו את הדטא בפרהסיה וממש עזרו אחד לשני. למעשה, הקבוצה הזוכה היא קואליציה של ארבע קבוצות שהחליטו לעבוד במשותף (וכמובן שישנו גם במרכיב הישראלי). התופעה הזו מרתקת. יש לנו כאן חברה מסחרית פרטית שמשחררת את הדטא שלה לציבור. יש כאן פרס כספי לא מבוטל שמוצע לכל דכפין ויש כאן שיתוף פעולה בין מתחרים. כלכלת רשת במובן הטוב של המילה. באמת מרתק. ידיעה ארוכה מעט (רק מעט) יותר תמצאו ב-NYT של סוף השבוע: And the Winner of the $1 Million Netflix Prize (Probably) Is …

עוד על מערכות המלצה והתחרות של נטפליקס בנפוליון דיינמייט ובעיית הרעב העולמי ובמוזיקה גחלילית.

9 תגובות עבור “נטפליקס – אוכלים סרטים (בקטנה)”

  1. I'll let you know if I can feel any improvement…

    Neta

  2. כמתכנת – אני דווקא לא אוהב את הרעיון של crowd sourcing.

    במילים פשוטות – המון אנשים עובדים ומשלמים רק להכי טובים.

    מהגג

  3. שכחתי לתת קרדיט ליוסי גורביץ על התיאור:
    http://www.calcalist.co.il/articles/0,7340,L-3314724,00.html

    מהגג

  4. מהגג -
    אני לא מסכים עם הביקורת. זו הייתה תחרות פתוחה והשתתפו בה בעיקר אנשים שעשו את זה כעיסוק נוסף. אל מי בדיוק מופנות הטענות?
    אגב, לנטפליקס יש מתכנתים שמפתחים אלגוריתם (או שהם משלמים לחברה אחרת עבור פטנט והתאמה) והתחרות הייתה משהו נוסף.
    גורביץ'* לקח את התאור מאיתמר שאלתיאל (שאני אוהב מאוד) שכורך גם את הטורקי המכני של אמזון באותה חבילה וזה כבר לגמרי מוזר כי בניגור לתחרות של נטפליקס בטורקי אנשים מבצעים מטלות שלא דורשות כל הכשרה או כישרון מלבד להיות אנושי (כמו למשל לפצח קפצ'ה). כך או אחרת – אני לא רואה בזה איום על מתכנתים.

    *סחתיין לגורביץ'. עד שבאת חייתי באשליה שאני הראשון שכתב בעברית על הניצחון באתגר של נטפליקס (כלוצר יש עוד חודש בו מותר לקבוצות האחרות להוכיח שגם הן יכולות להשיג את השיפור המיוחל, כל שאולי עוד צפויות הפתעת).

    אורן

  5. גם אני לא חושב שזה מאיים על מתכנתים באופן ישיר.
    גם אין לי שום טענות לנטפליקס שבאמת עשו דבר יפה.

    מצד שני, הרעיון שלא חייבים לשלם על תוכנה ושאפשר לקבל דברים טובים (מאוד) בחינם או תמורת פרסים למצטיינים מייתר את התוכנה כשירות (אאוט סרסינג) ומדגיש את פתרונות המדף (וורד פרס של הבלוג שלך למשל).

    בעיני תוכנה היא לא רק מוצר, אלא גם גישה לפתרון בעיות במחשב/ברשת. העובדה שיש כזה היצע טוב בחינם היא מין מהפכה תעשייתית של תוכנה. ככזו היא גורמת לאנשים להפסיק לקסטם (customize) קוד של מישהו אחר במקום לכתוב את הקוד שלהם בעצמם.
    בדיוק כמו שמאז הבגדים הסינים אף אחד כבר לא יודע לתפור. נדמה לי שאנחנו מאבדים משהו שהיה בקשר הבלתי אמצעי שבין הפלט לשורת הקוד שכתבנו בעצמנו.
    הלאה ספריות אופן סורס ענקיות ש99% מהן אתה אפילו לא מכיר, יחי הmain.c הקטן והטוב שעושה בדיוק מה שאתה צריך בלי להתלנקג' עם libExpat

    mehageg

  6. מהגג –
    הגישה שאתה מציג היא מעניינת עד כדי בקשה לפוסט אורח.
    לא חשבתי על זה בצורה הזו. אני משתמש בוורדפרס כי אין לי את הידע להרים כזה דבר למרות שאני מתכנת לא רע. גם אין לי את הזמן ללמוד מה שצריך. וגם אם אלמד – כיוון שאני רוצה להקים בלוג יחיד – לעולם לא אגיע לרמת ההתמקצעות של מפתח שמתמחה בPHP, אפליקציות רשת, אבטחה ושילוב של הכל עם דטאבייס וכו'.
    כשאני רוצה קוד קטן שעושה בדיוק מה שאני עושה אני אכן כותב אותו בעצמי. אבל גם אז אני משתמש בSTD או במודולים ופקג'ים שאני מוצא (או כאלו שכבר מותקרים עם הסביבה/קומפיילר).
    קיצורו של דבר – בעולם שדורש מומחיות ספציפית יותר ויותר אי אפשר שכולם ידעו גם לתכנת הכל וגם לתפור.

    אורן

  7. וכשאתה משתמש ב-if וב-for,
    לא חסר לך הקשר ל-0,1?

    אני חושב שצריך להסתכל על הדברים האלה לפי מבחן התוצאה – השאלה היא לא אם אני יודע לתפור או לקנות בגדים מוכנים, אלא האם אני מרוצה מהם באותה מידה.

    אלא אם כן אתה רואה ערך משמעותי בתפירה/תכנות, ובהחלט יתכן שיש כזה, אבל זה נושא אחר.

    אילן

  8. אורן – פוסט אורח בבמה המכובדת שלך זה עניין רציני. אני אשתדל למצוא זמן, ולשבת לכתוב. בכל אופן, הביקורת היא ללא ספק אנארכיסטית משהו ולא בשלה לגמרי. ושלא יהיה ספק, גם אני משתמש בספריות גדולות בעבודה שלי אבל אני מרגיש שיש משהו שמתפספס בקשר הבלתי אמצעי לקוד.

    אילן – ברור שמבחן התוצאה/יעילות מכתיב שימוש בספריות גדולות וחזקות. הנקודות הן לא (רק) התוצאה אלא גם הדרך ומידת ההנאה מהתהליך וההתאמה של התוצאה למטרה.

    ברור שיש עוד הרבה מה להרחיב על הנקודה הזאת, ואולי אמצא ברשת מישהו שכתב את זה כבר עם עוד הרבה דוגמאות, גרפים וסטטיסטיקות להמחשת העניין, עוד שישה נושאים די רלוונטיים, שבנקודה אחת אני לא ממש מסכים איתו ובשני נושאים הייתי כותב קצת אחרת…

    mehageg

  9. והנה מאמר, המסביר את האלגוריתם מאחורי הזכיה, זוכה גם הוא בפרס בכנס SIGKDD: http://www.searchenginecaffe.com/2009/07/kdd-best-paper-award-temporal-dynamics.html מחבר המאמר הוא ד"ר יהודה קורן, החבר הישראלי בצוות הזוכה

    יובל

להוספת תגובה