בסימסטר הזה אני מלמד גם את הקורס בכריית מידע (data mining) באוניברסיטה הפתוחה. בשיעור הראשון שהיה מעין מבוא הסברתי מה עושים עם DM , נתתי דוגמאות מחיי היומיום והסברתי קצת על האיך (+מבוא מטופש לתורת האינפורמציה). היה חשוב לי להשחיל בשיעור גם את המשפט הבא "DM זה תחום מרתק מבחינת התאוריה ומבחינה אלגוריתמית אבל תדעו שבעיניי מרבית השימושים ב-DM הם לא מוסריים". הנה אחד השקפים מהשיעור הראשון, לפני שבועיים:

ועכשיו לכו לקרוא את מתנתקים מהעם – סקירה מקיפה בעיתון לתוכן שיווקי בוטהכלכליסט שסוקרת את המהפך שעשה ה-CRM משיטה לשימור לקוחות לשיטה לתיעדוף פרות חולבות וזניחת לקוחות מהם אפשר לחלוב פחות. את כל הטענות האלו אני משמיע כבר שנים, גם כלקוח וגם כמי שמכיר את הטכנולוגיה. זה השילוב של חוסר תחרותיות אמיתית, מק-ג'וביות מודרנית (טבלת מקרים ותגובות נפוצים לעובד ההדיוט), אאוט-סורסינג ומחשבה שהלקוח הוא אידיוט ומה שחשוב לו זו רק התדמית והמלל ולא המהות/תוכן/איכות/שירות. אולי הם צודקים.
*זה היה הטיזר לכתבה כפי שהופיע אתמול בכלכליסט.

חלק מהאירוניה היא שניתן לחסוך בקלות הרבה כסף, ע"י שירות אינטרנטי. למה שאחכה שעות על הקו, אם אני יכול לשלוח שאלה קטנה באימייל? אז גם אם התשובה תגיע אחרי יום יומיים, אז מה. לרוב, איני ממהר. אבל מסיבות לא ברורות, הם ממש נגד. לחברות הגדולות עמן ניסיתי להיות בקשר, אין באתר מידע על איך ניתן ליצור קשר מקוון. וכשדיברתי עם נציגי שירות, אשרו שאין דרך כזאת.
לא ברור לי הקטע, באמת.
אסף
מרץ 18th, 2010
tones?
Maye you meant tons?
Ori
מרץ 18th, 2010
maybe he meant tonnes.
Neta
מרץ 18th, 2010
maybe he meant lots
anti-shaiba
מרץ 18th, 2010
tons.
זה מה שקורה כשמכינים שקפים בלחץ לפני השיעור וכשהספלצ'קר לא מבין סמנטיקה. וכשאני מדבר בעיקר בעל פה כשהשקפים הם רק רקע-עזר שלא נועד לקריאה.
אפשר לשלוח לכם את כל המצגות שלי לפני השיעור? (כלומר אם הם היו מוכנות יותר מכמה דקות לפני).
אורן
מרץ 19th, 2010
מעניין שממש במקביל לפוסט הזה שלך עלה בחורימבה פוסט עם הכותרת: הצד האפל של השופינג.
מעניין לראות לאיזה כיוונים שונים של הצד האפל מתכוונים בשני המקומות.
אה, ואתה יכול להשאיר קליינט טוויטר פתוח תוך כדי הרצאה ולקבל תיקונים בזמן אמת.
שחר
מרץ 19th, 2010
שחר –
אני רק אציין שבשקפים קודמים דיברתי (יחסית ארוכות) גם על fraud detection, והסברתי בסכמטיות איך האלגוריתמים האלו פועלים.
לגבי הכיוון בחורימבה – הפוסט נכתב על ידי ה"שותף" פלימוס. מתוך הסבר הPR בסוף הפוסט: "פלימוס היא פלטפורמה למסחר אלקטרוני וסליקה באינטרנט". נראה לי שזה מסביר הכל.
אורן
מרץ 19th, 2010
אולי הגיע הזמן שמישהו ימציא מאיית שיודע לתקן שגיאות הקשר? אני בילבלתי בין principal and principle רק לא מזמן.
Neta
מרץ 19th, 2010
וחבל גם שהקורם דאטא מיינינג של העברית כל כך מיותר. מעבר למונחים ושמות שיטות, לא לומדים בו כלום. במקרה הטוב, הציון הסופי הוא על פרוייקט בו תלמידי מדעי המחשב מנצלים ידע קודם, ותלמידי מנהל עסקים נחים בצד.
(במקרה הרע כולם מזיעים מאימה על כך שאין להם מושג איפה להתחיל אפילו.)
והעילום שם הוא כמעט רק מאחר ועוד לא הוגשו הפרוייקטים, וכמובן שמכאן גם עוד לא התקבלו ציונים.
אולי אלמוני
מרץ 20th, 2010
המממ. לא ידעתי שיש קורס DM בעברית. אבל לפי התאור שלך אני מנחש מי מעביר אותו. תיכף אבדוק בשנתון אם אני צודק.
אבל תרשה לי גם מילת סינגור כללית – זה קורס די בעייתי. בעיקר אם הוא מועבר בשיתוף לתלמידי מדעי המחשב ומנהל עסקים. האלגוריתמיקה בקורס דורשת הרבה ידע מוקדם (הסקה סטטיסטית, למידה חישובית ורצוי גם תורת האינפורמציה) אני לא בטוח שכל אלו הם קורסי חובה או דרישות קדם. ללא היידע הזה הדרך היחידה לצקת קצת תוכן בקורס הוא לוותר על השאיפות המדעיות ופשוט להציג דרכים לשימוש בכלים השונים. הקורס אמור להיות מיועד תואר שני במנהל עסקים או לחלופין קורס מתקדם במדעי המחשב (עם המון דרישות קדם). כאשר מנסים לעשות שילוב הקורס הולך לאיבוד וכולם מבזבזים את הזמן.
אורן
מרץ 20th, 2010
אין ספק שניתן לעשות קורס שיהיה מעניין ורלוונטי לאנשי מנהל עסקים. הוא מן הסתם יהיה קצר יותר.
אין ספק שניתן לעשות גם קורס שיהיה מעניין לאנשי מדעי המחשב. וכנראה אפילו לאלו מהם מתואר ראשון. אבל אחד הדברים שאנשי מדעי המחשב התלוננו עליו במשך הקורס הוא המחסור בשיעורי בית. אירוני, לא?
ואין לי ספק שבמצב הנוכחי, לא ניתן לספק אף אחד. אבל התוצאה היא קורס חסר ערך.
אולי אלמוני
מרץ 22nd, 2010
בחברת התוכנה שעבדתי בה, לפני מה-זה מלא שנים, פיתחנו תוכנות עבור חברות תוכנה אחרות. יענו, ללקוח הלכאורה משכיל שמבין מה הוא אמור לקבל. זה לא הפריע למנתחי השוק שלנו לדרוש מוצרים אטרקטיביים על חשבון מוצרים עובדים (וזה אכן מה שפיתחנו). זה גם לא הפריע למוצרים שלנו להימכר כמו לחמניות אחרי פסח. מה שאומר שתדמית כנראה מוכרת. גם ללקוחות הלא אידוטיים. לחץ חברתי עובד?
אבל האמת היא שבאתי לפה כדי להריע לקורס קריית מידע באוניברסיטה הפתוחה. הידד! אפילו אם הוא לא מיועד ממש למדמ"חים. עשיתי באוניברסיטה הפתוחה תואר ראשון, לפני לא מעט שנים. אז לא היה קורס בסגנון וכך יצא שאת סמינר המחקר (או איך שלא קוראים לזה) של סיום התואר רשמתי בדיוק בנושא הזה. אחרי זה הייתי קצת אובססיבי לכריית מידע כמה חודשים, אבל בסוף זה עבר לי עקב חוסר שימושיות בעבודה.
ניימן
מרץ 22nd, 2010
ניימן –
הבעיה היא שאין באוניברסיטה הפתוחה קורסים חשובים יותר (ונדרשים כדרישות קדם) כמו למידה חישובית ותורת האינפורמציה.
ואם נחזור לעברית – הקורסים האלו דווקא מועברים שם אבל משום מה* הם לא מהווים דרישות קדם לקורס בכריית מידע.
*בגלל שהקורס מועבר גם/בעיקר לאנשי מנהל עסקים.
אורן
מרץ 23rd, 2010
בעית המוסריות אינה קשורה בהכרח לתחום ה data mining לדעתי.
הבעיה היא כללי המשחק של השוק החפשי. כללי המוסר הקלאסיים של החברה אינם חלים על שוק שבו כמעט הכל מותר למען השגת יותר רווחים.
data mining הוא כלי שמאפשר את השגת היעדים באופן יותר יעיל.
liza
מרץ 23rd, 2010
ליזה –
לא אמרתי שDM זה לא מוסרי. אמרתי לסטודנטים שהרבה מהשימושים המסחריים הם לא מוסריים בעיניי. האלגוריתם עצמו אין לו מוסר. זו הייתה הערה שנועדה לתת גם זוית אחרת ולעורר מודעות. הכל כלול בשקף – השימושים הטובים יותר ופחות ובעיקר סימן השאלה.
אורן
מרץ 23rd, 2010
[...] קשורים: – זו שטות לתת שירות – קצקצר על היבטים מוסריים בכריית מידע. – מה גוגל [...]
in heart I’m a muslem , משחק רמדאן, או: מה יודעות עליך חברות הסלולר
אוגוסט 28th, 2011