יום שבת, 4 ביולי 2009

הדבר הבא במדיה החברתית: Sentiment Analysis

כמי שבוחנת את שוק ה-BI בשנים האחרונות, מאוד מעניין אותי כיצד ניתן למנף את המידע הרב המצטבר כיום באתרי רשתות חברתיות באותה צורה שבה ארגונים כיום מצליחים למנף מידע עסקי שטמון (בצורה מסודרת למדי, להבדיל מעולם ה-Web) באפליקציות הארגוניות שלהם.
ואולי ההשוואה הזו כלל לא נכונה, וצריך להסתכל על התוכן של רשתות חברתיות בצורה שונה לגמרי?

מחלקות שיווק ו PR מנסות לפענח מה "נאמר על החברה/המוצרים" ברחבי הרשת באתרים בעלי תוכן הנבנה ע"י אנשים, ובאופן ספציפי – באתרי הרשתות החברתיות. באתרים אלה גלום מידע בעל ערך רב: ניתן להבין הרבה על האופן בו החברה/המוצרים/שירותיה נתפסים, העדפות, מגמות, ועוד מאפיינים של תרבות הצריכה הרלוונטית לחברה.
בדיוק כדי לספק את הרצון הזה צמחו כלי כריית נתוני רשתות חברתיות, הדומים במאפייניהם לכלי כריית מידע קלאסיים ובמיוחד לכלי כריית מידע בלתי מובנה / טקסטואלי (Text Mining). לתחום זה של הפקת תובנות מניתוח מידע באתרי רשתות חברתיות קוראים כיום "Sentiment Analysis": הניסיון להבין מהי הגישה של כותב תוכן כלפי אובייקט מסוים. מטרת כלים אלה לאפשר לארגונים "להאזין" לתוכן של רשתות חברתיות, לנתח את השיחה כדי לזהות איזשהו רגש המתקשר עם החברה. זהו חלק ראשון של היוזמה, החלק השני הוא להשתמש בתובנה הזו כדי להגיב בצורה כלשהיא - לפעול להגן על המותג, לנסות לתקן, למנף ביקורת חיובית של בלוגר וכד'. כיום מתחילים לצוץ כמה ספקים של כלי תוכנה שאמורים לספק מענה לצרכים אלה. כלים אלה מספקים יכולות ניתוח טקסט המאפשרות לדוגמה יצירת clusters של תוכן חיובי לעומת שלילי, חלקם מספקים "ציון כולל" לקבוצה של תכנים לגבי מוצר מסוים, ורכיב חשוב – היכולת להגדיר על ידי מחלקת השיווק של הארגון חוקים ספציפיים עבורו (מילות חיפוש חשובות שמשנות את הציון וכד').
דוגמה של כלים כאלה: Umbria (מתמקדת באתרים חברתיית – לדוגמה, בלוגים), Biz360, ודוגמה לחברה ישראלית בתחום – באזילה.
בלינק הבא (בלוג של חברת המחקר 451 Group) יש רשימה די ארוכה של כלי sentiment analysis.

מהן הבעיות כרגע בניתוח Sentiment של רשתות חברתיות?
  • התוכן הוא מאוד בלתי מובנה, אין שום שליטה על הדרך בה אנשים מתבטאים, שימוש בסלנג וקיצורים, בעיות שפה, ושימוש במדיות שונות - טקסטים, קבצי אודיו, קול...
  • מס' האתרים הנו גדול, ומשתנה מתעשיה לתעשיה (מצד שני, עובדה זו רק מחזקת עריכת ניתוחים מסוג אלה בצורה ממוחשבת ולא ידנית)
  • פרטיות – כרגע אינה מהווה בעיה אך ייתכן ובעתיד לא ניתן יהיה להאזין לשיחות ברשת בצורה כה קלה.

ניתן לחשוב על כמה רמות של כלי "האזנה וניטור לשיחות ברשתות חברתיות", החל מ"האזנה" בלבד וברמת תחכום בסיסית (לדוגמה, הקפצת כל התכנים המזכירים ישירות את שם המוצר), דרך האזנה בלבד אבל קצת יותר מתוחכמת (לדוגמה, סידור התכנים על פי קבוצות, תוך התחשבות בתכנים אחרים כגון מתחרים וכד'), האזנה וכן הנעה לפעולה (יצירת מענה אוטומטי שיישלח ל"מתלוננים" על שירות/ הפצת לינק לביקורת טובה דרך אתרים רלוונטיים וכד'), קישור תובנות למערכות אחרות (לדוגמה, כיום חלק ממערכות ה CRM כבר מספקות "ציון" sentiment המופיע עם פרטי הלקוח).

נושא זה מזכיר כלים לניתוח סנטימנטלי בערוצים אחרים – לדוגמה, ניתוח רגשות ("emotion detection") במוקד השירות באמצעות כלים המגיעים מתחום ה-speech recognition. כלים בתחום זה מזהים טונציה, מילים ספציפיות – word spotting (תביעה משפטית/שם המתחרה) ויכולים להוביל לפעולה על סמך התובנות המתגלות.
אך צריך להיזהר לנסות לנתח תוכן באותה הצורה בה אנו מנתחים תכנים אחרים, יותר מסודרים וקונבנציונאליים, המדיה שונה לחלוטין. לראיה, כל ניסיון לנסות ולהשוות את Twitter עם מדיה אחרת יהיה מוטעה. טוויטר מספק כיום אמצעי העברת מידע מהיר מכל מדיה אחרת (דוגמה טובה לכך היא העברת המידע בצורה כל כך חיה על המתחרש ברחובות איראן). כך, לדוגמה, ניתן לנתח בצורה מהירה השפעה של קמפיין מסוים על ה"שיחה" שבשטח כמעט בזמן אמיתי.

לסיכום, לדעתי, ארגונים שיתחילו כבר עכשיו לנסות ולנצל את הכוח הגדול של התוכן החבוי ברשתות חברתיות לא רק יצליחו "להרגיש" את השטח יותר טוב כדי להגן על המותג והתדמית, אלא עם שימוש נכון, יוכלו גם לנצל שיחות אלה למטרת קידום חדשנות מונעת-לקוחות.

2 תגובות:

סיגלית אמר/ה...

כיוון מעניין וחשוב. אין ספק שבשילוב חיפוש מתקדם על סוגי מדיות שונות, ווב סמנטי ויכולת לימוד של הכלי - אפשר להגיע למידע מאוד רלוונטי ברחבי המדיה החברתית. מדיה שהיום אנחנו מגיעים אליו במקרה או בעזרת חברים טובים ששולחים - "כתבו עליכם ב...". הגיע הזמן להחליף את הסוכנים האנושיים הללו בכלים אוטומטיים.

dridan אמר/ה...

התהליך הקלאסי של הBI שמטרתו הפיכת מידע לידע, נשאר אבל התכנים שבו משתנים. התהליך בווב 1.0 היה: נתונים גולמיים ממערכות תפעוליות, ETL, מחסן נתונים, כריית נתונים, הצגת הנתונים, פעולה. התהליך בווב 2.0 נהיה: שיחה גולמית מהבלוגוספירה ומהסוציוספירה (פייסבוק וטוויטר), לא צריך ETL, מחסן שיחות, כריית טקסטים, כריית וידאו, כריית רשתות (גרף חברתי), כריית מציאות (ריאליטי מיינינג, כמו SENSE NETWORKS או כמו WWW.LAYARS.COM), מדידית ROI