יום שישי, 4 ביולי 2008

תובנות משולחן עגול בנושא מנועי חיפוש ארגוניים

לאחרונה ערכתי שולחן עגול בנושא מנועי חיפוש ארגוניים, בהשתתפות ארגונים ממגוון סקטורים.

המצב הקיים אצל רובו הגדול של משתתפי הדיון, וכן בקרב ארגונים רבים עמם אנו בקשר לגבי תחום זה, הנו שימוש במספר מנועי חיפוש שונים הנכללים במערכות השונות. כלומר, כמעט לכלל הארגונים אין מנוע חיפוש כלל ארגוני כיום, כל מערכת עם מנוע החיפוש שלה (מע' ניהול מסמכים, פורטל ארגוני, מערכות ארגוניות – ERP/CRM, מערכות ניהול ידע וכד'):













השיטות הרצויות ליישום מנועי חיפוש ארגוניים
משתתפי הדיון דנו בגישות ליישום מנוע חיפוש ארגוני, ביתרונות וחסרונות של כל גישה, ואילו שיטות רצויות יותר בארגונם. ישנן שתי שיטות בולטות ליישום מנוע חיפוש ארגוני:




מנוע- על שמתחבר למקורות מידע שונים, מאנדקס מקורות אלה בעצמו, ומספק ממשק אחד לחיפוש בכלל המקורות;
מנוע-על פדרטיבי, שמתחבר למנועי חיפוש קיימים של מקורות מידע שונים, כלומר – הוא אינו מאנדקס את התכנים בעצמו אלא מסתמך על תוצאות החיפוש של מנועי חיפוש אחרים, ומספק ממשק אחד לאחזור כלל התוצאות.

בדיון שמענו גישות שונות של ארגונים באשר לאופן היישום, ובנושא זה לא הייתה תמימות דעים. כמחצית ממשתתפי הדיון (42%) העדיפו מנוע המאנדקס את מקורות המידע בעצמו, וכמחצית (50%) העדיפו את גישת המנוע הפדרטיבי. היתרון העיקרי שצוין ביישום מנוע פדרטיבי כלל ארגוני הנו היכולת לשמור על הרשאות הגישה למידע הנשמר במערכות התפעוליות. חיסרון אשר צוין על ידי אחד ממשתתפי הדיון שעובד בשיטה זו הנו ביצועים איטיים הנובעים מהעובדה שהמנוע "שואל" את המנועים האחרים ומחכה לתשובות. גישות האבטחה שצוינו – גישת אבטחה פר כל פריט, וגישת אבטחה אפליקטיבית.

מה ארגונים רוצים לקבל מפרויקט יישום מנוע חיפוש ארגוני?
משתתפי הדיון דיברו על ה"חזון" שלהם למנוע חיפוש ארגוני, למה הם בכלל מעוניינים ביישום שכזה, ומה הם מקווים לקבל. להלן כמה דוגמאות לתוצאות שארגונים מעוניינים לקבל:

  • נציג אחד הארגונים תיאר כי המצב הרצוי בארגונו הוא שבסופו של דבר יהיה כלי אחד מרכזי, בו כל אחד מהעובדים יוכל לשאול שאלה (לדוגמה, אנשי שירות לקוחות אינם יכולים להיות מומחים בכל דבר וצריכים מקום בו יוכלו לחפש מידע מבוקש). נציג ארגון זה סיפר כי גישת מנועי החיפוש עדיפה על גישת הקטלוג המסודרת הוותיקה – על פיה יש לשייך כל פריט תוכן למקום ספציפי על פי שיטת תיוג ספציפית, מה שמכביד על העובדים וגם מוביל לכך שיש פונקציה מרכזית אחת בלבד שיודעת איפה נמצא פריט התוכן המבוקש. לכל עובד יש את הסדר שלו ושיטות העבודה שלו, וגישת מנוע החיפוש מאפשרת "לזרוק הכול למקום אחד, בלי האילוצים שמתבקשים מעבודה על פי טקסונומיה מוגדרת מראש. מנוע החיפוש יחפש בצורה טקסטואלית, כאשר הטקסונומיה מתבצעת ברקע. ארגון זה בוחן כיום כלים לנושא זה.

  • בארגון אחר גם כן תוארה הגישה של יישום מנוע חיפוש כגישה המחליפה את הגישה ה"מסודרת" שמכריחה את העובדים לסדר את התכנים בסדר מסוים (אך לא בכל נושא, ישנם עדיין נושאים המחייבים עבודה מאוד מוסדרת ומאורגנת לשמירת התכנים כמו לדוגמה במסמכים הנדסיים).

  • בארגון גדול נוסף צוין מגוון רחב של מערכות ידע שונות לצרכים שונים, לכל אחת מהן יש מנוע חיפוש שונה שמחזיר תוצאות בצורות שונות. הרצון הוא לשלב מנוע חיפוש חזק בפורטל הארגוני שיאפשר מקום גישה אחד לכלל מקורות המידע.
  • בארגון מסוים קיים מבנה די מבוזר, וגם המערכות בהן נשמר המידע מבוזרות. כתוצאה מכך, ידע הולך לאיבוד. יישום מנוע חיפוש ארגוני יכול לעזור למנוע את המצב הקיים בו כל פעם מחדש ממציאים את הגלגל. ידע שקיים כיום בגוף אחד מומצא מחדש בגוף אחר. בארגון זה קיימת מחלקה מרכזית למידע שמאתרת ומחפשת מידע במאגרי חיפוש שונים והעובדים אינם מחפשים בעצמם מחוסר זמן. הדבר יוצר צווארי בקבוק ועומס על אותה מחלקת מידע.
  • נושאים בעייתיים ביישום מנועי חיפוש ארגוניים: נושא העברית צוין כבעייתי, וכגורם לאי דיוק בתוצאות החיפוש. יחד עם זאת, אף אחד מבין כלל משתתפי הארגון לא עושה שימוש ביכולות מורפולוגיות שנרכשות כתוסף, לדוגמה – Morphix. באחד הארגונים נבחן נושא זה ותוצאות הבדיקה היו טובות אך הוחלט שלא ליישמו בשל העלות הכרוכה בכך שלהערכתם לא ניתן היה להצדיק. כמה ארגונים סיפרו על בעייתיות בחיפוש בתוך מסמכי PDF בעברית וסיפרו שכדי לבצע חיפוש בעברית במסמכי PDF יש להפוך תחילה את המסמך ולחפש על תמונת הראי. אחד הארגונים שניסה זאת ציין שכתוצאה מכך בניסיון שנעשה התקבלו עודף תוצאות מאוד גדול כאשר היה ידוע שהיו אמורים להתקבל מסמכים בודדים לחיפוש הספציפי שנעשה. צוינו מספר יכולות כחשובות שבהיעדרן מתעוררות בעיות: יכולת שצוינה כחשובה, שלא תמיד ניתן לקבלה, היא היכולת לקבל Highlight של המילה הרצויה בתוך המסמך. ארגון אחר ציין כי חסרה לו מאוד היכולת לעשות Preview של מסמך לפני שפותחים אותו. ארגון נוסף ציין שהיכולות לעשות tuning באפשרויות החיפוש הוא חשוב מאוד. כלומר, מנוע שמגיע כמעין "קופסה שחורה" שלא ניתן כלל להתערב בה הנו חיסרון מסוים. אי התאמת תוצאות החיפוש למשתמש מהווה הנה יכולת חסרה נוספת שצוינה. בצורה זו, חיפוש של מנהל בכיר אינו שונה מחיפוש של עובד תפעול. בעיה נוספת היא חוסר המובנות אשר גוררת תוצאות חיפוש לא טובות - ככל שמתרחקים מההבניה המסודרת של מידע מקבלים יותר זבל בתוצאות החיפוש. כלומר, אין פיתרון קסם. יישום של מנוע חיפוש על מקורות מידע בעלי תכנים שאינם מובנים כלל ייתן תוצאות "מבולגנות" בעוד שיישום מנוע חיפוש על מסמכים מובנים כגון טפסים בעלי מבנה וסדר ידוע יתנו תוצאות ברורות ומסודרות. ארגונים ציינו שברגע שמדובר בתחום מאוד אסטרטגי לארגון ופריט התוכן מהווה חלק מתהליך העבודה, ישנו טופס בעל מבנה מסודר ומוגדר מראש. ציפיות העובדים הן נושא בעייתי נוסף. עובדי הארגון התרגלו בעולם האינטרנט לחפש ולמצוא כמעט כל דבר שהם צריכים. רמת הציפיות שלהם גבוהה מלכתחילה, הם מצפים לקבל את אותו הדבר גם בתוך הארגון, וכתוצאה מכך צפויה להם מראש אכזבה. חיפוש במנוע חיפוש פנים ארגוני מוגבל מבחינה מסוימת ובעל סיכויים יותר קטנים להצלחה בעיקר בשל חוסר היתרון לגודל. בעולם האינטרנט החיצוני מנועים כגון Google, Yahoo נהנים מיכולת Rating המתבססת על מיליוני חיפושים בכל יום. גם נושא התגיות נשען על יתרון לגודל זה. בתוך הארגון אין את היתרון לגודל כך ששיטות ה Rating משתנות ולא מקבלים את אותה החוויה. משתתפים בדיון ציינו כי את העובדים עובדות אלה לא ממש מעניינות, קשה להתאים מראש את רמת הציפיות שלהם, והם מחפשים את אותה החוויה שיש להם בעולם האינטרנט החיצוני גם בתוך הארגון. למרות שהסיכוי לתת להם חוויה דומה מאוד נמוך, צריך לשאוף לתת להם כלים טובים שיתקרבו לאפשרויות הגישה שלהם למידע בעולם ה אינטרנט החיצוני. וגם מהימנות ביצוע פיילוט צויינה כבעייתית. ביצוע פיילוט נעשה על ידי רוב הארגונים שבוחנים מנועי חיפוש ארגוניים. יחד עם זאת, קשה לבצע בדיקה אמיתית שכן כשבודקים רק על חלק קטן מהנתונים מקבלים תוצאות מסוימות, וברגע שמחפשים על מקור נתונים גדול יותר הכול עשוי להשתנות. בנוסף, כל tuning שנעשה, אפילו אם הוא קטן מאוד, יכול לשנות לגמרי את תוצאות החיפוש. למרות כל זאת, ארגונים נוטים לעשות פיילוט על אחד או כמה מהכלים הנבחנים.

    מקורות המידע: תכנים מובנים או בלתי מובנים?
    במהלך הדיון רוב הארגונים דיברו על יישום של מנועי חיפוש לצורך בלתי מובנה, לעומת זאת בסקר רובם ענו שמנועי החיפוש צריכים בסופו של דבר לחפש גם במקורות מידע מובנים וגם בלתי מובנים. להערכתנו, הסיבה לפער זה נעוצה בין הדחיפות הקיימת כיום בחיפוש במקורות מידע בלתי מובנים – זהו הצורך העיקרי והדחוף יותר אותו מתכוונים ארגונים ליישם בשלבים הראשונים. יחד עם זאת, מתוך הסתכלות עתידית והתפתחות מנועים אלה בארגון, היכולת של מנועי החיפוש לחפש הן במקורות מידע מובנים והן במקורות מידע בלתי מובנים כנראה חשובה.






מדיניות לגבי חיפוש שולחני – Desktop Search
ברוב הארגונים אין כיום מדיניות בנושא השימוש בכלי חיפוש שולחניים אישיים. היו מספר קטן של ארגונים שציין כי נתקל בבעיות ממשיות בשימוש בכלים אלה על ידי העובדים, שני ארגונים ציינו השפעה שלילית על ביצועי המחשב ואחד מהם ציין כי תחנות עבודה ממש "נתקעו", בארגון אחר נתקלו בהתנגדות אבטחת מידע. ברוב הארגונים שהשתתפו בדיון לא מגבילים אך גם לא מעוניינים לעודד שימוש זה מכיוון שהוא מפחית את רמת השיתוף הארגוני, וכי בסופו של דבר המטרה היא להעביר כמה שיותר מידע מה desktops לרשת. בארגונים בהם כן קיימת כיום מדיניות בנושא חיפוש ארגוני, באחד מהם לדוגמה המדיניות הכללית בארגון היא שלא להתקין תכניות פרטיות (גם אם חינמיות); בארגון אחר דווקא הוחלט על מדיניות של הפצת מנוע חיפוש שולחני לצורך חיפוש אישי בתחנת העבודה של המשתמש כאשר ההגבלה היא שהעובד מחפש אך ורק בחומרים אליהם הוא מורשה לגשת.

אחריות ארגונית לנושא החיפוש
חלק ממשתתפי הארגון התייחסו לנושא האחריות הארגונית בציינם כי נדרשת פונקציה בארגון שהנה dedicated לפרויקט. פרויקט חיפוש ארגוני רק ילך ויגדל כל הזמן, כאשר עוד ועוד מקורות מידע ייכנסו. התחזוק היומיומי צריך להיות בידיים של מידענים או פונקציות עסקיות אחרות בארגון שיטפלו בשאלות כגון - איזה מטהדטה לכלול? האם לכל הארגון מטהדטה זהה? קווים מנחים והגדרת מדיניות.

שיטות הטמעה שצוינו לנושא החיפוש
מהמפגש עלה כי חיפוש ארגוני נתפס כתחום בו פחות צריך להדריך את העובדים כיצד להשתמש, לעומת מערכות אחרות. ארגון שהטמיע פיתרון חיפוש כלל ארגוני סיפר כי בסה"כ הנחת העבודה הנה שחיפוש הנו די אינטואיטיבי. נעשתה הדרכה מקוונת דרך מערכת e-Learning, וישנו שימוש במדדי בקרה תקופתיים כדי לבקר את מידת ואופן השימוש.

לסיכום:
רוב הארגונים מפעילים כיום מנועי חיפוש שונים לצרכים שונים, ומביעים רצון לספק לעובדים מקום אחד וגישה מהירה באמצעות חיפוש במאגרי המידע של הארגון. העובדים מצפים מהארגון לספק להם יכולת חיפוש במאגרי הארגון בדומה לדרך בה הם כיום יכולים לחפש מידע בקלות באינטרנט.
ארגונים כיום מסתכלים בעיקר על ניהול תכנים בלתי מובנים כמקור המידע העיקרי בו יש לטפל, אך מתארים את המצב הרצוי העתידי בו מנוע החיפוש יחפש בכלל מקורות המידע, מובנים ובלתי מובנים.
אין הסכמה רווחת באשר לאופן היישום של מנוע החיפוש, פדרטיבי או מנוע אינדוקס. הגורם המכריע בד"כ בסוגיה זו הנו אופן ומידת ההרשאות הנדרשת.
משתתפי הדיון התייחסו לסוגיות בעייתיות עיקריות – עברית, יכולות חסרות/מוגבלות, רמת ציפיות בלתי ריאלית מהעובדים, והקושי בחיפוש במקורות מידע מאוד בלתי מובנים (כלומר, כאשר רמת ההבניה יורדת רמת האיכות בתוצאות החיפוש גם כן יורדת).נתון מעניין נוסף הוא שרוב הארגונים עוד לא גיבשו מדיניות בנושא החיפוש הארגוני אך באופן כללי אינטרס הארגון הוא להעביר כמה שיותר מידע למערכות הארגוניות וקיים חשש שיישום כלים שולחניים יסייע לעובדים "להתבצר" עוד יותר בתיקיות האישיות שלהם.

2 תגובות:

אנונימי אמר/ה...

חבל שלא ציינתם גם שמות של כלים שיושמו בארגונים השונים.

Einat Shimoni אמר/ה...

מידע על כלי חיפוש ניתן למצוא במצגת שלי:
http://www.slideshare.net/Einats/2010-enterprise-applications-bi-km-trends
(שקף 93 מדבר על ספקי מנועי חיפוש בישראל, נציגיהם ואינטגרטורים)