• אסף שפירא

הרחבות לפרק 20: מדע הרשתות בשטח – הצלחות וכשלונות

עודכן ב: ספט 26

(ר' קישורים בגוף הטקסט)

מה מתרחש (:

אני אסף שפירא וזה נטפריקס – הפודקאסט העברי הראשון למדע הרשתות.


היום הבאתי אורח מיוחד לסדרה העוסקת ביישומים של מדע הרשתות בהייטק ובתעשייה, אבל כדי באמת להציג אותו, אני צריך להתחיל מההתחלה. וכמו כל התחלה טובה, היא התחילה מכישלון. סיפרתי על זה בפרק הראשון של הפודקאסט אז לא ארחיב, רק אזכיר שכישלון מקצועי הוא מה שהביא אותי למדע הרשתות. כישלון - וההוא מ-MIT. אותו אחד שהפגיש אותי לראשונה עם הרעיונות שאז נשמעו לי מופרכים שקשורים לתכונות אוניברסליות של רשתות והתנהגות אנושית.

כך גיליתי שלושה דברים:

הראשון, שהדבר הכי קשה בכישלון זה להודות בו. השני זה, כשמודים – לומדים (ואם זה חרוז זה בטוח נכון).

והשלישי – שאין על רשתות. אז זו תמיד נראתה לי תעלומה: למה לא כולם משתמשים במדע הרשתות? זו בעצם השאלה שאיתה יצאתי לדרך עם הסדרה הזו ועימתתי איתה אנשים מהתחום ומחוץ לתחום, בדגש על התעשייה. השילוב של המסע התיאורטי הזה לצד החיכוך בפרקטיקה, כאחד שעוסק בתחום, זיקקו אצלי את שתי התובנות הבאות:

הראשונה, וכנראה המרכזית היא ש... מדע הרשתות זה הפתרון לבעיה שלא ידענו שיש לנו. אני לא מתכוון רק ליכולת של ניתוח רשתי לחשוף בפנינו את מה שלא ידענו שלא ידענו, או ה-Unknown-Unknown (כפי שראינו בפרק 5). אני מתכוון לכך שרוב האנשים לא מסוגלים לדמיין בכלל צורך בניתוח רשתי, בדיוק כמו שמי שחי את הדאטה שלו בדו-מימד, לא יכול לדמיין את העולם בתלת מימד. והסיבה השנייה, שגם בה תקלתי יותר מפעם אחת היא שיש כאלה שאומרים: כן, ניסינו איזה משהו מתורת הגרפים/מדע הרשתות אבל לא הבנו את התוצאה אז ויתרנו.

בסדרה הזו אני מבקש מאנשים שיחשפו את השימוש העסקי שהם עושים במדע הרשתות, אז זה רק הוגן לדרוש דוגמא אישית. אם אני רוצה שאחרים יספרו, צריך לספר גם. אז דרך פרויקטים שעסקתי בהם בשנה האחרונה אנסה לא רק להדגים יישומים עסקיים של מדע הרשתות אלא גם איך התובנות שהזכרנו קודם באו לידי ביטוי.


אתחיל במה שנראה לי דוגמא קלאסית לצורך להבין שהבעיה שלנו היא בעצם רשתית והיא עלתה במספר פרויקטים שעשיתי בתחום המודיעין העסקי. במודיעין עסקי אנחנו אוספים מידע ומידע מגיע לא פעם בצורה של רשימות. לפעמים קצרות, לפעמים ארוכות, מפורטות יותר או פחות, אבל רשימות.

ורשימה זה הנמסיס של הרשת. רשימה זה אוסף שרירותי ואפור של מידע. גם אם נתעדף, נסנן, נפלטר ונמיין, עדיין, מה נקבל? אוסף שרירותי של מידע, רק ממויין. איפה ההקשר? איפה התמונה הרחבה?

החוכמה פה היא כמובן להפוך את אותן רשימות לרשתות וכך להבין טוב יותר את המודיעין שהתקבל. למה הכוונה?

מימין: ערוץ טלגרם (של פודקאסטים), משמאל: מבט רשתי על אותו ערוץ

במובן הכי פשוט, מבט רשתי על המידע שאספנו, כשהנקודות או המידע מחובר בקשרים, מאפשר לראות איזה קצה חוט מוביל לאן. אבל זה בנאלי. היתרון האמיתי הוא שמבט-על או מבט רחב על אותן רשתות, לשעבר רשימות, מאפשר לראות איך המידע שלנו בנוי, מה ומי מרכזי בו ולעזור גם לקבוע סדרי עדיפויות או במילים אחרות, מאיפה בכלל להתחיל ולהביא קצות חוט.

הבנייה של מידע כרשת היה גם אחד מהאתגרים של סטארט אפ בתחום האבחון הרפואי. במקרה זה, במקום להסתכל על סימפטומים כרשימת מכולת, הגענו לתובנה שמבט רשתי מאפשר לראות איזה סימפטומים למשל מצביעים על איזה קבוצה של מחלות. חלוקה של סימפטומים לקהילות למשל תוכל להראות לנו איזה סימפטומים מגשרים בין קהילות ויכולים לדרוש בדיקות מקיפות יותר.

לפעמים, הרשת כבר כמעט בנויה לנו כמו למשל בסטארט אפ שעסק בתחום הסייבר. הם ניסו לענות על אחד מהפערים המשמעותיים בתחום הזה והוא לדעת מה בין הסיכונים לבין הביזנס. הכל חשוב והכל מאוים. אבל מה חשוב ומה הכי חשוב? על מה להגן יותר ומה נמצא בסכנה ממה? כדי להבין ארגון או רשתות IT של ארגון, אני נשען כאן על חוק קונווי, הקרוי על שם מלווין קונווי, שעוד ב-1967 ניסח את האמירה הבאה: "כשארגון מאפיין מערכת, היא תשקף את מערכת התקשורת הארגונית שלו באותו הזמן." כך, ניתוח של רשת ה-IT מאפשר בכלל להבין את הביזנס עצמו, איך הוא בנוי, מה הוא באמת עושה ואיך הוא באמת עושה את זה. ואני די בטוח שהרוב יהיו מופתעים לפחות מחלק מהתובנות שהרשת שלהם תראה על עצמם.

ניתוח רשתי טוב יחשוף את האנומליות שבין התיאוריה לפרקטיקה ואלו נקודות העניין למחקר.

ההפתעה שלי הייתה ברשת הראשונה שניתחנו במסגרת מחקר הסייבר. פתחנו את הרשת ו... כמעט לא הצלחתי למצוא תובנות. חילקנו לקהילות, השתמשנו במדדי מרכזיות ו... לא היה לי סיפור לספר. הרשת הזו לא הייתה בדיוק הדאטה שציפינו לו, ידענו את זה מראש, אבל עדיין.. ואז אחד מהחבר'ה הציע לקפל את הרשת, מה שנקרא לעשות Projection, שזה מושג שדיברנו עליו בפרק אודות כנס הרשתות . אז רק בקצרה, מה זה אומר? יש רשתות שבנויות משני סוגי צמתים, למשל, איזה יוזר פונה לאיזה כתובת. היוזרים והכתובות עצמם לא מחוברים זה לזה. Projection, או קיפול הרשת, מאפשר להראות איזה כתובת קשורה לאיזה כתובת על סמך זה שאותו יוזר פנה לשתיהן. הצמתים של היוזרים עצמם נעלמים מהרשת ומשאירים מאחוריהם רק את תרומתם לקשרים בין הכתובות. בשיטה הזו ניתן לנתח באופן "נורמלי" את רשת היוזרים או את רשת הכתובות ואז... אז הרשת שרה...

אני עדיין לא סאקר של רשתות שמורכבות משני סוגי צמתים, מה שנקרא Bipartite Networks, אבל עכשיו אני גם לא שונא אותן. קיפול הרשת חיבר גם אותנו.


תובנות מרשתות על ארגון השתלבו בצורה הכי אינטואיטיבית בפרויקטים בהם עסקתי בתחום הייעוץ הארגוני, מן הסתם, וגם בתחום ה-B2B של Customer Success and service . מה שנקרא, המחוזות הקלאסיים של ה-ONA או ניתוח רשתות ארגוניות. במקרים האלה אפשר היה לזהות את המבנה הארגוני "האמיתי" דרך הרשת וזיהוי הגורמים המרכזיים שיכולים לשמש לשינוי ארגוני או הצלחת המוצר.


אבל רשת היא לא רק רשת. רשת - כמו שכבר אמרנו - היא קודם כל A state of mind. הייתי לא מזמן בביקור בחברה עם מוצר מרשים מאד בתחום הראייה הממוחשבת שמטרתו זיהוי של, נקרא לזה, תקלות.

אבל יש תקרת זכוכית לרמת הזיהוי מהרבה סיבות, ואחת מהסיבות היא עצם ההגדרה של התקלה. לפעמים אפילו מומחים אנושיים לא ידעו להגיד מה התקלה או אם יש כאן תקלה בכלל. אז מה הרשת מלמדת אותנו? שלא אלמן ישראל. תקלה לא נוצרת בואקום. תקלה היא תוצר של התפשטות תהליכים וגורמים. אמרנו התפשטות, אמרנו תהליכים וגורמים, בעצם - אמרנו רשת. מבט רשתי ורחב על המערכת שאנו סוקרים אולי לא יוכל להגיד לנו שבנקודה הספציפית הזו יש בוודאות תקלה, אבל הוא יוכל להגיד לנו שבמרחב מסוים יש הצטברות של "חשדות" ובמקרה הזה, מכיוון שמדובר בסוג של תקלות שמתפשטות, אפשר ממש לתת התרעות על אזורים "נגועים".

אפרופו הצלחות וכישלונות, בביקור ההוא בחברה הייתי נוכח בישיבה פנימית שעסקה בכישלון עסקי שהיה להם. השיחה הייתה פתוחה לגמרי כשכל היתרונות והחסרונות מונחים על השולחן. לא רק כי מובילי השיחה היו מנהלים ויועצים טובים אלא כי כולם הבינו שצריך להשתפר. המדד היה פשוט – כישלון משמעותו פחות כסף. חלק מהאנשים היו קולגות טובים שלי שהכרתי ממסגרת קודמת שכסף לא היה בראש מעייניה. וזה היה מדהים לראות איך השיח נראה אחרת לגמרי, אפקטיבי, כנה ובונה, כשמשהו חיצוני כמו צורך כלכלי בוחן אותך. בהקשר של הצלחות/כשלונות ומדע הרשתות, ברבאשי, חוקר הרשתות המפורסם, הוציא ב-2018 ספר, שאני מודה, הכותרת שלו נשמעת טיפה'לה שרלטנית, בשם: "הנוסחה: החוקים האוניברסליים להצלחה" ובו הוא מתאר איך הבנה של מדע הרשתות מאפשרת להבין הצלחה. אני מקווה שבפרק עתידי ניגע קצת בנושא, אם כי ממקום צנוע יותר. ואפרופו צניעות וכשלונות, אני רואה את הכישלון הגדול ביותר שלי בעת האחרונה בתחום הקורונה. במסגרת עבודה עם גופים ממשלתיים וגרורותיהם ניסיתי ללא הצלחה להתחיל תהליך של ניתוח רשתי לחקור שרשראות הדבקה וזה לא צלח. מאמצי השכנוע שלי נתקלו בחומה של התמכרות לעבודה הטורית שהיא אחת מההתמכרויות הקשות של ארגונים. וככל שהארגון גדול יותר, כך ההתמכרות קשה יותר ולצער כולנו, כך גם המשמעויות. לא הצלחתי להטמיע את המסר . והנה עוד סיבה לסדרה הזו של מדע הרשתות בתעשייה. סוג של "להעביר את זה הלאה" מה שנקרא Pass it forward: הפודקאסט, בעברית ובאנגלית, הרצאות שאני מעביר על הנושא ולאחרונה גם השתתפות בקמפיין לעדכון ערכי הויקיפדיה בתחום, זו הדרך הכי טובה שיכולתי לחשוב עליה להראות את היישומיות הגבוהה של התחום לארגונים וכך לנסות לשכנע. לא יודע אם הייתה פה הצלחה אבל העיסוק בזה מאד מספק.

אז בשורה התחתונה, מה אני מנסה להגיד? שניתוח רשתי היה פותר את הכל? שניתוח רשתי הוא תרופת פלא? מה אני, ברבאשי? אז תרופות פלא מזכיר לי את הסיפור הבא: אי שם בילדותי הסתובב אצלנו תקליט (תרתי משמע) שנקרא: You don't have to be jewish שהיה אוסף מערכונים יהודים-אמריקאיים משנות השישים. אחד מהמערכונים התחיל בלווייה כשבאמצע ההספד צועקת איזו סבתא מאחורה:

"Give him some chicken soup, give him some chicken soup!"

מנהל הטקס הסתובב לכיוונה של הגברת הקשישה ואמר בעגמומיות: "Madam, It wouldn't help"

אז היא עונה: "!It wouldn't hurt".

אז שווה לנסות. למה? כי רשת היא מידול של המציאות. זה עובדה. האם היא המידול הכי טוב של המציאות? לא יודע, אבל עד היום אני לפחות לא מצאתי משהו טוב יותר.

ומודה, כשאנחנו פותחים את הרשת ומנסים להבין אותה, לא תמיד נצליח. קרה גם לי.

לרוב, זה יקרה כי אנחנו חדשים בתחום. וכמו שאי אפשר להתחיל ריצה במרתון, כך גם ניתוח רשתי דורש תרגול ואימון של שרירי האנליזה שלנו. לפעמים אנחנו לא משתמשים באלגוריתמיקה הנכונה או משתמשים בה אבל לא יודעים להסביר אותה כמו שצריך (בנקודה האחרונה הזו נגענו בסוף הראיון).

אבל לפעמים, גם עם ניסיון, לא נצליח להבין מה קורה. וכאן אני חוזר לרשת כמודל של המציאות. המשמעות של זה יכולה להיות שמשהו בהבנה שלנו של המציאות לא טוב. לא פעם זה כי אולי חסר לנו דאטה משמעותי ולכן הייצוג של המציאות חלקי ודל ומקשה על הניתוח. ואולי אנחנו פשוט לא מבינים את המציאות טוב כמו שנדמה לנו. יש הפתעות בחיים.

דוגמא לזה אפשר לראות בתרגיל שהעברתי עם איילת ספירסטיין בקורס של ביג דאטה נייטס שעסק בתורת הגרפים ומדע הרשתות. הדאטאסט שהבאנו הוא רשת גדולה של דפים בפייסבוק, בעיקר דפי ממשל (או דפי GOV) מכל העולם, דפים של חברות גדולות ועוד. הרשת המקורית שניתחנו כללה כמה עשרות אלפי דפים. והחלק המפתיע היה שאחד מהגורמים המרכזיים ביותר באותה רשת הייתה שגרירות ישראל בגוואטמלה. WTF?! לא התעצלנו. בדקנו. אז הדאטה היה מ-2017 ובאותו זמן, גוואטמלה העבירה את השגרירות שלה לירושלים, והשגריר זכה בזמנו לשבחים מהממשלה בישראל על פעילותו הרבה בנושא. אין על רשתות.

יאללה, בירברנו מספיק. הגיע הזמן למנה העיקרית: ד"ר יניב אלטשולר, AKA אלטשולר AKA "ההוא מ-MIT", הוא זה שהכיר לי את עולם הרשתות וזה היה רק עניין של זמן עד שאמצא תירוץ לארח אותו בפודקאסט. כיום אלטשולר הוא מנכ"ל הסטארט אפ Endor שעוסק בחיזוי התנהגות צרכנית.

דיברנו על, ברור, מדע הרשתות, ואיך הוא עשה בתחום זה שימוש בפרויקטים השונים שעבד עליהם. אחד מהסיפורים המעניינים ביותר לדעתי זה הפרויקט שעבד עליו עם חברת eToro בתחילת דרכה. eToro היא חברה שמאפשרת סחר חברתי במניות וכיום שוויה מוערך בכ-10 מיליארד דולר. ניצלנו גם את הזמן לדבר גם קצת על Machine Learning, יתרונות וחסרונות, וגם על תחום נושק למדע הרשתות שנקרא פיזיקה חברתית או Social Physics, שעוסק במציאת חוקים אוניברסליים פיזיקליים בהתנהגות האנושית והזכרנו אותו קצרות בפרק מוקדם. אלטשולר עבד במעבדה של אחת מהפיגורות המרכזיות בתחום הפיזיקה החברתית הרי הוא אלכס "סנדי" פנטלנד. חוצמזה, דיברנו גם על השימוש שעשה במדע הרשתות לניתוח התעבורה בניו יורק וסינגפור וגם על יישומים נוספים של פיזיקה חברתית כמו למשל איך זיהוי התנהגות אנושית מאפשר לעשות גם את ההפך – לזהות גורמים ברשת שאינם אנושיים, למשל, בוטים, כי התנהגות אנושית טבעית קשה לחקות. אפשר לחקות טקסט שבן אדם כותב, אבל קשה לייצר רשת פיקטיבית שתיראה ותתנהג בטבעיות.

הנושא האחרון שדיברנו עליו היה נושא הקריפטו והבלוקצ'יין, שהוא נושא שאלטשולר אוהב במיוחד.

דיברנו על מקרה מ-2012 שבו 2 חוקרים ניתחו גניבה גדולה של ביטקוין מאחת מבורסות הקריפטו הגדולות. בעבודת נמלים, שכללה הרבה עבודה מעקב ידני, הם הצליחו להגיע למסקנה שהגניבה בוצעה ע"י קבוצה קטנה שהקימה מאות ארנקים פיקטיביים והזרימה את הביטקוין הגנוב דרכם כדי לטשטש את עקבותיהם. מה שאלטשולר הראה ב-2018 הוא שע"י יוריסטיקות סטטיסטיות, למשל, קורולציות בהתנהגות של ארנקים, ניתן להבנות את הדאטה כרשת וכך 80% מעבודת הנמלים נחסכת. על הרשת מחפשים את אותן אנומליות שלא תואמות התנהגות אנושית וכך מאתרים את הצמתים או הקלאסטרים החשודים. לפי אלטשולר, זה מה שהם עושים בחברה שלו, Endor. נהניתם, ורוצים לשתף? סבלתם ולא רוצים לסבול לבד?

שתפו ו/או כיתבו Review באתר הפודקסטים של ישראל ו/או כיתבו Review באפל-פודקסטס. עקבו אחרינו בטוויטר לכל מה שקשור במדע הרשתות או כנסו לאתר הפודקאסט בפייסבוק.

נתראה בפרק הבא של נטפריקס (:


#NetworkScience #SNA #SocialNetworkAnalysis #DataScience #Social_Physics #Cyber #Covid19 #Blockchain #Intelligence #Facebook #ONA #MIT #OrganizationNetworkAnalysis #Wikipedia

94 צפיות0 תגובות

פוסטים אחרונים

הצג הכול