(ר' קישורים בטקסט)
מה מתרחש (:
אני אסף שפירא וזה נטפריקס – הפודקאסט העברי הראשון למדע הרשתות.
עד היום הבאנו דוגמאות לשימוש במדע הרשתות ובניתוח רשתי בלא מעט תחומים: מחקר אינטרנט ורשתות חברתיות
מחקר התנהגות אנושית
בישול ועוד. אבל נושא אחד חשוב הזנחנו – החיים עצמם, או לפחות חלק מהותי בהם – זוגיות.
היום נציץ אל מאחורי הקלעים של אפליקציות הדייטינג ונראה איזה סודות ניתוח הרשת של עולמות אלו יחשוף לנו על מציאת זוגיות. מאחל לכולנו שליש גן עדן – swipe right ובואו נתחיל.
היו הרבה הרצאות מעניינות בכנס מחקר הרשתות שהתקיים ב-2021, שסקרנו בפרק 17 בפודקאסט, אבל אולי המרתקת ביותר הייתה זו של מארק ניומן, אליל מדע הרשתות ואליזבט ברוץ', שמגיעה מתחום מדעי החברה. השניים שיתפו פעולה לחקור את אחת מהרשתות המסקרנות ביותר שנוגעת בליבה של ההתנהגות האנושית – במילים אחרות – אפליקציית דייטינג.
האפליקציה כללה רשת מסרים של כ- 4 מיליון משתמשים פעילים מארה"ב, כלומר, מי שלח מסר למי, והחוקרים ניתחו רשת זו, באמצעות כלים מעולם מדע הרשתות. מטרתם היתה ולנסות לאשש או להפריך "תחושות בטן" שכנראה יש לרובנו על נושא שוק הדייטינג. (למאמר של ניומן וברוץ'). מעבר לסקרנות טבעית, הסוגייה הזו היא גם סופר רלוונטית:
לפי מחקר מסטנפורד מ-2019, כ-40% מהאוכלוסיה הבוגרת בארה"ב מוצאים זוגיות ברשת ולפי הערכה של האתר statista, נכון ל-2020, אפליקציות דייטינג כוללות כ-44 מיליון משתמשים.
אז מה היו שאלות המחקר של ברוץ' וניומן ואיך הם בדקו אותן?
פירוט מלא פירסמתי בזמנו בקבוצת הפייסבוק "עליית המכונות" של מתי מריאנסקי אז כאן אשתדל לטרחן פחות ורק אציג את שני הממצאים העיקריים שרלוונטיים לעולם הרשת:
הראשון, הוא איך בנויות הקהילות בעולם הדייטינג והשני, ואולי הכי מעניין – איך נראית ההיררכיה של עולם הדייטינג.
אז נתחיל עם הנושא של חלוקת הרשת לקהילות שאותו סקרנו בפרק 5 של נטפריקס.
באותו פרק תיארנו את תופעת הקהילות כחוק מס' 2 של הרשת – כלומר, כל רשת מתחלקת לקהילות.
נזכיר שלקהילות אין הגדרה מדעית, אך ההגדרה הרווחת היא שבקהילה הכוונה לצביר של צמתים שיש ביניהם יותר קשרים בתוכם מאשר מחוצה להם, או במילים פשוטות, קהילה היא אזור צפוף יותר ברשת.
באותו פרק גם סיפרנו שיש היגיון בצפיפות הזו שקראנו לו "הומופיליה", כלומר, אהבת הדומה.
פירושו שצמתים ייטו להיות בקשר עם צמתים שדומים להם ולכן לכל קהילה יש מכנה משותף כלשהו.
אז כשניומן וברוץ' בנו רשת מהמסרים שנשלחו בין המשתמשות והמשתמשים באפליקציה, הם כמובן מצאו בה קהילות. אולי זה לא מפתיע, אבל הדבר שאיפיין את אותם איזורים צפופים ברשת, כלומר הקהילות, היה הומופיליה גיאוגרפית.
הכוונה היא שמשתמשים נטו ליצור קשר יותר עם אנשים קרובים אליהם פיזית מאשר למשתמשים רחוקים. למרות שמדובר ברשת מקוונת/אונליין, בסוף הציפיה היא הרי לפגוש פיזית את האדם השני. אז הלקח הראשון הוא שאהבה מנצחת הכל, חוץ מנסיעות ארוכות. החלק המעניין בממצא היה שהנטייה הזו של "לחפש מתחת לפנס" לא חצתה את גבולות המדינה, כלומר ה-state בארה"ב. ראינו תופעה דומה גם בפרק על הקהילות בהקשר של פייסבוק. כך, כמות החברויות בפייסבוק נוטות לצנוח כשגבול המדינה נחצה, גם אם מדובר באיזורים סמוכים גיאוגרפית. מצד שני, יכול להיות שהסיפור פה הוא קצת שונה. אולי האפליקציה שנחקרה איפשרה למשתמשים לבחור מדינה כברירת מחדל לחיפוש פרטנרים ולכן הדאטה היה מוטה מראש לטובת קשרים פנים-מדינתיים. אין לי תשובה לזה, אבל החלק החשוב כאן הוא שהתופעה הזו לא ייחודית לרשת הדייטינג וגבולות נראים ולא נראים יכולים להגביל את הקהילות שלנו.
הנושא השני שהחוקרים בדקו ברשת הוא כאמור היררכיית הדייטינג:
השניים ניסו לבדוק מה זה אומר להיות מבוקש או מבוקשת וגם האם הקונספט של "out of your league" , כלומר, מישהי או מישהו שיהיו בלתי מושגים לנו, קיים בעולם הדייטינג ומקבל אישוש מהנתונים?
כדי לבדוק את רמת המבוקשות הכללית, מארק ניומן ניתח את רשת המסרים על ידי שימוש במדדי מרכזיות, שזה נושא שכיסינו בפרק 4 של נטפריקס. מדדי מרכזיות מספרים לנו מי הכי מרכזי ברשת וישנם עשרות אם לא מאות שיטות לעשות זאת.
השיטה הבסיסית ביותר, עליה דיברנו באותו פרק, היא מדד הדרגה או ה-Degree. במילים פשוטות - ככל שיש לצומת יותר קשרים, הוא יותר מרכזי. במקרה שלפנינו, הכוונה היא כמובן לכמות הקשרים הנכנסים של הצומת, כלומר, מדד ה-inDegree, שבמחקר זה, המדד ספר כמה מסרים נשלחו לכל משתמש או משתמשת. התמונה הלא מפתיעה שהתקבלה מניתוח זה היא שרשת המסרים התפלגה "זנב ארוך". התפלגות זו נקראת לעיתים גם התפלגותPower Law או "חוק החזקה", שאלה מושגים שהרחבנו עליהם בפרק 3 של נטפריקס.
המשמעות של אותה התפלגות היא שבכל רשת ניתקל רק בצמתים בודדים מרכזיים מאד, שייקראו "רכזות" או האבים, ואילו לשאר הצמתים ברשת יהיו מעט מאד קשרים והם יהוו את "הזנב הארוך" של ההתפלגות. וזה בדיוק מה שקרה גם ברשת המסרים של האפליקציה:
שני החוקרים מצאו שהשיא שייך לבחורה מניו יורק שבמהלך חודש אחד קיבלה 1,500(!) מסרים ממשתמשים שונים, ואילו רוב-רובם של המשתמשות והמשתמשים קיבלו רק מסרים בודדים, אם בכלל.
בנוסף, החוקרים ביקשו להבין איך המושג "out of your league" בא לידי ביטוי ברשת ולשם כך, הם השתמשו במדד מרכזיות שנקרא PageRank שגם אותו תיארנו בפרק 4 בנטפריקס. מדד זה יוצא מנקודת הנחה שמרכזיות לא באה רק לידי ביטוי במספר הקשרים שלנו אלא גם בסטטוס של הצמתים השכנים לנו – האם הצמתים המרכזיים ברשת פונים אלינו וכך הופכים אותנו למרכזיים בעצמנו?
בהקשר של המחקר, המשמעות היא שמבוקשות היא לא רק שהרבה פונים אלינו אלא גם שאנשים שהרבה פונים אליהם, כלומר, משתמשים ומשתמשות מבוקשים– פונים אלינו.
אז למי נשים וגברים פונים? איך "היררכיית המבוקשות" מיתרגמת ברשת? האם אנו נוטים לחפש את אלה שלכאורה אין לנו סיכוי להשיג או שאנחנו מכוונים את "השווים" לנו? והאם לנשים יש אסטרטגיה שונה מלגברים בהקשר הזה?
אז המחקר העלה ממצא מרתק: א.נשים באפליקציה נטו לרוב לפנות לכאלה ש"מדורגים.ות" בערך באותה רמה שלהם.ן, בעצם, המשמעות של זה היא שנראה שקיימת הפנמה של המעמדות בעולם הדייטינג אצל אותם משתמשים. אבל - באותה נשימה - יש גם טוויסט: גם נשים וגם גברים פנו גם לכאלה שמדורגים כ-25% מעליהם ברמת המבוקשות, או מה שנקרא, הן והם ניסו את מזלם וכיוונו מעט יותר גבוה ב"שרשרת המזון". וזה עבד?
אז במקרה כזה, לפי המחקר, הסיכוי של נשים לקבל תשובה חזרה למסר הוא גבוה יותר משל גברים, אבל סה"כ הסיכויים לקבל תשובה במקרה זה הם, לצערי, נמוכים. אבל בכל זאת אני מציע – לא לאבד תקווה - ודוגמא לכך היא הסיפור הבא.
אז אפרופו מרדפים חסרי סיכוי, ניהלתי כזה מרדף אחרי מורית צונג. מורית היא ה-CTO של אחד הסטארטאפים המסקרנים ביותר כיום שנקרא "אלי הבוטית". הסטארטאפ, שהוקם על ידי אליאנה ברבל (barbel), הוא למעשה אפליקציית דייטינג עם טוויסט מעניין שמפריד אותה מהאפליקציות המוכרות והמפורסמות שרצות היום בשוק.
הרעיון מאחורי הסטארטאפ נשמע מעניין, אבל זה פוטנציאל השימוש שלו בניתוח רשתות שגרם לי לרדוף במעלה שרשרת המזון עד שהשגתי את הראיון עם מורית, שנזכיר, היא לא רק יושבת כמו דרקון על אוצר הדאטה הזה אלא גם אחראית על הניתוח הרשתי שלו והיישומים הנובעים מכך. אחד הדברים ששיחקו לטובתי כאן הוא שמורית היא מאזינה של הפודקאסט וכפי שהיא מעידה על עצמה- "סאקרית של רשתות".
אז על מה דיברנו?
מורית ציינה שחידת הגשרים של קניגסברג (עליה יש פרק קצר בנטפריקס)היא זו שהביאה אותה לעולם הרשתות.
היא סיפרה שהייחוד של האפליקציה הוא שהשידוכים נעשים על סמך אנשי הקשר שהמשתמשים מעלים. כך נוצרת רשת קשרים שמאפשרת לאתר בן/בת זוג פוטנציאלי דרך חברות וחברים, בסביבה נעימה ומוגנת יותר.
סה"כ הרשת מכילה כ-400 אלף אנשי קשר. כ-75% מתוכם עם דרגה 1 וכ-90 אלף עם דרגה 2 ומעלה (כלומר, קיבלו הפנייה מיותר מאדם אחד).
הרשת בנויה כמובן מרכיבי קשירות, כלומר, איים ברשת, שמחוברים רק לעצמם, ובפרק 2 של הפודקאסט דיברנו על כך שכל רשת מורכבת מרכיב קשירות מרכזי אחד גדול והרבה איים קטנים שלא מחוברים לכלום. במקרה זה, רכיב הקשירות מכיל כמעט 100% מהצמתים ברשת.
לא במפתיע, הקשרים של המשתמשים מתפלגים זנב ארוך, מה שקראנו לו בפרק 3 של נטפריקס, "חוק החזקה" או ה-Power Law. כלומר, יש מעט משתמשים עם הרבה קשרים והרוב עם מעט מאד.
אולי במפתיע, לא נמצא הבדל בכמות אנשי הקשר שמעלים גברים או נשים. מבחינה זו, האסטרטגיות של המינים דומות.
האפליקציה התרחבה לכלול גם להט"ב, לאחר שנצברו מספיק אנשי קשר.
דיברנו על האתגרים שקיימים ברשת דו צדדית או Bipartite : הכוונה ברשת דו צדדית היא רשת שבה יש שני סוגים של צמתים, נגיד צומת מסוג זכר וצומת מסוג נקבה. הרבה פעמים מוצאים כאלה רשתות במערכות המלצה, כלומר צרכן, שהוא צומת מסוג A, קשור למוצר שהוא צומת מסוג B. ברשתות כאלו הצמתים יכולים להיות קשורים רק לצמתים מסוג אחר, נגיד צרכן למוצר או נקבה לזכר, במקרה שלנו, ולא קשורים לסוג שלהם. הבעיה ברשתות כאלו היא שהן מקשות על הסקת מסקנות עם מפעילים עליהן את האלגוריתמיקה הסטנדרטית של עולם הרשת, מהסוג שדיברנו עליו בפרקים 4 ו-5 בנטפריקס, נגיד, מדדי מרכזיות או חלוקה לקהילות. הסיבה היא שהדו-צדדיות הזאת מגבילה את הקשרים ברשת ולכן האלגוריתמיקה מקבלת משמעות אחרת, לרוב שונה מזו שהתכוונו אליה. במקרה זה, הרשת הדו צדדית באה לידי ביטוי בשני סוגי הצמתים הבאים: משתמשים ואנשי קשר (שאינם משתמשים בעצמם). כדי להתמודד עם רשת כזו נעשה קיפול הרשת, או באנגלית Projection, שזה נושא שנגענו בו בעבר בהקשר של רשת דו צדדית.
כדי לחלק את הרשת לקהילות, מורית משתמשת במספר אלגוריתמים : ליידן (שהוא שיפור של הלובאין) לובאין ושיטת ה-Label Propagation (שהיא שיטה שניתן להשתמש בה גם לצרכי חלוקה לקהילות והרעיון שמאחוריה הוא לעשות שימוש בשכנים של הצומת כדי לשייך אותו לקהילה, או פשוט – אמור לי מי חבריך ואומר לך מי אתה. אם כל הקשרים של צומת מסויים הם לקהילה X, אז גם הצומת הזה שייך לקהילה X). החלק המעניין בכל האלגוריתמים האלה הוא שאם מתחילים אותם מצומת רנדומלי, אז לרוב נקבל תוצאות שונות. במקרה זה, מטרת השוני היא להבין את ההקשרים השונים של הקהילות השונות (ולא פעם - חופפות) בין המשתמשים. באמצעות השימוש בקהילות, האפליקציה מאפשרת למצוא התאמות למשתמשים מאותה קהילה.
ההומופיליה שמאפיינת את הקהילות (כלומר, המכנה המשותף של הקהילות) ברשת זו הוא גיאוגרפי, שזה סוג ההומופיליה הנפוצה ברשתות.
עד כה, התייחסנו לטופולוגיה של הרשת (המבנה הסטאטי). בדומה למשל לרשת כבישים. זו רשת יחסית קבועה ולא משתנה וזה למשל מזכיר את רשת אנשי הקשר. אבל על אותו מבנה רשת, יש גם זרימה דינאמית, כלומר, אנשים שיוזמים או יוצרים קשר עם התאמות פוטנציאליות. כדי להתמודד עם התפלגות "הזנב הארוך" ברשת דינאמית זו, האפליקציה מגבילה את מספר ההתאמות שכל אחת ואחד מקבלים.
מורית היא מאזינה ותיקה. יש עוד. הכירו אותם בפינתנו – ביקורות מרחבי המרשתת: איתי גפני כתב פוסט ארוך בלינקדאין אז אסכם:
קפץ לי הפרק של נטפריקס על ניתוח נתונים וכדורגל. אחרי שנה+ של התמכרות, החלטתי לעשות את הצעד ולפנות לאסף שפירא להרצאה.
אני רוצה להודות לו על הרצאה יוצאת דופן ששינתה לכולם את דרך החשיבה בתפקיד,
מה הטיפ שלי? רוצו לשמוע NETfrix ובשונה ממני, מומלץ להתחיל דווקא מהפרק הראשון.
תודה איתי, הייתה הרצאה כיפית עם הזדמנות לדבר על נושאים שפחות יוצא לי להתייחס אליהם בפודקאסט.
דניר כתבה בטוויטר ביקורת אבל היא כל כך מפרגנת, שאני נבוך מדי להקריא אז תודה על ההסמקה.
ואריאל סיכם בטוויטר:
נטפריקס מעלף ומאלף.
תודה אריאל!
אם גם אתן רוצות ורוצים להפיץ את בשורת מדע הרשתות, ספרו לחברות וחברים על נטפריקס.
אפילו יותר טוב – תעלו פוסט, רצוי גם לתייג, ואני אביא אותן כאן.
ואם יש לכן או לכם שאלות או תהיות, כתבו לי! מוזמנות ומוזמנים לפנות במייל. נתראה בפרק הבא של נטפריקס.
#פודקאסט #מדע #נטפריקס #דייטינג #זוגיות #מדע_הרשתות #ניתוח_רשתות_חברתיות #תורת_הגרפים #מדע_הנתונים #אלי_הבוטית
#Podcast #NETfrix #Dating #NetworkScience #SNA #SocialNetworkAnalysis #GraphTheory #DataScience #CommunityDetection #Clustering
Коментарі