חיפוש
  • אסף שפירא

הרחבות לפרק 11: הפרויקט הגדול של נטפריקס

(ר' קישורים בטקסט)

מה מתרחש, אני אסף שפירא וזה נטפריקס (:

הרבה מאזינים מדומיינים פנו אלי אחרי ששמעו את פרק "עולם קטן" והפרק של המרמיטה ושאלו אותי בכאילו: "מה יש לך נגד מילגרם, החוקר החברתי המפורסם משנות ה60? למה כל הזמן הפודקסט הופך את מסקנות המחקר שלו?" אז זו שאלה מצוינת. שמתקשרת לפרויקט מעניין שאני מקווה שכולנו ניקח בו חלק בקרוב ונפרט עליו בהמשך, אבל בינתיים, למאזינים האמיתיים, רק נזכיר בקצרה את הניסויים של מילגרם שרלוונטים לעולם הרשת, ונספר על ניסוי נוסף שלו שלא איזכרנו אותו עדיין, אבל קשור לנושא של פרק 6 כלומר, בתחום ההשפעה: ניסוי ששת-הצעדים של מילגרם הוא ניסוי הרשת המפורסם ביותר שלו ובו הוא ניסה לבחון מה אורך שרשראות הקשרים של החברה האנושית. הוא בדק זאת ע"י בקשה מהנסיינים לשלוח מכתב שרשרת ליעד שנקבע מראש רנדומלית, כשלאנשים בשרשרת מותר להעביר את המכתב רק לאיש שהם מכירים וחושבים שיש לו סיכוי להכיר את היעד. דיברנו על כך שהניסוי הראה שאורך השרשרת הממוצעת היה כמעט 6 צעדים, מה שביסס את הרעיון בתרבות הפופולרית שכולנו נמצאים במרחק של עד 6 צעדים זה מזה. הראינו בפרק שזה אולי נשמע נהדר, אבל הנתונים של מילגרם מצביעים דווקא על הקושי בלייצר שרשראות קצרות כאלה ובפרק הסברנו למה.

ניסוי אחר שדיברנו עליו בפרק 9 בנושא רשתות דינאמיות וכאוס, הוא הניסוי שבו מילגרם רצה להראות שאנו מכירים את השיגרה של סביבתנו ע"י זיהוי "זר מוכר", כלומר, מישהו שאנחנו מעולם לא דיברנו אותו, אבל אנחנו מכירים אותו בפנים משהיות משותפות, למשל, מלחכות ביחד לרכבת באותה תחנה. גם במקרה הזה, הראינו שדווקא הנתונים של מילגרם מראים כמה מעט זרים מוכרים לנו, ושהדבר נובע מהכאוטיות של רשת המפגשים שלנו.

והניסוי שלא דיברנו עליו, ועוסק בהשפעה, הוא ניסוי מפורסם שאני מניח שהרוב מכירים, פשוט לא ידעו שהוא של מילגרם. אבל של מי עוד הוא יכול להיות?

בניסוי הזה, מילגרם העמיד אנשים שתולים ברחוב, שלפי סימן, עצרו ובהו ביחד בקומה שישית של בנין, ללא סיבה נראית לעין. במהלך הניסוי, העמיד מילגרם כמויות משתנות של שתולים, כשהשיא היה 15 שתולים שעמדו באותו מיקום ובהו באותה נקודה. על המדרכה ליד השתולים עברו כ-1400 עוברים ושבים, והניסוי הראה שככל שנעמדו יותר שתולים לצפות בבניין, כך גדלה כמות העוברים ושבים שהצטרפו לצפייה.

בשיא הניסוי, 40% מהקהל נעמד עם השתולים ו-87% מהקהל צפה למעלה, כלומר, הרוב לא עצר אלא רק הסתכל והמשיך ללכת. מילגרם הראה שבהינתן מאסה קריטית, הרוב ייטה לחקות את אותה מאסה, אבל לא בהכרח חיקוי מלא, או בניסוח פייסבוקי, זה אומר שהרוב יעשו לייק, ולא בהכרח יגיבו או ישתפו.


אז אחרי כל ההקדמה הזו, אני רוצה להתנצל בפני מילגרם בפרט ובפני קהילת הרשת בכלל. אני סאקר של מילגרם. צריך מוח מעוות באמת בשביל לחשוב על הניסויים האלו.

וכדי להוכיח שזה באמת לא אישי, אז נרים למילגרם ע"י שיחזור הניסוי שלו: ניסוי "העולם הקטן"!

רק שהפעם, היעד של השרשראות שלנו לא יהיה רנדומלי.

למעשה, יש ליעד שלנו קשר מיוחד לעולם הרשתות.

אז בואו נבחן את עצמנו: האם נגיע ליעד ונגלה את הקשר? והאם נוכל לעשות זאת בשרשרת קצרה ככל הניתן, ואולי אפילו נשבור את השיא של מילגרם?


אז איך נעשה את זה ומה הפרס למצליחים:

בדף הפייסבוק של נטפריקס מופיעה תמונה עם פרטי רקע של היעד. מי שמכיר אותה מוזמן לתייג אותה, אבל מי שלא, מוזמן לתייג את כל מי שהוא חושב שיש לו סיכוי להכיר אותה או לפחות לקדם את שרשרת התיוגים לכיוונה, כסוג של צ'לנג'. התבקשתי מצער בעלי חיים להפסיק לחלק עז עם פעמון כפרס ולכן יהיה פרס אלטרנטיבי:

כל מי שהשתתף בשרשרת מוצלחת, יוכל לבחור נושא עליו נדון בפודקסט, כולל הקדשה, אבל בלי ד"שים.



אז אפרופו שרשראות, במהלך כל הקורונה הזו ניסיתי לקחת חלק בחקירות האפידימיולוגיות בשביל לבצע מחקרי רשת על שרשראות ההדבקה, ודיברתי עם מלאנ'תאלפים אנשים. ואז זה קרה. יום שישי קיבלתי סמס ממשרד הבריאות שהפכתי מחוקר לסובייקט, כלומר, קיבלתי סמס שבאתי במגע עם חולה קורונה. ברגע הראשון חשבתי לעצמי: "זהו. אני החלל האחרון במלחמה הזו..." ואז נזכרתי – רגע, לא באתי במגע עם חולה קורונה.


התקשרתי למוקד ואמרתי שאני אזרח שומר חוק ולכן אכנס לבידוד אבל זה הזוי. אז אמרו לי שאפשר לערער אבל צריך למלא טופס בידוד. אמרתי לעצמי זורם.

מילאתי את הטופס להנאתי ונתקעתי בשדה חובה והוא הסיבה לכניסה לבידוד.

גיליתי שיש רק אופציה אחת: "מגע מאומת עם חולה קורונה".


הדו"ח שתקע אותי

לא התעצלתי, התקשרתי ואמרתי שמדובר ב"שקר-קרקר", כלומר, לא קרה, ולכן גם לא מוכן למלא את הסעיף הזה. הסבירו לי שזו חובה, ובשדה ההערות אפשר לרשום את הערעור על כך.

זה קצת הפריע לי. הסברתי שזה כמו לסמן בטופס בכניסה למשפט שאתה אשם, ובהערות לרשום למה לא. הטיעון הזה עזר לי כמו שעזר לאזרח ק'.

מילאתי ועירערתי. אמרו שיחזרו אלי תוך 2 ימי עסקים. מזכיר שמדובר ביום שישי. במהלך סוף השבוע הצלחתי לעבור את כל חמשת שלבי האבל, שבאופן קצת אירוני, השלב הראשון הוא הכחשה ובידוד. כמעט הגעתי לשלב הקבלה וההשלמה אבל - לא התעצלתי. ביום ראשון דיברתי עם המוקד. מסתבר שצריך לערער לרמה ממונה. עוד ערעור. אמרתי, סבבה. מערער.

לא התעצלתי. יום שני התקשרתי למוקד ערעורים. מסתבר שלא מופיע אצלהם. כי אמרתי שצריך לערער לרמה ממונה.

הם לא רמה ממונה. אז הערעור לא הגיע לאף אחד. אמרו שיעבירו לרמה ממונה. כמה זמן ייקח? 4 ימי עסקים.

מזכיר - העסקים סגורים.

עוד כמה שיחות והופה: התקשרה אלי גברת ערעור. וביקשה ממני את כל הפרטים. אמרתי: רגע, אתם אמורים לדעת את הפרטים, לא? הרי אתם טוענים שנפגשתי עם חולה קורונה. לא אני.

אז בניסיון אחרון, שאלה אותי המוכסת האם אני מכיר מישהו חולה קורונה. אמרתי - כן, השכן שלי. היא היתה מאושרת: "או, אז נפגשת איתו?" אמרתי "לא. כי הוא חולה קורונה"

"אבל הוא שכן שלך," היא אמרה "שמרתם שני מטר?" "בוודאי," עניתי "אפילו אנכית. הוא כמה קומות מעלי".

אז אתה מכיר מישהו אחר שחולה קורונה? אמרתי שלא. אז היא פישפשה קצת בניירות וענתה: "אתה אדם ישר, והכל מוקלט, אז אנחנו משחררים אותך." וזהו.


מה אנחנו לומדים מהסיפור?


לכאורה, אנחנו לומדים שאם הדאטה דפוק, כלומר, השדה המובנה בטופס הבידוד לא מייצג את מגוון האפשרויות, לא נקבל ייצוג אמין של שרשראות ההדבקה ונכניס הרבה זבל למערכת.

למה לכאורה? כי החשש הזה הוא חשש שנובע מחשיבה טורית, עליה הרחבנו בפרק 8 בנושא המודיעין. חשיבה טורית פוחדת מאד מזיבול של דאטה כי זה פוגע ביעילות שלה, וכנראה זו הסיבה שלקח מספר ימים עד שקיבלתי שחרור. חשיבה טורית אוהבת שהכל נקי, מסודר ומתועדף.

אבל כל מי שהיה בדירה שלי יודע שהחיים הם לא כאלה. אנשים שחושבים רשתית לא פוחדים מזיבול בדאטה. הם מקבלים זיבול בדאטה כמובן מאליו. הדרך שלהם להתמודד עם זה היא להישען על חוק מס' 1 של הרשת. נכון, ה-power law. חברינו מפרק 3.

למה? כי במציאות, כמו שמלמד אותנו ה-power law, רוב הדאטה שלנו הוא זבל או סתם לא מעניין, שוב, כמו בחיים, וניתן דוגמא. אז זוכרים את התקופה ההיא שהיינו כולנו בסגר בקורונה וחיפשנו לראות משהו בטלויזיה?

כמה מהתוכניות שהציעו לנו באמת רצינו לראות? אחוז? שניים? זהPower law קלאסי. שאר לוח המשדרים זה זנב ארוך שמורכב מתוכניות בוקר ושידורים חוזרים.

אז איך חשיבה רשתית וניתוח רשתי עוזרים לנו במקרה של ההדבקות?

אז דבר ראשון, נחלק את רשת ההדבקה שלנו לקהילות, כמו שלמדנו בפרק 5, ונסתכל על מרכזי הכובד בקהילות המרכזיות, כמו שלמדנו בפרק 4. ולא נשכח כמובן גם את חוק מס' 1 שדיברנו עליו ארוכות בפרק 3, שמסביר למה יהיו לנו מעט מאד מרכזי כובד כאלה.

אז למשל, אם אנחנו מבינים שהמובילים בקהילה, הם נגיד false positive, כלומר, זיהוי שגוי של חולי קורונה, אנחנו יכולים להניח באופן די אמין שהקהילה מורכבת מזיהויים שגויים – ולשחרר אותם.


הזכרתי מקודם שידורים חוזרים של סדרות טלויזיה, אז אני מעוניין להודות למתן רובין, לוחם דאטה רב ניסיון, שהפנה אותי למאמר חשוב מאד בנושא והוא מאמר של חוקרת מדעי מחשב מ-2019 על ענין שמעסיק מומחים בתחום עוד משנות התשעים: האם ג'ואי הוא דמות מרכזית יותר בסדרה "חברים" מצ'נדלר? והאם מוניקה היא זו ש"מחזיקה את החבורה יחד" כפי שנטען בפרק 3 עונה 9?

אז קצת רקע, לפני שנצלול בקצרה: הסדרה "חברים" רצה מ1994 עד 2004 וכללה 6 דמויות ראשיות: Rachel Green (Jennifer Aniston), Monica Geller (Courteney Cox), Phoebe Buffay (Lisa Kudrow), Joey Tribbiani (Matt LeBlanc), Chandler Bing (Matthew Perry), and Ross Geller (David Schwimmer)

החוקרת תיעדה את הקשרים בכל 236 הפרקים של הסדרה, כשקשר הוא כל אינטראקציה בין הדמויות, כולל קריצות, מבטים וכדומה, וקיבלה רשת או גרף של כ-750 צמתים ויותר מ-16 אלף קשתות.



מה שהחוקרת גילתה, חוץ מאת הנטיה שלה לאובססיה וגרפומניה, הוא שברוב הפרקים, השישייה יוצרת קליקה, כלומר, רשת שבה כל הצמתים קשורים לכולם. יש רק דמות אחת או שתיים בכל עונה, מחוץ לשישייה, שמצליחה לקחת חלק בקליקה.

בהתחשב שהגרף מכיל כ-750 צמתים או דמויות, המסקנה היא שהחבורה היא די סגורה וכמו שנטען במאמרים בנושא (כן, היו עוד מאמרים בנושא), החבורה מייצגת מעין משפחה חלופית.


הקוטר של אותה רשת הוא 5 צעדים, כמו אצל מילגרם, כלומר, ניתן להגיע מדמות לדמות תוך 5 צעדים. מה שמראה לנו שכמו אצל מילגרם, גם לסדרה אין בהכרח אחיזה במציאות.

נעבור למדדי המרכזיות של הדמויות, ונתחיל כמובן בדרגה. נזכיר שדרגה או Degree, זה מדד המרכזיות הבסיסי ביותר שמודד לכמה צמתים קשורה הצומת שלנו או, במקרה שלפנינו, עם כמה דמויות היתה לדמות שלנו אינטארקציה. יש כאן בעיה להשוות את הדרגה של הדמויות, כי ישנם פרקים בהם כמות הצמתים נמוכה יותר, כלומר, יש פחות דמויות, אבל זה אולי דווקא מגביר את החשיבות של אותם קשרים בודדים ולכן נרצה למשקל אותם בהתאם. לכן, כדי לא להפלות, החוקרת נירמלה את הדרגה. כדי לנרמל דרגה ולהפוך אותה לברת השוואה בין גרפים או רשתות שונות, נחלק את מספר הדרגה ב-1-N כלומר, במספר הצמתים ברשת פחות אחד (הצומת עצמו). מה שמעניין הוא זה שבסיכום כלל העונות, הדרגה של כל הדמויות הראשיות היא די שווה, כשלמוניקה יש יתרון קטן על האחרים, ויהיו כאלה שיגידו שזה לא הוגן, כי היא זו שתמיד מארחת את ארוחת ה-thanksgiving המשותפת. הקונספט של סדרה עם כמה דמויות ראשיות שוות, תרתי משמע, היה קונספט פורץ דרך בשנות התשעים. לפי מדד הדרגה השיוויוני, אנחנו יכולים לראות שהפורמט הזה הנחה את התסריטאים. לעומת זאת, אם מסתכלים על מדד המרכזיות betweenness נקבל תמונה שונה. betweenness, רק נזכיר, זה המדד שקובע כמה הצומת שלנו מגשרת בין צמתים אחרים ברשת. במדד הזה המוביל הוא ג'ואי, שמכניס קצת מהעולם מבחוץ לתוך החבורה. מוניקה, שמובילה בדרגה, דווקא מאבדת את ה-betweenness שלה לאורך העונות, עד לרגע שהיא מתחתנת עם צ'נדלר וזוכה לקפיצה משמעותית במדד. צ'נדלר לעומתה, חווה באותה עונה את ה-betweenness הנמוך ביותר שלו בסדרה או אם לנסח במילים אחרות: "Monica stole his thunder". בנושא חלוקת הרשת לקהילות, המאמר מדגים מספר אלגוריתמים שונים, מהסוגים שדיברנו עליהם בפרק 5, כשכל אחד מהם מביא תוצאות קצת שונות, אבל לא במפתיע, ומודה שאני משוחד, אלגוריתם לובאין הביא לדברי החוקרת את התוצאות הטובות והמהירות ביותר.


אז עכשיו אחרי שזרקנו משהו בשביל הסאחים, בואו נדבר שניה על מקומו של מדע הרשתות בעולם, על הפודקסט וגם עליכם.

ככל שאני מסתובב יותר בעולם התעשיה, האקדמיה והמחלות המדבקות, אני מגלה כמה חסרה המודעות לעולם הרשת.

חוויתי תחושה דומה גם בעולם הפודקסטים: כשמעלים פודקסט לרשת, צריך לבחור קטגוריה כדי לשייך אותו אליה, והופתעתי לגלות שאין קטגוריה שנקראת מדע הרשתות, ולא סתם. מדע הרשתות שואב ממתמטיקה/סטטיסטיקה, פיזיקה, מדע הנתונים, מדעי המחשב, מדעי החברה ועוד, וכפי שהראינו, הוא רלוונטי לעוד המון תחומים נוספים כמו למשל, ביולוגיה, גיימינג, פרסום, מודיעין, ספורט וכו' וכו'. נראה שקשה לאנשים לעכל משהו כל כך מולטי דיסיפלינארי. אז כמו במקרה של הרשתות, גם בפודקסט הזה יש ניסיון לתפוס מרובה, אבל האם הוא תופס? אשמח לשמוע על זה מכם. מוזמנים לכתוב את הביקורת שלכם בלינקים שמופיעים באתר SNApod.net או לשלוח לי הודעה דרך האתר או הדף שלנו בפייסבוק. חייב להגיד שמאד נהניתי מההתכתבויות שהיו לי עם המאזינים (אפילו מחו"ל) ולמדתי מהם הרבה. המון תודה!

שמתי לב שלא מעט מהפונים הם אנליסטים אבל לא רק, וזה מתחבר לשאלה הבאה שלי:

כבר זמן רב אני מבשל על אש קטנה פרק בנושא best practice לחוקר הרשת. הפרק הוא ברמת מורכבות מעט גבוהה יותר משאר הפרקים ואני תוהה ביני לבינכם האם להעלות אותו, ולהבריח את האנשים שכבר עכשיו טוענים שבגללי הם היו צריכים לשמוע חלק מהפרקים פעמיים כי הם היו מורכבים מאד.

אנצל גם את ההזדמנות הזו להזמין אנשי אקדמיה, תעשיה ואנליסטים או חוקרים בכלל, להעלות נושאים לפודקסט וגם לבוא להתראיין ולספר את הסיפור המעניין שלהם על המחקר הרשתי שעשו. אציין שאני מאד מעוניין לעשות פרק על רשתות נוירונים במוח, נושא מרתק בעיניי, ואשמח לפידבקים ולידים מכם.


ואחרונים חביבים, אני רוצה להודות לאלמוני שהכניס את נטפריקס כמקור לויקיפדיה. יצאת צדיק, ולהודות גם למאזינינו בתפוצות: בארה"ב, בריטניה, רוסיה וגם למאזין הבודד מאנדורה, שאחד מהשניים: או שנשבר אחרי פרק 3 או שעשה עלייה. צור קשר, אל תהיה זר מוכר.


אז אפסיק לבזבז לכם את הזמן – לכו תתחילו לייצר שרשראות תיוג ליעד המסתורית שלנו, גלו את הקשר המיוחד שלה לעולם הרשתות ותזכו בפודקסט!




נתראה בפרק הבא של נטפריקס.

18 צפיות

©2019 by SNAPOD. Proudly created with Wix.com

This site was designed with the
.com
website builder. Create your website today.
Start Now