• אסף שפירא

הרחבות לפרק 9: מרמיטה, רשתות דינאמיות והגביע הקדוש של עולם הנתונים (וקצת קורונה)

עודכן ב: 6 בדצמ׳ 2021

(ר' קישורים בטקסט)

מה מתרחש, אני אסף שפירא וזה נטפריקס

עד היום, רוב התכנים עליהם דיברנו עסקו ברשתות סטאטיות, כלומר, הסתכלנו על רשת בחלון זמן נתון, מה שנקרא snapshot של הרשת. אבל ברור לכולנו שרשתות הן ברובן המכריע – דינאמיות. אז למה אנחנו מתעסקים ברשתות סטאטיות, אם הן דינאמיות? שאלה מצוינת. במיוחד שאם חושבים על זה, הפוטנציאל מאחורי פיצוח הדינאמיות ברשת הוא אדיר ומהווה אולי את "הגביע הקדוש" של עולם ה-data science. למה הכוונה?

כשאנחנו מדמיינים עולם מוכוון דאטה, אנו מצפים שהדאטה יוכל לחשוף לנו את הדפוסים שמרכיבים את עולמנו כאמצעי להבנה טובה יותר של העולם ולחיזוי העתיד. ואם נוכל לזהות את הדפוסים נוכל הרי לזהות גם חריגה מהדפוסים וכך לחזות שינויים.

פתרון של רשת דינאמית הוא למעשה פתרון של העולם, היקום וכל השאר.

למה?

כבר אמרנו בעבר שעולמנו הוא עולם רשתי והרבה מהדאטה שלנו הוא רשת או שניתן להבנות אותו כרשת. הרשת מייצרת לנו מפה של המציאות וכמו שהמציאות היא דינאמית, כך גם הרשת. מכיוון שלרשת יש חוקים, פיצוח החוקים יאפשר לנו את פיצוח המפה כלומר נוכל לפצח את המציאות.

בעולמנו שטוף הקורונה, פיצוח דינאמיות הרשת יכול להראות לנו איך המגפה תופץ וכך להדביר אותה מוקדם יותר, ובחלק האחרון של הפרק נרחיב בנושא.

בעולם הפרסום, נוכל לעקוב אחר הרשתות החברתיות ולזהות את הטרנד הבא.

בעולם הסייבר למשל, פיצוח שינויים ברשת הדינאמית יכול לעזור לנו לזהות כל איום על הרשת.

בעולם הנוירולוגיה, אם נזהה את הדפוסים ברשת הנוירונים של המוח, זה יאפשר לנו לא רק לזהות מחלות אלא גם "לקרוא" את המוח. תחשבו על זה, תרתי משמע (: , אם נוכל לאתר את הדפוס של המחשבות שלנו, קריאת הרשת תאפשר קריאת מחשבות.

אם נבנה את עולם המניות כרשת, וכבר היו מחקרים שעשו זאת, ונפצח את החוקים הדינאמיים שלה, אז השמיים הם הגבול.


לא פלא שמחקר הרשתות הדינאמיות הוא נושא חם. אז למה התעסקנו בכלל ברשתות סטאטיות?

שוב, שאלה מצוינת, אבל חייב פה מילת אזהרה:

למי שלא שמע את הפרקים 2 עד 5, אני ממליץ בחום לחזור אליהם. בכלל, אני ממליץ גם לבוא לפרק הזה בראש פתוח. לא פעם הזהרתי שרשתות הן לא אינטואיטיביות. אז הפרק הזה ייקח אותנו לאקסטרים. אני יכול לספר מניסיון אישי שכל אינטואיציה שהייתה לי על הרשת (ומכאן על העולם) היתה שגויה, עד שהבנתי כמה אני לא מבין.

אני לא חושב שההסברים פה יהיו מורכבים, אני חושב פשוט שהם יאתגרו המון דברים שאנחנו לוקחים כמובן מאליו. . אז למי שהמשיך, כבוד. טוב, אז כדי לענות על השאלה המצוינת ששאלנו קודם, צריך להתחיל בלהגדיר שניה מה זה רשת דינאמית.

מה שהופך את הרשת לדינאמית הוא כמובן מימד הזמן שיכול לבוא לידי ביטוי בצמתים חדשים שמופיעים או נעלמים ברשת, קשתות חדשות שנוצרות או ישנות שנעלמות וכמובן שגם המשקלים של הקשתות יכולים להשתנות לאורך זמן.

שינויים אלו ברכיבי היסוד מהם בנויה הרשת משנים כמובן את הרשת כולה: היווצרות של צמתים חדשים יכולה להוליד קהילות חדשות והיעלמות של קשתות יכולה לפרק קהילות קיימות. כך הרשת כולה יכולה להתרחב או להצטופף לאורך זמן. הזכרנו כבר בפרק 2 את השינויים בטופולוגיית הרשת כשדיברנו למשל על תופעת ה"עולם הקטן" שמתארת איך ככל שנוספים קשרים ברשת, הקוטר שלה קטן.

זמן הוא מימד שלא הרחבנו עליו קודם אז נעצור שניה ונפריד בין שני מושגים של זמן ברשת:

המושג הראשון הוא הזמן כעוד תכונה או לייבל של קשת או צומת. כלומר, עוד מטא דאטה שיש לנו לגבי הרכיב ברשת.

בתכונה זו אנו עושים שימוש כל הזמן בניתוח רשתות, לדוגמא, כשאנחנו מנתחים את רשת החשמל של ישראל ב-2020 אנחנו מגבילים את עצמנו רק לצמתים וקשתות שיש להם לייבל של זמן ב-2020. כלומר, תכונת הזמן של הקשתות והצמתים משמשת אותנו לתיחום הרשת כשאנחנו בוחרים דאטהסט ולרוב, מחקרי רשת נעשים על רשת סטאטית בתקופת זמן מוגדרת (חלון זמן או "snapshot").

בנוסף, אנחנו יכולים לעשות שימוש בתכונת הזמן בשביל להבנות את הדאטהסט שלנו כרשת. יש מקרים שאין בזה צורך למשל ברשתות בהן הקשרים בין הצמתים מובהקים, נגיד, ברשת מייל. כתובת מייל אחת שולחת מייל לכתובת מייל אחר. יש לנו 2 צמתים וקשת ביניהם.


אבל מה לגבי רשת הנוירונים במוח? כיום, אין ברשות המחקר יכולת לזהות את היעד של מסר שנשלח מנוירון X. למעשה, אנחנו אפילו לא יכולים להגיד שמדובר במסר. מה שאנחנו יודעים להגיד הוא זה שבשעה מסויימת נוירון X היה פעיל. אנחנו קוראים לזה מסר, כי שמנו לב שמייד אחרי שנוירון X היה פעיל, נוירון Y החל להיות פעיל גם.

כלומר, מצאנו קורולוציה של פעילות בזמן שנובעת מהנחה של סיבתיות: אם Y פעיל אחרי ובסמוך ל-X, אז יש בינהם קשר.


שיטה זו נקראת השוואה בין סדרות זמן או time-series correlation. אנחנו משרטטים על גרף את הפעילות של הצמתים השונים, ובמידה ומוצאים תאימות או קורולציה בין הפעילויות אנחנו מחברים בינהם בקו. ניתן להגדיר שכעוצמת הקורולציה, כך עוצמת הקשר.


כך למשל אפשר לייצר רשת בין גורמים שאנו מניחים שיש בינהם קשרים אבל הם לא חשופים לנו. כך גם אפשר לייצר רשת ממעקב אחרי מניות. כשמניות עולות ביחד או יורדות ביחד, אנחנו יכולים לחבר בינהן בקשת. אבל זהירות! שימו לב שקורולציה אינה קוזאציה או תאימות אינה סיבתיות.

זה ששני דברים קורים בסמוך זה לזה, לא אומר שיש לכך סיבה. זה שגרף מכירות של רחפנים תואם בצורה מפתיעה לכמות הלוטרות בארה"ב, לא אומר שיש סיבתיות בין השניים. לאלה שמתענינים בנושא אני שמח להפנות לספרו של יהודה פרל The Book of Why שחסרונו היחיד הוא שהסוף שלו די רחוק מההתחלה. לכן ממצאים מסוג זה צריך לבדוק פרטנית ולצד הספקנות, יכול להיות שיעלו נקודות למחשבה שלא היו עולות בדעתנו קודם. מה שיכול לעזור לנו פה זו החלוקה לקהילות: כיוון שקהילות הן הומופיליות, חריגה מההומופיליה תצביע על נקודה שדורשת בדיקה, למשל,

קהילה של מניות נפט שכוללת בתוכה מניות של חברה לייצור מזון מעלה אנומליה חשודה. בירור עומק יכול לגלות שמדובר בקורולציה מקרית בין המניות או שאולי חברת המזון נזקקת לנפט בשביל המפעלים שלה ולכן היא מושפעת או שצריך לבדוק טוב טוב ממה היא מכינה את האוזני המן עם השחור בפנים. המושג השני והמאתגר יותר, ובו נעסוק בהמשך הפרק, הוא הזמן כמימד של הרשת, כלומר, הדינאמיקה ברשת.

כדי להימנע מפירוט טכני מדי, את השיטות לניתוח דינאמי של רשת נפרוט בפרק best practices לחוקר הדאטה. כאן רק נציין בכותרות שלוש שיטות נפוצות ואחרי זה... אחרי זה יבואו הזיקוקים.


אז בחלוקה גסה, יש כיום כמה גישות שונות למחקר דינאמי:




שיטת המחקר הרציף, שהיא אולי הכי אינטואיטיבית, והיא פשוט מאפשרת מעקב ויזואלי אחרי שינוי הרשת, מה שנקרא "לנגן את הרשת".










t=time window (Why start with zero? Tradition!)

השיטה השניה, היא שיטת חלונות הזמן, שבה נחלק את הרשת הדינאמית למקטעים סטאטיים (או חלונות) של שעות, ימים או שבועות לפי הצורך, ונשווה בינהם.





והשיטה השלישית היא שיטת הניטור, שפחות מסתכלת על הרשת כרשת אלא כאוסף של מדדים שלכל אחד מהם יש רצף בזמן, כלומר, התוצר שלה הוא גרפים, בדומה לפוליגרף, שהמחט שלהם נעה בכל שינוי במדד, למשל, מעקב אחרי מדד כמות הצמתים, צפיפות הרשת וכד'. גישה זו גם דורשת חלוקה של הרשת למקטעים או לחלונות זמן, אבל יתרונה שהם יכולים להיות קטנים מאד, מבלי להקשות על הויזואליזציה. השימוש הנפוץ בשיטה זו היא בכדי לאתר חריגות או נקודות שינוי ברשת, בהסתמך על גרף המדדים.


המטרה של כל השיטות האלה היא לתאר באופן מדוייק יותר את המציאות, שהיא דינאמית.

וחלקן, ובמיוחד גישת הניטור, מנסות לאפשר את הבסיס לזהות דפוסים, חריגות ושינויים.

יש רק בעיה אחת בגישה הזו, ולמעשה בהרבה מהשיטות לזיהוי דפוסים ופרדיקציות:

הן לא כ"כ עובדות.

(הבטחתי זיקוקים)


הופה, רגע, רגע, זו אמירה קצת קיצונית.

מה זאת אומרת לא עובדות? אנחנו לא יכולים לזהות דפוסים בדאטה? אז בשביל מה משלמים לכל האנשים האלה שמתעסקים כל היום בדאטה? ומה לגבי כל ההבטחות בנושא machine learning ו-AI שיזהו דפוסים בדאטה וייתנו פרדיקציות? עזבו הבטחות – הצלחות מוכחות!

אז זו באמת אמירה קצת קיצונית, וננסה למתן אותה ולהבהיר בהמשך מתי היא נכונה ומתי לא, אבל בינתיים, אנצל את המומנטום כל עוד אתם מוכנים להמשיך לשמוע ואגיד שהבעיה היא לא בזיהוי דפוסים בשיגרה. הבעיה היא בשיגרה.


אין שיגרה.


וכאן, נכנסת המרמיטה.

הסרט "לקום אתמול בבוקר", או "Groundhog's day" (יום המרמיטה), נבחר לאחת מעשרת הקומדיות הגדולות בכל הזמנים. הסרט מתאר את הדמות הראשית, בכיכובו של ביל מוריי (המלך) כאיש די מגעיל שהוטלה עליו קללה: הוא נידון לקום כל יום באותו תאריך ושעה ולחוות שוב ושוב את אותן 24 שעות, לנצח. הסרט, אגב, הרבה יותר מעניין ממה שנשמע.

אז קודם כל, ממליץ מאד לראות, אבל חוצמזה, למה זה נשמע לנו תרחיש כזה הזוי? לכאורה כולנו קוללנו באותה קללה. אנחנו קמים באותה שעה, עושים אותם דברים, נפגשים או מדברים עם אותם אנשים, חוזרים הביתה והולכים לישון. אז זהו, שזה לא בדיוק המצב.


אני מניח שלחלקנו יש לוז קבוע, למשל, כל יום שישי הייתי עומד באותה פינת רחוב לחכות להסעה של הילד בחזרה מבית ספר. אותו מקום, אותה שעה. כל שבוע.


יום אחד עבר חבר שלי ברחוב שהופתעתי לראות. דיברנו קצת, ואחרי שהוא הלך התחלתי לחשוב. למה אני לא פוגש אותו כל פעם באותו מקום? בעצם, למה אני לא מכיר את כל האנשים שעוברים כאן ברחוב? הרי אני שם באותו מקום, באותה שעה. אני מכיר חלק מהאנשים (למשל את המוכר הקבוע בקיוסק, או הקבצן הידוע בכינוי שלו "בשורות טובות" מקינג ג'ורג'), אבל את הרוב המכריע אני לא מזהה מהפעמים הקודמות שהייתי שם.

כדי להבין למה זה קורה, נצטרך להבין מערכות מורכבות. ואין שקר בפרסום. זה מורכב. אבל אנחנו נתגבר על זה (:


רשתות דינאמיות הן מערכות מורכבות (complex system) ולפיכך גם האתגר המחקרי מורכב. אז ממה נובעת המורכבות של הרשתות? כמו ש"אף אדם אינו אי", כך גם הצמתים ברשת קשורות/משפיעות זו על זו. ניסיון למפות שיגרת קשרים של צומת ברשת דומה לניסיון לעקוב אחר שיגרת תנועה של טיפת מים באדוות הנהר. כמו טיפת המים, כך גם הצומת מושפעת מסביבתה שמושפעת אף היא מהסביבה הרחוקה יותר וכן הלאה. מארג זה משפיע הדדית ויוצר "אדוות" ברשת. אם "אדוות הרשת" מזכירות את המושג הפופולרי "אפקט הפרפר" מתורת הכאוס, הדבר אינו מקרי. אפקט הפרפר הוא משל מעולם חיזוי מזג האוויר ובו תנודות כנפיים של פרפר בצד אחד של העולם יכולות לייצר סופה בצד השני, הכוונה לשרשרת של אירועים במיקרו שמייצרות תופעת מאקרו, באופן לא ליניארי. אפקט זה הוא אשר מייצר כאוס ברשת.




כאוס היא מילה טעונה. כשקוראים למשהו כאוטי, זה מגיע עם שובל ארוך של משמעויות, והן כבדות. אולי זו הסיבה שבעולם הרשת לא נוטים להשתמש במילה הזו אלא במושג "מערכת מורכבת" שזו הגדרה שכוללת בתוכה את ההיבטים הכאוטיים של המערכת אבל נשמעת פחות מיסטית. למי שלא מפחד מקצת כאוס, אני ממליץ על האזנה לפרק 9 בנושא בפודקאסט המשחק הגדול של ניצן פוקס.


אז בואו נשחק את משחק ההגדרות. מהי "מערכת מורכבת"?

מערכת מורכבת היא "מערכת דינאמית, לא-ליניארית וכאוטית". מה זה אומר? אז בואו נפרק את המשפט הזה:

  • מערכת: מערכת היא אוסף רכיבים המגיבים זה לזה ויוצרים שלם הגדול מסך חלקיו.

  • מערכת לא ליניארית: היא מערכת בה הקשרים וההיזונים בין הרכיבים מגדילים משמעותית את השלם.

  • דינאמית: כלומר המערכת משתנה לאורך זמן.

אז למה אם הרשת היא מערכת מורכבת היא גם כאוטית? אז נסביר קצת על מהי מערכת כאוטית, ונשתמש בדוגמאות מעולם מזג האוויר שכולנו מכירים ונקביל את זה בסוף לעולם הרשת אבל נתחיל בזה שנגיד שלמערכת כאוטית יש מספר מאפיינים או תנאים שצריכים להתקיים בה כדי להיחשב ככזו והם:

  • רגישות לתנאי פתיחה

  • דטרמיניסטיות

  • לא אקראית

  • לרוב פרקטלית

  • ויש בה מושכים מוזרים

ואחרי התפריט הסיני הזה, בואו נפרוט את התנאים: מערכת כאוטית היא מערכת דינאמית לא-ליניארית שרגישה לתנאי פתיחה, כלומר, שינוי ולו הקל ביותר במערכת יביא לתוצאות שונות מאד. התערבות במערכת, ולו המזערית, יכולה להוביל לתוצאות לא צפויות אף יותר ("אפקט הפרפר"). בנוסף, המערכת היא דטרמיניסטית, כלומר, בהינתן אותם תנאי פתיחה, נקבל 2 מערכות זהות. הכוונה לאותם תנאי פתיחה בדיוק מוחלט. גם אם תנאי הפתיחה יהיו מאד מאד מאד דומים, זה לא מספיק ותתקבלנה 2 מערכות שונות מאד. ומכיוון שהסכמנו שהמערכת היא דטרמיניסטית, אז הדינאמיות במערכת אינה אקראית ומצייתת לחוקים. זו אמירה ממש לא טריויאלית אז נקדיש לה דקה.


ניקח למשל את המספר pi. פאי הוא מספר מיוחד שמקבלים בחלוקת היקף המעגל לקוטר שלו והוא מתחיל ב-3.14 ואז רצף אינסופי של ספרות, כלומר, הוא לא מספר רגיל. הספרות ממשיכות עד אינסוף, ללא דפוס או חזרה, אבל לא באופן אקראי, כלומר, יש חוק מתמטי מאחוריהן, והוא חוק החילוק. ואגב, מכיוון שתנאי הפתיחה יהיו תמיד זהים בחישוב ה-Pi, כלומר, היחס תמיד יהיה זהה בין ההיקף לקוטר, תמיד נקבל אותה תוצאה, כלומר, מדובר במערכת דטרמיניסטית.


בשיח הפופולרי, כשאומרים על משהו שהוא כאוטי, הכוונה היא בדרך כלל להתנהגות שנראית אקראית ומבולגנת, ולא מצייתת לאף חוק, או בז'רגון המקצועי: שכונה. אגב, הסיפור מאחורי ההיסטוריה של המילה כאוס וההקבלות שלה ל"תוהו ובוהו" התנכי, מרתק גם, אבל זה נושא שנשאיר לצערי בצד כרגע. בכל מקרה, בשיח המדעי, זה לא המצב. מערכת כאוטית יכולה להיות מאד מסודרת, פשוט לא צפויה.

בחזרה לעולם ההגדרות שלנו, אז למערכת כאוטית יש גם קשר חזק לפרקטליות (fractals): התמקדות בחלק מהמערכת תחשוף את אותו מבנה וחוקים של המערכת בכל רזולוציה (מה שנקרא, scale-free, מושג שנתקלנו בו בעבר). ולבסוף, למערכת כאוטית ישנם גבולות הנקבעים ע"י "מושכים מוזרים" ועל כך נפרט בהמשך.


אז מערכת מורכבת היא מערכת דינאמית, שרגישה לתנאי פתיחה, ששינויים בה הם לא ליניאריים. היא לא אקראית אלא יש בה חוקים דטרמיניסטים שבאים לידי ביטוי בכל רזולוציה של המערכת, כלומר, המערכת היא פרקטלית. ויש לה גבולות.

למה הגדרה זו חשובה? שכן המשמעות של הגדרת מערכת כ"מערכת כאוטית" היא שקיימת "תקרת זכוכית" ליכולת לחזות אותה.למשל, בדוגמה של המספר pi, אנחנו לא נדע לחזות מה המספר הבא בשרשרת המספרים שבאים אחרי ה-3.14 , או למשל, לא נדע מה הספרה המיליון אחרי הנקודה, ללא חישוב מוקדם. בהערת אגב, יש חיזוי מסויים שניתן לעשות על מספרים אלו אבל הוא לא עונה לקריטריון שציינתי והוא קצת מורכב להסביר פה. למתענינים, מצ"ב קישור.


מערכת מזג האוויר היא מהמערכות הכאוטיות המפורסמות והנחקרות ביותר ובעיית החיזוי שבה היא מהמוכרות. נשתמש במערכת זו כדי להדגים את עקרונות הכאוס ונקשר בסוף את הכל לעולם הרשת:

מערכת מזג האוויר מגלה רגישות לתנאי פתיחה. ההשפעות על המערכת מצטברות באופן לא-ליניארי ("אפקט הפרפר") כך שחיזוי אפשרי לזמן קצר בלבד.

השפעות אלו אינן מחזוריות ולפיכך במערכת כאוטית, ידיעת ה"עבר" אינה מסייעת לחיזוי ה"עתיד". מזג האוויר אינו אקראי ופועל לפי חוקים פיסיקליים (למשל, אוויר חם עולה, אוויר קר יורד), וחוקים אלו קיימים בכל רזולוציה של המערכת (פרקטלית). אך ידיעת החוקים עדיין לא מאפשרת חיזוי וזאת למרות שמזג האוויר הוא דטרמיניסטי. לכאורה, דטרמיניזם של מערכת מאפשר חיזוי, בהינתן היכרות עם תנאי הפתיחה שלה, אך הקושי נובע בעיקר מהיעדר היכולת לשחזר את תנאי הפתיחה של המערכת במדויק לטובת מודלי החיזוי. חיזוי מזג האוויר הוא בעיה עתיקה שבני האדם השקיעו בה רבות לאורך השנים. למרות כל המשאבים הרבים שהושקעו ומושקעים בכך, הסנסורים המשתכללים והמתרבים, כמויות הנתונים העצומות, היכרות עמוקה עם החוקים הפיסיקליים של המערכת והידע הרב שנרכש, לא ניתן לתת חיזוי טוב למזג האוויר של יותר מימים בודדים וגם בתקופה קצרה זו לא פעם מתקבלות תחזיות שגויות. בנוסף, מכיוון שהמערכת נתונה להשפעות תמידיות ואפילו המזעריות שבהן יכולות לשנות אותה משמעותית, נדרש כיול מתמיד של הפרמטרים במודלים בהם משתמשים החזאים. חזאים אף העריכו שאפילו אם היינו יכולים לנטר כל מולקולה לצרכי המודלים, בגלל הרגישות הגבוה לתנאי פתיחה, עדיין תהיה קיימת "תקרת זכוכית" לתחזיות לטווח של כשבועיים. זהו.

המציג אינו חזאי, ולכן אני מסתמך על אדוארד לורנץ, שהוא אבי הכאוס של מזג האוויר, והסיפור בענינו הוא מדהים והתוצרים שלו מדהימים לא פחות, אבל מכיוון שאנו עוסקים ברשתות, אני נאלץ להפנות לספר "כאוס- מדע חדש נוצר" של ג'יימס גליק. במאמר מוסגר אני אגיד שהספר של גליק הוא אחד מהספרים הכי פחות ערוכים שקראתי, עד שגיליתי שכך נראים כל הספרים של ג'יימס גליק. מי שיצליח להתגבר על זה, צפוי לחוויה מטלטלת.

אבל לורנץ הוא עתיק, אז נצטרך לשכנע אם משהו קצת יותר עדכני. אז הנה זה גם מה שחושבים בארגון ה-EMCWF, שזה European Centre for Medium-Range Weather Forecasts יש כמה סיבות למה אני תופס מהם. קודם כל יש להם שם ארוך. חוצמזה, יש להם דאטה. הרבה דאטה. כל יום נאספים שם כ-233 טראבייט (TB) של נתונים, והארגון עושה במודלים שלו שימוש בכביליון (billion) משתנים. אני לא עושה שימוש בביליון משתנים. אתם כן?

וחוצמזה, המודל שלהם להוריקנים הוכח כטוב יותר מהמודל האמריקאי. שזה קצת מוזר כשחושבים על זה, כי אין הוריקנים באירופה. אנחנו עוד נחזור לארגון זה בהמשך בהקשר של למידת מכונה/machine learning אבל בינתיים, בואו נסכים שלא צריך ביליוני משתנים כדי לתת תחזית אמינה-יחסית שבחורף הטמפרטורות יהיו נמוכות מאשר בקיץ. אז למה דווקא זו פרדיקציה לגיטימית? הסיבה לכך היא שלמערכות כאוטיות ישנם גבולות המוגדרים ע"י "מושכים מוזרים" (strange attractors). ה"מושך" הוא אותו הפרמטר שסביבו סובבת המערכת. המערכת מסתובבת סביבו, אבל בצורה כאוטית, כלומר, ללא דפוסים, אך גם לא בצורה אקראית. אקראיות אומרת שישנה בחירה רנדומלית בין תוצאות ידועות מראש.

למשל, זריקת קוביה היא אקראית. עם זאת, ניתן להגיד שממוצע הזריקות יהיה 3.5 למרות שזו תוצאה שאף פעם לא נקבל בקוביה. במובן מסוים אפשר להגיד ש- 3.5 הוא המושך המוזר של הטלת הקוביה, כי הוא מאפשר לנו להגיד שהתוצאות יהיו סביב ה-3.5, כך שנוכל להעריך את גבולות המערכת בכ-1-6.

הבעיה היא שבמערכת כאוטית, יכולים להיות כמה מושכים מוזרים והמערכת עוברת בינהם בצורה לא צפויה.