תגיות

, , , ,

. יש המדברים על כך, שאלף אנשים יעלו מגוון רחב יותר של הצעות לפתרון בעיה, מאשר עשרה מומחים. זה דיי טריוויאלי, כשמדובר בנושא שאינו טכני. לא ברור, שאלף אנשים שאינם מומחים בבניין גשרים, יעריכו בממוצע את כמות הפלדה הדרושה לבניית גשר, במדויק יותר ממומחה אחד. אבל יש מושג אחר של חוכמת ההמונים, שנקרא לו מבחן השור. לדוגמא, עם כתיבת שורות אלו מצאתי בוויקפדיה בעברית את הטענה הבאה:

 "את הנתון הזה הוא מסביר באמצעות סיפור אנקדוטי שממחיש את התאוריה: הוא מספר על יריד מכירת חיות שבו נערכה תחרות הימורים על המשקל הצפוי של שור מסוים שעתיד להישחט. סר פרנסיס גלטון שביקר במקום, לקח את פתקאות ההימורים וחקר אותן. הוא מצא כי ממוצע הניחושים של כל משתתפי ההימור היה 542.9 ק"ג, קרוב מאוד למשקל האמיתי של השור, 543.4 ק"ג. מכאן גזר סורוסיצקי את המסקנה שעומדת בבסיס התאוריה שלו: הרבים חכמים הרבה יותר מהמעטים, לא משנה עד כמה המעטים יהיו מוכשרים ומומחים בתחומם."

הסיפור מוכר ונדוש ומלא אי דיוקים,  על השפעתו של סורוסיצקי ראה לדוגמא את ההסתמכות על ספרו בראיון בדה-מרקר, 26.08.2013.

לא מדובר בסיפור אנקדוטי. מדובר במאמר של סר פרנסיס גלטון בשם  Vox Populi (קול העם), שהתפרסם ב Nature, 7 במרס, 1907 עמוד 450. מאמר זה, מנסה להדגים את כוחם של הרבים לקבל החלטות נכונות  "בימים דמוקרטיים אלו". אנשים המרו על משקלו של שור. גלטון בדק 787 הערכות (לאחר פסילת 13 הצבעות), ואכן, חציון הניחושים היה 1207 פאונד,  טעות של 0.75% לעומת משקלו האמיתי של השור, שהיה 1198 פאונד (בשום מקום במאמר, אין התייחסות לממוצע…., ההתפלגות הינה מאוד אסימטרית, ולכן לא סביר שהממוצע קרוב לחציון).

פיזור הניחושים במאמר של גלטון

פיזור הניחושים במאמר של גלטון

זה נראה די מרשים. אבל בואו נבדוק, עד כמה טעו המעריכים הבודדים. רק 5% מהפתקים העריכו ת משקל השור כפחות מ 1074 (טעות של 10%), ורק 5% העריכו את משקל השור כיותר מ 1293 פאונד (טעות של 8%). במלים אחרות הרוב המוחלט של המנחשים טעו בפחות מ-10%. 68% מהמנחשים, טעו בפחות מ-5% (שהם 27 ק"ג)! אלו לא היו המונים, אלו היו מומחים. כשאני מסתכל על שור (או על טרקטור, המקביל בימינו), אין לי שום סיכוי להעריך את משקלו עם טעות כה נמוכה. שלשה אנשים, בבית קפה אחד, העריכו את משקלה של מכונית וולוו 144 ב-500, 1000, ו- 1500 ק"ג. המשקל האמיתי הוא כנראה 1290 ק"ג. קולגה שלי העריך את משקל מכוניתו עם טעות של 25% (אני טעיתי ב-7%). הקצבים היו הרבה יותר טובים מכולנו…  יתרה מכך, אצל גלטון, אנשים השקיעו כסף, ורק המומחים (חקלאים וקצבים) יכלו לקוות שיש סיכוי שיזכו.  רק קצב, שיודע להעריך נכוחה את משקלו של השור, יכול היה להרוויח ולהישאר במקצוע.

אני לא יודע מהי הסטטיסטיקה של משקל פרים. בעדר האוגנדי שמצאתי עליו פרטים, המשקל היה 278 ק"ג, עם סטיית תקן של 80.4 ק"ג, או סטיית תקן של כ-30%. במלים אחרות, דיוק האמידה היה גבוה בהרבה מהידע א פריורי.

אם נקבל את הערכים למעלה כאופייניים, ונניח הנחות "נורמליות", אזי הניחוש האופטימלי צריך להיות ממוצע משוקלל בין ההערכה הבלתי תלויה של משקל הבהמה, לבין משקלן הממוצע של הבהמות מסוג זה, כאשר יחס המשקלות הוא 1:36, ועיקר המשקל בממוצע ניתן להערכה. התוצאה תהיה אומדן מוטה בד"כ, עם הטיה של 0.65% בממוצע. די דומה להטיה שמצא גלטון.

אז מה למדנו? הדוגמא המובילה לחוכמת ההמונים, מדברת על חוכמתם של המומחים. חבל, לי זה קלקל סיפור יפה,  וזיכה אותי בסיפור שאינו נוגד את האינטואיציה.

סטטיסטיקאים נוהגים לחלק טעות הערכה לשני מרכיבים היפותטיים. ההטיה והטעות המקרית. ההטיה היא המרחק בין הממוצע של מדגם גדול מאוד לערך האמתי. הטעות המקרית, הוא ההפרש בין הטעות בפועל להטיה. ככל שמדגם גדול יותר (בהנחה שהנדגמים, פחות או יותר, הינם בלתי תלויים), הטעות המקרית קטנה יותר. זהו, פחות או יותר, חוק המספרים הגדולים. לכן כדאי לקחת מדגם גדול, ודעתו הממוצעת של מדגם גדול עדיפה על דעתו הממוצעת של מדגם קטן. אך, ההטיה לא תלויה בגודל המדגם, ההטיה תישאר כמו שהיא! לכן, אם יש להמונים טעות קונספטואלית, והפסיכולוגים כטברסקי וכהנמן מלמדים אותנו שכך הוא, שום מדגם לא יוכל לתקן אותה.

הערה טכנית: הבעיה מסתבכת, אם המטרה של המנחש הינה, כמו במקרה של גלטון, לזכות בפרס. כעת מטרתו של המנחש אינה להמר על הערך הסביר ביותר של משקל השור, אלא על הערך, שישיא (ימקסם?) את ההסתברות שהוא יזכה. כך, עדיף לו לנחש ערך שסבירותו נמוכה, אבל פחות מכך סביר שאחרים ינחשו משהו קרוב לו.

מודעות פרסומת