תגיות

,

לפני שנים (1987-1992) שודרה בטלוויזיה האמריקאית תכנית ילדים בשם "המשבצת הראשונה", שעסקה בעקרונות מתמטיים לילדים. במסגרת שודרה פינה בשם מת-נט, שעסקה בפעילותו של מחלק המתמטיקה במשטרת לוס-אנג'לס. שש אפיזודות הוקדשו לחקירה שהתבססה על שיטות סטטיסטיות. ובזה גם אני עוסק היום.

הסיפור הבא מסופר על המתמטיקאי הצרפתי הנרי פואנקרה (1854 – 1912), ואולי הוא גם נכון. פואנקרה, ירד כל יום למאפיה, וקנה כיכר לחם במשקל נקוב של 1000גר'. מאחר שחשד באופה, הוא רשם בכל יום את משקל הכיכר. בסוף השנה, הוא פנה למשטרה, והתלונן כי המשקל הממוצע הוא 950 גר'. השוטרים השתכנעו והזהירו את האופה. בשנה אחרי זה, פואנקרה המשיך לרשום את המשקל, ובסוף השנה הוא פנה שוב לשוטרים, למרות שמשקל הממוצע של הכיכרות שקיבל היה יותר מ-1000 גר'. מה ששכנע את השוטרים, שהאופה ממשיך בסורו, היה שלמרות שהמשקל הממוצע היה כמוצהר, ההתפלגות הייתה לא סימטרית, הציפיה היא שהמשקל יתפלג באופן סימטרי כצורת פעמון החרות בפילדלפיה* ("הפעמון הנורמלי"), וההסבר הסביר ביותר לחוסר הסימטריה, היה שהאופה המשיך לאפות כיכרות השוקלות פחות מק"ג, אבל נזהר מפואנקרה, ונתן לו כל פעם את הכיכר הכבדה ביותר במאפיה.

*תיקון. 14 שעות לאחר פרסום הפוסט הלכתי לבדוק במו עייניי. פעמון החרות, שהוצב כמה מאות מטר משוק עבדים פעיל, ממש לא נראה כעקומת הפעמון הנורמלי, ולא רק בגלל הסדק!

היסטוגרמות של 365 כיכרות לחם במשקל ממוצע של 950 גר', ושל 365 כיכרות לחם, כל אחת הינה הכבדה מבין 4 כיכרות כאלו. ממוצע המשקל של כיכרות אלו הוא 1003 גר'. אשמח למצוא את ההבדלים.

היסטוגרמות של סימולציה של 365 כיכרות לחם במשקל ממוצע של 950 גר', ושל 365 כיכרות לחם, שכל אחד הינו הכבד מבין 4 כיכרות מקריים. ממוצע המשקל של כיכרות אלו הוא 1003 גר'. אשמח למצוא את ההבדלים.

הסיפור יפה, אבל אנו נעסוק בסיפורים אמיתיים, שגיבוריהם אינם אופים ואינם רמאים, אלא שניים מהנסיינים המזהירים של המדע המודרני.

*

נתחיל בסיפורו של רוברט א. מיליקן, חתן פרס נובל בפיזיקה ל-1923. הבעיה שעמדה לפני מיליקן הייתה האם המטען החשמלי הוא תמיד בכפולה של יחידה אחת, ומהי יחידה זו. הערכה גסה של יחידת המטען האלמנטרי נקבעה כבר ב-1874 על ידי ג'ורג' סטוני. ב-1897 תומסון הראה כי הקרניים בשפופרות קתודיות הינן של חלקיקים טעונים, ומצא את יחס המשקל מטען שלהם. הניסוי של מיליקן התרחש בתחילת העשור השני של המאה העשרים. מערך הניסויי כלל שני לוחות, שניתן היה להפעיל ביניהם מתח חשמלי. על הלוח העליון רוסס תרסיס של טיפות שמן טעונות במטען חשמלי סטטי. בלוח היה חור קטנטן שבסופו של דבר טיפת שמן קטנה מתוך התרסיס, שקוטרה כאלפית המ"מ, נפלה. מיליקן עקב אחריה ב"טלסקופ". ומדד את מהירות הנפילה. כאשר הטיפה התקרבה ללוח התחתון, הוא הפעיל שדה חשמלי בין הלוחות, שהאיץ אותה בחזרה למעלה, וכך, על ידי הפסקת והפעלת השדה לסירוגין, הוא יכול היה לעקוב אחרי הטיפה במשך שעות. מהירות הנפילה של הטיפה היה פונקציה של משקלה והתנגדות האוויר. בעוד שמהירות עלייתה למעלה היה גם פונקציה של המטען. כתוצאה מכך הוא יכול היה לאמוד את המטען על הטיפה.

הניסוי היה מורכב, מדויק והניתוח של הנתונים היה מרשים. מטען האלקטרון נמצא על ידי מילקן ב-1911 כשווה ל-E-10 1.631 ק' (מצטער, אבל אני לא מצליח לרשום את החזקה של ה-10 במקום הנכון….). בדיוק של 0.2%. במאמר ב-1913 הוא דיווח על ניסויים נוספים במערך משופר, שהביא לתוצאה מדויקת יותר של  10-E  1.592 ק', במאמרו זה, מיליקן מנתח 58 טיפות שמן. הוא כותב:

"יש לציין, שאלו אינן קבוצה נבחרת של טיפות, אלא כזו המייצגת את כל הטיפות שנמדדו במשך 60 ימי ניסוי עוקבים".

מחברות המעבדה של מיליקן נשמרו, וניתן היה למצוא פרטים מעבר למה שהוא דיווח עליהם במאמריו. מתברר, שמדידות נלקחו במשך ארבעה החודשים הקודמים לטיפה הראשונה שהוזכרה במאמר. אך גם אם נתייחס לתקופה זו כאל תקופת הרצה, ונתחיל עם טיפה זו, נשאר עם 49 טיפות שנעלמו מהדיווח, ולא נמצאו ראויות לפרסום. לגביי 22 מהטיפות, נראה שהוא הרגיש שהוא לא היה זקוק להם לניתוח. 12 כנראה שהצריכו תיקון מסדר שני למכניקה של התנגדות האוויר, 2 נפסלו בגלל שהמערך לא פעל כראוי, 5 בגלל שלא היו נתונים מספיק מדויקים, ושתיים ללא כל סיבה ברורה. 5 בגלל שהתוצאה של מדידת מטען האלקטרון לא תאמה את צפיותיו….ולבסוף, עוד טיפה  נפסלה כנראה בגלל שכל החישובים הובילו למטען שהוא 60% ממטען האלקטרון. בעיה….

היו שתי דרכים לחשב את המטען האלמנטרי מתוצאות הניסוי. האחת הייתה להעריך את המטען הכולל, והשנייה את השינויים במטען. שתי הדרכים די דומות, ההבדלים ביניהם משניים, וכמעט חסרי השפעה על התוצאה הסופית. במאמרו הוא כותב שהוא השתמש רק בדרך הראשונה. לפי רישומיו הוא השתמש בוואריאציות שונות של ממוצע שתי השיטות ב-19 מתוך 58 הטיפות. אבל הייתה טיפה אחת, שעבורה שתי השיטות התאימו ממש. מיליקן כתב במחברת, "לפרסם. מתאים לתיאור שתי השיטות לחישוב המטען". אבל אז התבררה לו בעיה אחת קטנה. השיטות התאימו, אבל החישוב מצא את המטען שווה כ-60% מערכו הצפוי. לכן, מיליקן מתקן במחברתו:. "לא יעבוד". ומוסיף, "משהו פגום ב[מד] חום". אבל כנראה שאין דרך בה מדחום פגום יוכל להסביר את התוצאה. יש הסברים אחרים למה התוצאה לא מדויקת, אבל מיליקן לא היה מודע להם, ולא התייחס אליהם במחברתו. אבל איך כתב מיליקן: "אין גם מקרה אחד, בה השינוי במטען היה שונה מכמות מוגדרת אחת של חשמל, או כפולה קטנה מאוד של כמות זאת."

החלק המעניין, הוא שאם מנתחים את כל הטיפות, לא רק את ה-59 שעליהן דיווח מילקן, מקבלים בעצם את אותו מטען ממוצע, אם כי עם אומד כפול לטעות. במילים אחרות, התוצאות היו קצת פחות יפות מאשר התוצאות שפורסמו (אבל מאחר שהתוצאות של מיליקן היו כ-1% פחות מהאומדן הנוכחי, התוצאות עם השגיאה הגדולה יותר, היו עם רווחי הסמך הנכונים, המכסים את הערך האמיתי…).

*

גרגור מנדל היה נזיר לא ידוע שחי בין 1822 ל-1884, ונכשל פעמיים בבחינת ההסמכה כמורה בתיכון, אולם בשמונה השנים שבין 1856 ל-1863 מנדל ביצע שורה של ניסויים ב-29,000 שתליי אפונה. תוצאות המחקר הוצגו שנתיים אח"כ בשני כנסים מדעיים במורביה, ופורסמו לאחר כשנה. המאמר זכה לתהודה מינימלית, וצוטט כשלוש פעמים ב-35 השנים הבאות. ב-1900 מאמרו התגלה, התפרסם, התאים לרוח התקופה, ומכאן והלאה היה ברור שמנדל הוא אבי הגנטיקה.

המאמר מרשים ביותר. כדרכי, אני ממליץ לקרוא את המאמר המקורי. תתפלאו כמה התואר אבי הגנטיקה מתאים לו. טוב, לפחות תקראו את המאמר באנגלית ….. תמצאו שם את המושגים תכונה דומיננטית, ותכונה רצסיבית, וסימונים כמו Aa לנשא של שתי התכונות האלו. וכבר להבנתו של מנדל  "התפתחות זו היא לפי חוק קבוע, המבוסס על ההרכב החומרי, וסידור האלמנטים הנפגשים בתא באיחוד מחייה". .

המאמר מכיל תיאור מדויק של הניסויים שבוצעו, על הנתונים שנאספו. עם פרסומו של המאמר ברבים בתחילת המאה העשרים, נשמעו גם קולות המופתעים מהתוצאה. כבר ב-1902, במאמר בעיתון הסטטיסטי ביומטריקה, הושמעה תהייה על ההתאמה המופלאה של המספרים לתיאוריה. אולם, הטענות הברורות היו במאמר של ר. א. פישר. מ-1936. פישר, למרות הערצתו הבלתי מתפשרת (ואם יורשה לי להוסיף, המוצדקת) לעבודתו של מנדל, העלה תהיות לגבי התאמתם של הנתונים שפרסם מנדל לתיאוריה.

המחקר של מנדל התחיל עם זנים טהורים בעלי הרכב גנטי AA  או aa שהוכלאו ביניהם. התוצאה הייתה צמחים בעליי הרכב Aa. בשלב הבא מנדל הכליא צמחים כאלו בינם לבין עצמם, וקיבל צמחים שבהם התבטאה התכונה הרצסיבית, וכאלו שבהם התבטאה התכונה הדומיננטית. כיוון ששני ההורים היו Aa, כל הורה העניק לצאצא A בהסתברות 1/2, ובהסתברות 1/2 a.   אם מה שהצאצא קבל מהורה אחד בלתי תלוי ממה שהוא קבל מההורה השני, אז בהסבתרות רבע הצאצא יהיה AA, בהסבתרות רבע aa, ובמה שנישאר יהיה Aa. בכל מקרה, אם הוא קיבל לפחות A אחד, התכונה הדומיננטית תתבטא. במילים אחרות, התכונה הדומיננטית מתבטאת אם הצאצא הוא מטיפוס AA (שני גנים דומיננטיים), או Aa (דהיינו גן דומיננטי עם גן רצסיבי).

המטרה של מנדל הייתה להראות שעל על כל אחד מהטיפוס הראשון יש אכן שניים מהטיפוס השני. הוא עשה זו על ידי הכלאה עצמית של הצמחים. ובדיקת, כך כתב, של עשרה צאצאים. אם הצמח בעל שני גנים דומיננטיים, כל צאצאיו יהיו בעלי התכונה הדומיננטית. אבל אם הוא "הטרוזיגוטי", אז לפחות חלק מצאצאיו יהיו בעלי התכונה הרצסיבית. הנחתו המובלעת של מנדל הייתה, שאם בכל עשרת הצאצאים מתבטאת התכונה הדומיננטית, קרוב לוודאי שצמח המקור הומוזיגוטי, ולכן מספיק לבדוק 10 צאצאים.

הטענה העיקרית של פישר הייתה, שחוק המספרים הקטנים אינו נכון. כך, גם אם היחס התיאורטי הוא 1:2, בניסוי בעל מספר תצפיות קטן, ימצא אמפירית יחס שונה במקצת. כמה שונה? תלוי בגודל המדגם. ככל שהמדגם גדול יותר, היחס האמפירי יהיה קרוב יותר ליחס התיאורטי. התוצאות של מנדל נראות כקרובות שיטתית ליחס התיאורטי. הרבה יותר מדי. רק באחד מכשלושים ניסויים התוצאה תהיה קרובה יותר לתיאוריה. אבל למנדל, המזל, כפי שפישר כותב, המשיך להאיר לו פנים באופן חריג גם בשאר הניסויים (לדוגמא גם כאשר הוא רצה לאשש את היחס 1:3).

הטענה השנייה, והמשנית, של פישר לגבי ניסוי זה. שהתוצאה קרובה לא לתוצאה התיאורטית שמנדל האמין בה, אבל זו לא הייתה התיאוריה הנכונה. הטעות לכאורה של מנדל היא שאם הצמח הטרוזיגוטי, כל עשרת הצאצאים יכולים להיות בעלי התכונה הדומיננטית בהסתברות הנמוכה, אבל לא זניחה של כ-5.6% (שלשה רבעים בעשירית). אי לכך, היחס שמנדל היה צריך לקבל לא היה 1:2, אלא קרוב יותר ל 1:1.6963.

בואו נתעכב קצת על הטענה של פישר. אם תטיל מטבע 1000 פעמים, ויוצא לך "ראש" 500 פעמים, אז למרות שזו התוצאה הסבירה ביותר, כנראה ששיקרת. יש משהו מיוחד בתוצאה הזו, שהסתברותה כ 0.025, שאין בתוצאה (שהסתברותה כ- 0.013) שיצא לך ראש 482 פעם. לכן, במקרה הראשון אחשוד ששיקרת, במקרה השני לא. אם תטיל את המטבע עוד פעם 1000 פעמים, ושוב יצא לך 500 פעם, אז כנראה, התוצאה אינה "מקרית". לעומת זאת, אם בפעם הראשונה הצלחת ב-482 מהפעמים, ובפעם השנייה ב-517, יראה שדיווחת נכון על ההטלות. התוצאות 482 ו-517 יותר "דומות", מאשר 500 ו-505.

חידה: 'לפניכם מונחת שורה של חמש מעטפות סגורות ובהן חמישה קלפים צבעוניים שנשלפו באקראי מחפיסת קלפים. החפיסה המקורית הכילה 100 קלפים צבעוניים: 36 ירוקים, 25 כחולים, 22 צהובים ו-17 אדומים. מה הניחוש הטוב ביותר לרצף הקלפים במעטפות הסגורות?'

טוב, התשובה, היא "כל הקלפים ירוקים." אבל אם תהמרו על זה, נעשה ניסוי, וזה מה שיצא, כנראה שרימיתם. מדוע אחשוב כך? למעשה, זו התוצאה הסבירה ביותר, ויחד עם זאת התוצאה היחידה שתגרום לי לחשוב שרמאות הייתה מעורבת בהשגתה. אבל, אם עשרת אלפים אנשים יהמרו. כ-50 מהם יזכו. מדוע אין זה מפתיע? מדוע אין סתירה בין הטענות?

הדבר המפתיע, שישנה שורה של מאמרים (פתטיים לפי דעתי) שניסו להגן על מנדל (למה? מה הם יודעים עליו? הריי המחברים לא הלכו לתפוש ברווזים יחד עם האח גרגור). מאמרים אלו עסקו בניתוח סכולסטי של מאמרו של מנדל, כדי להראות שפישר לא הבין אותו כראוי, ושאפשר לפרש אותו כך שלא שיקר. מה לעשות, גם, אם אפשר להתפתל להתגבר בקושי רב, ובצורה מוזרה, על הקושי השני, הקושי הראשון נשאר בעיינו. אפשר לחקור למה התכוון פישר, כאילו אין זה ברור, ולהתווכח על משמעותה של הסטטיסטיקה בדיון, כאילו אין זה פשוט –  אותם כלים שמאפשרים לנו לטעון שהתיאוריה של מנדל נכונה, מאפשרים לנו לטעון שטענתו בושלה כדי לשפר את טעמה. לא, דעתו של אף אחד, לא תסיים את הוויכוח, ואת התער של אוקאם יש להשחיז, גם אם מנדל על הכוונת.

דא"ג, אשמח אם מישהו יסביר לי, מדוע אין זה מפתיע שמנדל לא מצא תלות בתורשה של התכונות שאותן בדק.

*

אל-גרקו. ישו מגרש את הסוחרים מבית המקדש. ~1600

לא הרבה השתנה מאז. אל-גרקו. ישו מגרש את הסוחרים מבית המקדש. ~1600. שימו לב לצבעים….

לפני שנים, באחת ממערכות הבחירות, חשדתי שתוצאות הסקרים המפורסמות בעתון חשוב זה או אחר (ולא "הארץ") שבוע לאחר שבוע, הינן דומות מדי אחת לשנייה. במערכת הבחירות שלאחר מכן, עקבתי שבוע אחר שבוע אחרי התוצאות, ואכן, שוב, השוני היה קטן מהמצופה ממדגם מקרי בין כאלף נבדקים. כן, גם אם לא קורה כלום, התוצאות צריכות להיות שונות משבוע לשבוע. כאשר העקביות היתרה הייתה מובהקת, פניתי לעיתון, ולא זכיתי לתגובה.

הלקח ממנדל לא נלמד. אם מה שמפרסמים אינו תואם את המתואר או את המחקר, צריך לעבוד קשה  על מה שמפרסמים, כדי שהתוצאות יראו סבירות. פרופסור סמסטרס נאלץ להתפטר ממשרתו כפסיכולוג חברתי באוניברסיטת ארסמוס ברוטרדם. תוצאות מאמריו נמצאו סימטריים מדי. תפישתו היתה בשיטתו של פישר (אם כי בכלים קצת יותר פרימיטיביים ועתירי תוכנה). בניגוד לעיתונאים, האקדמיה לא סלחנית לנתונים מטעים.  לא כל בלופר הוא גאון כמו מנדל או מיליקן. לא כל ייפויי של תוצאות מקרבם לאמת.

ניתן לתפוש בלופרים בשיטות סטטיסטיות. ואם בכל זאת רוצים לבלף, צריך ללמוד את המלאכה היטב.

מודעות פרסומת