תגיות

, , , ,

ההיסטוריה המודרנית של נוגדי הדיכאון היא דוגמא מעניינת לקימומה ונפילתה של אמונה מדעית. 

לא, אני לא הולך לסכם את ספרו של קירש, 180 עמודים כתובים בחן ומתאימים לכל. העצלן יכול לקרוא את הסיכום העברי והבהיר (כ-4350 מילים). ענייני אני, כדרכי, הוא בכמה נקודות מיתודולגיות.

זה היה הפרק השלישי בסדרה, אחרי "רגרסיה לממוצע, או מה שהווה, הוא שלא יהיה" ו"ניסויים קליניים, כי בחיים זה אחרת"

לא, אני לא פסיכיאטר, רופא או סתם אדם מדוכא. אין לי מושג אם נוגדי דיכאון עובדים פיסיולוגית, או שמא, מה שיש בהם הוא המסר: אם הפה יבש ויש לך בחילה, כנראה בלעת משהו שיקל על הדיכאון. לא תמצאו כאן ראשיי תיבות כמו SSRI, ולא תבות כמו סרוטנין או דופמין.

יש משהו מרתק בהיסטוריה של נוגדי הדיכאון. הם מודל די ייחודי לשני דברים. ראשית לחשיפה החלקית והמוטה שלנו למחקר המדעי, לתהליך, שבו תרופה הופכת ללהיט בשלב הראשון, ובשלב השני היא יורדת מנכסיה.

התמונות הבאות של ארבע עמודי שער שני שבועוניי החדשות האמריקאים המרכזים מסכמים את עלייתם וירידתם של נוגדי הדיכאון המודרניים .

 

בסוף שנות השמונים החלו להופיע נוגדי הדיכאון "החדשים". באמצע שנות התשעים, הפרוזק היה בשיא גדולתו. כך נכתב בניוזוויק:

"בהשוואה לנוגדי דכאון מהעבר, חומרים מוזרים שרק פסיכיאטרים ומטופליהם ידעו את שמם, השם פרוזק מקובל וידוע לא פחות מקלינקס, יש לפרוזק את המעמד החברתי של מי מעיינות. …. אמריקאים מספרים עליו בארוחות ערב, קריקטורות ומאמרים צוחקים עליו, ואנשים ממליצים עליו לחברים וקרובים מותשים. לאלו עם מודם [בכ"ז, זה היה לפני 20 שנה בדיוק…], יש אפילו אתריי מחשב [קצת אנכרוניזם בתרגום] המוקדשים לו. התרופה שהוצגה ב-1988 ע"י אלי לילי, גורפת כעת 1.2 ביליון דולר בשנה… 'היא עוזרת לאנשים שחשוב להם להירגע'. השאלה היא, אם זה שימוש מתאים  לתרופה משנת תודעה, אם השפעות ארוכות טווח לא ידועות".

ארוכות טווח? ומה עם השפעות קצרות טווח? הן כן היו ידועות? 16 שנה מאוחר יותר, התפרסם באותו שבועון, מאמר שכותרתו היא "מדוע נוגדי דכאון אינם יותר טובים מפלסבו".

Rojier van der Weyden, St. Luke Drawing a Portrait of the Virgin Mary. Detail. c.1435-1440. Oil on wood. The Museum of Fine Arts, Boston, MA, USA.

מטא-אנליזה הינה מחקר הסוקר את הספרות המדעית, ומנסה לבדוק מה ניתן ללמוד מכל מה שהתפרסם על נושא נתון, על ידי חישוב האפקט הממוצע של הטיפול מעבר לכל הניסויים שנמצאו. יתרונה, שהיא מאפשרת את בחינת הנושא בשלמותו, השוואת תוצאות של מחקרים, ומציאת הקונצנזוס. אבל היא מוגבלת למה שפורסם, וסובלת, לכן, מהרבה הטיות, שהמרכזית שבהן היא הטיית אי הפרסום (המוכרת גם בשם הציורי, בעיית המגרה). אם פרסומם של מאמרים תלוי בתוצאה, לדוגמא, רק מאמרים המוצאים שהתרופה עובדת מתפרסמים (והאחרים נשארים במגרה), ברור שמטא האנליזה תשקף תמונה מוטה של המחקר שנערך.

Rojier van der Weyden, Deposition. The Virgin Mary. Detail. c.1435-1440. Oil on panel. Museo del Prado, Madrid, Spain

סקירת ספרות של נוגדי הדיכאון החדשים, הראתה שהדור החדש נוגדי דכאון אינו תרופת פלא, ויתרונם על פני פלסבו הוא קטן, בסביבות חצי סטיית תקן או פחות.

למעשה היה מי שתהו, ולפני קירש, האם יתרונם העיקרי הן על תרופות העבר מחד, והן על פלסבו מאידך, הוא בתופעות הלוואי המועטות. היתרון במיעוט תופעות הלוואי ברור: החולים סובלים פחות, וממשיכים בטיפול יותר. אבל, איך יכולים להיות תופעות הלוואי היתרון של הטיפול התרופתי על הפלסבו?

כדי שפלסבו יעבוד, החולה צריך להאמין שהוא מקבל טיפול נאות. כאשר משווים תרופה לפלסבו, כמחצית החולים מקבלים את התרופה, וכמחציתם מקבלים תרופת דמה, ולכאורה, לא המטופל ולא הצוות הרפואי יודעים מה קיבל החולה. אבל המגבלות האתיות, מחייבות את עורכי הניסוי ליידע את המטופלים, שרק מחציתם יקבלו טיפול, ומה יכולות להיות תופעות הלוואי. לכן, אם החולה סובל מתופעות לוואי, הן הוא והן רופאו, חושדים שהוא מקבל את התרופה, ולכן יש יתרון פסיכולוגי ברור לתרופה עם תופעות לוואי. והעובדה שהן החולים והן המטפלים ידעו לנחש אם הם מטופלים בחומר פעיל או בפלסבו, הוכחה לכאורה כישלונה של תרופה נגד דכאון שאמורה הייתה להיות ללא תופעות לוואי, רק מוכיחה את הטענה.

אך מצד שני היה מי שאמר, שכאשר השתמשו בפלסבו עם תופעות לוואי, לא היה לתופעות הבייניים אפקט אמיתי. אז אולי. הנקודה היא, שדי קשה להראות שמשהו באמת עובד. הלמה, זו כבר ספקולציה.

בכל מקרה, כבר בשלב הזה של הדיון, היה ברור שהאפקט של התרופות הוא משני יותר משל פלסבו. ההערכה הייתה שהאפקט של הטיפול הוא כחצי פלסבו, רבע הזמן הטוב, וכרבע הכימיה.

כדי לכמת את האפקט, משתמשים, שלא במפתיע, במושג של גודל האפקט. גודל האפקט הוא היחס בין ההפרש בממוצעים לסטיית התקן של הערכים. או כמה מוסיף הטיפול יחסית לפיזור הערכים ללא הטיפול.  במקרה של השוואה בין התרופות נוגדות הדיכאון לפלסבו, התקבלה תמונה בערך כזו לפיזור ההפרש בין רמת הדיכאון לאחר הטיפול לרמתו עם התחלת הטיפול (הגרף באחריותי, אבל סדרי הגודל בהתאם לספרות):

הטענות שהמלך הוא ערום, שנוגדי דיכאון אינם משמעותית יותר טובים מפלסבו, והייתה שבירה של העיוורון בניסוי, שיכולה הייתה להשפיע, נשמעו לאורך כל הדרך. וכול זה, שמדובר בסקירת ספרות שניתן לחשוב שהיא מוטה לטובת חברות התרופות.

הספרות לא כל כך תמכה, אבל בכל זאת היא הכירה בכך, שיש אפקט (קטן) לתרופות. אבל, זו רק ראשית הדרך.

Rojier van der Weyden, Portrait of Francesco d'Este. c.1460. Oil on panel. The Metropolitan Museum of Art, New York, USA

בניסוי קליני מסודר מראש מחליטים על פרוטוקול מדויק: איך יבחרו החולים, איך יתנהל הטיפול, מתי הוא יופסק, מתי יופסק הניסוי, איך ינותחו הנתונים, ומהם הם האינדיקטורים עליהם יסתכלו בסוף הטיפול, ולפיהם יקבע באם הטיפול הצליח או נכשל.

הרוב המחולט של הדיון הסטטיסטי מניח שזה המצב. כל מה שמלמדים בשיעוריי סטטיסטיקה, מניח את התסריט הנ"ל, אך רק מעט מאוד מהמחקרים מתפרסמים, נעשו בדרך זו.

יוצאים מהכלל הם ניסויים לאישור תרופות. רשות התרופות והמזון האמריקאית (FDA), דורשת שניסוייים יתנהלו לפי הפרוטוקול. על חברות התרופות להודיע מראש על הפרוטוקול, ועליהן לדווח על תוצאות הניסוי, ולא משנה מה שהן תהיינה. עוד יתרון לנתונים המקוריים, הרשות חייבה את כל המחקרים להתבסס על אותה סקלה, של שאלון המילטון עם 17 שאלות.

כלי המדידה העיקרי של דיכאון הוא הסקלה של המילטון, בה הבודק ממלא שאלון על מצבו של הנבדק לאחר ראיון של כ-20 דקות. רמת הדיכאון נקבעת לפי סה"כ הנקודות שהצטברו (0 עד 2 או עד 4 לכל שאלה):

תחום

הגדרה

0-7

נורמלי

8-13

קל

14-18

בינוני

19-22

קשה

23-50

קשה מאוד

 

המטא-אנליזות של תרופות אנטי דיכאון, אלו שהתפרסמו עד ראשית המאה הנוכחית, התייחסו רק לתוצאות שהתפרסמו. אבל הרוב המחולט של הניסויים מתבצעים על ידי חברות התרופות, ולאלו יש אינטרס לפרסם מאמרים שהם אמת ושום דבר פרט לאמת. על שקרים נתפסים ומשלמים מחיר כבד (במדינות מסוימות לפחות, נראה מה יקרה לחברה הקבלנית שלא שמה מספיק ברזל במרפסותיה). אבל החובה לפרסם את "כל האמת", היא כבר פחות ברורה.

Rojier van der Weyden (workshop), Portrait of a Lady. c.1465. Oil on panel. National Gallery, London,

כאן נכנס לתמונה חוק חופש המידע. בתחילת המאה, רשות המזון והתרופות נתבקשה לשחרר את כל הנתונים שברשותה לגבי הניסויים הקליניים של נוגדי דיכאון. למרבה ההפתעה, כל הנתונים מהמחקרים שדווחו ל-FDA שוחררו בשלמותם. כעת ניתן היה לבצע מטא-אנליזה שלמה. ומעניין היה להשוות את מה שהיה ידוע לפני שחרור הנתונים למה שהסתבר לאחריהם.

התמונה שהתקבלה היתה הרבה פחות מחמיאה לטיפול התרופתי. האפקט של הטיפול התרופתי הוא 2 נקודות יותר על סולם המילטון מעל מה שמתקבל מפלסבו בלבד. תזכרו את טווח הציונים על הסקלה, כפי שהם מופיעים למעלה, מדובר בכשליש טווח של קטגוריה.  זהו הבדל משמעותי סטטיסטית, אבל חסר משמעות קלינית (3 נקודות נחשב לסף המשמעות), ולא ברור, כאמור, אם הוא נובע מהכימיה, או משבירת העיוורון בעזרת תופעות הלוואי. יתרה מזו, כיוון שהסולם כולל שאלות שרק בעקיפין קשורות בדיכאון (לדוגמא, 6 נקודות לבעיות שינה, 4 לחרדה, ו-2 לאובדן משקל), הרי לא ברור מלכתחילה, שהחומרים הכימיים רלוונטיים לדיכאון, ושלא מדובר רק באפקט מרגיע (וחומרים כימיים אחרים, כמו אלכוהול וחשיש היו מצליחים לא פחות).

התמונה שהסתברה סוכמה במטא-אנליזה שהתפרסמה ב-2010:

 "בין חולים עם ציון המילטון פחות מ-23, … גודל האפקט נמצא כפחות מ-0.2 (אפקט קטן בהגדרה המקובלת). אומדני גודל היתרון של טיפול תרופתי על פלסבו עולים כפונקציה של ציון המילטון ההתחלתי, וחוצים את הסף של טיפול בעל משמעות בערך המילטון תחילי של 25)"

נזכור ש-23 הינו הערך המינימלי של דכאון קשה מאוד. לא הדיכאון של הלוזר מהמשרד ליד.

יתרה מכך, האפקטיביות היחסית של הטיפול אצל המקרים הקשים ממש, לא נובעת, כנראה, מכך שהתרופה הופכת ליעילה יותר, אלא מזה שאצל מקרים אלו, אפקט הפלסבו נחלש. (שאם אני מבין את הטענה, פירושה שהטיפול הכימי ממשי, ואי האיזון הכימי יש בו משהו, אבל, כך טוענים, הפלסבו ממשי כמעט באותה מידה, ולכן, כיוון שאיני פסיכיאטר אסתפק ואומר, שאני לא מוצא את הטיעון של קירש עקיב).

ישנה גם השאלה האם ההתייחסות להפרש בציון המילטון לפני ואחרי הטיפול מוצדק, או שמא יש מקום להתייחס ליחס (ואז "היעילות" במקרים הקשים יכולה להעלם). במחלות אחרות, היה בסיס לטענה שהסקלה היחסית (או הלוגריתמית) היא הסקלה הנכונה.

Rojier van der Weyden, Portrait of a Man. c.1455-1460. Oil on panel. Thyssen-Bornemisza Collection, Madrid, Spai

סטטיסטיקת הניסויים היא כזו. ל-FDA דווח על 74 ניסויים ב-12 תרופות עם סה"כ  12,564 משתתפים. מתוכם, פורסמו בכתבי עת מדעיים תוצאות של 51 מחקרים בלבד. אבל, כמובן, הפרסום לא היה מקרי.

מתוך 38 מחקרים שרשות התרופות והמזון העריכה כבעלי תוצאה חיובית, 37 פורסמו, ואחד לא. מתוך שאר 36 המחקרים, אלו שה-FDA העריכה כלא תומכים ביעילות הטיפול התרופתי, 22 לא פורסמו כלל, ו-11 פורסמו בצורה שעיוותה את התוצאות, ונראו כתומכים בתרופה. בקיצור, 94% מהמאמרים בספרות נראו כתומכים בתרופות האנטי דפרסיביות, לעומת 51% מהמחקרים כפי שהוצגו לפני ה-FDA.

לא ברור, איזה חלק מההטיה נובע מחוסר רצונן של חברות התרופות לספר את כל האמת, ואיזה חלק נובע, מנטייתם הברורה והחד משמעית של עיתונים לא לפרסם תוצאות "שליליות". קשה מאוד לפרסם מאמר עם ממצא שפלסבו יותר טוב מחומר פעיל, או שמאמר המסביר שהחוקר לא הצליחו לשחזר תוצאה "ידועה".

גודל האפקט של תרופות הדור החדש המתקבל מהמאמרים שפורסמו בעתונות המדעית גדול בממוצע ב-31% מגודל האפקט של המחקרים שהוגשו ל-FDA. ונזכור, גם לפני שחרור נתוני ה-FDA, הערכה הייתה שהאפקט של נוגדי הדיכאון משני…

Rojier van der Weyden, Seven Sacraments Altarpiece. Virgin Mary and St. John. Detail of the cental part. c.1445-1450. Oil on panel. Koninklijk Museum voor Schone Kunsten, Antwerp, Belgium.

איך אפשר להפוך מחקר שתוצאותיו שליליות למחקר שתוצאותיו חיוביות, יתמה הקורא, ואשיב, שאין קל מזה, וזו פרקטיקה רגילה. הנה רשימת דרכים שננקטו במקרה של הדפרסיה (הדוגמאות בסוגריים הם שלי):

  1.  המאמר התרכז בתוצאה שהוגדרה מראש כתוצאה משנית, או שלא הוגדרה מראש כלל (לדוגמא, מראש אמורים היו החוקרים להשוות את הקבוצות לאחר שלשה חודשים, לעומת זאת, במאמר משווים אותן אחרי חודשיים).
  2. המחקר התנהל במספר מרכזים אך פורסמו תוצאות ממרכז בודד.
  3.  ריכזו תוצאות משני מחקרים, כאילו היו ממחקר בודד.
  4. פורסמו תוצאות של תת-קבוצה של החולים המקוריים (לדוגמא, מקרים קשים בלבד).
  5. תוצאה שבפרוטוקול המקורי הייתה מספרית (לדוגמא, הציון בשאלון של המילטון), הוצגה כתוצאה בינארית (לדוגמא, היה/לא היה שינוי גדול מ-3 נקודות).
  6. פרסמו מובהקות חד צדדית, בעוד שמראש דובר על דו צדדי (ובכך, הופכים תוצאה לא מובהקת למובהקת).
  7. השתמשו במבחן סטטיסטי שונה מזה שהוצהר עליו מראש (לדוגמא, מבחן לא פרמטרי, במקום ANOVA סטנדרטית).

ברגע, שמרחיבים את האפשרויות, ברגע שבודקים הרבה דברים, מה שמוצג כמובהק, כנראה אינו כזה.

אבל, כל קו המאמרים שהתייחסתי אליו לא טוען, שהבעיה נעוצה רק בחברות התרופות. למעשה,  הביקורת על המחקר הציבורי הגדול STAR*D היא לא פחותה. במחקר זה ניסו לקחת חולים "אמיתיים" (4041 מהם), ולבדוק את העלמות סימניי המחלה לאורך תקופה, תוך שינוי הטיפול התרופתי אם הטיפול לא הצליח (אתגר סטטיסטי מושלם…). הבעיה גם כאן, כנראה, היא הצגת הטיפול כאילו שהצליח יותר, ממה שכנראה אפשר שהיה בנתונים. מאחר ש-35 מיליון דולר מכספי הציבור הושקעו במחקר, סביר היה לצפות שהחוקרים ישתדלו להגיע לתוצאות משמעותיות. גם כאן, לא נראה היה שיש אפקט של הטיפול הספציפי על ההצלחה (קירש מאוד מתלהב מכך ששיעוריי ההצלחה של הטיפולים השונים זהים, מה שלכאורה מרמז, שהם באמת לא עושים כלום). אחת הבעיות הגדולות במחקר הזה, הוא שיעור הנשירה הגבוה (היו יותר נושרים ממקרים מוצלחים), ואיך מתייחסים לנושרים. צורת ההתייחסות, בדיעבד, מאפשר ניפוח תוצאות, והצגתן כטובות יותר ממה שהן באמת.

זה היה הפרק השלישי מתוך ארבעה בסדרה:

רגרסיה לממוצע, או מה שהווה, הוא שלא יהיה

ניסויים קליניים, כי בחיים זה אחרת

עלייתו הנמנעת של הפרוזק – על דכאון, תרופות, והטיית פרסום

פלסבו ומיגרנה, מה שיש, ומה שאין בו

מודעות פרסומת