How many stratification factors are "too many" to use in a randomization plan?
Stratified randomization for clinical trials
Thrombectomy for Stroke at 6 to 16 Hours with Selection by Perfusion Imaging
רנדומיזציה תפעל פחות טוב כאשר מדובר במספר משתתפים קטן (או בניתוח ביניים עם מספר משתתפים קטן). במצב זה גם רנדומיזציה טובה יכולה לייצר שתי קבוצות שונות אחת מהשניה. ריבוד, סטרטיפיקציה, באה לנסות לפתור בעיה זו. הריבוד יעיל כאשר הוא מתבצע עם בלוקים, שיטה שבה האנשים ברובד מסוים (למשל, צעירים) יתחלקו בצורה שווה בין קבוצת ההתערבות לקבוצת הטיפול. ריבוד של משתנים רבים מדי עלול לייצר רבדים קטנטנים, שבהם חלוקה שווה בין הקבוצות לא תמיד אפשרית, ולכן כדאי לצמצם את מספר המשתנים עבורם יש ריבוד למשתנים בודדים- אלו עם ההשפעה הצפויה הגדולה ביותר. כאשר יש צורך בריבוד עבור משתנים מרובים אפשר להשתמש במזעור (מינימיזציה) בזמן הרנדומיזציה, או ברגרסיה רבת משתנים בשלב ניתוח הנתונים.
Small sample size
Interim analysis
Stratification
Permuted blocks
Minimization
How many stratification factors are "too many" to use in a randomization plan?
Stratified randomization for clinical trials
Thrombectomy for Stroke at 6 to 16 Hours with Selection by Perfusion Imaging
רנדומיזציה תפעל פחות טוב כאשר מדובר במספר משתתפים קטן (או בניתוח ביניים עם מספר משתתפים קטן). במצב זה גם רנדומיזציה טובה יכולה לייצר שתי קבוצות שונות אחת מהשניה. ריבוד, סטרטיפיקציה, באה לנסות לפתור בעיה זו. הריבוד יעיל כאשר הוא מתבצע עם בלוקים, שיטה שבה האנשים ברובד מסוים (למשל, צעירים) יתחלקו בצורה שווה בין קבוצת ההתערבות לקבוצת הטיפול. ריבוד של משתנים רבים מדי עלול לייצר רבדים קטנטנים, שבהם חלוקה שווה בין הקבוצות לא תמיד אפשרית, ולכן כדאי לצמצם את מספר המשתנים עבורם יש ריבוד למשתנים בודדים- אלו עם ההשפעה הצפויה הגדולה ביותר. כאשר יש צורך בריבוד עבור משתנים מרובים אפשר להשתמש במזעור (מינימיזציה) בזמן הרנדומיזציה, או ברגרסיה רבת משתנים בשלב ניתוח הנתונים.
Small sample size
Interim analysis
Stratification
Permuted blocks
Minimization
Thrombectomy for Stroke at 6 to 16 Hours with Selection by Perfusion Imaging
גם שעות רבות לאחר הופעת התסמינים של אירוע מוחי ניתן לעתים לשפר משמעותית את התוצאה התפקודית בעזרת שליפת קריש הדם בצנתור.
אחד המחקרים שהדגים זאת פורסם ב 2018. המחקר גייס אנשים עם חסימת עורק הקרוטיד הפנימי או העורק המוחי האמצעי, שיכלו להגיע לתרומבקטומיה בין 6 ל 16 שעות לאחר האוטם, ושבהדמיית פרפוזיה אצלם הודגמה רקמת מח איסכמית שעדיין ניתנת להצלה. כל המטופלים קיבלו טיפול תרופתי, ובקבוצת ההתערבות בוצעה גם תרומבקטומיה. לאחר 90 יום שיעור אלו עם שיקום טוב בקבוצת ההתערבות היה 45%, לעומת רק 17% בקבוצת הביקורת. היו הבדלים קטנים בין שתי הקבוצות בבסיס, לרעת קבוצת הביקורת, והמחקר היה פתוח (ללא סמיות)
Thrombectomy
Cerebrovascular accident
Middle cerebral artery
Internal carotid artery
Randomized controlled trial
Non-blinded study
Rankin scale
Thrombectomy for Stroke at 6 to 16 Hours with Selection by Perfusion Imaging
גם שעות רבות לאחר הופעת התסמינים של אירוע מוחי ניתן לעתים לשפר משמעותית את התוצאה התפקודית בעזרת שליפת קריש הדם בצנתור.
אחד המחקרים שהדגים זאת פורסם ב 2018. המחקר גייס אנשים עם חסימת עורק הקרוטיד הפנימי או העורק המוחי האמצעי, שיכלו להגיע לתרומבקטומיה בין 6 ל 16 שעות לאחר האוטם, ושבהדמיית פרפוזיה אצלם הודגמה רקמת מח איסכמית שעדיין ניתנת להצלה. כל המטופלים קיבלו טיפול תרופתי, ובקבוצת ההתערבות בוצעה גם תרומבקטומיה. לאחר 90 יום שיעור אלו עם שיקום טוב בקבוצת ההתערבות היה 45%, לעומת רק 17% בקבוצת הביקורת. היו הבדלים קטנים בין שתי הקבוצות בבסיס, לרעת קבוצת הביקורת, והמחקר היה פתוח (ללא סמיות)
Thrombectomy
Cerebrovascular accident
Middle cerebral artery
Internal carotid artery
Randomized controlled trial
Non-blinded study
Rankin scale
The American Heart Association PREVENT™ Online Calculator
Development and Validation of the American Heart Association’s PREVENT Equations
המחקר הישראלי:
הסי-סטטיסטיק מודד יכולת הפרדה של כלי לחיזוי. מתוך כל הזוגות ברי ההשוואה, שבהם משתתף אחד חלה ומשתתף שני לא חלה (או חלה מאוחר יותר), באיזה אחוז הכלי אכן נתן ציון גבוה יותר (גרוע יותר) למשתתף הראשון. הוא דומה מאוד לשטח תחת העקומה המשמש למדידת יכולת ההפרדה של בדיקה אבחנתית, וגם לאחוז המקרים בהם פרשן ספורט נתן מראש ציון גבוה יותר למשתתפת שתנצח במשחק הטניס לעומת הציון לזו שתפסיד. במודלים לחיזוי, משתמשים בסי-סטטיסטיק ולא בשטח תחת העקומה. הסיבה היא משך המעקב השונה עבור כל אחד מהמשתתפים, ונתונים הכוללים גם זמן עד אירוע המחלה.
ערך של הסי מעל 0.9 נחשב יכולת הפרדה מצוינת, ועריך שבין 0.7 ל 0.8 נחשב כיכולת הפרדה סבירה.
Discrimination
Harrell’s c index= “c-statistic”
AUROC-area under the ROC curve
PREVENT score for predicting cardiovascular disease
The American Heart Association PREVENT™ Online Calculator
Development and Validation of the American Heart Association’s PREVENT Equations
המחקר הישראלי:
הסי-סטטיסטיק מודד יכולת הפרדה של כלי לחיזוי. מתוך כל הזוגות ברי ההשוואה, שבהם משתתף אחד חלה ומשתתף שני לא חלה (או חלה מאוחר יותר), באיזה אחוז הכלי אכן נתן ציון גבוה יותר (גרוע יותר) למשתתף הראשון. הוא דומה מאוד לשטח תחת העקומה המשמש למדידת יכולת ההפרדה של בדיקה אבחנתית, וגם לאחוז המקרים בהם פרשן ספורט נתן מראש ציון גבוה יותר למשתתפת שתנצח במשחק הטניס לעומת הציון לזו שתפסיד. במודלים לחיזוי, משתמשים בסי-סטטיסטיק ולא בשטח תחת העקומה. הסיבה היא משך המעקב השונה עבור כל אחד מהמשתתפים, ונתונים הכוללים גם זמן עד אירוע המחלה.
ערך של הסי מעל 0.9 נחשב יכולת הפרדה מצוינת, ועריך שבין 0.7 ל 0.8 נחשב כיכולת הפרדה סבירה.
Discrimination
Harrell’s c index= “c-statistic”
AUROC-area under the ROC curve
PREVENT score for predicting cardiovascular disease
Common Diseases in Clinical Cohorts — Not Always What They Seem
במבוגרים עם מחלת מעי דלקתית, טרשת נפוצה או דרמטיטיס אטופי, האם אולי מדובר באבחנה אחרת, נדירה? כאשר בוצע ריצוף גנים רלוונטים, התגלו אצל שיעור לא זניח מחולים אלו מחלות גנטיות נדירות שמסבירות את התסמינים. מדובר באחוז עד חמישה אחוז, תלוי במדגם שנבדק ובמחלה. ייתכן שבחלק מהמקרים המחלה הגנטית נוספת לאבחנה הנכונה, אך בחלק אחר מדובר בטעות אבחנתית. טעות אבחנתית כזו יכולה להוביל לטיפול מיותר ולהחמצת הזדמנויות טיפול טובות יותר, ויש לטעות כזו גם השלכות על מחקר רפואי. ניתן לגלות את האבחנה הנכונה בעזרת ריצוף של גנים הקשורים לתפקוד המערכת הרלוונטית, חיפוש שינויים נקודתיים באותם גנים, והערכה האם מדובר בשינויים פתוגניים.
SNV- single nucleotide variation
Rare genetic diseases
likely pathogenic variant
OMIM
UK biobank
Multiple sclerosis
Inflammatory bowel disease
Atopic dermatitis
CVID- Common Variable Immunodeficiency
Ichthyosis vulgaris
CADASIL
Common Diseases in Clinical Cohorts — Not Always What They Seem
במבוגרים עם מחלת מעי דלקתית, טרשת נפוצה או דרמטיטיס אטופי, האם אולי מדובר באבחנה אחרת, נדירה? כאשר בוצע ריצוף גנים רלוונטים, התגלו אצל שיעור לא זניח מחולים אלו מחלות גנטיות נדירות שמסבירות את התסמינים. מדובר באחוז עד חמישה אחוז, תלוי במדגם שנבדק ובמחלה. ייתכן שבחלק מהמקרים המחלה הגנטית נוספת לאבחנה הנכונה, אך בחלק אחר מדובר בטעות אבחנתית. טעות אבחנתית כזו יכולה להוביל לטיפול מיותר ולהחמצת הזדמנויות טיפול טובות יותר, ויש לטעות כזו גם השלכות על מחקר רפואי. ניתן לגלות את האבחנה הנכונה בעזרת ריצוף של גנים הקשורים לתפקוד המערכת הרלוונטית, חיפוש שינויים נקודתיים באותם גנים, והערכה האם מדובר בשינויים פתוגניים.
SNV- single nucleotide variation
Rare genetic diseases
likely pathogenic variant
OMIM
UK biobank
Multiple sclerosis
Inflammatory bowel disease
Atopic dermatitis
CVID- Common Variable Immunodeficiency
Ichthyosis vulgaris
CADASIL
Use of Brier score to assess binary predictions
Expert-Level Detection of Epilepsy Markers in EEG on Short and Long Timescales
המאמר המקורי של בראייר:
VERIFICATION OF FORECASTS EXPRESSED IN TERMS OF PROBABILITY
הן במודל בינה מלאכותית והן כאשר מדובר על בדיקה אבחנתית שמבצעת תחזית ונותנת את התוצאה באחוזים, ניתן לבדוק את הקליברציה גם בעזרת ציון בראייר, שנקבע לפי ההפרש בין התחזית עבור תצפית מסוימת לבין התוצאה בפועל. גם התחזית וגם התוצאה נמדדות באחוזים, או בשבר עשרוני, אך לעומת התחזית שיכולה להיות כל מספר בין 0 ל 1, התוצאה בפועל כאשר מדובר על תוצא דיכוטומי יכולה להיות רק אחד משני הערכים- או 0 או 1. ציון בראייר משתמש בהפרשים האלו, עבור כל התצפיות, וממצע אותם. ככל שהבדיקה היא עם קליברציה טובה יותר, הציון יהיה קטן יותר. לרוב גרף קליברציה טוב יגיע יחד עם ציון בראייר נמוך (טוב), אך לא תמיד.
Brier score
Calibration
Machine learning
Training set
Validation set
EEG
Spikes
Use of Brier score to assess binary predictions
Expert-Level Detection of Epilepsy Markers in EEG on Short and Long Timescales
המאמר המקורי של בראייר:
VERIFICATION OF FORECASTS EXPRESSED IN TERMS OF PROBABILITY
הן במודל בינה מלאכותית והן כאשר מדובר על בדיקה אבחנתית שמבצעת תחזית ונותנת את התוצאה באחוזים, ניתן לבדוק את הקליברציה גם בעזרת ציון בראייר, שנקבע לפי ההפרש בין התחזית עבור תצפית מסוימת לבין התוצאה בפועל. גם התחזית וגם התוצאה נמדדות באחוזים, או בשבר עשרוני, אך לעומת התחזית שיכולה להיות כל מספר בין 0 ל 1, התוצאה בפועל כאשר מדובר על תוצא דיכוטומי יכולה להיות רק אחד משני הערכים- או 0 או 1. ציון בראייר משתמש בהפרשים האלו, עבור כל התצפיות, וממצע אותם. ככל שהבדיקה היא עם קליברציה טובה יותר, הציון יהיה קטן יותר. לרוב גרף קליברציה טוב יגיע יחד עם ציון בראייר נמוך (טוב), אך לא תמיד.
Brier score
Calibration
Machine learning
Training set
Validation set
EEG
Spikes
Aspirin in Patients with Chronic Coronary Syndrome Receiving Oral Anticoagulation
Antithrombotic Therapy for Atrial Fibrillation with Stable Coronary Disease
קווים מנחים בנושא שהתפרסמו השנה, אך לפני מחקר זה:
מחקר השנה שלי עוסק בבעיה קלינית משמעותית ונפוצה, בהחלטה בעלת משמעות רבה לחיי המטופלים, ותוצאותיו סותרות תפיסות פיזיולוגיות ופרמקולוגיות קודמות.
Medical reversal
Dual therapy
Anticoagulant therapy
Antiplatelet therapy
Aspirin
Loss to follow up
Aspirin in Patients with Chronic Coronary Syndrome Receiving Oral Anticoagulation
Antithrombotic Therapy for Atrial Fibrillation with Stable Coronary Disease
קווים מנחים בנושא שהתפרסמו השנה, אך לפני מחקר זה:
מחקר השנה שלי עוסק בבעיה קלינית משמעותית ונפוצה, בהחלטה בעלת משמעות רבה לחיי המטופלים, ותוצאותיו סותרות תפיסות פיזיולוגיות ופרמקולוגיות קודמות.
Medical reversal
Dual therapy
Anticoagulant therapy
Antiplatelet therapy
Aspirin
Loss to follow up
Evaluating Prediction Model Performance
Evaluation metrics and statistical tests for machine learning
///
כאשר מעריכים ביצועים של מודל בינה מלאכותית המבצע קלסיפיקציה לשני מצבים (למשל, גבר או אשה בתמונה, דלקת ריאות או העדר דלקת ריאות בצילום), משתמשים באותה טבלת שכיחויות המוכרת לנו מהערכת ביצועי בדיקה אבחנתית. גם בחקר ביצועי הבינה וגם ברפואה הנתונים הגולמיים (כמו למשל שיעור בדיקה חיובית כוזבת) נקראים באותו שם. אך כאשר מדובר במדדי ביצוע מורכבים, השמות משתנים. במקום רגישות, משתמשים במונח ריקול, ובמקום ערך מנבא חיובי, במונח פרסיז'ן. בניגוד לרפואה ולמחקר על בדיקות רפואיות, במדידת ביצועי מודל בינה מלאכותית משתמשים הרבה גם במדד המתייחס בבת אחת גם לרגישות וגם לערך המנבא החיובי, מדד 1F, שהוא ממוצע הרמוני של שני אלו. ממוצע הרמוני "מעניש" עבור ערך נמוך, זאת אומרת יהיה קרוב יותר לערך הנמוך יותר מבין שני הערכים.
Accuracy
True/false positive/negative
Positive predictive value=Precision
Sensitivity=Recall
F1
AUROC
AUPRC
Evaluating Prediction Model Performance
Evaluation metrics and statistical tests for machine learning
///
כאשר מעריכים ביצועים של מודל בינה מלאכותית המבצע קלסיפיקציה לשני מצבים (למשל, גבר או אשה בתמונה, דלקת ריאות או העדר דלקת ריאות בצילום), משתמשים באותה טבלת שכיחויות המוכרת לנו מהערכת ביצועי בדיקה אבחנתית. גם בחקר ביצועי הבינה וגם ברפואה הנתונים הגולמיים (כמו למשל שיעור בדיקה חיובית כוזבת) נקראים באותו שם. אך כאשר מדובר במדדי ביצוע מורכבים, השמות משתנים. במקום רגישות, משתמשים במונח ריקול, ובמקום ערך מנבא חיובי, במונח פרסיז'ן. בניגוד לרפואה ולמחקר על בדיקות רפואיות, במדידת ביצועי מודל בינה מלאכותית משתמשים הרבה גם במדד המתייחס בבת אחת גם לרגישות וגם לערך המנבא החיובי, מדד 1F, שהוא ממוצע הרמוני של שני אלו. ממוצע הרמוני "מעניש" עבור ערך נמוך, זאת אומרת יהיה קרוב יותר לערך הנמוך יותר מבין שני הערכים.
Accuracy
True/false positive/negative
Positive predictive value=Precision
Sensitivity=Recall
F1
AUROC
AUPRC
לאחר העיבוד ברמת הנוירון המלאכותי הבודד, המסר עובר הלאה ברשת ה"נוירונים" ובסופו של דבר מתקבלת תחזית. בין התחזית לבין האמת ייתכן פער. המערכת מזהה את הפער בעזרת פונקציית ההפסד, ומעבירה היזון חוזר ("הפצה לאחור") כדי לתקן את המשקלים שכל אחד מהנוירונים המלאכותיים נותן לקלטים שלו. התהליך חוזר שוב ושוב עד הגעה למצב מיטבי שבו הפער בין התחזית לאמת הוא הקטן ביותר.
התהליך של משוב מוכר לנו מהמערכת האנדוקרינית, למשל השליחה "קדימה" של הורמון בלוטת התריס והמידע "החוזר לאחור" הנשלח מההיפופיזה חזרה לבלוטת התריס לגבי צורך בתיקון. בלימוד הרפואה יש תהליך דומה מאוד לתהליך בבינה המלאכותית: הלומד נותן משקלים שונים לאנמנזה, לבדיקה הגופנית ולבדיקות המעבדה. המשקלים האלו מובילים אותו להחלטה על האבחנה המשוערת. המנטורית מזהה פערים בין ההחלטות של הלומד לבין ההחלטות הנכונות, ונותנת לו משוב שיאפשר לו לתת משקל קצה שונה לכל אחד מהקלטים שהוא מקבל, למשל מתן משקל גדול יותר לאנמנזה. חזרה שוב ושוב על התהליך הזה מול מטופלים שונים תהפוך את הלומד למומחה.
Loss function
Back propagation
Mentoring
Machine learning
Multiplication and accumulation unit
Activation unit
Artificial neuron
Perceptron
Decision
לאחר העיבוד ברמת הנוירון המלאכותי הבודד, המסר עובר הלאה ברשת ה"נוירונים" ובסופו של דבר מתקבלת תחזית. בין התחזית לבין האמת ייתכן פער. המערכת מזהה את הפער בעזרת פונקציית ההפסד, ומעבירה היזון חוזר ("הפצה לאחור") כדי לתקן את המשקלים שכל אחד מהנוירונים המלאכותיים נותן לקלטים שלו. התהליך חוזר שוב ושוב עד הגעה למצב מיטבי שבו הפער בין התחזית לאמת הוא הקטן ביותר.
התהליך של משוב מוכר לנו מהמערכת האנדוקרינית, למשל השליחה "קדימה" של הורמון בלוטת התריס והמידע "החוזר לאחור" הנשלח מההיפופיזה חזרה לבלוטת התריס לגבי צורך בתיקון. בלימוד הרפואה יש תהליך דומה מאוד לתהליך בבינה המלאכותית: הלומד נותן משקלים שונים לאנמנזה, לבדיקה הגופנית ולבדיקות המעבדה. המשקלים האלו מובילים אותו להחלטה על האבחנה המשוערת. המנטורית מזהה פערים בין ההחלטות של הלומד לבין ההחלטות הנכונות, ונותנת לו משוב שיאפשר לו לתת משקל קצה שונה לכל אחד מהקלטים שהוא מקבל, למשל מתן משקל גדול יותר לאנמנזה. חזרה שוב ושוב על התהליך הזה מול מטופלים שונים תהפוך את הלומד למומחה.
Loss function
Back propagation
Mentoring
Machine learning
Multiplication and accumulation unit
Activation unit
Artificial neuron
Perceptron
Decision
ביחידות כמו רופא שמבצע שיקול קליני, מחקר המשתמש ברגרסיה לחיזוי, נוירון או פרספטרון- יש רכיב אחד שמבצע מכפלה ואז סיכום, ורכיב נוסף שמבצע החלטה מתמטית מה לעשות עם הסכום שהתקבל, למשל האם להפנות למיון, האם להעביר את המסר באקסון או האם להעביר את המסר החשמלי הלאה.
Perceptron
MAC unit
Activation unit
Decision
Neural network
Threshold
Clinical reasoning
Weighting
Neuron
Neuron’s soma
Membrane potential
Dendrites
Axon
Artificial Intelligence
Linear regression
Logistic regression
Learning
Weights/coefficients
Sum
Constant
ביחידות כמו רופא שמבצע שיקול קליני, מחקר המשתמש ברגרסיה לחיזוי, נוירון או פרספטרון- יש רכיב אחד שמבצע מכפלה ואז סיכום, ורכיב נוסף שמבצע החלטה מתמטית מה לעשות עם הסכום שהתקבל, למשל האם להפנות למיון, האם להעביר את המסר באקסון או האם להעביר את המסר החשמלי הלאה.
Perceptron
MAC unit
Activation unit
Decision
Neural network
Threshold
Clinical reasoning
Weighting
Neuron
Neuron’s soma
Membrane potential
Dendrites
Axon
Artificial Intelligence
Linear regression
Logistic regression
Learning
Weights/coefficients
Sum
Constant
Immunogenicity as a Predictor of Influenza Vaccine Efficacy: A Systematic Review
עד כה יש מעט מאוד מחקר מדעי על תת הזן החדש של שפעת, קיי (שהוא שבט מתוך המטה H3N2). מחקר מאנגליה בדקת אימונוגניות של תתי זנים קודמים כנגד זן זה במעבדה (בעזרת "הדבקת דם"), ואת מועילות חיסון 2025-2026 כנגד זן זה בעזרת מחקר מקרה בקרה בקרב אנשים שבצעו בדיקה לשפעת.
Vaccine effectiveness
Immunogenicity
Type, subtype, subclade, strain
Hemagglutination inhibition
Hemagglutinin
Vaccine effectiveness
Unmeasured bias
Social distancing
Negative test case control
Influenza A(H3N2) subclade K
Immunogenicity as a Predictor of Influenza Vaccine Efficacy: A Systematic Review
עד כה יש מעט מאוד מחקר מדעי על תת הזן החדש של שפעת, קיי (שהוא שבט מתוך המטה H3N2). מחקר מאנגליה בדקת אימונוגניות של תתי זנים קודמים כנגד זן זה במעבדה (בעזרת "הדבקת דם"), ואת מועילות חיסון 2025-2026 כנגד זן זה בעזרת מחקר מקרה בקרה בקרב אנשים שבצעו בדיקה לשפעת.
Vaccine effectiveness
Immunogenicity
Type, subtype, subclade, strain
Hemagglutination inhibition
Hemagglutinin
Vaccine effectiveness
Unmeasured bias
Social distancing
Negative test case control
Influenza A(H3N2) subclade K
Beta-Blockers after Myocardial Infarction with Normal Ejection Fraction
כהמשך לשני המחקרים שהוצגו לאחרונה בפודקאסט על חסמי בטא.
מטא אנליזה על חמישה מחקרים ובהם כ 18 אלף איש, בדקה תועלת חסם בטא במטופלים לאחר התקף לב עם תפקוד חדר שמאל תקין. התוצא היה מורכב (התקף לב, מוות או אי ספיקת לב) ולאחר מעקב חציוני של שלוש וחצי שנים לא נראתה תועלת מובהקת לטיפול. למרות זאת, הרווח בר סמך כלל גם אפשרות של תועלת משמעותית קלינית, וכיוון שהיה מעבר מטופלים מזרוע טיפול אחת לשניה יש ספק מסוים בממצאי המחקרים. בינתיים עדיין אין שינוי בהנחיות הקליניות ורוב המטופלים לאחר התקף לב אמורים לקבל חסם בטא אם אין התוויות נגד.
Beta blockers
Myocardial infarction with preserved ejection fraction
Meta analysis
Beta-Blockers after Myocardial Infarction with Normal Ejection Fraction
כהמשך לשני המחקרים שהוצגו לאחרונה בפודקאסט על חסמי בטא.
מטא אנליזה על חמישה מחקרים ובהם כ 18 אלף איש, בדקה תועלת חסם בטא במטופלים לאחר התקף לב עם תפקוד חדר שמאל תקין. התוצא היה מורכב (התקף לב, מוות או אי ספיקת לב) ולאחר מעקב חציוני של שלוש וחצי שנים לא נראתה תועלת מובהקת לטיפול. למרות זאת, הרווח בר סמך כלל גם אפשרות של תועלת משמעותית קלינית, וכיוון שהיה מעבר מטופלים מזרוע טיפול אחת לשניה יש ספק מסוים בממצאי המחקרים. בינתיים עדיין אין שינוי בהנחיות הקליניות ורוב המטופלים לאחר התקף לב אמורים לקבל חסם בטא אם אין התוויות נגד.
Beta blockers
Myocardial infarction with preserved ejection fraction
Meta analysis
המחקר שמתוכו נוצר סולם החיזוי לצירוזיס הוא בעל תקפות נמוכה אם מסתכלים עליו כמחקר על בדיקה אבחנתית. הדבר נובע בעקר משיטת מחקר המתבססת רטרוספקטיבית על נתונים הקיימים בתיק הממוחשב. במקום להשתמש בגולד סטנדרט לצירוזיס, השתמשו באבחנות שנרשמו בתיקים הרפואיים. במקום לוודא קלינית שבתחילת המחקר אין לאנשים מחלת כבד, השתמשו בהעדר אבחנה בתיק הרפואי כסימן לכך. בנוסף, הייתה תלות בין בדיקת האבחנה לבין ביצוע בדיקה ההשוואה, ולא הייתה הסמיה של מבצעי בדיקת ההשוואה (רופאים שרשמו או שלא רשמו אבחנות הקשורות לצירוזיס) לבדיקה שמעניינת אותנו (למשל, ערכי אנזימי הכבד).
מחקר שמייצר מודל לחיזוי צריך להשתמש גם בקבוצות לאימות, ולידציה. שני מחקרי ולידציה, באנגליה ובפינלנד, הראו תוצאות דומות למחקר המקורי מבחינת קליברציה ורווח נקי מהבדיקה אך תוצאות שונות בדיסקרימינציה של הבדיקה.
במחקרים בהם חסרים נתונים, משתמשים בשיטות סטטיסטיות להשלמת נתונים חסרים. למשל, אפשר לנסות לחזות מתוך מאפיינים אחרים של המטופל מהו ערך של אחד מאנזימי הכבד אצלו, ולהשתמש בערך החזוי בניתוח הסטטיסטי כאילו היה זה ערך אמיתי. במחקר שלנו השתמשו בשיטה דומה להשלמת נתונים חסרים.
Validity of diagnostic study
Gold standard
Representative sample
Dependency of reference test
Blinding of testing
Prediction models
Validation
Imputation
MICE- Multivariate Imputation by Chained Equations
המחקר שמתוכו נוצר סולם החיזוי לצירוזיס הוא בעל תקפות נמוכה אם מסתכלים עליו כמחקר על בדיקה אבחנתית. הדבר נובע בעקר משיטת מחקר המתבססת רטרוספקטיבית על נתונים הקיימים בתיק הממוחשב. במקום להשתמש בגולד סטנדרט לצירוזיס, השתמשו באבחנות שנרשמו בתיקים הרפואיים. במקום לוודא קלינית שבתחילת המחקר אין לאנשים מחלת כבד, השתמשו בהעדר אבחנה בתיק הרפואי כסימן לכך. בנוסף, הייתה תלות בין בדיקת האבחנה לבין ביצוע בדיקה ההשוואה, ולא הייתה הסמיה של מבצעי בדיקת ההשוואה (רופאים שרשמו או שלא רשמו אבחנות הקשורות לצירוזיס) לבדיקה שמעניינת אותנו (למשל, ערכי אנזימי הכבד).
מחקר שמייצר מודל לחיזוי צריך להשתמש גם בקבוצות לאימות, ולידציה. שני מחקרי ולידציה, באנגליה ובפינלנד, הראו תוצאות דומות למחקר המקורי מבחינת קליברציה ורווח נקי מהבדיקה אך תוצאות שונות בדיסקרימינציה של הבדיקה.
במחקרים בהם חסרים נתונים, משתמשים בשיטות סטטיסטיות להשלמת נתונים חסרים. למשל, אפשר לנסות לחזות מתוך מאפיינים אחרים של המטופל מהו ערך של אחד מאנזימי הכבד אצלו, ולהשתמש בערך החזוי בניתוח הסטטיסטי כאילו היה זה ערך אמיתי. במחקר שלנו השתמשו בשיטה דומה להשלמת נתונים חסרים.
Validity of diagnostic study
Gold standard
Representative sample
Dependency of reference test
Blinding of testing
Prediction models
Validation
Imputation
MICE- Multivariate Imputation by Chained Equations
הרווח הנקי מבדיקה תלוי בערך הסף ממנו ומעלה אנו קובעים שהבדיקה חיובית. במודלים לחיזוי, ערך הסף הזה קובע הן את הסבירות לבדיקות חיוביות כוזבות או אמיתיות, והן את "שער החליפין הערכי", ולכן אפשר לחשב לפיו את הרווח הנקי מבדיקה. אך ערך הסף הוא סובייקטיבי מאוד. יהיה מצב שבו רופאה ומטופל יבחרו ערך סף אחד לפעולה ורופא ומטופלת אחרים ערך סף אחר. עקומת ניתוח ההחלטות עוקפת את הבעיה הזו, בכך שהיא מציגה לנו את הרווח הנקי מהבדיקה עבור טווח רחב של ערכי סף. בציר האופקי נמצא ערך הסף, ובציר האנכי של הגרף, הרווח הנקי מהבדיקה. ככל שהגרף גבוה יותר, כך הרווח הנקי גבוה יותר. עליה בערכי הסף (התקדמות בציר האופקי) מייצגת שער חליפין שבו יש משקל גדול לנזק מהבדיקה (בדיקות חיוביות כוזבות מקבלות יותר משקל), וכמעט תמיד תהיה קשורה לירידה ברווח הנקי מהבדיקה. על אותה מערכת צירים ניתן לבדוק מודל חיזוי אחד לעומת מודל אחר וגם לעומת ברירות מחדל (למשל, לטפל בכולם, או לא לטפל באף אחד).
Decision curve analysis
Net benefit approach to testing
Threshold for a positive test
Exchange rate
True positives/false positives
רווח נקי של בדיקה=
שיעור בדיקות חיוביות אמיתיות (מבין כלל המשתתפים)
פחות
[שיעור בדיקות חיוביות כוזבות (מבין כלל המשתתפים) X שער החליפין*]
*היחס אותו אנחנו מוכנים לסבול בין מספר בדיקות חיוביות אמיתיות למספר בדיקות אמיתיות כוזבות
הרווח הנקי מבדיקה תלוי בערך הסף ממנו ומעלה אנו קובעים שהבדיקה חיובית. במודלים לחיזוי, ערך הסף הזה קובע הן את הסבירות לבדיקות חיוביות כוזבות או אמיתיות, והן את "שער החליפין הערכי", ולכן אפשר לחשב לפיו את הרווח הנקי מבדיקה. אך ערך הסף הוא סובייקטיבי מאוד. יהיה מצב שבו רופאה ומטופל יבחרו ערך סף אחד לפעולה ורופא ומטופלת אחרים ערך סף אחר. עקומת ניתוח ההחלטות עוקפת את הבעיה הזו, בכך שהיא מציגה לנו את הרווח הנקי מהבדיקה עבור טווח רחב של ערכי סף. בציר האופקי נמצא ערך הסף, ובציר האנכי של הגרף, הרווח הנקי מהבדיקה. ככל שהגרף גבוה יותר, כך הרווח הנקי גבוה יותר. עליה בערכי הסף (התקדמות בציר האופקי) מייצגת שער חליפין שבו יש משקל גדול לנזק מהבדיקה (בדיקות חיוביות כוזבות מקבלות יותר משקל), וכמעט תמיד תהיה קשורה לירידה ברווח הנקי מהבדיקה. על אותה מערכת צירים ניתן לבדוק מודל חיזוי אחד לעומת מודל אחר וגם לעומת ברירות מחדל (למשל, לטפל בכולם, או לא לטפל באף אחד).
Decision curve analysis
Net benefit approach to testing
Threshold for a positive test
Exchange rate
True positives/false positives
רווח נקי של בדיקה=
שיעור בדיקות חיוביות אמיתיות (מבין כלל המשתתפים)
פחות
[שיעור בדיקות חיוביות כוזבות (מבין כלל המשתתפים) X שער החליפין*]
*היחס אותו אנחנו מוכנים לסבול בין מספר בדיקות חיוביות אמיתיות למספר בדיקות אמיתיות כוזבות
הרווח הנקי מבדיקה הוא מידת התועלת של הבדיקה, המתבטאת בבדיקות חיוביות אמיתיות, פחות הנזק מהבדיקה, המתבטא בבדיקות חיוביות כוזבות. כדי לבצע חישוב של ההפרש בין שני אלו, צריך לבצע המרה לאותן יחידות. הדרך לבצע את זה היא קביעה (בעזרת מומחיות קלינית, הכרת הנושא, ערכים ומטרות של המטופל) של "שער חליפין ערכי": כמה בדיקות חיוביות כוזבות אנחנו מוכנים לסבול עבור כל בדיקה חיובית אמיתית. שיעור הבדיקות החיוביות הכוזבות מוכפל בשער החליפין כדי שיחידת המדידה תהיה גם שם "יחידות של בדיקות חיוביות אמיתיות", ואז מחסירים ערך זה משיעור הבדיקות החיוביות האמיתיות. רווח נקי חיובי, משמעותו שהמטופל ירוויח מביצוע הבדיקה. במודלים של חיזוי, ערך הסף שמעליו נבצע התערבות או המשך בירור קובע לנו גם את שער החליפין (למשל, אם ערך הסף במודל הוא 2.5%, שער החליפין הוא 1/39) וגם, בעזרת מחקר, מאפשר לנו לדעת מה יהיה שיעור הבדיקות החיוביות האמיתיות ושיעור הבדיקות החיוביות הכוזבות.
רווח נקי של בדיקה=
שיעור בדיקות חיוביות אמיתיות (מבין כלל המשתתפים)
פחות
[שיעור בדיקות חיוביות כוזבות (מבין כלל המשתתפים) X שער החליפין*]
*היחס אותו אנחנו מוכנים לסבול בין מספר בדיקות חיוביות אמיתיות למספר בדיקות אמיתיות כוזבות
Net benefit (of testing)
True positives/ false positives
Exchange rate
הרווח הנקי מבדיקה הוא מידת התועלת של הבדיקה, המתבטאת בבדיקות חיוביות אמיתיות, פחות הנזק מהבדיקה, המתבטא בבדיקות חיוביות כוזבות. כדי לבצע חישוב של ההפרש בין שני אלו, צריך לבצע המרה לאותן יחידות. הדרך לבצע את זה היא קביעה (בעזרת מומחיות קלינית, הכרת הנושא, ערכים ומטרות של המטופל) של "שער חליפין ערכי": כמה בדיקות חיוביות כוזבות אנחנו מוכנים לסבול עבור כל בדיקה חיובית אמיתית. שיעור הבדיקות החיוביות הכוזבות מוכפל בשער החליפין כדי שיחידת המדידה תהיה גם שם "יחידות של בדיקות חיוביות אמיתיות", ואז מחסירים ערך זה משיעור הבדיקות החיוביות האמיתיות. רווח נקי חיובי, משמעותו שהמטופל ירוויח מביצוע הבדיקה. במודלים של חיזוי, ערך הסף שמעליו נבצע התערבות או המשך בירור קובע לנו גם את שער החליפין (למשל, אם ערך הסף במודל הוא 2.5%, שער החליפין הוא 1/39) וגם, בעזרת מחקר, מאפשר לנו לדעת מה יהיה שיעור הבדיקות החיוביות האמיתיות ושיעור הבדיקות החיוביות הכוזבות.
רווח נקי של בדיקה=
שיעור בדיקות חיוביות אמיתיות (מבין כלל המשתתפים)
פחות
[שיעור בדיקות חיוביות כוזבות (מבין כלל המשתתפים) X שער החליפין*]
*היחס אותו אנחנו מוכנים לסבול בין מספר בדיקות חיוביות אמיתיות למספר בדיקות אמיתיות כוזבות
Net benefit (of testing)
True positives/ false positives
Exchange rate
מלבד הדיסקרימינציה , יש לנו שאלה נוספת כדי להחליט האם מדד חיזוי הוא מדד מוצלח: האם הסיכוי המחושב דומה לסבירות האמיתית כפי שנצפתה בהמשך המעקב. התאמה כזו נקראת קליברציה. אי אפשר לדעת מה הסבירות האמיתית עבור מטופל בודד- מטופל בודד יחלה או שלא יחלה, זאת אומרת הסבירות האמיתית שיחלה היא או אפס או מאה אחוז. לכן קליברציה משתמשת בקבוצות. בכל קבוצה הסיכוי המחושב (התחזית) נמצאת בטווח מסויים, והממוצע של הסיכוי המחושב באותה קבוצה מושווה לשיעור האנשים באותה קבוצה שחלו בסופו של דבר. מדד ה CORE הוא בעל קליברציה מצויינת בערכים עד 17-18%, אך בערכים גבוהים יותר נתן הערכת יתר.
Calibration
Probability
Calculated risk
מלבד הדיסקרימינציה , יש לנו שאלה נוספת כדי להחליט האם מדד חיזוי הוא מדד מוצלח: האם הסיכוי המחושב דומה לסבירות האמיתית כפי שנצפתה בהמשך המעקב. התאמה כזו נקראת קליברציה. אי אפשר לדעת מה הסבירות האמיתית עבור מטופל בודד- מטופל בודד יחלה או שלא יחלה, זאת אומרת הסבירות האמיתית שיחלה היא או אפס או מאה אחוז. לכן קליברציה משתמשת בקבוצות. בכל קבוצה הסיכוי המחושב (התחזית) נמצאת בטווח מסויים, והממוצע של הסיכוי המחושב באותה קבוצה מושווה לשיעור האנשים באותה קבוצה שחלו בסופו של דבר. מדד ה CORE הוא בעל קליברציה מצויינת בערכים עד 17-18%, אך בערכים גבוהים יותר נתן הערכת יתר.
Calibration
Probability
Calculated risk
השטח תחת העקומה מתייחס לעקומת הרוק, והוא נמדד כיחס בין שני שטחים ולא ביחידות שטח. היחס הזה מקבל ערכים שבין 0.5 לבין 1, כאשר ככל שהערך גבוה יותר, כך יכולת ההפרדה של הבדיקה (דיסקרימינציה) טובה יותר. ערך של 0.88 אומר לנו שהסבירות שמטופל שיפתח שחמת בעתיד יקבל ציון חיזוי גבוה יותר ממטופל שלא יפתח שחמת היא 88%. חיזוי זה הוא עבור עשר שנים קדימה, אך מה לגבי חיזוי לזמנים קצרים יותר? שטח תחת העקומה תלוי זמן מציג לנו מהו השטח תחת העקומה עבור זמני תחזית שונים. למשל, בקוהורט המקורי עבור סולם הקור- 0.94 עבור תחזית של שנה אחת קדימה, ו 0.88 עשר שנים קדימה.
Time-dependent AUC
ROC curve
AUROC
Discrimination
CORE prediction model
SCORE2 prediction model
FIB4
השטח תחת העקומה מתייחס לעקומת הרוק, והוא נמדד כיחס בין שני שטחים ולא ביחידות שטח. היחס הזה מקבל ערכים שבין 0.5 לבין 1, כאשר ככל שהערך גבוה יותר, כך יכולת ההפרדה של הבדיקה (דיסקרימינציה) טובה יותר. ערך של 0.88 אומר לנו שהסבירות שמטופל שיפתח שחמת בעתיד יקבל ציון חיזוי גבוה יותר ממטופל שלא יפתח שחמת היא 88%. חיזוי זה הוא עבור עשר שנים קדימה, אך מה לגבי חיזוי לזמנים קצרים יותר? שטח תחת העקומה תלוי זמן מציג לנו מהו השטח תחת העקומה עבור זמני תחזית שונים. למשל, בקוהורט המקורי עבור סולם הקור- 0.94 עבור תחזית של שנה אחת קדימה, ו 0.88 עשר שנים קדימה.
Time-dependent AUC
ROC curve
AUROC
Discrimination
CORE prediction model
SCORE2 prediction model
FIB4
שיקולים שונים בסקירה ברמת האוכלוסיה לשחמת- מאמר סקירה
קווים מנחים אירופאיים- המלצה לבצע סקירה באנשים בסיכון
קווים מנחים- עדיין אין התוויה לסקירה למחלת כבד על רקע סטאטוזיס מטבולי (מכרס"מ © )
במחקר קוהורט ענקי בשוודיה, התגלה ששימוש בחמישה מדדים בלבד- שלושה אנזימי כבד, גיל ומין, מאפשר חיזוי של שחמת כבד בעשר השנים הקרובות. המודל לחיזוי אומת בשני קוהורטים בארצות אחרות, ולפי מחקר זה, יכולת הניבוי של מדד זה טובה יותר מאשר יכולת הניבוי של מדד ה FIB4.
CORE
Prediction model
Liver cirrhosis
שיקולים שונים בסקירה ברמת האוכלוסיה לשחמת- מאמר סקירה
קווים מנחים אירופאיים- המלצה לבצע סקירה באנשים בסיכון
קווים מנחים- עדיין אין התוויה לסקירה למחלת כבד על רקע סטאטוזיס מטבולי (מכרס"מ © )
במחקר קוהורט ענקי בשוודיה, התגלה ששימוש בחמישה מדדים בלבד- שלושה אנזימי כבד, גיל ומין, מאפשר חיזוי של שחמת כבד בעשר השנים הקרובות. המודל לחיזוי אומת בשני קוהורטים בארצות אחרות, ולפי מחקר זה, יכולת הניבוי של מדד זה טובה יותר מאשר יכולת הניבוי של מדד ה FIB4.
CORE
Prediction model
Liver cirrhosis
במטופלים לאחר אוטם שריר הלב וללא הפרעה בתפקוד חדר שמאל, האם טיפול בחסם בטא מונע בעיות עתידיות? ננצל את השאלה כדי להבין כיצד לנתח תוצאות של מחקרים סותרים, ולהחמיא הן למדע, הן לספרות הרפואית והן לעזרה של מודל בינה מלאכותית לניתוח מחקרים.
Differences in: Population
Method
Intervention
Outcome measurement
Confidence interval
Evidence based medicine
במטופלים לאחר אוטם שריר הלב וללא הפרעה בתפקוד חדר שמאל, האם טיפול בחסם בטא מונע בעיות עתידיות? ננצל את השאלה כדי להבין כיצד לנתח תוצאות של מחקרים סותרים, ולהחמיא הן למדע, הן לספרות הרפואית והן לעזרה של מודל בינה מלאכותית לניתוח מחקרים.
Differences in: Population
Method
Intervention
Outcome measurement
Confidence interval
Evidence based medicine
ביטוי מעוות יכול לשמש כחכה בדיג של מחקרים מפוברקים. שימוש בביטוי כזה העלה בחכה מחקר חשוד. בעזרת הצלבת נתונים וחיפוש סימני אזהרה הקשורים לחוקר, לטקסט, לתוצאות המחקרים, לעיתון ולמו"ל, הגעתי לעיתונים חשודים נוספים של אותו מו"ל ולהתכתבויות ברשת המתארות ניסיון לסחיטת חוקר וניסיון השתלטות על עיתון מדעי.
לקריאה מומלצת: בעיה ושמה זיוף- יהונתן ברקהיים, מכון דוידסון.
Int. J. of School and Cognitive Psychology
חוקרת לגיטימית שהוזכרה בדף הבית של העיתון כאחת העורכות
עיתון נוסף של אותו מוציא לאור ובתוכו "מטא אנליזה" על דכאון אצל סטודנטים באתיופיה
מאמר על המו"ל מ retraction watch
התכתבות בין חוקרים על ניסיון רכישת עיתון לגיטימי על ידי אותה הוצאה לאור
מאגר המידע לזיהוי מחקרים בעייתיים לפי ביטויים מעוותים
(Guillaum Cabanac- problematic paper screener)
ביטוי מעוות יכול לשמש כחכה בדיג של מחקרים מפוברקים. שימוש בביטוי כזה העלה בחכה מחקר חשוד. בעזרת הצלבת נתונים וחיפוש סימני אזהרה הקשורים לחוקר, לטקסט, לתוצאות המחקרים, לעיתון ולמו"ל, הגעתי לעיתונים חשודים נוספים של אותו מו"ל ולהתכתבויות ברשת המתארות ניסיון לסחיטת חוקר וניסיון השתלטות על עיתון מדעי.
לקריאה מומלצת: בעיה ושמה זיוף- יהונתן ברקהיים, מכון דוידסון.
Int. J. of School and Cognitive Psychology
חוקרת לגיטימית שהוזכרה בדף הבית של העיתון כאחת העורכות
עיתון נוסף של אותו מוציא לאור ובתוכו "מטא אנליזה" על דכאון אצל סטודנטים באתיופיה
מאמר על המו"ל מ retraction watch
התכתבות בין חוקרים על ניסיון רכישת עיתון לגיטימי על ידי אותה הוצאה לאור
מאגר המידע לזיהוי מחקרים בעייתיים לפי ביטויים מעוותים
(Guillaum Cabanac- problematic paper screener)
בפרוייקט שנועד לסנן מתוך סקירות שיטתיות מחקרים בעייתיים (מחקרים רעים מאוד ומחקרים מכוערים לפי שיטת הסיווג שלנו), בוצע סקר בין מומחים לזיהוי מחקרים כאלו, ונאספו 116 בדיקות שונות לאיתור או זיהוי. מתוך בדיקות אלו, 76 ניתנות ליישום ממידע גלוי (ללא נתונים גולמיים של המשתתפים במחקר). אלו בדיקות בקטגוריות הבאות: בדיקת תוצאות המחקר, בדיקת הכותבים, בדיקת ניהול המחקר, ובדיקת הטקסט והעיתון.
כאשר סדרת הבדיקות בוצעה על 50 סקירות שיטתיות של קוקרן, כ 31% מהמחקרים המבוקרים הנכללים היו חשודים במידת מה, ו 6% היו חשודים ביותר כמחקרים בעייתיים.
INSPECT-SR
Problematic studies
Individual participant data
Results in the paper
Conduct
Research team
Text and publication
בפרוייקט שנועד לסנן מתוך סקירות שיטתיות מחקרים בעייתיים (מחקרים רעים מאוד ומחקרים מכוערים לפי שיטת הסיווג שלנו), בוצע סקר בין מומחים לזיהוי מחקרים כאלו, ונאספו 116 בדיקות שונות לאיתור או זיהוי. מתוך בדיקות אלו, 76 ניתנות ליישום ממידע גלוי (ללא נתונים גולמיים של המשתתפים במחקר). אלו בדיקות בקטגוריות הבאות: בדיקת תוצאות המחקר, בדיקת הכותבים, בדיקת ניהול המחקר, ובדיקת הטקסט והעיתון.
כאשר סדרת הבדיקות בוצעה על 50 סקירות שיטתיות של קוקרן, כ 31% מהמחקרים המבוקרים הנכללים היו חשודים במידת מה, ו 6% היו חשודים ביותר כמחקרים בעייתיים.
INSPECT-SR
Problematic studies
Individual participant data
Results in the paper
Conduct
Research team
Text and publication
מיקום דנמרק וישראל במדד השחיתות העולמי
המחקר המצוטט ביותר בתחום זה, שבוצע על חוקרים בפסיכולוגיה.
בסקר שנערך בין חוקרים בכירים מכל התחומים בדנמרק ובארצות אחרות התגלה שיעור גבוה מאוד של פרקטיקות מחקר מפוקפקות. הבעיות היו בטווח רחב של חומרה: החל מציטוטים עצמיים דרך מניפולציות סטטיסטיות כדי להשיג מובהקות ועד העתקת רעיונות. 90% מהחוקרים הודו שלפחות פעם אחת במחקריהם האחרונים השתמשו בפרקטיקה אחת מאלו. לחץ לפרסם היה מנבא לפרקטיקות בעייתיות. לעומת זאת נחמדות, נוירוטיות, מצפוניות, וותק אקדמי, ותרבות מקומית של יושרה- הם גורמים מעט מגנים מהפרקטיקות המפוקפקות.
Questionable research practices- QRP
פרקטיקות מפוקפקות במחקר- פמפ"ם
HARKing
P hacking
authorship
מיקום דנמרק וישראל במדד השחיתות העולמי
המחקר המצוטט ביותר בתחום זה, שבוצע על חוקרים בפסיכולוגיה.
בסקר שנערך בין חוקרים בכירים מכל התחומים בדנמרק ובארצות אחרות התגלה שיעור גבוה מאוד של פרקטיקות מחקר מפוקפקות. הבעיות היו בטווח רחב של חומרה: החל מציטוטים עצמיים דרך מניפולציות סטטיסטיות כדי להשיג מובהקות ועד העתקת רעיונות. 90% מהחוקרים הודו שלפחות פעם אחת במחקריהם האחרונים השתמשו בפרקטיקה אחת מאלו. לחץ לפרסם היה מנבא לפרקטיקות בעייתיות. לעומת זאת נחמדות, נוירוטיות, מצפוניות, וותק אקדמי, ותרבות מקומית של יושרה- הם גורמים מעט מגנים מהפרקטיקות המפוקפקות.
Questionable research practices- QRP
פרקטיקות מפוקפקות במחקר- פמפ"ם
HARKing
P hacking
authorship
פרק סיכום זמני על מחקרים שלא צריכים להתפרסם. בפרק זה אני מציע שיטת סיווג משלי עבור מחקרים אלו: מחקר רע הוא מחקר בעזרת שיטות לא נכונות או לא מתאימות. המחקר הרע מאוד מתחיל כמחקר לגיטימי, אך מתבצעת בו מניפולציה מודעת בנתונים או בשיטה הסטטיסטית כדי להגיע לתוצאה שהחוקר מעוניין בה, והמחקר המכוער הוא מחקר שמומצאים בו נתונים או מחקר מפוברק לחלוטין. שלושת סוגי המחקרים האלו יכולים להביא לנזק רב, הן ישירות למטופלים והן לאמון במדע וברפואה. החלוקה לשלושה סוגים אלו נקבעה לפי האתיולוגיה (הרע נובע מבורות, הרע מאוד מרצון להגיע לתוצאה מסוימת ולפרסם אותה, והמכוער נובע מנוכלות והונאה)
פרק סיכום זמני על מחקרים שלא צריכים להתפרסם. בפרק זה אני מציע שיטת סיווג משלי עבור מחקרים אלו: מחקר רע הוא מחקר בעזרת שיטות לא נכונות או לא מתאימות. המחקר הרע מאוד מתחיל כמחקר לגיטימי, אך מתבצעת בו מניפולציה מודעת בנתונים או בשיטה הסטטיסטית כדי להגיע לתוצאה שהחוקר מעוניין בה, והמחקר המכוער הוא מחקר שמומצאים בו נתונים או מחקר מפוברק לחלוטין. שלושת סוגי המחקרים האלו יכולים להביא לנזק רב, הן ישירות למטופלים והן לאמון במדע וברפואה. החלוקה לשלושה סוגים אלו נקבעה לפי האתיולוגיה (הרע נובע מבורות, הרע מאוד מרצון להגיע לתוצאה מסוימת ולפרסם אותה, והמכוער נובע מנוכלות והונאה)
The entities enabling scientific fraud at scale are large, resilient, and growing rapidly
מאמר זה מציג עדויות עקיפות לכך שפרסום מחקרים מפוברקים או כוזבים מתבצע בצורה מאורגנת. המחקר בדק מחקרים, עורכים, עיתונים מדעיים וארגונים, ומצא עדויות עקיפות לארגון זה: מיעוט קטנטן מעורכי עיתונים מדעיים שאחראי לקבלה לפרסום של מחקרים רבים שנוהלו בצורה לא תקינה, ארגונים שמכוונים לעיתונים מסוימים לצורך פרסום מאמרים מפוברקים או גרועים, עיתונים שמטרתם פרסום מאמרים ללא ביקורת, ייצור מאמרים מפוברקים באצוות (כמות מוצר גדולה בבת אחת), ועליה חדה בקצב של מאמרים המוסרים מעיתונים מדעיים עקב בעיות אמינות או רמאות.
Retraction
De indexing
Paper mills
Fraud
Batch
Image duplication
Plos one
Hindawi
IEEE
ARDA
Retraction watch
Pub-peer
The entities enabling scientific fraud at scale are large, resilient, and growing rapidly
מאמר זה מציג עדויות עקיפות לכך שפרסום מחקרים מפוברקים או כוזבים מתבצע בצורה מאורגנת. המחקר בדק מחקרים, עורכים, עיתונים מדעיים וארגונים, ומצא עדויות עקיפות לארגון זה: מיעוט קטנטן מעורכי עיתונים מדעיים שאחראי לקבלה לפרסום של מחקרים רבים שנוהלו בצורה לא תקינה, ארגונים שמכוונים לעיתונים מסוימים לצורך פרסום מאמרים מפוברקים או גרועים, עיתונים שמטרתם פרסום מאמרים ללא ביקורת, ייצור מאמרים מפוברקים באצוות (כמות מוצר גדולה בבת אחת), ועליה חדה בקצב של מאמרים המוסרים מעיתונים מדעיים עקב בעיות אמינות או רמאות.
Retraction
De indexing
Paper mills
Fraud
Batch
Image duplication
Plos one
Hindawi
IEEE
ARDA
Retraction watch
Pub-peer
Tolerating bad health research: the continuing scandal
מדגם של מחקרים מבוקרים אקראיים מתחומים שונים ברפואה מציג תמונה עגומה: רובם מחקרים גרועים, עם סיכוי גבוה להטיה. גם רוב המשתתפים במחקרים שנדגמו השתתפו למעשה במחקר גרוע. העלות של מחקרים אלו עצומה, הן כלכלית והן מבחינות אחרות. מחברי המאמר מציעים מספר הצעות לתיקון המצב בעולם המחקר הרפואי.
Meta research
High risk of bias
Bad research
Cochrane systematic reviews
Tolerating bad health research: the continuing scandal
מדגם של מחקרים מבוקרים אקראיים מתחומים שונים ברפואה מציג תמונה עגומה: רובם מחקרים גרועים, עם סיכוי גבוה להטיה. גם רוב המשתתפים במחקרים שנדגמו השתתפו למעשה במחקר גרוע. העלות של מחקרים אלו עצומה, הן כלכלית והן מבחינות אחרות. מחברי המאמר מציעים מספר הצעות לתיקון המצב בעולם המחקר הרפואי.
Meta research
High risk of bias
Bad research
Cochrane systematic reviews
הבינה המלאכותית וזיוף מחקרים
AI-generated research paper fabrication and plagiarism in the scientific community
בפרק זה נשים שני דברים על השולחן: הראשון הוא שישנם חוקרים המזייפים נתונים או אפילו ממציאים מחקרים שלמים, ולא מדובר באחוז זניח של החוקרים. השני הוא שהיום בעזרת מנועי בינה מלאכותית ניתן לייצר בקלות רבה מאמרים מומצאים על מחקרים דמיוניים. יכולת של סוקרים אנושיים או דיגיטלים לזיהוי מאמרים כאלו היא חלקית בלבד. שילוב שני הגורמים האלו יכול להביא אותנו לתקופה בה רבים מפרסומים הרפואיים יהיו מומצאים או מזוייפים.
Fabrication
Falsification
Large language models
ChatGPT
Detection of fabricated articles
הבינה המלאכותית וזיוף מחקרים
AI-generated research paper fabrication and plagiarism in the scientific community
בפרק זה נשים שני דברים על השולחן: הראשון הוא שישנם חוקרים המזייפים נתונים או אפילו ממציאים מחקרים שלמים, ולא מדובר באחוז זניח של החוקרים. השני הוא שהיום בעזרת מנועי בינה מלאכותית ניתן לייצר בקלות רבה מאמרים מומצאים על מחקרים דמיוניים. יכולת של סוקרים אנושיים או דיגיטלים לזיהוי מאמרים כאלו היא חלקית בלבד. שילוב שני הגורמים האלו יכול להביא אותנו לתקופה בה רבים מפרסומים הרפואיים יהיו מומצאים או מזוייפים.
Fabrication
Falsification
Large language models
ChatGPT
Detection of fabricated articles
למרות שמחקר אמור להיות מדויק, והחוקר צריך להיות בעל יושרה ולפרסם אמת ואת כל האמת, ישנם מקרים בהם זה לא כך. מקרים אלו נקראים "התנהלות בלתי הולמת במחקר" אך אפשר להסיר את הכפפות ולקרוא להם גם "רמייה במחקר". הסיבה העיקרית לרמייה במחקר היא הלחץ לפרסם מאמרים. הלחץ הזה יכול לנבוע מסיבות כלכליות, תעסוקתיות ופסיכולוגיות, אך המנוע העיקרי שגורם ללחץ זה הוא המבנה האקדמי שבו יש דרישה וציפייה לפרסום מאמרים.
הרמייה יכולה ללבוש דרכים רבות, ורשימה (אולי חלקית) שלה כוללת המצאת נתונים, שינוי, זיוף או השמטת נתונים, מניפולציה בשיטות ניתוח הנתונים, וספין בפירוש תוצאות מחקר. בנוסף, רמייה מסוג אחר היא אי דיווח על כותבי המאמר האמיתיים, על ניגודי אינטרסים של הכותבים ועל שימוש בבינה מלאכותית בכתיבה.
לאחר שמאמר שבוצע ברמייה כבר התפרסם, יש פעמים נדירות שבהן מצליחים לגלות זאת, ואז ייתכן שהמאמר יוסר מהפרסום (רטרקציה). הגילוי יכול להגיע דרך החוקר עצמו אם הוא הגון ומגלה בעיות בניהול המחקר שפורסם, אך גם על ידי הלשנה, קריאה לעומק של המחקר על ידי קוראים ביקורתיים, וכן שיטות סטטיסטיות מתקדמות כמו זו שהציע קרלייל.
בשנת 2023 כ 10,000 מאמרים בעיתונות המדעית (לא רק רפואית) הוסרו בשל רמייה, וסביר להניח שזהו רק קצה הקרחון של מחקרים שבהם בוצעה רמייה.
Nature- 2023 record in retractions
הסרת מאמר על הדיאטה הים תיכונית מהניו אינגלנד
מאמר המפרט את השיטה של קרלייל לזיהוי מחקרים עם נתונים לא הגיוניים
Retraction of articles
Research misconduct
Data fabrication
Falsification
incomplete reporting
spin
conflict of interest
publish or perish
authentic authorship
למרות שמחקר אמור להיות מדויק, והחוקר צריך להיות בעל יושרה ולפרסם אמת ואת כל האמת, ישנם מקרים בהם זה לא כך. מקרים אלו נקראים "התנהלות בלתי הולמת במחקר" אך אפשר להסיר את הכפפות ולקרוא להם גם "רמייה במחקר". הסיבה העיקרית לרמייה במחקר היא הלחץ לפרסם מאמרים. הלחץ הזה יכול לנבוע מסיבות כלכליות, תעסוקתיות ופסיכולוגיות, אך המנוע העיקרי שגורם ללחץ זה הוא המבנה האקדמי שבו יש דרישה וציפייה לפרסום מאמרים.
הרמייה יכולה ללבוש דרכים רבות, ורשימה (אולי חלקית) שלה כוללת המצאת נתונים, שינוי, זיוף או השמטת נתונים, מניפולציה בשיטות ניתוח הנתונים, וספין בפירוש תוצאות מחקר. בנוסף, רמייה מסוג אחר היא אי דיווח על כותבי המאמר האמיתיים, על ניגודי אינטרסים של הכותבים ועל שימוש בבינה מלאכותית בכתיבה.
לאחר שמאמר שבוצע ברמייה כבר התפרסם, יש פעמים נדירות שבהן מצליחים לגלות זאת, ואז ייתכן שהמאמר יוסר מהפרסום (רטרקציה). הגילוי יכול להגיע דרך החוקר עצמו אם הוא הגון ומגלה בעיות בניהול המחקר שפורסם, אך גם על ידי הלשנה, קריאה לעומק של המחקר על ידי קוראים ביקורתיים, וכן שיטות סטטיסטיות מתקדמות כמו זו שהציע קרלייל.
בשנת 2023 כ 10,000 מאמרים בעיתונות המדעית (לא רק רפואית) הוסרו בשל רמייה, וסביר להניח שזהו רק קצה הקרחון של מחקרים שבהם בוצעה רמייה.
Nature- 2023 record in retractions
הסרת מאמר על הדיאטה הים תיכונית מהניו אינגלנד
מאמר המפרט את השיטה של קרלייל לזיהוי מחקרים עם נתונים לא הגיוניים
Retraction of articles
Research misconduct
Data fabrication
Falsification
incomplete reporting
spin
conflict of interest
publish or perish
authentic authorship
מחקר מתואר כמשולש סמיות למרות שמדובר בהתערבות שאינה ניתנת להסמיה של המטופל או המטפל, התוצאות המתוארות מילולית אינן תואמות כלל את התוצאות המוצגות בטבלאות, והתוצאות בטבלאות אינן תואמות את התוצאות בגרפים.
מחקר מתואר כמשולש סמיות למרות שמדובר בהתערבות שאינה ניתנת להסמיה של המטופל או המטפל, התוצאות המתוארות מילולית אינן תואמות כלל את התוצאות המוצגות בטבלאות, והתוצאות בטבלאות אינן תואמות את התוצאות בגרפים.
Performance of ultrasonography screening for breast cancer: a systematic review and meta-analysis
מטא אנליזה באיכות נמוכה
מחקר בדיקה אבחנתית באיכות נמוכה
מחקר על בדיקה אבחנתית באיכות גבוהה יותר
ניסיון למצוא מענה לשאלה מהי רגישות וספציפות אולטראסאונד לבדו כבדיקת סקירה לסרטן השד מוליך אותנו למטא אנליזה, אך נראה שכותבי המטא אנליזה ביצעו עבודה בינונית ולפחות מחקר אחד שחוקרי המטא אנליזה דיווחו עליו כ"איכות טובה" הוא מחקר באיכות נמוכה מאוד. התופעה של אמת חלקית (שפה עדינה) במחקרים היא תופעה מפחידה ומסוכנת, אך כתמיד יש להיזהר ממסקנות גורפות לגבי כלל המחקר הרפואי.
Low quality systematic review
Meta analysis
Diagnostic accuracy trial
Waste research
Performance of ultrasonography screening for breast cancer: a systematic review and meta-analysis
מטא אנליזה באיכות נמוכה
מחקר בדיקה אבחנתית באיכות נמוכה
מחקר על בדיקה אבחנתית באיכות גבוהה יותר
ניסיון למצוא מענה לשאלה מהי רגישות וספציפות אולטראסאונד לבדו כבדיקת סקירה לסרטן השד מוליך אותנו למטא אנליזה, אך נראה שכותבי המטא אנליזה ביצעו עבודה בינונית ולפחות מחקר אחד שחוקרי המטא אנליזה דיווחו עליו כ"איכות טובה" הוא מחקר באיכות נמוכה מאוד. התופעה של אמת חלקית (שפה עדינה) במחקרים היא תופעה מפחידה ומסוכנת, אך כתמיד יש להיזהר ממסקנות גורפות לגבי כלל המחקר הרפואי.
Low quality systematic review
Meta analysis
Diagnostic accuracy trial
Waste research
Nirmatrelvir for Vaccinated or Unvaccinated Adult Outpatients with Covid-19
המחקר שהתפרסם באיחור
Oral Nirmatrelvir for High-Risk, Nonhospitalized Adults with Covid-19
המחקר שהתפרסם תוך זמן קצר
מחקר עם תוצאות חיוביות (פקסלוביד אצל חולי קורונה בסיכון גבוה לסיבוכים) פורסם במהירות, ומחקר עם תוצאות שליליות שבוצע באותו זמן כמעט (אותה תרופה במטופלים בסיכון רגיל) פורסם הרבה יותר מאוחר.
Paxlovid- Nirmatrelvir/ritonavir
Publication bias
Off label use
Nirmatrelvir for Vaccinated or Unvaccinated Adult Outpatients with Covid-19
המחקר שהתפרסם באיחור
Oral Nirmatrelvir for High-Risk, Nonhospitalized Adults with Covid-19
המחקר שהתפרסם תוך זמן קצר
מחקר עם תוצאות חיוביות (פקסלוביד אצל חולי קורונה בסיכון גבוה לסיבוכים) פורסם במהירות, ומחקר עם תוצאות שליליות שבוצע באותו זמן כמעט (אותה תרופה במטופלים בסיכון רגיל) פורסם הרבה יותר מאוחר.
Paxlovid- Nirmatrelvir/ritonavir
Publication bias
Off label use
Aluminum-Adsorbed Vaccines and Chronic Diseases in Childhood: A Nationwide Cohort Study.
סטטיסטיקות לגבי אוטיזם כולל גיל האבחון – מידע של ה CDC
Aluminum Effects in Infants and Children- סקירה מ pediatrics.
Cumulative Incidence of Autism Into Adulthood for Birth Cohorts in Denmark, 1980-2012
אלומיניום בכמות קטנה מאוד משמש לחיזוק יעילות חיסוני הילדות. קוהורט דני שכלל מעל מיליון ילדים בדק קשר בין כמות האלומיניום שהוזרק לתינוקות במסגרת חיסוני הילדות לבין מגוון מחלות כולל מחלות אוטואימוניות, אלרגיות ואוטיזם, ולא מצא אף קשר מובהק לרעת החיסונים. בנוגע להפרעות על רצף האוטיזם, היה אפילו קשר מובהק הפוך: עבור כל מ"ג נוסף של אלומיניום במצטבר, הסיכוי להפרעה כזו היה נמוך ב 7% (למדייקים: יחס האזארד של 0.93 (רווח ברך סמך 0.89-0.97) עבור כל מ"ג אלומיניום נוסף). בפרק היום אענה לטוקבקיסט רמב"ם ואציג את טענותיו שאמנם נראות במבט ראשון כמדעיות אך אינן מכבדות את שם העט שלו.
Aluminum-Adsorbed Vaccines and Chronic Diseases in Childhood: A Nationwide Cohort Study.
סטטיסטיקות לגבי אוטיזם כולל גיל האבחון – מידע של ה CDC
Aluminum Effects in Infants and Children- סקירה מ pediatrics.
Cumulative Incidence of Autism Into Adulthood for Birth Cohorts in Denmark, 1980-2012
אלומיניום בכמות קטנה מאוד משמש לחיזוק יעילות חיסוני הילדות. קוהורט דני שכלל מעל מיליון ילדים בדק קשר בין כמות האלומיניום שהוזרק לתינוקות במסגרת חיסוני הילדות לבין מגוון מחלות כולל מחלות אוטואימוניות, אלרגיות ואוטיזם, ולא מצא אף קשר מובהק לרעת החיסונים. בנוגע להפרעות על רצף האוטיזם, היה אפילו קשר מובהק הפוך: עבור כל מ"ג נוסף של אלומיניום במצטבר, הסיכוי להפרעה כזו היה נמוך ב 7% (למדייקים: יחס האזארד של 0.93 (רווח ברך סמך 0.89-0.97) עבור כל מ"ג אלומיניום נוסף). בפרק היום אענה לטוקבקיסט רמב"ם ואציג את טענותיו שאמנם נראות במבט ראשון כמדעיות אך אינן מכבדות את שם העט שלו.
במיון ילדים, במבוגרים עם קוצר נשימה, בטיפול נמרץ, או בביצוע גיבור על של אולטראסאונד ריאות- מחקרים שבדקו בהקשרים קליניים שונים ואל מול בדיקות השוואה שונות אתהדיוק של אולטראסאונד לאבחון דלקת ריאות.
---
המאמרים שהוזכרו בפרק:
מאמר מ JAMA pediatrics 2013, הכולל גם תמונות והסברי וידאו על בדיקת US לאבחון דלקת ריאות
Ultrasound diagnosis of alveolar consolidation in the critically ill
Evaluation of lung ultrasound for the diagnosis of pneumonia in the ED
מה קורה כאשר מבצע הבדיקה הוא רדיולוג עם עשר שנות נסיון באולטראסאונד ריאות
מחקר התערבותי מבוקר אקראי בילדים: US בלבד כבדיקה ראשונית, עם אפשרות לבצע צלום בהמשך, אל מול צלום כבדיקה ראשונית ו US בהמשך.
במיון ילדים, במבוגרים עם קוצר נשימה, בטיפול נמרץ, או בביצוע גיבור על של אולטראסאונד ריאות- מחקרים שבדקו בהקשרים קליניים שונים ואל מול בדיקות השוואה שונות אתהדיוק של אולטראסאונד לאבחון דלקת ריאות.
---
המאמרים שהוזכרו בפרק:
מאמר מ JAMA pediatrics 2013, הכולל גם תמונות והסברי וידאו על בדיקת US לאבחון דלקת ריאות
Ultrasound diagnosis of alveolar consolidation in the critically ill
Evaluation of lung ultrasound for the diagnosis of pneumonia in the ED
מה קורה כאשר מבצע הבדיקה הוא רדיולוג עם עשר שנות נסיון באולטראסאונד ריאות
מחקר התערבותי מבוקר אקראי בילדים: US בלבד כבדיקה ראשונית, עם אפשרות לבצע צלום בהמשך, אל מול צלום כבדיקה ראשונית ו US בהמשך.
האם אולטראסאונד הוא כלי מדויק לאבחון דלקת ריאות?
אבחון דלקת ריאות הוא מעשה מורכב ומתבצע לפי כלל המידע ולא לפי בדיקה בודדת. אפשר לדון מהי בעצם בדיקת הזהב שלפיה נבחן בדיקה כמו אולטראסאונד. האם זה צלום חזה? CT? אבחנה של מומחים לפי כלל המידע?
נדבר על בעיות במחקרים על נושא זה, בעקר בהקשר של דלקת ריאות במרפאה, על הטיית הספקטרום, ועל מטא אנליזה שאספה 33 מחקרים שהשוו בין בדיקת אולטראסאונד ריאתי לבין בדיקות השוואה שונות.
---
המטא אנליזה שעליה דברנו בפרק
קווים מנחים לאבחון וטיפול דלקת ריאות בקהילה ברפואת המשפחה
מטא אנליזות נוספות שבדקו נושא זה בעבר
האם אולטראסאונד הוא כלי מדויק לאבחון דלקת ריאות?
אבחון דלקת ריאות הוא מעשה מורכב ומתבצע לפי כלל המידע ולא לפי בדיקה בודדת. אפשר לדון מהי בעצם בדיקת הזהב שלפיה נבחן בדיקה כמו אולטראסאונד. האם זה צלום חזה? CT? אבחנה של מומחים לפי כלל המידע?
נדבר על בעיות במחקרים על נושא זה, בעקר בהקשר של דלקת ריאות במרפאה, על הטיית הספקטרום, ועל מטא אנליזה שאספה 33 מחקרים שהשוו בין בדיקת אולטראסאונד ריאתי לבין בדיקות השוואה שונות.
---
המטא אנליזה שעליה דברנו בפרק
קווים מנחים לאבחון וטיפול דלקת ריאות בקהילה ברפואת המשפחה
מטא אנליזות נוספות שבדקו נושא זה בעבר
Atezolizumab plus Bevacizumab in Unresectable Hepatocellular Carcinoma
Sorafenib in Advanced Hepatocellular Carcinoma
כאשר רוצים להשוות בין שתי תרופות שלא נבדקו מעולם אחת מול השניה, יש שלוש שיטות אפשריות. השיטה התמימה היא השוואת קבוצות טיפול בתרופה ממחקר אחד לתרופה אחרת ממחקר אחר. שיטה מתוחכמת יותר, השוואה לא ישירה עם תקנון, משתמשת במכנה משותף- תרופה אחרת שהושוותה לשתי התרופות שמעניינות אותנו, ולכן בשני מחקרים לפחות. בכל אחד מהמחקרים מתבצע חישוב שלוקח בחשבון גם ערפלנים אפשריים, ואז התוצאות מושוות אחת לשניה. במקרה של תוצאה הניתנת ביחס, כמו למשל hazard ratio, התוצאות מוכפלות או מחולקות אחד בשנייה, ובמקרה של תוצאה הניתנת כמשתנה כמותי, התוצאות מחוברות או מחוסרות אחת מהשניה. השיטה השלישית והמקובלת ביותר כיום היא מטא אנליזה רשתית.
Adjusted indirect comparisons
Network meta-analysis
Unresectable liver cancer
Atezolizumab-bevacizumab
Atezolizumab plus Bevacizumab in Unresectable Hepatocellular Carcinoma
Sorafenib in Advanced Hepatocellular Carcinoma
כאשר רוצים להשוות בין שתי תרופות שלא נבדקו מעולם אחת מול השניה, יש שלוש שיטות אפשריות. השיטה התמימה היא השוואת קבוצות טיפול בתרופה ממחקר אחד לתרופה אחרת ממחקר אחר. שיטה מתוחכמת יותר, השוואה לא ישירה עם תקנון, משתמשת במכנה משותף- תרופה אחרת שהושוותה לשתי התרופות שמעניינות אותנו, ולכן בשני מחקרים לפחות. בכל אחד מהמחקרים מתבצע חישוב שלוקח בחשבון גם ערפלנים אפשריים, ואז התוצאות מושוות אחת לשניה. במקרה של תוצאה הניתנת ביחס, כמו למשל hazard ratio, התוצאות מוכפלות או מחולקות אחד בשנייה, ובמקרה של תוצאה הניתנת כמשתנה כמותי, התוצאות מחוברות או מחוסרות אחת מהשניה. השיטה השלישית והמקובלת ביותר כיום היא מטא אנליזה רשתית.
Adjusted indirect comparisons
Network meta-analysis
Unresectable liver cancer
Atezolizumab-bevacizumab
Patient-Specific In Vivo Gene Editing to Treat a Rare Genetic Disease
CRISPR-Based Therapy for Hereditary Angioedema
Exagamglogene Autotemcel for Severe Sickle Cell Disease
Family of Baby Saved by Gene-Editing Therapy Speaks to TODAY
לאחר מתן התרופה לתינוק קיי ג'יי בשתי מנות במינון עולה, מצבו הקליני של השתפר מאוד. משברים מטבולים הפסיקו להופיע בזמן זיהומים וירליים, רמות האמוניה ירדו, היה אפשר להגביר את כמות החלבון בתזונה, חלה עליה במשקל, והיה אפשר להפחית את הטיפול בקושר הגלוטמין.
זהו המאמר הראשון המתאר עריכת בסיס נקודתית באדם, ומתוארת בו שיטה שבה אפשר להשתמש כדי לייצר תרופה מותאמת אישית למחלות גנטיות אחרות בהן יש שינוי בבסיס אחד.
Patient-Specific In Vivo Gene Editing to Treat a Rare Genetic Disease
CRISPR-Based Therapy for Hereditary Angioedema
Exagamglogene Autotemcel for Severe Sickle Cell Disease
Family of Baby Saved by Gene-Editing Therapy Speaks to TODAY
לאחר מתן התרופה לתינוק קיי ג'יי בשתי מנות במינון עולה, מצבו הקליני של השתפר מאוד. משברים מטבולים הפסיקו להופיע בזמן זיהומים וירליים, רמות האמוניה ירדו, היה אפשר להגביר את כמות החלבון בתזונה, חלה עליה במשקל, והיה אפשר להפחית את הטיפול בקושר הגלוטמין.
זהו המאמר הראשון המתאר עריכת בסיס נקודתית באדם, ומתוארת בו שיטה שבה אפשר להשתמש כדי לייצר תרופה מותאמת אישית למחלות גנטיות אחרות בהן יש שינוי בבסיס אחד.
Patient-Specific In Vivo Gene Editing to Treat a Rare Genetic Disease
זמן קצר לאחר הלידה, החוקרות והרופאים שטיפלו בתינוק קיי ג'יי נכנסו למרוץ סביב השעון לתפירת ריפוי גנטי מותאם אישית עבורו.
בפרק הזה נזכיר את מבנה ה DNA, נדבר על מערכת ה CRISPR הטבעית והשינויים שנערכו בה כדי לאפשר עריכה גנטית נקודתית- החלפת בסיס אחד בבסיס אחר.
k-abe היא תרופה תפורה לפי מידה עבור קיי ג'יי. היא מכילה ABE (המורכב מחלבון CAS ספציפי יחד עם מחליף נוקלאוטידים), וכן gRNA ספציפי לגן הפגום של המטופל.
התרופה ניתנת בתוך ננו-חלקיק שומני המכיל את שני חומרים:mRNA לייצור ABE, ו- gRNA
בדיקת התרופה בוצעה על תרבית תאים הנושאת את הגן הפגום, ובחיות מעבדה לבדיקת יעילות עריכת הגן, עריכה off target, ורעילות. תהליך פיתוח התרופה כולל אישור הרשויות נמשך שבעה חודשים בלבד.
Patient-Specific In Vivo Gene Editing to Treat a Rare Genetic Disease
זמן קצר לאחר הלידה, החוקרות והרופאים שטיפלו בתינוק קיי ג'יי נכנסו למרוץ סביב השעון לתפירת ריפוי גנטי מותאם אישית עבורו.
בפרק הזה נזכיר את מבנה ה DNA, נדבר על מערכת ה CRISPR הטבעית והשינויים שנערכו בה כדי לאפשר עריכה גנטית נקודתית- החלפת בסיס אחד בבסיס אחר.
k-abe היא תרופה תפורה לפי מידה עבור קיי ג'יי. היא מכילה ABE (המורכב מחלבון CAS ספציפי יחד עם מחליף נוקלאוטידים), וכן gRNA ספציפי לגן הפגום של המטופל.
התרופה ניתנת בתוך ננו-חלקיק שומני המכיל את שני חומרים:mRNA לייצור ABE, ו- gRNA
בדיקת התרופה בוצעה על תרבית תאים הנושאת את הגן הפגום, ובחיות מעבדה לבדיקת יעילות עריכת הגן, עריכה off target, ורעילות. תהליך פיתוח התרופה כולל אישור הרשויות נמשך שבעה חודשים בלבד.
Patient-Specific In Vivo Gene Editing to Treat a Rare Genetic Disease
בפרק הזה נבין מתי מחקר על מטופל בודד הוא ראייה טובה במסגרת רפואה נתמכת ראיות, ונספר את הסיפור הקליני של תינוק שנולד עם מחלה מטבולית נדירה. זמן קצר אחרי הלידה, קיי ג'יי סבל מישנוניות ודיכוי נשימתי שנבעו מהצטברות אמוניה, ואובחן כחסר האנזים CPS1, האנזים הראשון במעגל האוראה. התינוק קיבל טיפול שכלל הגבלת צריכת חלבון, קושרי גלוטמין ותוספת ציטרולין, אך מצבו החמיר והוא היה מועמד להשתלת כבד.
Patient-Specific In Vivo Gene Editing to Treat a Rare Genetic Disease
בפרק הזה נבין מתי מחקר על מטופל בודד הוא ראייה טובה במסגרת רפואה נתמכת ראיות, ונספר את הסיפור הקליני של תינוק שנולד עם מחלה מטבולית נדירה. זמן קצר אחרי הלידה, קיי ג'יי סבל מישנוניות ודיכוי נשימתי שנבעו מהצטברות אמוניה, ואובחן כחסר האנזים CPS1, האנזים הראשון במעגל האוראה. התינוק קיבל טיפול שכלל הגבלת צריכת חלבון, קושרי גלוטמין ותוספת ציטרולין, אך מצבו החמיר והוא היה מועמד להשתלת כבד.
Treatment of stroke with a PSD-95 inhibitor in the gyrencephalic primate brain
במחקר שפורסם בלאנסט בפברואר 2025 אנשים עם חשד לאירוע מוחי איסכמי בשלב האמבולנס קיבלו תרופה שאמורה לכאורה להגן על המח מנזקי האיסכמיה. המחקר לא הדגים שוני בין נרינטייד לבין פלצבו, אך מאפשר לנו לדון בספין בתקציר המאמר ובשיטת רנדומיזציה שעלולה להיות לקויה.
block randomization
confidence interval
Treatment of stroke with a PSD-95 inhibitor in the gyrencephalic primate brain
במחקר שפורסם בלאנסט בפברואר 2025 אנשים עם חשד לאירוע מוחי איסכמי בשלב האמבולנס קיבלו תרופה שאמורה לכאורה להגן על המח מנזקי האיסכמיה. המחקר לא הדגים שוני בין נרינטייד לבין פלצבו, אך מאפשר לנו לדון בספין בתקציר המאמר ובשיטת רנדומיזציה שעלולה להיות לקויה.
block randomization
confidence interval
Real‑World Data and Clinical Experience From Over 100,000 Multi‑Cancer Early Detection Tests
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
נתוני "עולם אמיתי" מציגים יחס חיובי אמיתי/חיובי כוזב מוצלח יותר מהנתונים שהתקבלו במחקר הפת'פיינדר, אך מסתמכים על סקר עם אחוז מענה נמוך.
MCED-multicancer early detection test
CSDR-cancer signal detection rate
Positive predictive value
True positive Vs false positive
Real‑World Data and Clinical Experience From Over 100,000 Multi‑Cancer Early Detection Tests
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
נתוני "עולם אמיתי" מציגים יחס חיובי אמיתי/חיובי כוזב מוצלח יותר מהנתונים שהתקבלו במחקר הפת'פיינדר, אך מסתמכים על סקר עם אחוז מענה נמוך.
MCED-multicancer early detection test
CSDR-cancer signal detection rate
Positive predictive value
True positive Vs false positive
An update on the ongoing NHS-Galleri trial
Multicancer Early Detection Tests — Keeping a High Bar for Evidence of Benefit
מאמר דעה ב NEJM מיולי 2024
Ann onc 2020- מקרה בקרה
Lanc onc 7-2023- קוהורט בדיקה אבחנתית במשתתפים עם תסמינים
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
מחקר סקירה במתנדבים ללא תסמינים
טור של אברי גלעד על הבדיקה- מתוך ישראל היום, 12/2/2025
כתבה במאקו על בדיקת גלרי (בשיתוף אונקוטסט)
כתבה באתר של איכילוב
כתבה באתר וואלה
מידע מאתר אונקוטסט
הפודקאסט מיועד ללימוד שיטות מחקר והתמצאות בקריאה ביקורתית של מחקרים ולא מיועד לייעוץ רפואי. בשאלות לגבי בדיקות מומלצות וטיפולים מומלצים, יש לדון עם רופא.ת המשפחה שלכם.
בפרק זה נדבר על פרסומים לציבור אל מול תוצאות שלושת המחקרים שקראנו יחד בפרק הקודם, ובעקר נתמקד ביחס בין בדיקות חיוביות אמיתיות לבדיקות חיוביות כוזבות, נתון המוצג באופן שונה בין פרסומים לציבור לבין תוצאות מחקר הפת'פיינדר כפי שפורסמו בלאנסט.
כל הכתבות נצפו שוב בתחילת מאי 2025 כדי לוודא דיוק הציטוטים בפרק.
An update on the ongoing NHS-Galleri trial
Multicancer Early Detection Tests — Keeping a High Bar for Evidence of Benefit
מאמר דעה ב NEJM מיולי 2024
Ann onc 2020- מקרה בקרה
Lanc onc 7-2023- קוהורט בדיקה אבחנתית במשתתפים עם תסמינים
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
מחקר סקירה במתנדבים ללא תסמינים
טור של אברי גלעד על הבדיקה- מתוך ישראל היום, 12/2/2025
כתבה במאקו על בדיקת גלרי (בשיתוף אונקוטסט)
כתבה באתר של איכילוב
כתבה באתר וואלה
מידע מאתר אונקוטסט
הפודקאסט מיועד ללימוד שיטות מחקר והתמצאות בקריאה ביקורתית של מחקרים ולא מיועד לייעוץ רפואי. בשאלות לגבי בדיקות מומלצות וטיפולים מומלצים, יש לדון עם רופא.ת המשפחה שלכם.
בפרק זה נדבר על פרסומים לציבור אל מול תוצאות שלושת המחקרים שקראנו יחד בפרק הקודם, ובעקר נתמקד ביחס בין בדיקות חיוביות אמיתיות לבדיקות חיוביות כוזבות, נתון המוצג באופן שונה בין פרסומים לציבור לבין תוצאות מחקר הפת'פיינדר כפי שפורסמו בלאנסט.
כל הכתבות נצפו שוב בתחילת מאי 2025 כדי לוודא דיוק הציטוטים בפרק.
An update on the ongoing NHS-Galleri trial
Multicancer Early Detection Tests — Keeping a High Bar for Evidence of Benefit
מאמר ב NEJM מיולי 2024 הממליץ זהירות
Ann onc 2020- מקרה בקרה על בדיקה אבחנתית
Lanc onc 7-2023- קוהורט על בדיקה אבחנתית בחולים עם תסמינים
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
סקירה במתנדבים ללא תסמינים
הפודקאסט מיועד ללימוד שיטות מחקר והתמצאות בקריאה ביקורתית של מחקרים ולא מיועד לייעוץ רפואי. בשאלות לגבי בדיקות מומלצות וטיפולים מומלצים, יש לדון עם רופא.ת המשפחה שלכם.
בפרק זה נדבר על שלושת המחקרים החשובים שעוסקים בבדיקת הדם לגילוי מוקדם של סרטן ונמצאים בידנו באפריל 2025: מחקר מקרה- בקרה על ביצועי הבדיקה, מחקר קוהורט אצל מטופלים תסמיניים על ביצועי הבדיקה, ומחקר קוהורט על התהליך שעוברים אנשים עם בדיקה חיובית אצל מטופלים ללא תסמינים.
מדובר בבדיקה עם רגישות גבוהה לשלבים מתקדמים של סרטן ורגישות נמוכה לשלבים התחלתיים, עם ביצועי בדיקה שונים עבור גידולים שונים, ולפי מחקר הפת'פיינדר מהלאנסט- היחס חיובי כוזב-חיובי אמיתי הוא 3:5 (על כל שלושה מקרי חיובי אמיתי, חמישה מקרי חיובי כוזב).
An update on the ongoing NHS-Galleri trial
Multicancer Early Detection Tests — Keeping a High Bar for Evidence of Benefit
מאמר ב NEJM מיולי 2024 הממליץ זהירות
Ann onc 2020- מקרה בקרה על בדיקה אבחנתית
Lanc onc 7-2023- קוהורט על בדיקה אבחנתית בחולים עם תסמינים
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
סקירה במתנדבים ללא תסמינים
הפודקאסט מיועד ללימוד שיטות מחקר והתמצאות בקריאה ביקורתית של מחקרים ולא מיועד לייעוץ רפואי. בשאלות לגבי בדיקות מומלצות וטיפולים מומלצים, יש לדון עם רופא.ת המשפחה שלכם.
בפרק זה נדבר על שלושת המחקרים החשובים שעוסקים בבדיקת הדם לגילוי מוקדם של סרטן ונמצאים בידנו באפריל 2025: מחקר מקרה- בקרה על ביצועי הבדיקה, מחקר קוהורט אצל מטופלים תסמיניים על ביצועי הבדיקה, ומחקר קוהורט על התהליך שעוברים אנשים עם בדיקה חיובית אצל מטופלים ללא תסמינים.
מדובר בבדיקה עם רגישות גבוהה לשלבים מתקדמים של סרטן ורגישות נמוכה לשלבים התחלתיים, עם ביצועי בדיקה שונים עבור גידולים שונים, ולפי מחקר הפת'פיינדר מהלאנסט- היחס חיובי כוזב-חיובי אמיתי הוא 3:5 (על כל שלושה מקרי חיובי אמיתי, חמישה מקרי חיובי כוזב).
An update on the ongoing NHS-Galleri trial
Multicancer Early Detection Tests — Keeping a High Bar for Evidence of Benefit
מאמר דעה מה NEJM
Implosion of Grail’s Galleri Cancer Screening Test?
מאמר דעה נוסף
מחקר מקרה בקרה שבדק בין השאר רגישות הבדיקה בשלבים שונים של סרטן
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
מחקר סקירה במתנדבים ללא תסמינים שבדק בין השאר זמן עד הגעה למסקנה לגבי אבחון סרטן
הפודקאסט מיועד ללימוד שיטות מחקר והתמצאות בקריאה ביקורתית של מחקרים ולא מיועד לייעוץ רפואי. בשאלות לגבי בדיקות מומלצות וטיפולים מומלצים, יש לדון עם רופא.ת המשפחה שלכם.
בדיקת סקירה היא התערבות שנועדה לגלות מחלה בשלב טרם הופעת התסמינים. כמו בכל התערבות גם לביצוע בדיקת סקירה ישנם גם נזקים אפשריים. במקרה של בדיקות סקירה, הנזקים האפשריים הם בין השאר תוצאות חיוביות כוזבות, אבחון יתר, ועומס אבחוני על המטופל. בדיקות הסקירה לסרטן המומלצות כיום, כמו ממוגרפיה, אושרו לאחר מחקר אקראי מבוקר שבדק האם התועלת מהבדיקה רבה מהנזק. לאחרונה משווקת בעולם ובארץ בדיקת דם לגילוי מוקדם של סרטן מסוגים שונים. בדיקה זו עדיין לא נבדקה במחקר אקראי מבוקר (אם כי מחקר גדול כזה מתבצע כעת בבריטניה), ואין וודאות לגבי יעילות הבדיקה במניעת תחלואה קשה או תמותה אל מול הנזקים האפשריים.
הבדיקה מבוססת על ריצוף DNA חפשי בדם וקריאת המתילציה על גבי ה DNA כדי לזהות מאפייני מתילציה האופייניים לסרטנים מסויימים. לבדיקה ספציפיות גבוהה מאוד אך לא מושלמת, ורגישות משתנה לפי שלבי מחלה ולפי הסרטן הספציפי. עבור סרטנים בשלב ראשון או שני, רגישות הבדיקה יחסית נמוכה כפי שנצפה במחקר מקרה בקרה.
MCED- multicancer early detection
Cell free DNA
Methylation
Sequencing
Screening tests
Overdiagnosis
False positive tests
Diagnostic burden
Randomized controlled trial
An update on the ongoing NHS-Galleri trial
Multicancer Early Detection Tests — Keeping a High Bar for Evidence of Benefit
מאמר דעה מה NEJM
Implosion of Grail’s Galleri Cancer Screening Test?
מאמר דעה נוסף
מחקר מקרה בקרה שבדק בין השאר רגישות הבדיקה בשלבים שונים של סרטן
Blood-based tests for multicancer early detection (PATHFINDER): a prospective cohort study
מחקר סקירה במתנדבים ללא תסמינים שבדק בין השאר זמן עד הגעה למסקנה לגבי אבחון סרטן
הפודקאסט מיועד ללימוד שיטות מחקר והתמצאות בקריאה ביקורתית של מחקרים ולא מיועד לייעוץ רפואי. בשאלות לגבי בדיקות מומלצות וטיפולים מומלצים, יש לדון עם רופא.ת המשפחה שלכם.
בדיקת סקירה היא התערבות שנועדה לגלות מחלה בשלב טרם הופעת התסמינים. כמו בכל התערבות גם לביצוע בדיקת סקירה ישנם גם נזקים אפשריים. במקרה של בדיקות סקירה, הנזקים האפשריים הם בין השאר תוצאות חיוביות כוזבות, אבחון יתר, ועומס אבחוני על המטופל. בדיקות הסקירה לסרטן המומלצות כיום, כמו ממוגרפיה, אושרו לאחר מחקר אקראי מבוקר שבדק האם התועלת מהבדיקה רבה מהנזק. לאחרונה משווקת בעולם ובארץ בדיקת דם לגילוי מוקדם של סרטן מסוגים שונים. בדיקה זו עדיין לא נבדקה במחקר אקראי מבוקר (אם כי מחקר גדול כזה מתבצע כעת בבריטניה), ואין וודאות לגבי יעילות הבדיקה במניעת תחלואה קשה או תמותה אל מול הנזקים האפשריים.
הבדיקה מבוססת על ריצוף DNA חפשי בדם וקריאת המתילציה על גבי ה DNA כדי לזהות מאפייני מתילציה האופייניים לסרטנים מסויימים. לבדיקה ספציפיות גבוהה מאוד אך לא מושלמת, ורגישות משתנה לפי שלבי מחלה ולפי הסרטן הספציפי. עבור סרטנים בשלב ראשון או שני, רגישות הבדיקה יחסית נמוכה כפי שנצפה במחקר מקרה בקרה.
MCED- multicancer early detection
Cell free DNA
Methylation
Sequencing
Screening tests
Overdiagnosis
False positive tests
Diagnostic burden
Randomized controlled trial
Serum Urate and Risk of Chronic Kidney Disease: A Mendelian Randomization Study Using Taiwan Biobank
מחקר רנדומיזציה מנדליאנית השתמש בסולם סיכון גנטי לרמת החומצה האורית בדם, ולא מצא קשר בינו לבין הופעת מחלת כליה כרונית.
Genetic risk score
Mendelian randomization
Linkage disequilibrium
Uric acid
Pleiotropy
Confounding by ancestry
Serum Urate and Risk of Chronic Kidney Disease: A Mendelian Randomization Study Using Taiwan Biobank
מחקר רנדומיזציה מנדליאנית השתמש בסולם סיכון גנטי לרמת החומצה האורית בדם, ולא מצא קשר בינו לבין הופעת מחלת כליה כרונית.
Genetic risk score
Mendelian randomization
Linkage disequilibrium
Uric acid
Pleiotropy
Confounding by ancestry
Mendelian Randomization as a Tool for Cardiovascular Research
Reading Mendelian randomisation studies: a guide, glossary, and checklist for clinicians
במחקר שמשתמש ברנדומיזציה מנדליאנית צריכים להתקיים שלושה תנאים לפחות: קשר בין המשתנה האינסטרומנטלי (גרסת הגן) לבין גורם הסיכון, העדר פליאוטרופיות, והעדר ערפלן הקשור למוצא.
שימוש במשתנים מרובים יגביר את עצמת המחקר כאשר עבור כל משתנה בנפרד הקשר עם גורם הסיכון חלש, יאפשר זיהוי של גן יוצא דופן בהשפעתו על התוצא (חשוד בפלאוטרופיה), ושימוש בטבלה משווה של מאפייני המשתתפים עם גרסאות שונות של אותו גן, תאפשר לנו לבדוק האם יש חשד לפלאוטרופיה או ערפלן הקשור למוצא.
כאשר משתמשים במשתנים מרובים, אפשר לחבר את ההשפעה שלהם על התוצא בעזרת רגרסיה, או להשתמש בציון אלל (allele score) המייצג את ההשפעה של גרסה מסויימת על גורם הסיכון, ולבדוק את הציון הזה כמשפיע על התוצא הקליני שמעניין אותנו.
LDL-low density lipoprotein
Instrumental variable
Multiple variants
Pleiotropy
Confounding by ancestry
Allele score
Mendelian Randomization as a Tool for Cardiovascular Research
Reading Mendelian randomisation studies: a guide, glossary, and checklist for clinicians
במחקר שמשתמש ברנדומיזציה מנדליאנית צריכים להתקיים שלושה תנאים לפחות: קשר בין המשתנה האינסטרומנטלי (גרסת הגן) לבין גורם הסיכון, העדר פליאוטרופיות, והעדר ערפלן הקשור למוצא.
שימוש במשתנים מרובים יגביר את עצמת המחקר כאשר עבור כל משתנה בנפרד הקשר עם גורם הסיכון חלש, יאפשר זיהוי של גן יוצא דופן בהשפעתו על התוצא (חשוד בפלאוטרופיה), ושימוש בטבלה משווה של מאפייני המשתתפים עם גרסאות שונות של אותו גן, תאפשר לנו לבדוק האם יש חשד לפלאוטרופיה או ערפלן הקשור למוצא.
כאשר משתמשים במשתנים מרובים, אפשר לחבר את ההשפעה שלהם על התוצא בעזרת רגרסיה, או להשתמש בציון אלל (allele score) המייצג את ההשפעה של גרסה מסויימת על גורם הסיכון, ולבדוק את הציון הזה כמשפיע על התוצא הקליני שמעניין אותנו.
LDL-low density lipoprotein
Instrumental variable
Multiple variants
Pleiotropy
Confounding by ancestry
Allele score
מה זו סיבתיות (והאם LDL הוא סיבה למחלת לב)
סיבתיות יכולה להיות דטרמיניסטית- זאת אומרת פועלת תמיד ובאופן עקבי לגרימת התוצאה, אך לרוב כאשר נדבר על סיבות הן אינן כאלו. ניתן לשאול האם הסיבה היא הכרחית, מספיקה, או פשוט הסתברותית. כאשר יש גורם הכרחי, התוצאה לא תיגרם ללא נוכחותו. כאשר יש גורם מספיק, נוכחותו תגרום תמיד לתוצאה. סיבתיות הסתברותית היא הסיבתיות עליה בדרך כלל אנחנו מדברים במחקרים רפואיים, ומשמעותה היא שנוכחות של גורם מסויים מגבירה את הסיכוי לתוצאה. לרוב לא מדובר בסיבתיות הכרחית או מספיקה אלא רק בגורם תורם.
מחקר שהשתמש ברנדומיזציה מנדליאנית בדק האם הקשר בין LDL למחלת לב איסכמית הוא סיבתי, בעזרת שימוש במספר גנים הקשורים לרמת LDL בדם.
Causality
Causation
Necessary and sufficient causes
Contributory cause
Probabilistic causation
Reverse causation
Deterministic causation
Linear causality
Alleles
Polymorphism
rs number
מה זו סיבתיות (והאם LDL הוא סיבה למחלת לב)
סיבתיות יכולה להיות דטרמיניסטית- זאת אומרת פועלת תמיד ובאופן עקבי לגרימת התוצאה, אך לרוב כאשר נדבר על סיבות הן אינן כאלו. ניתן לשאול האם הסיבה היא הכרחית, מספיקה, או פשוט הסתברותית. כאשר יש גורם הכרחי, התוצאה לא תיגרם ללא נוכחותו. כאשר יש גורם מספיק, נוכחותו תגרום תמיד לתוצאה. סיבתיות הסתברותית היא הסיבתיות עליה בדרך כלל אנחנו מדברים במחקרים רפואיים, ומשמעותה היא שנוכחות של גורם מסויים מגבירה את הסיכוי לתוצאה. לרוב לא מדובר בסיבתיות הכרחית או מספיקה אלא רק בגורם תורם.
מחקר שהשתמש ברנדומיזציה מנדליאנית בדק האם הקשר בין LDL למחלת לב איסכמית הוא סיבתי, בעזרת שימוש במספר גנים הקשורים לרמת LDL בדם.
Causality
Causation
Necessary and sufficient causes
Contributory cause
Probabilistic causation
Reverse causation
Deterministic causation
Linear causality
Alleles
Polymorphism
rs number
Plasma HDL cholesterol and risk of myocardial infarction: a mendelian randomisation study
במחקרים תצפיתיים קשה מאוד להוכיח סיבתיות. רנדומיזציה מנדליאנית היא שיטת מחקר תצפיתית שבכל זאת מקרבת אותנו להוכחה או שלילה של סיבתיות.
הרנדומיזציה שמדובר בה מתרחשת בשלב מוקדם מאוד בחיים, בשלב יצירת הגמטות או שלב הביצית המופרית. מנדל, נזיר ומדען מהמאה ה 19 גילה שישנו קוד לתכונות של הייצורים החיים, ובתהליך יצירת הגמטות (תאי המין), יש רנדומיזציה- כאשר ישנן שתי גרסאות לקוד אצל ההורה, תא המין יכלול באופן רנדומלי אחת מגרסאות אלו בלבד, וגרסה זו תגיע לביצית המופרית שממנה יווצר הייצור החדש.
התהליך הזה מייצר רנדומיזציה בין אנשים שונים באוכלוסיה- חלקם יקבלו גרסה אחת של הקוד, ולכן תהיה להם תכונה מסוימת, וחלקם גרסה אחרת, שתגרום לתכונה אחרת.
אם אנחנו רוצים לחקור תכונה מסוימת, למשל HDL גבוה יותר, כגורם סיכון למחלה, למשל מחלות לב וכלי דם, אפשר להשתמש ברנדומיזציה מנדליאנית- לבדוק אצל משתתפים במחקר נשאות לקוד גנטי הקשור לרמה גבוהה יותר של HDL , ואז לבחון האם קוד זה קשור לשכיחות נמוכה יותר של התקפי לב.
ספוילר: הקשר בין HDL לפחות התקפי לב הופרך במחקרים מסוג זה.
mendelian randomization
trait
gametes
zygote
HDL- high density lipoprotein
Plasma HDL cholesterol and risk of myocardial infarction: a mendelian randomisation study
במחקרים תצפיתיים קשה מאוד להוכיח סיבתיות. רנדומיזציה מנדליאנית היא שיטת מחקר תצפיתית שבכל זאת מקרבת אותנו להוכחה או שלילה של סיבתיות.
הרנדומיזציה שמדובר בה מתרחשת בשלב מוקדם מאוד בחיים, בשלב יצירת הגמטות או שלב הביצית המופרית. מנדל, נזיר ומדען מהמאה ה 19 גילה שישנו קוד לתכונות של הייצורים החיים, ובתהליך יצירת הגמטות (תאי המין), יש רנדומיזציה- כאשר ישנן שתי גרסאות לקוד אצל ההורה, תא המין יכלול באופן רנדומלי אחת מגרסאות אלו בלבד, וגרסה זו תגיע לביצית המופרית שממנה יווצר הייצור החדש.
התהליך הזה מייצר רנדומיזציה בין אנשים שונים באוכלוסיה- חלקם יקבלו גרסה אחת של הקוד, ולכן תהיה להם תכונה מסוימת, וחלקם גרסה אחרת, שתגרום לתכונה אחרת.
אם אנחנו רוצים לחקור תכונה מסוימת, למשל HDL גבוה יותר, כגורם סיכון למחלה, למשל מחלות לב וכלי דם, אפשר להשתמש ברנדומיזציה מנדליאנית- לבדוק אצל משתתפים במחקר נשאות לקוד גנטי הקשור לרמה גבוהה יותר של HDL , ואז לבחון האם קוד זה קשור לשכיחות נמוכה יותר של התקפי לב.
ספוילר: הקשר בין HDL לפחות התקפי לב הופרך במחקרים מסוג זה.
mendelian randomization
trait
gametes
zygote
HDL- high density lipoprotein
Causal inference for clinicians
The Environment and Disease: Association or Causation?
איך נשתכנע שיש קשר סיבתי בין שני דברים? נחשוב על כל שאר הדברים שיכולים לייצר קשר (שאינו סיבתי) ביניהם: סיבתיות הפוכה, ערפלנים, הטיות אחרות, שיטות סטטיסטיות לקויות, טעות מדגם, ספין והונאה. רק אם כל שאר האפשרויות לא סבירות, נקבל את העובדה שקיימת סיבתיות. בדרך כלל נוכל לשלול את שאר האפשרויות רק במחקרים עם רנדומיזציה. במקרים בהם לא נוכל לעשות כך, ניאלץ להיעזר בקריטריונים של ברדפורד היל.
causality/causation
reverse causation
confounders
bias
sample error
spin
fraud
Causal inference for clinicians
The Environment and Disease: Association or Causation?
איך נשתכנע שיש קשר סיבתי בין שני דברים? נחשוב על כל שאר הדברים שיכולים לייצר קשר (שאינו סיבתי) ביניהם: סיבתיות הפוכה, ערפלנים, הטיות אחרות, שיטות סטטיסטיות לקויות, טעות מדגם, ספין והונאה. רק אם כל שאר האפשרויות לא סבירות, נקבל את העובדה שקיימת סיבתיות. בדרך כלל נוכל לשלול את שאר האפשרויות רק במחקרים עם רנדומיזציה. במקרים בהם לא נוכל לעשות כך, ניאלץ להיעזר בקריטריונים של ברדפורד היל.
causality/causation
reverse causation
confounders
bias
sample error
spin
fraud
Streptomycin Treatment of Pulmonary Tuberculosis
The MRC randomized trial of streptomycin and its legacy: a view from the clinical front line
Smoking and Carcinoma of the Lung
The Mortality of Doctors in Relation to Their Smoking Habits
הקריטריונים של ברדפורד היל
The Environment and Disease: Association or Causation?
הרפואה מבוססת על סיבתיות. מחלה היא סיבה לתסמינים, גורמים מסוימים גרמו למחלה עצמה, וטיפול יכול להיות סיבה להחלמה. אבל קשר בין שני דברים לא מוכיח שאחד גרם לשני. איך נדע האם אכן מדובר בסיבה ותוצאה? בתחום הזה אנחנו חייבים הרבה לאדם אחד, אוסטין ברדפורד היל. הוא יזם את המחקר האקראי המבוקר הראשון, ואת המחקרים הראשונים שהדגימו קשר בין עישון לסרטן הריאה. דרך שלושת המחקרים החשובים האלו שלו נדגים איך אנחנו משתכנעים בסיבתיות, בעזרת הקריטריונים אותם היל עצמו ניסח יותר מאוחר: טמפורליות, גודל אפקט, מנה-תגובה, מכניזם, ניסוי, אנלוגיה למקרים דומים, התאמה בין ממצאים פיזיולוגים לממצאים במחקר האפידמיולוגי, עקביות במחקרים שונים, וספציפיות של האפקט. מאז הייתה התקדמות רבה בתחום, אך הקריטריונים האלו יצקו את הבסיס להבנת הסיבתיות במחקרים אפידמיולוגיים.
Streptomycin Treatment of Pulmonary Tuberculosis
The MRC randomized trial of streptomycin and its legacy: a view from the clinical front line
Smoking and Carcinoma of the Lung
The Mortality of Doctors in Relation to Their Smoking Habits
הקריטריונים של ברדפורד היל
The Environment and Disease: Association or Causation?
הרפואה מבוססת על סיבתיות. מחלה היא סיבה לתסמינים, גורמים מסוימים גרמו למחלה עצמה, וטיפול יכול להיות סיבה להחלמה. אבל קשר בין שני דברים לא מוכיח שאחד גרם לשני. איך נדע האם אכן מדובר בסיבה ותוצאה? בתחום הזה אנחנו חייבים הרבה לאדם אחד, אוסטין ברדפורד היל. הוא יזם את המחקר האקראי המבוקר הראשון, ואת המחקרים הראשונים שהדגימו קשר בין עישון לסרטן הריאה. דרך שלושת המחקרים החשובים האלו שלו נדגים איך אנחנו משתכנעים בסיבתיות, בעזרת הקריטריונים אותם היל עצמו ניסח יותר מאוחר: טמפורליות, גודל אפקט, מנה-תגובה, מכניזם, ניסוי, אנלוגיה למקרים דומים, התאמה בין ממצאים פיזיולוגים לממצאים במחקר האפידמיולוגי, עקביות במחקרים שונים, וספציפיות של האפקט. מאז הייתה התקדמות רבה בתחום, אך הקריטריונים האלו יצקו את הבסיס להבנת הסיבתיות במחקרים אפידמיולוגיים.
Blood Biomarkers to Detect Alzheimer Disease in Primary Care and Secondary Care
Clinical diagnosis of Alzheimer's disease: recommendations of the International Working Group
A Review of Application of Aβ42/40 Ratio in Diagnosis and Prognosis of Alzheimer's Disease
בדיקות דם לחלבוני טאו ולבטא אמילואיד מוצעות כבדיקה אבחנתית למחלת אלצהיימר. מהן הבעיות הפילוסופיות בהקשר של אבחנה ומדוע מחקר זה בעייתי?
נדבר על שימוש במבחנים סטטיסטיים במאמר על בדיקה אבחנתית, על מדדי ביצוע של בדיקה אבחנתית כולל דיוק וערך מנבא חיובי ושלילי, על בדיקת הזהב, ועוד.
Blood Biomarkers to Detect Alzheimer Disease in Primary Care and Secondary Care
Clinical diagnosis of Alzheimer's disease: recommendations of the International Working Group
A Review of Application of Aβ42/40 Ratio in Diagnosis and Prognosis of Alzheimer's Disease
בדיקות דם לחלבוני טאו ולבטא אמילואיד מוצעות כבדיקה אבחנתית למחלת אלצהיימר. מהן הבעיות הפילוסופיות בהקשר של אבחנה ומדוע מחקר זה בעייתי?
נדבר על שימוש במבחנים סטטיסטיים במאמר על בדיקה אבחנתית, על מדדי ביצוע של בדיקה אבחנתית כולל דיוק וערך מנבא חיובי ושלילי, על בדיקת הזהב, ועוד.
Continuous vs Intermittent β-Lactam Antibiotic Infusions in Critically Ill Patients With Sepsis
במאושפזים בטיפול נמרץ עם ספסיס, האם טיפול רציף באנטיביוטיקה עדיף על טיפול במנות?
מחקר מבוקר אקראי שפורסם ביוני 2024.
Continuous vs Intermittent β-Lactam Antibiotic Infusions in Critically Ill Patients With Sepsis
במאושפזים בטיפול נמרץ עם ספסיס, האם טיפול רציף באנטיביוטיקה עדיף על טיפול במנות?
מחקר מבוקר אקראי שפורסם ביוני 2024.
Learning Through Listening: A Scoping Review of Podcast Use in Medical Education
סטטיסטיקה מרפאת- (1) הקדמה וממוצע 14/11/2023 סטטיסטיקה מרפאת- (2) חציון 19/11/2023 סטטיסטיקה מרפאת- (3) הטווח הבין רבעוני 23/11/2023 סטטיסטיקה מרפאת- (4) שיעור בכל טווח ערכים 27/11/2023 סטטיסטיקה מרפאת 5- היסטוגרמה והתפלגות 01/12/2023 סטטיסטיקה מרפאת 6- התפלגות סימטרית והתפלגות מוטה 05/12/2023 סטטיסטיקה מרפאת 7- התפלגות בימודלית 10/12/2023 סטטיסטיקה מרפאת 8- סטיית התקן 14/12/2023 סטטיסטיקה מרפאת 9- מבוא להסקה סטטיסטית 18/12/2023 סטטיסטיקה מרפאת 10- ההתפלגות הנורמלית 21/12/2023 סטטיסטיקה מרפאת 11- מיהו חריג? שימוש בחוק האמפירי 25/12/2023 סטטיסטיקה מרפאת 12- התפלגות הדגימה 28/12/2023 סטטיסטיקה מרפאת 13- הנורמלית מכה שנית -מסע הקסם המסתורי 01/01/2024 סטטיסטיקה מרפאת 14- שגיאת התקן 04/01/2024 סטטיסטיקה מרפאת 15- שגיאת התקן והחוק האמפירי 08/01/2024 סטטיסטיקה מרפאת 16- רווח בר סמך 11/01/2024 סטטיסטיקה מרפאת 17- שימוש ברווח בר סמך 15/01/2024 סטטיסטיקה מרפאת 18- רווח בר סמך ומחקרים פורצי דרך ב 2023 18/01/2024 סטטיסטיקה מרפאת 19- ביטוי מחדש 22/01/2024 סטטיסטיקה מרפאת 20- ביטוי מחדש בהתפלגות הדגימה 25/01/2024 סטטיסטיקה מרפאת 21- רווח בר סמך בקריאת מטא-אנליזה 29/01/2024 סטטיסטיקה מרפאת 22- בדיקת השערות, שוד הבנק הגדול 01/02/2024 סטטיסטיקה מרפאת 23 - p value 05/02/2024 סטטיסטיקה מרפאת 24- ערך האלפא, מובהקות וטעות מסוג אחד 08/02/2024 סטטיסטיקה מרפאת 25- טעות מסוג שני 12/02/2024 סטטיסטיקה מרפאת 26- עוצמה 19/02/2024 סטטיסטיקה מרפאת 27- הפחתת הסיכוי לשגיאות מסוג אחד ושניים. 22/02/2024 סטטיסטיקה מרפאת 28- שלוש דרכים לטעות לגבי פי 26/02/2024 סטטיסטיקה מרפאת 29- הטעות שכולם עושים וסטטיסטיקה בייסיאנית 04/03/2024 סטטיסטיקה מרפאת 30- מבוא למבחנים סטטיסיים 07/03/2024 סטטיסטיקה מרפאת 31 - Student’s t test 11/03/2024 סטטיסטיקה מרפאת 32- מתרמוס לפרימוס (t to p) 14/03/2024 סטטיסטיקה מרפאת 33- סוגי משתנים 18/03/2024 סטטיסטיקה מרפאת 34- לשחות בים המבחנים הסטטיסטיים 21/03/2024 סטטיסטיקה מרפאת 35- מבחנים א-פרמטריים 25/03/2024 סטטיסטיקה מרפאת 36 - Mann-Whitney 28/03/2024 סטטיסטיקה מרפאת 37 - Paired samples t-test 01/04/2024 סטטיסטיקה מרפאת 38-שונות 04/04/2024 סטטיסטיקה מרפאת 39 -Why ANOVA 08/04/2024 סטטיסטיקה מרפאת 40 - ANOVA How 11/04/2024 סטטיסטיקה מרפאת 41 - ANOVA What 15/04/2024 סטטיסטיקה מרפאת 42 - ANOVA Post hoc 18/04/2024 סטטיסטיקה מרפאת 43- קרוסקל וואליס 29/04/2024 סטטיסטיקה מרפאת 44- קרובים רחוקים- ווילקוקסון, אנובה למדידות חוזרות 02/05/2024 סטטיסטיקה מרפאת 45- חי בריבוע- חלק ראשון 09/05/2024 סטטיסטיקה מרפאת 46- חי בריבוע חלק שני- איך זה עובד 18/05/2024 סטטיסטיקה מרפאת 47- דרגות חופש 20/05/2024 סטטיסטיקה מרפאת 48- דרגות חופש וטבלת חי 23/05/2024 סטטיסטיקה מרפאת 49- מבחן מקנמר 30/05/2024 סטטיסטיקה מרפאת 50- קוקרן-מנטל-הנזל וערפלנים 03/06/2024 סטטיסטיקה מרפאת 51- מתאם (קורלציה) 10/06/2024 סטטיסטיקה מרפאת 52- מקדם המתאם של פירסון 17/06/2024 סטטיסטיקה מרפאת 53- מקדם המתאם של ספירמן 27/06/2024 סטטיסטיקה מרפאת 54- רגרסיות: שלושה שימושים, שלושה סוגים 04/07/2024 סטטיסטיקה מרפאת 55- נוסחת הרגרסיה 11/07/2024 סטטיסטיקה מרפאת 56- המח מבצע רגרסיות בחיי היום יום 18/07/2024 סטטיסטיקה מרפאת 57- איך נוסחת הרגרסיה עוזרת לה לתפקד 25/07/2024 סטטיסטיקה מרפאת 58- משוואת הקו הישר ורגרסיה לינארית 01/08/2024 סטטיסטיקה מרפאת 59- קו הרגרסיה 08/08/2024 סטטיסטיקה מרפאת 60 – רגרסיה לינארית מרובה 15/08/2024 סטטיסטיקה מרפאת 61- איך להבין תוצאות רגרסיה לינארית 22/08/2024 סטטיסטיקה מרפאת 62 - R squared in the regression 29/08/2024 סטטיסטיקה מרפאת 63 – מה קורה כשזה לא לינארי 05/09/2024 סטטיסטיקה מרפאת 64 -Odds and odds ratio 12/09/2024 סטטיסטיקה מרפאת 65 -רגרסיה לוגיסטית- ההסבר הפשוט 19/09/2024 סטטיסטיקה מרפאת 66- הטריקים של הרגרסיה הלוגיסטית 26/09/2024 סטטיסטיקה מרפאת 67- למה קוראים לה לוגיסטית 03/10/2024 סטטיסטיקה מרפאת 68- מקדמי הרגרסיה הלוגיסטית 10/10/2024 סטטיסטיקה מרפאת 69 – שרידות ועקומת שרידות 17/10/2024 סטטיסטיקה מרפאת 70 – hazard and hazard ratio 24/10/2024 סטטיסטיקה מרפאת 71 – עקומת קפלן מאייר 31/10/2024 סטטיסטיקה מרפאת 72 – פענוח עקומת קפלן מאייר 07/11/2024 סטטיסטיקה מרפאת 73- רגרסיית קוקס- ההסבר הפשוט 14/11/2024 סטטיסטיקה מרפאת 74- רגרסיית קוקס- הבנת התוצאות 21/11/2024 סטטיסטיקה מרפאת 75- רגרסיית קוקס- למה? 28/11/2024 סטטיסטיקה מרפאת 76- נוסחת רגרסיית קוקס 05/12/2024 סטטיסטיקה מרפאת 77- האמת המפתיעה על רגרסיות 12/12/2024 סטטיסטיקה מרפאת 78 - log rank test 19/12/2024 סטטיסטיקה מרפאת 79- רווח בר סמך למקדם הרגרסיה הלינארית 26/12/2024 סטטיסטיקה מרפאת 80- רווח בר סמך ברגרסיית קוקס 02/01/2025 סטטיסטיקה מרפאת 81- קיטוע סדרת מדידות (קס"מ)- מתי ולמה 09/01/2025
סטטיסטיקה מרפאת 82- קס"מ- תנאים
סטטיסטיקה מרפאת 83- קס"מ- סוג המשתנים
סטטיסטיקה מרפאת 84- קס"מ- השיטה ושכלולים
סטטיסטיקה מרפאת 85- מודלים סטטיסטיים ומודל מעורב
סטטיסטיקה מרפאת 86- מודל מעורב ב'
סטטיסטיקה מרפאת 87- חישוב גודל מדגם
סטטיסטיקה מרפאת 88- כל הסטטיסטיקה על רגל אחת- סיכום כל הסדרה עם הפניות לפרקים השונים
Learning Through Listening: A Scoping Review of Podcast Use in Medical Education
סטטיסטיקה מרפאת- (1) הקדמה וממוצע 14/11/2023 סטטיסטיקה מרפאת- (2) חציון 19/11/2023 סטטיסטיקה מרפאת- (3) הטווח הבין רבעוני 23/11/2023 סטטיסטיקה מרפאת- (4) שיעור בכל טווח ערכים 27/11/2023 סטטיסטיקה מרפאת 5- היסטוגרמה והתפלגות 01/12/2023 סטטיסטיקה מרפאת 6- התפלגות סימטרית והתפלגות מוטה 05/12/2023 סטטיסטיקה מרפאת 7- התפלגות בימודלית 10/12/2023 סטטיסטיקה מרפאת 8- סטיית התקן 14/12/2023 סטטיסטיקה מרפאת 9- מבוא להסקה סטטיסטית 18/12/2023 סטטיסטיקה מרפאת 10- ההתפלגות הנורמלית 21/12/2023 סטטיסטיקה מרפאת 11- מיהו חריג? שימוש בחוק האמפירי 25/12/2023 סטטיסטיקה מרפאת 12- התפלגות הדגימה 28/12/2023 סטטיסטיקה מרפאת 13- הנורמלית מכה שנית -מסע הקסם המסתורי 01/01/2024 סטטיסטיקה מרפאת 14- שגיאת התקן 04/01/2024 סטטיסטיקה מרפאת 15- שגיאת התקן והחוק האמפירי 08/01/2024 סטטיסטיקה מרפאת 16- רווח בר סמך 11/01/2024 סטטיסטיקה מרפאת 17- שימוש ברווח בר סמך 15/01/2024 סטטיסטיקה מרפאת 18- רווח בר סמך ומחקרים פורצי דרך ב 2023 18/01/2024 סטטיסטיקה מרפאת 19- ביטוי מחדש 22/01/2024 סטטיסטיקה מרפאת 20- ביטוי מחדש בהתפלגות הדגימה 25/01/2024 סטטיסטיקה מרפאת 21- רווח בר סמך בקריאת מטא-אנליזה 29/01/2024 סטטיסטיקה מרפאת 22- בדיקת השערות, שוד הבנק הגדול 01/02/2024 סטטיסטיקה מרפאת 23 - p value 05/02/2024 סטטיסטיקה מרפאת 24- ערך האלפא, מובהקות וטעות מסוג אחד 08/02/2024 סטטיסטיקה מרפאת 25- טעות מסוג שני 12/02/2024 סטטיסטיקה מרפאת 26- עוצמה 19/02/2024 סטטיסטיקה מרפאת 27- הפחתת הסיכוי לשגיאות מסוג אחד ושניים. 22/02/2024 סטטיסטיקה מרפאת 28- שלוש דרכים לטעות לגבי פי 26/02/2024 סטטיסטיקה מרפאת 29- הטעות שכולם עושים וסטטיסטיקה בייסיאנית 04/03/2024 סטטיסטיקה מרפאת 30- מבוא למבחנים סטטיסיים 07/03/2024 סטטיסטיקה מרפאת 31 - Student’s t test 11/03/2024 סטטיסטיקה מרפאת 32- מתרמוס לפרימוס (t to p) 14/03/2024 סטטיסטיקה מרפאת 33- סוגי משתנים 18/03/2024 סטטיסטיקה מרפאת 34- לשחות בים המבחנים הסטטיסטיים 21/03/2024 סטטיסטיקה מרפאת 35- מבחנים א-פרמטריים 25/03/2024 סטטיסטיקה מרפאת 36 - Mann-Whitney 28/03/2024 סטטיסטיקה מרפאת 37 - Paired samples t-test 01/04/2024 סטטיסטיקה מרפאת 38-שונות 04/04/2024 סטטיסטיקה מרפאת 39 -Why ANOVA 08/04/2024 סטטיסטיקה מרפאת 40 - ANOVA How 11/04/2024 סטטיסטיקה מרפאת 41 - ANOVA What 15/04/2024 סטטיסטיקה מרפאת 42 - ANOVA Post hoc 18/04/2024 סטטיסטיקה מרפאת 43- קרוסקל וואליס 29/04/2024 סטטיסטיקה מרפאת 44- קרובים רחוקים- ווילקוקסון, אנובה למדידות חוזרות 02/05/2024 סטטיסטיקה מרפאת 45- חי בריבוע- חלק ראשון 09/05/2024 סטטיסטיקה מרפאת 46- חי בריבוע חלק שני- איך זה עובד 18/05/2024 סטטיסטיקה מרפאת 47- דרגות חופש 20/05/2024 סטטיסטיקה מרפאת 48- דרגות חופש וטבלת חי 23/05/2024 סטטיסטיקה מרפאת 49- מבחן מקנמר 30/05/2024 סטטיסטיקה מרפאת 50- קוקרן-מנטל-הנזל וערפלנים 03/06/2024 סטטיסטיקה מרפאת 51- מתאם (קורלציה) 10/06/2024 סטטיסטיקה מרפאת 52- מקדם המתאם של פירסון 17/06/2024 סטטיסטיקה מרפאת 53- מקדם המתאם של ספירמן 27/06/2024 סטטיסטיקה מרפאת 54- רגרסיות: שלושה שימושים, שלושה סוגים 04/07/2024 סטטיסטיקה מרפאת 55- נוסחת הרגרסיה 11/07/2024 סטטיסטיקה מרפאת 56- המח מבצע רגרסיות בחיי היום יום 18/07/2024 סטטיסטיקה מרפאת 57- איך נוסחת הרגרסיה עוזרת לה לתפקד 25/07/2024 סטטיסטיקה מרפאת 58- משוואת הקו הישר ורגרסיה לינארית 01/08/2024 סטטיסטיקה מרפאת 59- קו הרגרסיה 08/08/2024 סטטיסטיקה מרפאת 60 – רגרסיה לינארית מרובה 15/08/2024 סטטיסטיקה מרפאת 61- איך להבין תוצאות רגרסיה לינארית 22/08/2024 סטטיסטיקה מרפאת 62 - R squared in the regression 29/08/2024 סטטיסטיקה מרפאת 63 – מה קורה כשזה לא לינארי 05/09/2024 סטטיסטיקה מרפאת 64 -Odds and odds ratio 12/09/2024 סטטיסטיקה מרפאת 65 -רגרסיה לוגיסטית- ההסבר הפשוט 19/09/2024 סטטיסטיקה מרפאת 66- הטריקים של הרגרסיה הלוגיסטית 26/09/2024 סטטיסטיקה מרפאת 67- למה קוראים לה לוגיסטית 03/10/2024 סטטיסטיקה מרפאת 68- מקדמי הרגרסיה הלוגיסטית 10/10/2024 סטטיסטיקה מרפאת 69 – שרידות ועקומת שרידות 17/10/2024 סטטיסטיקה מרפאת 70 – hazard and hazard ratio 24/10/2024 סטטיסטיקה מרפאת 71 – עקומת קפלן מאייר 31/10/2024 סטטיסטיקה מרפאת 72 – פענוח עקומת קפלן מאייר 07/11/2024 סטטיסטיקה מרפאת 73- רגרסיית קוקס- ההסבר הפשוט 14/11/2024 סטטיסטיקה מרפאת 74- רגרסיית קוקס- הבנת התוצאות 21/11/2024 סטטיסטיקה מרפאת 75- רגרסיית קוקס- למה? 28/11/2024 סטטיסטיקה מרפאת 76- נוסחת רגרסיית קוקס 05/12/2024 סטטיסטיקה מרפאת 77- האמת המפתיעה על רגרסיות 12/12/2024 סטטיסטיקה מרפאת 78 - log rank test 19/12/2024 סטטיסטיקה מרפאת 79- רווח בר סמך למקדם הרגרסיה הלינארית 26/12/2024 סטטיסטיקה מרפאת 80- רווח בר סמך ברגרסיית קוקס 02/01/2025 סטטיסטיקה מרפאת 81- קיטוע סדרת מדידות (קס"מ)- מתי ולמה 09/01/2025
סטטיסטיקה מרפאת 82- קס"מ- תנאים
סטטיסטיקה מרפאת 83- קס"מ- סוג המשתנים
סטטיסטיקה מרפאת 84- קס"מ- השיטה ושכלולים
סטטיסטיקה מרפאת 85- מודלים סטטיסטיים ומודל מעורב
סטטיסטיקה מרפאת 86- מודל מעורב ב'
סטטיסטיקה מרפאת 87- חישוב גודל מדגם
סטטיסטיקה מרפאת 88- כל הסטטיסטיקה על רגל אחת- סיכום כל הסדרה עם הפניות לפרקים השונים
Statistical Methods in the Journal — An Update
Intraosseous or Intravenous Vascular Access for Out-of-Hospital Cardiac Arrest
העוצמה גדלה ככל שערך האלפא, גודל המדגם, וגודל האפקט גדלים. לעומת זאת היא נחלשת כאשר שגיאת התקן גדלה. את כל הנתונים האלו ניתן לשבץ בתוך נוסחה ייחודית למבחן סטטיסטי מסוים כדי לחשב את העוצמה של מחקר. אם לעומת זאת, מגדירים מהי העוצמה הרצויה, מגדירים מהו גודל האפקט הרצוי, ומהי שגיאת התקן הצפויה, נשאר רק משתנה אחד לא ידוע- גודל המדגם. בצורה כזו אפשר לחשב את גודל המדגם הרצוי כדי להשיג עוצמה מסוימת.
Power analysis
Power
Sample size calculation
Effect size
Standard error
Statistical Methods in the Journal — An Update
Intraosseous or Intravenous Vascular Access for Out-of-Hospital Cardiac Arrest
העוצמה גדלה ככל שערך האלפא, גודל המדגם, וגודל האפקט גדלים. לעומת זאת היא נחלשת כאשר שגיאת התקן גדלה. את כל הנתונים האלו ניתן לשבץ בתוך נוסחה ייחודית למבחן סטטיסטי מסוים כדי לחשב את העוצמה של מחקר. אם לעומת זאת, מגדירים מהי העוצמה הרצויה, מגדירים מהו גודל האפקט הרצוי, ומהי שגיאת התקן הצפויה, נשאר רק משתנה אחד לא ידוע- גודל המדגם. בצורה כזו אפשר לחשב את גודל המדגם הרצוי כדי להשיג עוצמה מסוימת.
Power analysis
Power
Sample size calculation
Effect size
Standard error
Effect of Salt Substitution on Cardiovascular Events and Death
A Community-Based Intervention for Managing Hypertension in Rural South Asia
הצורך במודל מעורב עולה כאשר רוצים לבצע רגרסיה אך יש תלות בין מדידות שונות, למשל תוצאות עבור אנשים ממשפחה אחת או מכפר אחד, או מדידות חוזרות אצל אותו אדם.
במודל הזה לתוך מוכנסים לנוסחה אפקטים קבועים, בדומה לרגרסיות המוכרות לנו מפרקים קודמים, אך גם אפקטים רנדומליים. אפקט רנדומלי נמצא נמוך יותר בהיררכיה של ההשפעה, והוא גורם לשונות סביב האפקט הקבוע. למשל, השפעת כפר המגורים על שכיחות אירועים מוחיים יכול להיות אפקט רנדומלי, סביב האפקט הקבוע שהוא השפעת ההתערבות עצמה על שכיחות אירועים מוחיים. עבור אפקטים קבועים יתקבל בנוסחת המודל הסטטיסטי מקדם קבוע, אך המקדם עבור האפקט הרנדומלי, הכפר למשל, השני לא יהיה מקדם קבוע בנוסחה אלא כזה שיכול להשתנות (בצורה רנדומלית) בין כפר לכפר.
במודל מעורב המתאר קשר לינארי, למשל עבור התערבות והשפעתה על ערכי לחץ דם במדידות חוזרות באותם אנשים, האפקט הרנדומלי, למשל האפקט של המשתתף הספציפי במחקר, יכול להתבטא גם עבור הקבוע במשוואה (למשל, מהו לחץ הדם ההתחלתי) וגם עבור המקדם בנוסחה המציין את שיפוע הקו (למשל, מה קצב שיפור לחץ הדם).
Mixed effects model
Independence assumption for non-mixed regression
Dependent measurements
Hierarchical model
Fixed effects
Random effects
Random effect for the constant (intercept)
Random effect for the coefficient (slope)
Effect of Salt Substitution on Cardiovascular Events and Death
A Community-Based Intervention for Managing Hypertension in Rural South Asia
הצורך במודל מעורב עולה כאשר רוצים לבצע רגרסיה אך יש תלות בין מדידות שונות, למשל תוצאות עבור אנשים ממשפחה אחת או מכפר אחד, או מדידות חוזרות אצל אותו אדם.
במודל הזה לתוך מוכנסים לנוסחה אפקטים קבועים, בדומה לרגרסיות המוכרות לנו מפרקים קודמים, אך גם אפקטים רנדומליים. אפקט רנדומלי נמצא נמוך יותר בהיררכיה של ההשפעה, והוא גורם לשונות סביב האפקט הקבוע. למשל, השפעת כפר המגורים על שכיחות אירועים מוחיים יכול להיות אפקט רנדומלי, סביב האפקט הקבוע שהוא השפעת ההתערבות עצמה על שכיחות אירועים מוחיים. עבור אפקטים קבועים יתקבל בנוסחת המודל הסטטיסטי מקדם קבוע, אך המקדם עבור האפקט הרנדומלי, הכפר למשל, השני לא יהיה מקדם קבוע בנוסחה אלא כזה שיכול להשתנות (בצורה רנדומלית) בין כפר לכפר.
במודל מעורב המתאר קשר לינארי, למשל עבור התערבות והשפעתה על ערכי לחץ דם במדידות חוזרות באותם אנשים, האפקט הרנדומלי, למשל האפקט של המשתתף הספציפי במחקר, יכול להתבטא גם עבור הקבוע במשוואה (למשל, מהו לחץ הדם ההתחלתי) וגם עבור המקדם בנוסחה המציין את שיפוע הקו (למשל, מה קצב שיפור לחץ הדם).
Mixed effects model
Independence assumption for non-mixed regression
Dependent measurements
Hierarchical model
Fixed effects
Random effects
Random effect for the constant (intercept)
Random effect for the coefficient (slope)
מודל הוא נסיון לתאר תופעה בעולם בעזרת נוסחה מתמטית. בפרק הזה נשתמש בתיאור של פסלים במקום תופעות, ונבין שלרוב המודל לא יתאר בצורה מדויקת את הפסל, ושבמצבים מסויימים נצטרך להכניס למודל גם אפקטים קבועים המשותפים לכל המיקי-מאוסים, כמו צורת האוזניים וגם אפקטים רנדומליים שמשתנים בין ייצוגים שונים של מיקי-מאוס, כמו הגודל או תנוחת היד. הכנסת האפקטים הרנדומליים תאפשר לתאר את האפקטים הקבועים בצורה טובה יותר. למשל, אפשר יהיה לתאר את מבנה היד של מיקי מאוס (אפקט קבוע) גם כאשר היד בתנוחות (אפקט רנדומלי) שונות.
Statistical model
Mixed effects model
Fixed effects
Random effects
מודל הוא נסיון לתאר תופעה בעולם בעזרת נוסחה מתמטית. בפרק הזה נשתמש בתיאור של פסלים במקום תופעות, ונבין שלרוב המודל לא יתאר בצורה מדויקת את הפסל, ושבמצבים מסויימים נצטרך להכניס למודל גם אפקטים קבועים המשותפים לכל המיקי-מאוסים, כמו צורת האוזניים וגם אפקטים רנדומליים שמשתנים בין ייצוגים שונים של מיקי-מאוס, כמו הגודל או תנוחת היד. הכנסת האפקטים הרנדומליים תאפשר לתאר את האפקטים הקבועים בצורה טובה יותר. למשל, אפשר יהיה לתאר את מבנה היד של מיקי מאוס (אפקט קבוע) גם כאשר היד בתנוחות (אפקט רנדומלי) שונות.
Statistical model
Mixed effects model
Fixed effects
Random effects
השיטה הסטטיסטית בקיטוע סדרת מדידות דומה מאוד לשיטה ברגרסיה לינארית פשוטה. למרות שהמשתנה הבלתי תלוי שמעניין אותנו הוא ההתערבות שקרתה בזמן מסויים, הזמן הוא המשתנה הבלתי תלוי שסביבו הנוסחה בנויה. לפני ההתערבות ישנו קבוע שאומר מה הייתה המדידה בתחילת המעקב ומקדם שאומר מהו קצב השינוי, זאת אומרת בכמה המדידה השתנתה עבור כל יחידת זמן. בנוסחה מופיע גם משתנה קטגוריאלי עם שני ערכים אפשריים: האם מדובר בזמן שלפני או אחרי ההתערבות. אם מדובר בזמן שאחרי ההתערבות מתווספים שני שינויים אפשריים: ברמת המדידה ובמגמה לאורך זמן.
שכלולים אפשריים לשיטה הם שיכוב לפי משתנה מסביר נוסף (למשל, שכבות גיל), השוואה בין הצפוי לפי המגמה הקודמת לבין מה שקרה בפועל לאחר ההתערבות, ושימוש ב negative control (משתנה תלוי שלא אמור להיות מושפע מההתערבות)
Interrupted time series analysis
Segmented regression model
Change in level
Change in trend
Negative control
Stratification
השיטה הסטטיסטית בקיטוע סדרת מדידות דומה מאוד לשיטה ברגרסיה לינארית פשוטה. למרות שהמשתנה הבלתי תלוי שמעניין אותנו הוא ההתערבות שקרתה בזמן מסויים, הזמן הוא המשתנה הבלתי תלוי שסביבו הנוסחה בנויה. לפני ההתערבות ישנו קבוע שאומר מה הייתה המדידה בתחילת המעקב ומקדם שאומר מהו קצב השינוי, זאת אומרת בכמה המדידה השתנתה עבור כל יחידת זמן. בנוסחה מופיע גם משתנה קטגוריאלי עם שני ערכים אפשריים: האם מדובר בזמן שלפני או אחרי ההתערבות. אם מדובר בזמן שאחרי ההתערבות מתווספים שני שינויים אפשריים: ברמת המדידה ובמגמה לאורך זמן.
שכלולים אפשריים לשיטה הם שיכוב לפי משתנה מסביר נוסף (למשל, שכבות גיל), השוואה בין הצפוי לפי המגמה הקודמת לבין מה שקרה בפועל לאחר ההתערבות, ושימוש ב negative control (משתנה תלוי שלא אמור להיות מושפע מההתערבות)
Interrupted time series analysis
Segmented regression model
Change in level
Change in trend
Negative control
Stratification
Survival after Minimally Invasive Radical Hysterectomy for Early-Stage Cervical Cancer
בקיטוע סדרת מדידות נמדדת השפעת משתנה בלתי תלוי קטגוריאלי (דיכוטומי) על משתנה תלוי כמותי או קטגוריאלי. המשתנה הקטגוריאלי הוא החשיפה או ההתערבות. למשל, ללא קווים מנחים חדשים לפני האירוע ועם קווים מנחים אחריו. המשתנה התלוי, גם אם החל כקטגוריאלי, מקבל תמיד צורה כמותית כדי לבחון את מגמת ההשתנות לאורך זמן.
הזמן עצמו הוא משתנה בלתי תלוי נוסף, שגם הוא משפיע על התוצא, אך צריך לזכור שמדובר רק במשתנה עזר.
הזמן קשור גם למשתנה התלוי, כיוון שנבדקת השפעה גם על המגמה, ושמגמה (trend) היא שינוי לאורך זמן.
Interrupted time series analysis
Trend
Independent variable
Dependent variable
Time as an independent variable
Survival after Minimally Invasive Radical Hysterectomy for Early-Stage Cervical Cancer
בקיטוע סדרת מדידות נמדדת השפעת משתנה בלתי תלוי קטגוריאלי (דיכוטומי) על משתנה תלוי כמותי או קטגוריאלי. המשתנה הקטגוריאלי הוא החשיפה או ההתערבות. למשל, ללא קווים מנחים חדשים לפני האירוע ועם קווים מנחים אחריו. המשתנה התלוי, גם אם החל כקטגוריאלי, מקבל תמיד צורה כמותית כדי לבחון את מגמת ההשתנות לאורך זמן.
הזמן עצמו הוא משתנה בלתי תלוי נוסף, שגם הוא משפיע על התוצא, אך צריך לזכור שמדובר רק במשתנה עזר.
הזמן קשור גם למשתנה התלוי, כיוון שנבדקת השפעה גם על המגמה, ושמגמה (trend) היא שינוי לאורך זמן.
Interrupted time series analysis
Trend
Independent variable
Dependent variable
Time as an independent variable
מאמר הסבר מצויין על השיטה
כדי לבצע קיטוע סדרת מדידות, ההתערבות צריכה להיות מוגדרת היטב בזמן, התוצא צריך להיות כזה שמופיע זמן קצר (או לפחות זמן ידוע) לאחר ההתערבות, וצריך כמות מספיקה של מדידות לפני ואחרי ההתערבות כדי לאפשר דיוק ואמינות וכדי למנוע הטיה שנובעת מעונתיות של תוצאות- למשל, מהעובדה שדלקת ריאות שכיחה יותר בחורף. למרות הרצון לכלול כמה שיותר מדידות, לעתים נרצה להגביל את תקופת המדידות לפני ההתערבות או אחריה, כדי לא לכלול בתקופת המדידות אירוע "זר" שיכול להשפיע על התוצא.
Time series analysis
Interrupted time series analysis
Intervention/Outcome characteristics allowing time series analysis
Seasonality
Bias
מאמר הסבר מצויין על השיטה
כדי לבצע קיטוע סדרת מדידות, ההתערבות צריכה להיות מוגדרת היטב בזמן, התוצא צריך להיות כזה שמופיע זמן קצר (או לפחות זמן ידוע) לאחר ההתערבות, וצריך כמות מספיקה של מדידות לפני ואחרי ההתערבות כדי לאפשר דיוק ואמינות וכדי למנוע הטיה שנובעת מעונתיות של תוצאות- למשל, מהעובדה שדלקת ריאות שכיחה יותר בחורף. למרות הרצון לכלול כמה שיותר מדידות, לעתים נרצה להגביל את תקופת המדידות לפני ההתערבות או אחריה, כדי לא לכלול בתקופת המדידות אירוע "זר" שיכול להשפיע על התוצא.
Time series analysis
Interrupted time series analysis
Intervention/Outcome characteristics allowing time series analysis
Seasonality
Bias
Survival after Minimally Invasive Radical Hysterectomy for Early-Stage Cervical Cancer
מחקר מבוקר אקראי שפורסם בהמשך:
מחקר ה arrive:
Labor Induction versus Expectant Management in Low-Risk Nulliparous Women
Interrupted time series analysis
או בחידוש שלי- קיטוע סדרת מדידות, היא שיטה סטטיסטית המשתמשת בניסוי טבעי. אירוע מסויים הגורם לשינוי בטיפול או בחשיפה, ושימוש במדידות חוזרות של משתנה מסוים לפני ואחרי אותו אירוע. לאחר האירוע נבדקים שני השפעות אפשריות: הראשונה- השפעה מיידית על ערך המשתנה הנמדד, והשנייה- השפעה על הטרנד, מגמת ההשתנות לאורך זמן. המדידות החוזרות שלפני האירוע מאפשרות לזהות מגמת שינוי שאינה קשורה לאירוע המדובר, והשינוי במגמה לאחר האירוע יכול להיות מיוחס לאירוע עצמו.
Time series analysis
Interrupted time series analysis
Level
Treand
Change in level
Change in trend
Survival after Minimally Invasive Radical Hysterectomy for Early-Stage Cervical Cancer
מחקר מבוקר אקראי שפורסם בהמשך:
מחקר ה arrive:
Labor Induction versus Expectant Management in Low-Risk Nulliparous Women
Interrupted time series analysis
או בחידוש שלי- קיטוע סדרת מדידות, היא שיטה סטטיסטית המשתמשת בניסוי טבעי. אירוע מסויים הגורם לשינוי בטיפול או בחשיפה, ושימוש במדידות חוזרות של משתנה מסוים לפני ואחרי אותו אירוע. לאחר האירוע נבדקים שני השפעות אפשריות: הראשונה- השפעה מיידית על ערך המשתנה הנמדד, והשנייה- השפעה על הטרנד, מגמת ההשתנות לאורך זמן. המדידות החוזרות שלפני האירוע מאפשרות לזהות מגמת שינוי שאינה קשורה לאירוע המדובר, והשינוי במגמה לאחר האירוע יכול להיות מיוחס לאירוע עצמו.
Time series analysis
Interrupted time series analysis
Level
Treand
Change in level
Change in trend
כיוון שבתוך רגרסיית קוקס כלולה למעשה רגרסיה לינארית*, אפשר לבנות רווח בר סמך למקדם בתוך אותה רגרסיה לינארית. ובדיוק כפי שאפשר לתרגם את המקדם ל hazard ratio, גם את אותו רווח בר סמך למקדם אפשר לתרגם לרווח בר סמך עבור ה hazard ratio. כאשר רווח בר סמך ל hazard ratio כולל בתוכו את הערך 1, התוצאה אינה מובהקת.
*(בתוך הנוסחה יש חזקה, והרגרסיה הלינארית היא המעריך בחזקה זו)
Cox regression inference
Confidence interval for hazard ratio
כיוון שבתוך רגרסיית קוקס כלולה למעשה רגרסיה לינארית*, אפשר לבנות רווח בר סמך למקדם בתוך אותה רגרסיה לינארית. ובדיוק כפי שאפשר לתרגם את המקדם ל hazard ratio, גם את אותו רווח בר סמך למקדם אפשר לתרגם לרווח בר סמך עבור ה hazard ratio. כאשר רווח בר סמך ל hazard ratio כולל בתוכו את הערך 1, התוצאה אינה מובהקת.
*(בתוך הנוסחה יש חזקה, והרגרסיה הלינארית היא המעריך בחזקה זו)
Cox regression inference
Confidence interval for hazard ratio
Antiepileptic Drug Exposure in Infants of Breastfeeding Mothers With Epilepsy
המקדם עבור משתנה מסביר ברגרסיה הלינארית מציין שיפוע של קו. זהו הקו המתאר את הקשר בינו לבין המשתנה החזוי. בעזרת השאריות סביב קו זה אפשר לחשב את סטיית התקן לשיפוע הקו. מתוך סטיית תקן זו, מחושבת שגיאת תקן ובעזרתה אפשר לבנות רווח בר סמך. רווח בר סמך זה הוא עבור שיפוע הקו, זאת אומרת עבור המקדם בנוסחת הרגרסיה הלינארית. כאשר רווח בר סמך כולל את הערך 0, התוצאה אינה מובהקת, כיוון ששיפוע 0 מייצג העדר קשר בין המשתנה המסביר למשתנה החזוי.
Linear regression
Inference in linear regression
Confidence interval for the regression coefficient
Statistical significance
Antiepileptic Drug Exposure in Infants of Breastfeeding Mothers With Epilepsy
המקדם עבור משתנה מסביר ברגרסיה הלינארית מציין שיפוע של קו. זהו הקו המתאר את הקשר בינו לבין המשתנה החזוי. בעזרת השאריות סביב קו זה אפשר לחשב את סטיית התקן לשיפוע הקו. מתוך סטיית תקן זו, מחושבת שגיאת תקן ובעזרתה אפשר לבנות רווח בר סמך. רווח בר סמך זה הוא עבור שיפוע הקו, זאת אומרת עבור המקדם בנוסחת הרגרסיה הלינארית. כאשר רווח בר סמך כולל את הערך 0, התוצאה אינה מובהקת, כיוון ששיפוע 0 מייצג העדר קשר בין המשתנה המסביר למשתנה החזוי.
Linear regression
Inference in linear regression
Confidence interval for the regression coefficient
Statistical significance
מבחן הלוג-ראנק עוזר כאשר יש שתי קבוצות ולכל אחת מהן עקומת קפלן מאייר. המבחן בודק האם כאשר השערת האפס נכונה, סביר לקבל הבדל בין העקומות כפי שהתקבל במחקר.
השיטה של המבחן מאוד דומה למבחן חי בריבוע, ומתבססת על הפער בין הצפוי (בנוכחות השערת האפס) למה שהתקבל בפועל במחקר. אך בניגוד לחי בריבוע הרגיל, כאן הפער מחושב פעמים רבות (עבור נקודות זמן מרובות). מספר האירועים הצפוי בנקודת זמן מסוימת נובע מחלוקה של האירועים בין שתי הקבוצות באופן יחסי לגודלן. במלים אחרות, כמות האירועים הצפוייה בכל קבוצה תלויה בכמות האנשים בסיכון בכל נקודות זמן. הפער מתוקנן לכמות האירועים הצפויה בכל קבוצה.
ככל שהפער בין הצפוי בנוכחות השערת האפס למה שהתקבל בפועל יותר גדול, כך יתקבל במבחן הזה ערך גדול יותר, וערך ה p יהיה קטן יותר.
Log rank test
Kaplan-meier curves
Statistical inference
מבחן הלוג-ראנק עוזר כאשר יש שתי קבוצות ולכל אחת מהן עקומת קפלן מאייר. המבחן בודק האם כאשר השערת האפס נכונה, סביר לקבל הבדל בין העקומות כפי שהתקבל במחקר.
השיטה של המבחן מאוד דומה למבחן חי בריבוע, ומתבססת על הפער בין הצפוי (בנוכחות השערת האפס) למה שהתקבל בפועל במחקר. אך בניגוד לחי בריבוע הרגיל, כאן הפער מחושב פעמים רבות (עבור נקודות זמן מרובות). מספר האירועים הצפוי בנקודת זמן מסוימת נובע מחלוקה של האירועים בין שתי הקבוצות באופן יחסי לגודלן. במלים אחרות, כמות האירועים הצפוייה בכל קבוצה תלויה בכמות האנשים בסיכון בכל נקודות זמן. הפער מתוקנן לכמות האירועים הצפויה בכל קבוצה.
ככל שהפער בין הצפוי בנוכחות השערת האפס למה שהתקבל בפועל יותר גדול, כך יתקבל במבחן הזה ערך גדול יותר, וערך ה p יהיה קטן יותר.
Log rank test
Kaplan-meier curves
Statistical inference
למרות שמדובר בטכניקות מורכבות, גם הרגרסיות וגם עקומת קפלן מאייר הן רק סטטיסטיקה תיאורית. הן מספרות לנו משהו על המדגם במחקר מסוים, אך אינן מספיקות כדי להסיק מתוכן על המציאות, האמת שמחוץ למחקר. כדי להסיק על המציאות ניתן להשתמש ברווח ברך סמך (עבור מקדמי רגרסיות, למשל) ובמבחנים סטטיסטיים (להשוואה בין שתי עקומות קפלן-מאייר, למשל)
Kaplan-meier curves
Cox regression
Statistical inference in regressions
Statistical test
Confidence interval
למרות שמדובר בטכניקות מורכבות, גם הרגרסיות וגם עקומת קפלן מאייר הן רק סטטיסטיקה תיאורית. הן מספרות לנו משהו על המדגם במחקר מסוים, אך אינן מספיקות כדי להסיק מתוכן על המציאות, האמת שמחוץ למחקר. כדי להסיק על המציאות ניתן להשתמש ברווח ברך סמך (עבור מקדמי רגרסיות, למשל) ובמבחנים סטטיסטיים (להשוואה בין שתי עקומות קפלן-מאייר, למשל)
Kaplan-meier curves
Cox regression
Statistical inference in regressions
Statistical test
Confidence interval
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
נוסחת רגרסיית קוקס דומה מאוד לנוסחת הרגרסיה הלוגיסטית. בשני המקרים מדובר בחזקה, במספר אוילר (e) בבסיס, ובמעריך שבו רצף דומה מאוד לנוסחת הרגרסיה הלינארית: מכפלות המחוברות אחת לשנייה. כל מכפלה היא מקדם מסוים כפול משתנה מסויים, למשל המקדם 0.48 כפול לחץ הדם הסיסטולי. כדי לתרגם מקדם ל HR (hazard ratio), אפשר פשוט להציב אותו כמעריך של מספר אוילר (e). למשל, כאשר מספר אוילר מועלה בחזקת 0.48, מקבלים HR של 1.58, וזוהי הייתה אכן התוצאה שפורסמה במחקר ושהתקבלה מתוך רגרסיית קוקס שכללה גם משתנים אחרים. ה HR לתמותה כללית היה 1.58 עבור כל עליה של סטיית תקן אחת (14 ממ כספית) בלחץ הדם הביתי. (רווח בר סמך: 1.56-1.60)
Cox regression formula
Cox regression coefficients
Hazard ratio- HR
Translation from coefficients to HR
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
נוסחת רגרסיית קוקס דומה מאוד לנוסחת הרגרסיה הלוגיסטית. בשני המקרים מדובר בחזקה, במספר אוילר (e) בבסיס, ובמעריך שבו רצף דומה מאוד לנוסחת הרגרסיה הלינארית: מכפלות המחוברות אחת לשנייה. כל מכפלה היא מקדם מסוים כפול משתנה מסויים, למשל המקדם 0.48 כפול לחץ הדם הסיסטולי. כדי לתרגם מקדם ל HR (hazard ratio), אפשר פשוט להציב אותו כמעריך של מספר אוילר (e). למשל, כאשר מספר אוילר מועלה בחזקת 0.48, מקבלים HR של 1.58, וזוהי הייתה אכן התוצאה שפורסמה במחקר ושהתקבלה מתוך רגרסיית קוקס שכללה גם משתנים אחרים. ה HR לתמותה כללית היה 1.58 עבור כל עליה של סטיית תקן אחת (14 ממ כספית) בלחץ הדם הביתי. (רווח בר סמך: 1.56-1.60)
Cox regression formula
Cox regression coefficients
Hazard ratio- HR
Translation from coefficients to HR
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
יש שתי סיבות עקריות להשתמש ברגרסיית קוקס ולא בעקומות קפלן מאייר. אחת- כאשר המשתנה המסביר הוא כמותי (ולא קטגוריאלי עם שתי קבוצות בלבד). השנייה, חשובה יותר, היא כיוון שכך ניתן לקחת בחשבון מאפיינים נוספים מרובים של המטופלים, ולנטרל ערפלנים.
Cox regression
Multivariate analysis
Adjustment for confounders
Prediction
Kaplan-Meier method
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
יש שתי סיבות עקריות להשתמש ברגרסיית קוקס ולא בעקומות קפלן מאייר. אחת- כאשר המשתנה המסביר הוא כמותי (ולא קטגוריאלי עם שתי קבוצות בלבד). השנייה, חשובה יותר, היא כיוון שכך ניתן לקחת בחשבון מאפיינים נוספים מרובים של המטופלים, ולנטרל ערפלנים.
Cox regression
Multivariate analysis
Adjustment for confounders
Prediction
Kaplan-Meier method
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
בפרק הזה נבין את משמעות ה hazard ratio (HR) בתוצאות מחקר.
עבור משתנה כמותי , HR מציין פי כמה הקצב של האירועים גדל עבור כל יחידת מדידה של המשתנה. עבור משתנה קטגוריאלי, נבחרת קבוצת התייחסות, וה HR מציין פי כמה קצב האירועים גדל כאשר המשתתף שייך לקבוצה אחרת.
כאשר ה HR גדול מ 1, מדובר בעליה בסיכון לאירוע. כאשר הוא קטן מ 1, מדובר בירידת סיכון, וכאשר הוא 1, מדובר במשתנה שלא משפיע על האירוע. הרווח בר סמך סביב ה HR מראה לנו האם התוצאה מובהקת. רווח בר סמך הכולל בתוכו את המספר 1 מעיד על תוצאה שאינה מובהקת- גורם סיכון שאולי לא באמת מגביר סיכון, או טיפול שאולי לא באמת מפחית סיכון.
Cox regression
Hazard ratio
(Categorical (nominal) variable (and reference
Quantitative variable
Cox regression coefficients
Confidence interval for hazard ratio
statistical significance of hazard ratio
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
בפרק הזה נבין את משמעות ה hazard ratio (HR) בתוצאות מחקר.
עבור משתנה כמותי , HR מציין פי כמה הקצב של האירועים גדל עבור כל יחידת מדידה של המשתנה. עבור משתנה קטגוריאלי, נבחרת קבוצת התייחסות, וה HR מציין פי כמה קצב האירועים גדל כאשר המשתתף שייך לקבוצה אחרת.
כאשר ה HR גדול מ 1, מדובר בעליה בסיכון לאירוע. כאשר הוא קטן מ 1, מדובר בירידת סיכון, וכאשר הוא 1, מדובר במשתנה שלא משפיע על האירוע. הרווח בר סמך סביב ה HR מראה לנו האם התוצאה מובהקת. רווח בר סמך הכולל בתוכו את המספר 1 מעיד על תוצאה שאינה מובהקת- גורם סיכון שאולי לא באמת מגביר סיכון, או טיפול שאולי לא באמת מפחית סיכון.
Cox regression
Hazard ratio
(Categorical (nominal) variable (and reference
Quantitative variable
Cox regression coefficients
Confidence interval for hazard ratio
statistical significance of hazard ratio
טעות בהעלאת הפרק האחרון: ההקלטה שהועלתה השבוע לפרק "ההסבר הפשוט על רגרסיית קוקס" הייתה שגויה, וכעת העניין תוקן וההקלטה הנכונה הועלתה. מעכשיו באתר הפודקאסט ebm.podneam.com ועוד כמה ימים בכל אפליקציות הפודקאסטים, תוכלו לשמוע את הפרק האמיתי. תודה רבה לאביהוא על ההערה ובכלל לכל המאזינים ששלחו לי הערות, רעיונות ובקשות. לפודקאסט יש דף פייסבוק: "רפואה נתמכת ראיות- הפודקאסט" ואפשר לשלוח לי דרכו הערות מחשבות ובעקר, אם יש נושא חשוב בסטטיסטיקה שנראה לכם שהחמצתי ותרצו שאעשה עליו פרק.
טעות בהעלאת הפרק האחרון: ההקלטה שהועלתה השבוע לפרק "ההסבר הפשוט על רגרסיית קוקס" הייתה שגויה, וכעת העניין תוקן וההקלטה הנכונה הועלתה. מעכשיו באתר הפודקאסט ebm.podneam.com ועוד כמה ימים בכל אפליקציות הפודקאסטים, תוכלו לשמוע את הפרק האמיתי. תודה רבה לאביהוא על ההערה ובכלל לכל המאזינים ששלחו לי הערות, רעיונות ובקשות. לפודקאסט יש דף פייסבוק: "רפואה נתמכת ראיות- הפודקאסט" ואפשר לשלוח לי דרכו הערות מחשבות ובעקר, אם יש נושא חשוב בסטטיסטיקה שנראה לכם שהחמצתי ותרצו שאעשה עליו פרק.
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
רגרסיית קוקס היא מודל שמשתמש במונח ההאזארד, ומכפיל אותו ב hazard ratio מסוים עבור כל משתנה, כדי לקבל האזארד חדש. הנחת היסוד של המודל הזה, היא שהיחס בין שני האזארדים (ה hazard ratio) עבור כל משתנה נשאר דומה לאורך תקופת המעקב. המודל מאפשר לנו להעריך את אותו יחס, זאת אומרת פי כמה קצב האירועים (ההאזארד) בקבוצה אחת גבוה מקצב האירועים בקבוצה אחרת בנקודת זמן מסוימת. בגלל הנחת היסוד, אותו יחס יהיה רלוונטי בנקודות זמן שונות.
Proportional hazards model- Cox regression
Proportional hazards assumption
hazard
hazard ratio
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
רגרסיית קוקס היא מודל שמשתמש במונח ההאזארד, ומכפיל אותו ב hazard ratio מסוים עבור כל משתנה, כדי לקבל האזארד חדש. הנחת היסוד של המודל הזה, היא שהיחס בין שני האזארדים (ה hazard ratio) עבור כל משתנה נשאר דומה לאורך תקופת המעקב. המודל מאפשר לנו להעריך את אותו יחס, זאת אומרת פי כמה קצב האירועים (ההאזארד) בקבוצה אחת גבוה מקצב האירועים בקבוצה אחרת בנקודת זמן מסוימת. בגלל הנחת היסוד, אותו יחס יהיה רלוונטי בנקודות זמן שונות.
Proportional hazards model- Cox regression
Proportional hazards assumption
hazard
hazard ratio
Early Palliative Care for Patients with Metastatic Non–Small-Cell Lung Cancer
Initial Invasive or Conservative Strategy for Stable Coronary Disease
עקומת קפלן מאייר היא אומדן. אומדן של עקומת השרידות אותה היינו רואים לו היו לנו נתונים עבור כל התקופה לכל משתתפי המחקר. בציר האופקי נמצא הזמן מתחילת המעקב, או מהרנדומיזציה, ובציר האנכי אומדן אחוז השרידות (או שיעור ההארעות המצטבר). אם נרצה לבדוק מהו אחוז השרידות לאחר תקופת זמן מסוימת, נתחיל מהציר האופקי. נחתוך את הגרף בנקודת הזמן שמעניינת אותנו, ואז נבדוק מהו אחוז השרידות בציר האנכי. אם נרצה לבדוק מהו אומדן זמן השרידות החציוני, נתחיל מהציר האנכי, בגובה בו השרידות היא 50%, ונבדוק באיזו נקודת זמן הגרף נחתך. לעתים על גבי העקומה יסומנו קווים אנכיים קטנים- אלו הם מקרי הצנזור, אנשים שעדיין לא חוו אירוע, אך שמנקודת זמן זו והלאה כבר אין לגביהם נתונים. סביב עקומת קפלן מאייר אפשר לצייר ענן שמייצג רווח בר סמך לשיעור השרידות עבור כל נקודה בזמן.
Kaplan-meyer curve
Censoring
Confidence interval for the KM curve
Number at risk
Median survival time
Early Palliative Care for Patients with Metastatic Non–Small-Cell Lung Cancer
Initial Invasive or Conservative Strategy for Stable Coronary Disease
עקומת קפלן מאייר היא אומדן. אומדן של עקומת השרידות אותה היינו רואים לו היו לנו נתונים עבור כל התקופה לכל משתתפי המחקר. בציר האופקי נמצא הזמן מתחילת המעקב, או מהרנדומיזציה, ובציר האנכי אומדן אחוז השרידות (או שיעור ההארעות המצטבר). אם נרצה לבדוק מהו אחוז השרידות לאחר תקופת זמן מסוימת, נתחיל מהציר האופקי. נחתוך את הגרף בנקודת הזמן שמעניינת אותנו, ואז נבדוק מהו אחוז השרידות בציר האנכי. אם נרצה לבדוק מהו אומדן זמן השרידות החציוני, נתחיל מהציר האנכי, בגובה בו השרידות היא 50%, ונבדוק באיזו נקודת זמן הגרף נחתך. לעתים על גבי העקומה יסומנו קווים אנכיים קטנים- אלו הם מקרי הצנזור, אנשים שעדיין לא חוו אירוע, אך שמנקודת זמן זו והלאה כבר אין לגביהם נתונים. סביב עקומת קפלן מאייר אפשר לצייר ענן שמייצג רווח בר סמך לשיעור השרידות עבור כל נקודה בזמן.
Kaplan-meyer curve
Censoring
Confidence interval for the KM curve
Number at risk
Median survival time
Initial Invasive or Conservative Strategy for Stable Coronary Disease
עקומת קפלן מאייר היא אומדן לעקומת שרידות או לעקומת אירועים מצטברים, וההסתכלות עליה דומה מאוד. אך בכל נקודת זמן היא מחושבת ומשורטטת לפי המשתתפים במחקר שזמינים לחוקרים. כיוון שבמחקר יש גיוס הדרגתי של משתתפים, חלק מהמשתתפים, אלו שגויסו מוקדם, יהיו עם זמן מעקב ארוך, אך חלק אחר, הקבוצה שגויסה מאוחר, ישתתפו במחקר רק זמן קצר ולכן יתרמו נתונים רק לתקופת הזמן הראשונה. בכל נקודת זמן אחוז הצטברות האירועים מחושב לא יחסית לקבוצה כולה אלא יחסית למספר האנשים הזמינים למעקב שעדיין לא עברו אירוע. אנשים הזמינים למעקב מייצגים עבור החישוב גם את האנשים שכבר אינם זמינים למעקב. העקומה המתקבלת מייצגת ומעריכה את שיעור האירועים המצטברים, או את שיעור השרידות בכל הקבוצה, אך חשוב לזכור שזהו רק אומדן, כיוון שלאורך הזמן יש פחות ופחות אנשים עבורם קיימים נתונים.
Kaplan meyer curve
Kaplan-Meier estimate
number at risk
Initial Invasive or Conservative Strategy for Stable Coronary Disease
עקומת קפלן מאייר היא אומדן לעקומת שרידות או לעקומת אירועים מצטברים, וההסתכלות עליה דומה מאוד. אך בכל נקודת זמן היא מחושבת ומשורטטת לפי המשתתפים במחקר שזמינים לחוקרים. כיוון שבמחקר יש גיוס הדרגתי של משתתפים, חלק מהמשתתפים, אלו שגויסו מוקדם, יהיו עם זמן מעקב ארוך, אך חלק אחר, הקבוצה שגויסה מאוחר, ישתתפו במחקר רק זמן קצר ולכן יתרמו נתונים רק לתקופת הזמן הראשונה. בכל נקודת זמן אחוז הצטברות האירועים מחושב לא יחסית לקבוצה כולה אלא יחסית למספר האנשים הזמינים למעקב שעדיין לא עברו אירוע. אנשים הזמינים למעקב מייצגים עבור החישוב גם את האנשים שכבר אינם זמינים למעקב. העקומה המתקבלת מייצגת ומעריכה את שיעור האירועים המצטברים, או את שיעור השרידות בכל הקבוצה, אך חשוב לזכור שזהו רק אומדן, כיוון שלאורך הזמן יש פחות ופחות אנשים עבורם קיימים נתונים.
Kaplan meyer curve
Kaplan-Meier estimate
number at risk
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
Initial Invasive or Conservative Strategy for Stable Coronary Disease
האזארד הוא הסיכוי לאירוע ביחידת הזמן הקרובה, בתנאי שהמשתתף במחקר כבר הגיע לנקודת זמן זו ללא אירוע עד כה. במלים פשוטות מדובר בקצב האירועים הצפוי ביחידת זמן, אך חשוב להבין שמדובר בחישוב מותנה: רק עבור אלו שהגיעו לתחילת יחידת זמן זו ללא התרחשות האירוע. גם כאשר קצב האירועים הוא לכאורה אחיד, למשל 600 אירועים בשנה מתוך 30000 משתתפים בתחילת המחקר, ההאזארד משתנה, כיוון שבתחילת המחקר יש 30,000 איש בסיכון, אך לאחר ארבע שנים ו 2400 אירועים, נותרו רק 27,600 איש בסיכון ורק מתוכם מחושב ההאזארד עבור נקודת הזמן הזו.
אם יש לנו נתונים של ההאזארד בשתי קבוצות באותה נקודת זמן, אפשר לחלק האזארד של קבוצה אחת בהאזארד של הקבוצה השניה ולקבל את היחס ביניהם: ההאזארד רשיו (סליחה על האינגליש).
במצבים מסוימים, יחס זה נשאר קבוע פחות או יותר לאורך כל תקופת המעקב ואז החוקרים יציגו לנו אותו כהאזארד רשיו הכללי. למשל, במחקר על השפעת יתר לחץ דם ממוסך על תמותה כללית, ההאזארד רשיו (של אנשים עם יתר לחץ דם ממוסך לעומת אנשים ללא יתר לחץ דם) היה 2.8.
במצבים אחרים, בהם עקומות ההשרדות של שתי קבוצות חוצות אחת את השנייה, נוכל להבין שההאזארד רשיו אינו קבוע.
hazard
Hazard ratio (HR)
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
Initial Invasive or Conservative Strategy for Stable Coronary Disease
האזארד הוא הסיכוי לאירוע ביחידת הזמן הקרובה, בתנאי שהמשתתף במחקר כבר הגיע לנקודת זמן זו ללא אירוע עד כה. במלים פשוטות מדובר בקצב האירועים הצפוי ביחידת זמן, אך חשוב להבין שמדובר בחישוב מותנה: רק עבור אלו שהגיעו לתחילת יחידת זמן זו ללא התרחשות האירוע. גם כאשר קצב האירועים הוא לכאורה אחיד, למשל 600 אירועים בשנה מתוך 30000 משתתפים בתחילת המחקר, ההאזארד משתנה, כיוון שבתחילת המחקר יש 30,000 איש בסיכון, אך לאחר ארבע שנים ו 2400 אירועים, נותרו רק 27,600 איש בסיכון ורק מתוכם מחושב ההאזארד עבור נקודת הזמן הזו.
אם יש לנו נתונים של ההאזארד בשתי קבוצות באותה נקודת זמן, אפשר לחלק האזארד של קבוצה אחת בהאזארד של הקבוצה השניה ולקבל את היחס ביניהם: ההאזארד רשיו (סליחה על האינגליש).
במצבים מסוימים, יחס זה נשאר קבוע פחות או יותר לאורך כל תקופת המעקב ואז החוקרים יציגו לנו אותו כהאזארד רשיו הכללי. למשל, במחקר על השפעת יתר לחץ דם ממוסך על תמותה כללית, ההאזארד רשיו (של אנשים עם יתר לחץ דם ממוסך לעומת אנשים ללא יתר לחץ דם) היה 2.8.
במצבים אחרים, בהם עקומות ההשרדות של שתי קבוצות חוצות אחת את השנייה, נוכל להבין שההאזארד רשיו אינו קבוע.
hazard
Hazard ratio (HR)
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
במחקרים בהם עוקבים אחר אנשים לאורך זמן ובודקים מתי התרחש אירוע מסויים, למשל תמותה, אפשר לשרטט את גרף האירועים המצטברים לאורך זמן, זאת אומרת איזה אחוז מהקבוצה המקורית עבר כבר אירוע בנקודת זמן כלשהי.
בכל נקודת זמן, יש גם את קבוצת האנשים שלא עברו אירוע, ואלו נקראים "השורדים". נאמר שהאירוע בו מדובר הוא תמותה. בכל נקודת זמן אחוז השרידות הוא המשלים לאחד של אחוז התמותה המצטברת. למשל, אם עד נקודה מסוימת נפטרו 2% מהקבוצה המקורית, אחוז השרידות באותה נקודה יהיה 98%. לכן, עקומת השרידות תהיה עקומה הפוכה לעקומת התמותה המצטברת, מעין תמונת ראי שלה. עקומת התמותה המצטברת תהיה גרף עולה, ועקומת השרידות, גרף יורד.
כאשר קצב האירועים (יחסית לקבוצה ממנה התחלנו!) הוא אחיד, עקומת השרידות תהיה קו ישר, אך כאשר קצב האירועים מתמתן, עקומת השרידות תהיה מעוקלת, עם "בטן" הפונה כלפי מטה.
Survival analysis
Survival curve
Relationship between Clinic and Ambulatory Blood-Pressure Measurements and Mortality
במחקרים בהם עוקבים אחר אנשים לאורך זמן ובודקים מתי התרחש אירוע מסויים, למשל תמותה, אפשר לשרטט את גרף האירועים המצטברים לאורך זמן, זאת אומרת איזה אחוז מהקבוצה המקורית עבר כבר אירוע בנקודת זמן כלשהי.
בכל נקודת זמן, יש גם את קבוצת האנשים שלא עברו אירוע, ואלו נקראים "השורדים". נאמר שהאירוע בו מדובר הוא תמותה. בכל נקודת זמן אחוז השרידות הוא המשלים לאחד של אחוז התמותה המצטברת. למשל, אם עד נקודה מסוימת נפטרו 2% מהקבוצה המקורית, אחוז השרידות באותה נקודה יהיה 98%. לכן, עקומת השרידות תהיה עקומה הפוכה לעקומת התמותה המצטברת, מעין תמונת ראי שלה. עקומת התמותה המצטברת תהיה גרף עולה, ועקומת השרידות, גרף יורד.
כאשר קצב האירועים (יחסית לקבוצה ממנה התחלנו!) הוא אחיד, עקומת השרידות תהיה קו ישר, אך כאשר קצב האירועים מתמתן, עקומת השרידות תהיה מעוקלת, עם "בטן" הפונה כלפי מטה.
Survival analysis
Survival curve
Predicting Mortality in Patients with Diabetes Starting Dialysis
מהי משמעות הקבוע והמקדמים המתקבלים ברגרסיה לוגיסטית ואיך לתרגם את המקדמים ליחסי הסיכויים
יחסי הסיכויים - odds ratio
Predicting Mortality in Patients with Diabetes Starting Dialysis
מהי משמעות הקבוע והמקדמים המתקבלים ברגרסיה לוגיסטית ואיך לתרגם את המקדמים ליחסי הסיכויים
יחסי הסיכויים - odds ratio
ישנה דרך אחרת לבטא את נוסחת הרגרסיה הלוגיסטית שהכרנו בפרק הקודם. במקום להשתמש בחזקה שבה מספר אוילר הוא הבסיס, והתוצאה היא האודס, מבצעים לוג על שני הצדדים ומקבלים את הנוסחה הזו:
Log odds=R
כאשר "R" היא נוסחת הרגרסיה הלינארית המוכרת והלוג הוא על בסיס e.
כך שאם ברגרסיה הלינארית הצבנו את הקבוע והמקדמים בצורה שתתן לנו ערך, כאן מתקבל לנו ה log odds, ולכן logistic
logistic regression
מספר אוילר- e
ישנה דרך אחרת לבטא את נוסחת הרגרסיה הלוגיסטית שהכרנו בפרק הקודם. במקום להשתמש בחזקה שבה מספר אוילר הוא הבסיס, והתוצאה היא האודס, מבצעים לוג על שני הצדדים ומקבלים את הנוסחה הזו:
Log odds=R
כאשר "R" היא נוסחת הרגרסיה הלינארית המוכרת והלוג הוא על בסיס e.
כך שאם ברגרסיה הלינארית הצבנו את הקבוע והמקדמים בצורה שתתן לנו ערך, כאן מתקבל לנו ה log odds, ולכן logistic
logistic regression
מספר אוילר- e
Predicting Mortality in Patients with Diabetes Starting Dialysis
איך בנויה נוסחת הרגרסיה הלוגיסטית? היא משתמשת באותה נוסחה לינארית שהכרנו, אך התוצאה שלה צריכה לייצג סבירות. את זה הנוסחה עושה בעזרת שימוש בשני טריקים מתמטיים. הראשון הופך את התוצאה לכזו שתמיד תהיה חיובית- הכנסת הנוסחה כמעריך של חזקה. השני מאפשר להשתמש בתוצאה גם כשהיא גדולה מאחד: התוצאה מתקבלת בצורת odds במקום כ risk.
Logistic regression formula
Logistic regression coefficients
Predicting Mortality in Patients with Diabetes Starting Dialysis
איך בנויה נוסחת הרגרסיה הלוגיסטית? היא משתמשת באותה נוסחה לינארית שהכרנו, אך התוצאה שלה צריכה לייצג סבירות. את זה הנוסחה עושה בעזרת שימוש בשני טריקים מתמטיים. הראשון הופך את התוצאה לכזו שתמיד תהיה חיובית- הכנסת הנוסחה כמעריך של חזקה. השני מאפשר להשתמש בתוצאה גם כשהיא גדולה מאחד: התוצאה מתקבלת בצורת odds במקום כ risk.
Logistic regression formula
Logistic regression coefficients
ברגרסיה לוגיסטית הערך החזוי אינו מספר אלא סיכוי. למשל, באנשים עם מעורבות מוחית של קדחת הנילוס המערבי, מה הסיכוי לתמותה. כמו ברגרסיה לינארית, מדובר במצבים בהם אנחנו רוצים לבחון כמה משתנים מסבירים בבת אחת כדי לחזות משתנה (חזוי) אחד. אך כאן המשתנה החזוי הוא קטגוריאלי. למשל, נפטר או לא נפטר. דרך פשוטה להסביר רגרסיה לוגיסטית, היא שהיא מאפשרת לנו לבצע תחזית בעזרת סיכוי בסיסי מסויים, המוכפל ביחסי סיכויים. הסיכוי כאן מוגדר כ odds ולא כ risk.
אם ברגרסיה הלינארית עסקנו בחיבור של מכפלות כדי לקבל ערך מספרי, כאן עוסקים בכפל של מכפלות כדי לקבל odds לאירוע.
בהמשך נסביר את נוסחת הרגרסיה בצורה מדויקת יותר, אך בינתיים אפשר להבינה כך: קבלת נוסחת הרגרסיה בעזרת המחקר מאפשרת לחשב את ה odds החזוי, כיוון שהיא מספקת odds בסיסי, וכן odds ratio מסויים עבור כל אחד מהמשתנים. למשל, במחקר שהוזכר בפרק, עבור דיכוי חיסוני , ה OR לתמותה היה 26. לכן, כאשר יש דיכוי חיסוני, ה odds לתמותה מוכפל ב 26.
Logistic regression
Odds
Odds ratio=OR
Multivariate analysis
ברגרסיה לוגיסטית הערך החזוי אינו מספר אלא סיכוי. למשל, באנשים עם מעורבות מוחית של קדחת הנילוס המערבי, מה הסיכוי לתמותה. כמו ברגרסיה לינארית, מדובר במצבים בהם אנחנו רוצים לבחון כמה משתנים מסבירים בבת אחת כדי לחזות משתנה (חזוי) אחד. אך כאן המשתנה החזוי הוא קטגוריאלי. למשל, נפטר או לא נפטר. דרך פשוטה להסביר רגרסיה לוגיסטית, היא שהיא מאפשרת לנו לבצע תחזית בעזרת סיכוי בסיסי מסויים, המוכפל ביחסי סיכויים. הסיכוי כאן מוגדר כ odds ולא כ risk.
אם ברגרסיה הלינארית עסקנו בחיבור של מכפלות כדי לקבל ערך מספרי, כאן עוסקים בכפל של מכפלות כדי לקבל odds לאירוע.
בהמשך נסביר את נוסחת הרגרסיה בצורה מדויקת יותר, אך בינתיים אפשר להבינה כך: קבלת נוסחת הרגרסיה בעזרת המחקר מאפשרת לחשב את ה odds החזוי, כיוון שהיא מספקת odds בסיסי, וכן odds ratio מסויים עבור כל אחד מהמשתנים. למשל, במחקר שהוזכר בפרק, עבור דיכוי חיסוני , ה OR לתמותה היה 26. לכן, כאשר יש דיכוי חיסוני, ה odds לתמותה מוכפל ב 26.
Logistic regression
Odds
Odds ratio=OR
Multivariate analysis
The Mortality of Doctors in Relation to Their Smoking Habits
כדי להבין רגרסיה לוגיסטית נצטרך להבהיר שני מושגים.
Odds
המונח "אודס" הוא דרך לבטא סיכון או סיכוי לאירוע מסוים. בכך הוא דומה מאוד לסיכון ("ריסק"). הוא מציין חלוקת שני מספרים: אלו עם האירוע חלקי אלו ללא האירוע, לדוגמה מספר האנשים שנפטרו חלקי מספר האנשים שלא נפטרו. בניגוד לסיכון, "ריסק", שיכול לקבל רק ערכים קטנים מ 1, אודס יכול להיות כל מספר חיובי. כאשר מדובר באירועים נדירים, האודס והריסק יהיו קרובים מאוד. (סליחה על הכיתוב באינגליש, אך האתר מסדר מלים באנגלית מחוץ לשורה) אך באירועים נפוצים הם יהיו שונים מאוד.
Odds ratio
אם יש לנו שתי קבוצות ובכל אחת מצאנו מהו ה"אודס", נוכל לבצע חלוקה בין שני אלו ולקבל את היחס ביניהם. זהו האודס רשיו, יחס הסיכויים. כאשר מדובר באירועים נדירים, יחס זה יהיה קרוב ל"רלטיב ריסק", יחס הסיכונים.
האודס מאפשר לעשות פעולות שלא ניתן לבצע עם ריסק, כיוון שתמיד יהיה אפשר להכפיל אודס באודס רשיו ולקבל אודס חדש. למשל, אם ידוע לנו מהו האודס לסרטן ריאה במעשנים קלים יחסית, נוכל להכפיל את האודס הזה באודס רשיו שחושב עבור עישון כבד ולקבל את האודס (הסיכוי) לסרטן ריאה במעשנים כבדים.
Odds
Odds ratio
Risk
Relative risk
The Mortality of Doctors in Relation to Their Smoking Habits
כדי להבין רגרסיה לוגיסטית נצטרך להבהיר שני מושגים.
Odds
המונח "אודס" הוא דרך לבטא סיכון או סיכוי לאירוע מסוים. בכך הוא דומה מאוד לסיכון ("ריסק"). הוא מציין חלוקת שני מספרים: אלו עם האירוע חלקי אלו ללא האירוע, לדוגמה מספר האנשים שנפטרו חלקי מספר האנשים שלא נפטרו. בניגוד לסיכון, "ריסק", שיכול לקבל רק ערכים קטנים מ 1, אודס יכול להיות כל מספר חיובי. כאשר מדובר באירועים נדירים, האודס והריסק יהיו קרובים מאוד. (סליחה על הכיתוב באינגליש, אך האתר מסדר מלים באנגלית מחוץ לשורה) אך באירועים נפוצים הם יהיו שונים מאוד.
Odds ratio
אם יש לנו שתי קבוצות ובכל אחת מצאנו מהו ה"אודס", נוכל לבצע חלוקה בין שני אלו ולקבל את היחס ביניהם. זהו האודס רשיו, יחס הסיכויים. כאשר מדובר באירועים נדירים, יחס זה יהיה קרוב ל"רלטיב ריסק", יחס הסיכונים.
האודס מאפשר לעשות פעולות שלא ניתן לבצע עם ריסק, כיוון שתמיד יהיה אפשר להכפיל אודס באודס רשיו ולקבל אודס חדש. למשל, אם ידוע לנו מהו האודס לסרטן ריאה במעשנים קלים יחסית, נוכל להכפיל את האודס הזה באודס רשיו שחושב עבור עישון כבד ולקבל את האודס (הסיכוי) לסרטן ריאה במעשנים כבדים.
Odds
Odds ratio
Risk
Relative risk
רגרסיה לינארית מצריכה קשר לינארי בין המשתנה המסביר למשתנה החזוי. מה קורה כאשר לא זה המצב?
ניתן לבצע טרנספורמציה (ביטוי מחדש) לאחד המשתנים, כפי שהסברנו בפרק "ביטוי מחדש"
ואז להכניס את המשתנה (לאחר הביטוי מחדש שלו) לנוסחת הרגרסיה. לכן לעתים כאשר נקרא מאמר שהשתמש ברגרסייה לינארית, ניתקל במושג טרנספורמציה. שיטה זו מקובלת ורצויה אך גוזלת מאתנו הקוראים את הבנת המשמעות הקלינית של מקדם הרגרסיה.
linear regression
log-transformation
assumptions
רגרסיה לינארית מצריכה קשר לינארי בין המשתנה המסביר למשתנה החזוי. מה קורה כאשר לא זה המצב?
ניתן לבצע טרנספורמציה (ביטוי מחדש) לאחד המשתנים, כפי שהסברנו בפרק "ביטוי מחדש"
ואז להכניס את המשתנה (לאחר הביטוי מחדש שלו) לנוסחת הרגרסיה. לכן לעתים כאשר נקרא מאמר שהשתמש ברגרסייה לינארית, ניתקל במושג טרנספורמציה. שיטה זו מקובלת ורצויה אך גוזלת מאתנו הקוראים את הבנת המשמעות הקלינית של מקדם הרגרסיה.
linear regression
log-transformation
assumptions
Prediction Factors in the Determination of Final Height in Subjects Born Small for Gestational Age
רגרסיה לינארית מנסה לחזות עבור משתתפי המחקר מהו ערך המשתנה החזוי אצלם, בעזרת המשתנים המסבירים. עד כמה היא עושה את זה טוב? מדד פשוט הוא היחס בין השונות של המשתנה החזוי המוסברת על ידי נוסחת הרגרסיה, חלקי השונות הכללית של אותו משתנה חזוי. זהו ערך ה R בריבוע.
R squared
Total variation
Variation explained by the regression
Overfitting
Prediction Factors in the Determination of Final Height in Subjects Born Small for Gestational Age
רגרסיה לינארית מנסה לחזות עבור משתתפי המחקר מהו ערך המשתנה החזוי אצלם, בעזרת המשתנים המסבירים. עד כמה היא עושה את זה טוב? מדד פשוט הוא היחס בין השונות של המשתנה החזוי המוסברת על ידי נוסחת הרגרסיה, חלקי השונות הכללית של אותו משתנה חזוי. זהו ערך ה R בריבוע.
R squared
Total variation
Variation explained by the regression
Overfitting
Prediction Factors in the Determination of Final Height in Subjects Born Small for Gestational Age
ברגרסיה לינארית מרובה, תוצאת המחקר היא נוסחת רגרסיה עם מקדמים. אותם מקדמים הם הדבר שמעניין אותנו, כיוון שהם יראו לנו מהי השפעת משתנה מסוים, כששאר המשתנים נשארים קבועים. כאשר מדברים על תיקון (adjustment) למשתנים נוספים או שליטה (control) עליהם, הכוונה היא חישוב מקדם הרגרסיה של המשתנה שמעניין אותנו כאשר הרגרסיה כוללת גם את המשתנים הנוספים האלו.
מקדם הרגרסיה ברגרסיה לינארית אומר בכמה יחידות יעלה המשתנה החזוי כאשר יש עלייה של יחידה אחת במשתנה המסביר. אך כאשר יש משתנה מסביר קטגוריאלי (שהוא לא כמותי ולכן אין לו יחידות), צריך למצוא פתרון כדי לתת למשתנה הזה ערך מספרי. קטגוריה אחת בדרך כלל תקבל את הערך 0, וקטגוריה שניה את הערך 1, וערכים אלו יוכפלו במקדם. לכן עבור משתנה קטגוריאלי מקדם הרגרסיה אומר לנו בכמה יחידות יעלה המשתנה החזוי אצל משתתף בקטגוריה 1 יחסית למשתתף בקטגוריה 0 כאשר כל שאר המשתנים נשארים קבועים.
R squared in linear regression
Regression coefficients
Controlling/adjusting for other variables
Prediction Factors in the Determination of Final Height in Subjects Born Small for Gestational Age
ברגרסיה לינארית מרובה, תוצאת המחקר היא נוסחת רגרסיה עם מקדמים. אותם מקדמים הם הדבר שמעניין אותנו, כיוון שהם יראו לנו מהי השפעת משתנה מסוים, כששאר המשתנים נשארים קבועים. כאשר מדברים על תיקון (adjustment) למשתנים נוספים או שליטה (control) עליהם, הכוונה היא חישוב מקדם הרגרסיה של המשתנה שמעניין אותנו כאשר הרגרסיה כוללת גם את המשתנים הנוספים האלו.
מקדם הרגרסיה ברגרסיה לינארית אומר בכמה יחידות יעלה המשתנה החזוי כאשר יש עלייה של יחידה אחת במשתנה המסביר. אך כאשר יש משתנה מסביר קטגוריאלי (שהוא לא כמותי ולכן אין לו יחידות), צריך למצוא פתרון כדי לתת למשתנה הזה ערך מספרי. קטגוריה אחת בדרך כלל תקבל את הערך 0, וקטגוריה שניה את הערך 1, וערכים אלו יוכפלו במקדם. לכן עבור משתנה קטגוריאלי מקדם הרגרסיה אומר לנו בכמה יחידות יעלה המשתנה החזוי אצל משתתף בקטגוריה 1 יחסית למשתתף בקטגוריה 0 כאשר כל שאר המשתנים נשארים קבועים.
R squared in linear regression
Regression coefficients
Controlling/adjusting for other variables
ברגרסיה לינארית מרובה יש יותר ממשתנה מסביר אחד, ולעתים קרובות משתנים מסבירים מרובים. כל משתנה מסביר מקבל מקדם משלו בנוסחת הרגרסיה, ואותו מקדם מייצג את השפעת אותו משתנה על המשתנה המוסבר, לו היינו שולטים על כל שאר המשתנים האחרים ("מנטרלים" אותם). מבחינת תיאור גרפי, המעבר מרגרסיה לינארית פשוטה לרגרסיה עם שני משתנים מסבירים דורש מעבר מקו על דף למרחב תלת ממדי, והמעבר לרגרסיה עם יותר משני משתנים מסבירים ניתן לדמיון רק בעולם בעל ממדים מרובים.
Multiple linear regression
Regression coefficients
Controlling for other variables
ברגרסיה לינארית מרובה יש יותר ממשתנה מסביר אחד, ולעתים קרובות משתנים מסבירים מרובים. כל משתנה מסביר מקבל מקדם משלו בנוסחת הרגרסיה, ואותו מקדם מייצג את השפעת אותו משתנה על המשתנה המוסבר, לו היינו שולטים על כל שאר המשתנים האחרים ("מנטרלים" אותם). מבחינת תיאור גרפי, המעבר מרגרסיה לינארית פשוטה לרגרסיה עם שני משתנים מסבירים דורש מעבר מקו על דף למרחב תלת ממדי, והמעבר לרגרסיה עם יותר משני משתנים מסבירים ניתן לדמיון רק בעולם בעל ממדים מרובים.
Multiple linear regression
Regression coefficients
Controlling for other variables
קו הרגרסיה הלינארית הוא קו ישר שמייצג "דרך אמצע" ולא ייצוג מדוייק של קשר בין שני משתנים, אלא רק תיאור מקורב של הקשר הלינארי ביניהם. עבור משתתף בודד במחקר, הערך של המשתנה המוסבר לא ייפול בדיוק על קו הרגרסיה, כיוון שמלבד המשתנה המסביר ישנם תמיד עוד גורמים מסבירים וגם מרכיב של אקראיות. במלים אחרות, עבור אותו ערך של המשתנה המסביר, אצל שני משתתפים שונים במחקר הערך של המשתנה המוסבר יהיה שונה. למשל, גם לאחר קבלת קו הרגרסיה הלינארית המסבירה בעזרת רמת רעש באזור המגורים את לחץ הדם הדיאסטולי, אצל כל משתתף נותרת שארית, residual, בין המדידה של לחץ הדם אצלו לבין הערך שהיה צפוי אצלו לפי קו הרגרסיה. כדי שקו הרגרסיה ייצג בצורה הטובה ביותר את מירב המשתתפים במחקר, הוא נבנה בצורה כזו שתצמצם ככל האפשר את אותן שאריות, את ה residuals. הדרך המקובלת לעשות זאת היא על ידי מציאת הקו עבורו סכום ריבועי השאריות הוא הנמוך ביותר.
regression line
least squares
residuals
קו הרגרסיה הלינארית הוא קו ישר שמייצג "דרך אמצע" ולא ייצוג מדוייק של קשר בין שני משתנים, אלא רק תיאור מקורב של הקשר הלינארי ביניהם. עבור משתתף בודד במחקר, הערך של המשתנה המוסבר לא ייפול בדיוק על קו הרגרסיה, כיוון שמלבד המשתנה המסביר ישנם תמיד עוד גורמים מסבירים וגם מרכיב של אקראיות. במלים אחרות, עבור אותו ערך של המשתנה המסביר, אצל שני משתתפים שונים במחקר הערך של המשתנה המוסבר יהיה שונה. למשל, גם לאחר קבלת קו הרגרסיה הלינארית המסבירה בעזרת רמת רעש באזור המגורים את לחץ הדם הדיאסטולי, אצל כל משתתף נותרת שארית, residual, בין המדידה של לחץ הדם אצלו לבין הערך שהיה צפוי אצלו לפי קו הרגרסיה. כדי שקו הרגרסיה ייצג בצורה הטובה ביותר את מירב המשתתפים במחקר, הוא נבנה בצורה כזו שתצמצם ככל האפשר את אותן שאריות, את ה residuals. הדרך המקובלת לעשות זאת היא על ידי מציאת הקו עבורו סכום ריבועי השאריות הוא הנמוך ביותר.
regression line
least squares
residuals
משוואת קו ישר מייצגת קשר בין שני משתנים. הקשר הזה מבוטא בעזרת מקדם (המספר בו מוכפל המשתנה הראשון) ועוד קבוע. ברגרסיה לינארית, המקדם נקרה "בטא". הערך של המקדם הזה תלוי גם בעצמה של הקשר בין שני המשתנים וגם בקנה המידה שבו מדדו את המשתנים עצמם.
Y=mX+n
ובצורה המקובלת לכתיבה ברגרסיה לינארית
Y=beta(X)+beta 0
Simple linear regression
Beta (regression coefficient)
משוואת קו ישר מייצגת קשר בין שני משתנים. הקשר הזה מבוטא בעזרת מקדם (המספר בו מוכפל המשתנה הראשון) ועוד קבוע. ברגרסיה לינארית, המקדם נקרה "בטא". הערך של המקדם הזה תלוי גם בעצמה של הקשר בין שני המשתנים וגם בקנה המידה שבו מדדו את המשתנים עצמם.
Y=mX+n
ובצורה המקובלת לכתיבה ברגרסיה לינארית
Y=beta(X)+beta 0
Simple linear regression
Beta (regression coefficient)
בפרקים הקודמים דברנו גם על תפקידי הרגרסיה וגם על נוסחת הרגרסיה. בפרק זה ננסה לחבר בין שניהם ולהבין איך נוסחת רגרסיה עוזרת להבין השפעה של מאפיין מסוים של מטופל, בעזרת המקדם שאותו מאפיין מקבל בנוסחה, איך היא עוזרת לנטרל ערפלנים, כאשר מכניסים לנוסחה משתנה שהוא ערפלן, ואיך היא יכולה לעזור לחיזוי עבור מטופל מחוץ למחקר.
Regression formula/equation- נוסחת הרגרסיה
Confounder- ערפלן
Prediction- חיזוי
בפרקים הקודמים דברנו גם על תפקידי הרגרסיה וגם על נוסחת הרגרסיה. בפרק זה ננסה לחבר בין שניהם ולהבין איך נוסחת רגרסיה עוזרת להבין השפעה של מאפיין מסוים של מטופל, בעזרת המקדם שאותו מאפיין מקבל בנוסחה, איך היא עוזרת לנטרל ערפלנים, כאשר מכניסים לנוסחה משתנה שהוא ערפלן, ואיך היא יכולה לעזור לחיזוי עבור מטופל מחוץ למחקר.
Regression formula/equation- נוסחת הרגרסיה
Confounder- ערפלן
Prediction- חיזוי
בחיים הרגילים, המח שלנו מבצע משהו קצת דומה לרגרסיות, בפעולה של חישובים ותחזיות. הוא מתחשב במשתנים שונים, שכל אחד מהם מקבל חשיבות שונה. למשל, יכול להיות שהמשתנה "כמות האננסים" יקבל חשיבות שונה מ"כמות המלפפונים" כאשר אנחנו חוזים את התשלום הסופי בקופה אצל הירקן. המח מעריך את החשיבות (מקדם) של כל אחד מהמשתנים, ומבצע תחזית של הסכום הסופי. זו פעולה מוחית שדומה לרגרסיה לינארית. אפשר לחשוב על פעולה מוחית שדומה לרגרסיה לוגיסטית: איך העונה, כיסוי העננים בשמיים ומה שקרה אתמול עוזר לנו לחיזוי הסיכוי לגשם היום, ועל פעולה מוחית דומה לרגרסיית קוקס: איך סוג המכונית, כמות העליות הצפויה בדרך והמהירות בעליה יעזרו לנו לחזות את קצב צריכת הדלק.
בחיים הרגילים, המח שלנו מבצע משהו קצת דומה לרגרסיות, בפעולה של חישובים ותחזיות. הוא מתחשב במשתנים שונים, שכל אחד מהם מקבל חשיבות שונה. למשל, יכול להיות שהמשתנה "כמות האננסים" יקבל חשיבות שונה מ"כמות המלפפונים" כאשר אנחנו חוזים את התשלום הסופי בקופה אצל הירקן. המח מעריך את החשיבות (מקדם) של כל אחד מהמשתנים, ומבצע תחזית של הסכום הסופי. זו פעולה מוחית שדומה לרגרסיה לינארית. אפשר לחשוב על פעולה מוחית שדומה לרגרסיה לוגיסטית: איך העונה, כיסוי העננים בשמיים ומה שקרה אתמול עוזר לנו לחיזוי הסיכוי לגשם היום, ועל פעולה מוחית דומה לרגרסיית קוקס: איך סוג המכונית, כמות העליות הצפויה בדרך והמהירות בעליה יעזרו לנו לחזות את קצב צריכת הדלק.
(וגם: מפת דרכים לפרקים הבאים)
בנוסחאות הרגרסיה מאפיינים שונים של המשתתפים במחקר מקבלים חשיבות שונה. המאפיינים נקראים "משתנים", והחשיבות נקראת "מקדם". הרעיון המרכזי בנוסחה הוא שערך של משתנה מוכפל במקדם שלו, למשל, המשקל בק"ג מוכפל במקדם מסויים, וכאשר מבצעים את זה עבור כמה משתנים ואז מסכמים את התוצאות מקבלים מספר שהוא בסיס לחיזוי. עם המספר הזה אפשר לעשות כל מיני דברים שנציג בפרקים הבאים- למשל להוסיף לו קבוע מסוים, ולקבל תחזית למשתנה כמותי כמו לחץ הדם סיסטולי של מטופל. נוסחת הרגרסיה מופקת מתוך מחקר, והעיקר בה, השונה מנוסחאות רגרסיה אחרות, הוא המקדמים. בעזרת נוסחה זו אפשר לבצע תחזית: לקחת מאפיינים של משתתף במחקר, כמו המשקל והגיל, ולחזות מה יהיה לחץ הדם הסיסטולי שלו. במקרה של רגרסיה לוגיסטית או רגרסיית קוקס, נצטרך להפוך את המספר את אותו מספר (סכום המכפלות של המקדמים וערכי המשתנים) לסיכוי או לקצב. בהמשך הפרקים נסביר איך זה מתבצע. נדגיש כבר עכשיו שנוסחת הרגרסיה מייצרת תחזית, אך זוהי תחזית שאינה מדויקת.
בפרק הזה נסביר גם מה הולך לקרות בפרקים הבאים. מעין מפת דרכים להמשך. כדי לדבר על רגרסיות נצטרך לבנות את ההבנה בהדרגה ולהסתכל עליהן מכיוונים שונים. תחילה נבין באופן כללי ופשטני את נוסחת הרגרסיה, זו המשותפת לכמה סוגי רגרסיות, אחר כך נבין איך הנוסחה הזו עוזרת לרגרסיה לבצע את תפקידה. בהמשך נדבר בנפרד על שלושת סוגי הרגרסיות שכבר הזכרנו, וכל אחת מהן תדרוש פרק מבוא שיוצר בסיס להבנה של המתמטיקה שמאחורי אותה רגרסיה.
Regression
Regression coefficients- מקדמי הרגרסיה
Prediction- חיזוי
(וגם: מפת דרכים לפרקים הבאים)
בנוסחאות הרגרסיה מאפיינים שונים של המשתתפים במחקר מקבלים חשיבות שונה. המאפיינים נקראים "משתנים", והחשיבות נקראת "מקדם". הרעיון המרכזי בנוסחה הוא שערך של משתנה מוכפל במקדם שלו, למשל, המשקל בק"ג מוכפל במקדם מסויים, וכאשר מבצעים את זה עבור כמה משתנים ואז מסכמים את התוצאות מקבלים מספר שהוא בסיס לחיזוי. עם המספר הזה אפשר לעשות כל מיני דברים שנציג בפרקים הבאים- למשל להוסיף לו קבוע מסוים, ולקבל תחזית למשתנה כמותי כמו לחץ הדם סיסטולי של מטופל. נוסחת הרגרסיה מופקת מתוך מחקר, והעיקר בה, השונה מנוסחאות רגרסיה אחרות, הוא המקדמים. בעזרת נוסחה זו אפשר לבצע תחזית: לקחת מאפיינים של משתתף במחקר, כמו המשקל והגיל, ולחזות מה יהיה לחץ הדם הסיסטולי שלו. במקרה של רגרסיה לוגיסטית או רגרסיית קוקס, נצטרך להפוך את המספר את אותו מספר (סכום המכפלות של המקדמים וערכי המשתנים) לסיכוי או לקצב. בהמשך הפרקים נסביר איך זה מתבצע. נדגיש כבר עכשיו שנוסחת הרגרסיה מייצרת תחזית, אך זוהי תחזית שאינה מדויקת.
בפרק הזה נסביר גם מה הולך לקרות בפרקים הבאים. מעין מפת דרכים להמשך. כדי לדבר על רגרסיות נצטרך לבנות את ההבנה בהדרגה ולהסתכל עליהן מכיוונים שונים. תחילה נבין באופן כללי ופשטני את נוסחת הרגרסיה, זו המשותפת לכמה סוגי רגרסיות, אחר כך נבין איך הנוסחה הזו עוזרת לרגרסיה לבצע את תפקידה. בהמשך נדבר בנפרד על שלושת סוגי הרגרסיות שכבר הזכרנו, וכל אחת מהן תדרוש פרק מבוא שיוצר בסיס להבנה של המתמטיקה שמאחורי אותה רגרסיה.
Regression
Regression coefficients- מקדמי הרגרסיה
Prediction- חיזוי
Trajectories of Adolescent Media Use and Their Associations With Psychotic Experiences
רגרסיה מרובת משתנים היא טכניקה שבא לוקחים בחשבון מאפיינים שונים של המטופל כדי לבצע תחזית לגבי מאפיין אחר או תוצא.
מלבד אפשרות לבצע תחזית רגרסיות מאפשרות לנו לנטרל ערפלנים כדי לבדוק האם מאפיין מסוים משפיע על התוצא, וגם לכמת את השפעת המאפיין על התוצא. יש שלוש סוגי רגרסיות נפוצות במחקרים רפואיים: רגרסיה לוגיסטית, המנבאת משתנה קטגוריאלי (למשל, שימוש יתר במשחקי מחשב- כן או לא), רגרסייה לינארית, המנבאת ערך מסוים (למשל ערך לחץ דם סיסטולי), ורגרסיית קוקס, המנבאת זמן עד אירוע (למשל זמן עד תמותה ממחלת לב)
Regression
Multivariate analysis
Logistic regression
Multiple linear regression
Cox regression
Prediction
Adjustment for confounders
Trajectories of Adolescent Media Use and Their Associations With Psychotic Experiences
רגרסיה מרובת משתנים היא טכניקה שבא לוקחים בחשבון מאפיינים שונים של המטופל כדי לבצע תחזית לגבי מאפיין אחר או תוצא.
מלבד אפשרות לבצע תחזית רגרסיות מאפשרות לנו לנטרל ערפלנים כדי לבדוק האם מאפיין מסוים משפיע על התוצא, וגם לכמת את השפעת המאפיין על התוצא. יש שלוש סוגי רגרסיות נפוצות במחקרים רפואיים: רגרסיה לוגיסטית, המנבאת משתנה קטגוריאלי (למשל, שימוש יתר במשחקי מחשב- כן או לא), רגרסייה לינארית, המנבאת ערך מסוים (למשל ערך לחץ דם סיסטולי), ורגרסיית קוקס, המנבאת זמן עד אירוע (למשל זמן עד תמותה ממחלת לב)
Regression
Multivariate analysis
Logistic regression
Multiple linear regression
Cox regression
Prediction
Adjustment for confounders
Serum Immunoreactive-Leptin Concentrations in Normal-Weight and Obese Humans
ביצוע מתאם פירסון עליו דברנו בפרק הקודם מתאים כאשר מתקיימות כמה הנחות, ביניהן קשר ישר בין שני המשתנים, משתנים כמותיים והתפלגות קרובה להתפלגות נורמלית של כל אחד משני המשתנים . כאשר יש קשר שאינו ישר, כשהמשתנים לא מתפלגים נורמלית, או כשמדובר במשתנה אורדינלי אחד לפחות, צריך להשתמש במתאם ספירמן. זוהי המקבילה הא-פרמטרית של מתאם פירסון.
חישוב מתאם ספירמן מתבצע, בדומה למבחנים א-פרמטריים אחרים, בעזרת דירוג, כל משתתף מדורג לפי מיקומו בין שאר המשתתפים במשתנה הראשון, ובנפרד מדורג לפי המשתנה השני. קשר מונוטוני בין שני משתנים יתבטא בדירוג דומה עבור שני המשתנים- למשל, המשתתף המדורג שלישי ברמת אחוז השומן בגוף, ידורג שלישי גם ברמת הורמון הלפטין בדם. לאחר הדירוגים אנחנו מקבלים מספר חדש עבור כל משתתף- זהו הדירוג שלו. עבור הדירוגים עצמם מתבצע מתאם פירסון. ככל שהדירוגים מייצגים קשר מונוטוני, כך מתאם פירסון על הדירוגים יראה לנו קשר ישר. כך שאפשר להתייחס למתאם ספירמן כמתאם פירסון על הדירוגים. התוצאה של מתאם ספירמן, שהיא מקדם המתאם של ספירמן, מתארת את מידת המונוטוניות של הקשר בין המשתנים, ככל שקרובה ל 1 או למינוס 1, כך מדובר במתאם חזק יותר.
Spearman correlation
Non-linear Correlation
Ranks
Spearman's rank correlation coefficient
Monotonic relationship
Serum Immunoreactive-Leptin Concentrations in Normal-Weight and Obese Humans
ביצוע מתאם פירסון עליו דברנו בפרק הקודם מתאים כאשר מתקיימות כמה הנחות, ביניהן קשר ישר בין שני המשתנים, משתנים כמותיים והתפלגות קרובה להתפלגות נורמלית של כל אחד משני המשתנים . כאשר יש קשר שאינו ישר, כשהמשתנים לא מתפלגים נורמלית, או כשמדובר במשתנה אורדינלי אחד לפחות, צריך להשתמש במתאם ספירמן. זוהי המקבילה הא-פרמטרית של מתאם פירסון.
חישוב מתאם ספירמן מתבצע, בדומה למבחנים א-פרמטריים אחרים, בעזרת דירוג, כל משתתף מדורג לפי מיקומו בין שאר המשתתפים במשתנה הראשון, ובנפרד מדורג לפי המשתנה השני. קשר מונוטוני בין שני משתנים יתבטא בדירוג דומה עבור שני המשתנים- למשל, המשתתף המדורג שלישי ברמת אחוז השומן בגוף, ידורג שלישי גם ברמת הורמון הלפטין בדם. לאחר הדירוגים אנחנו מקבלים מספר חדש עבור כל משתתף- זהו הדירוג שלו. עבור הדירוגים עצמם מתבצע מתאם פירסון. ככל שהדירוגים מייצגים קשר מונוטוני, כך מתאם פירסון על הדירוגים יראה לנו קשר ישר. כך שאפשר להתייחס למתאם ספירמן כמתאם פירסון על הדירוגים. התוצאה של מתאם ספירמן, שהיא מקדם המתאם של ספירמן, מתארת את מידת המונוטוניות של הקשר בין המשתנים, ככל שקרובה ל 1 או למינוס 1, כך מדובר במתאם חזק יותר.
Spearman correlation
Non-linear Correlation
Ranks
Spearman's rank correlation coefficient
Monotonic relationship
Antiepileptic Drug Exposure in Infants of Breastfeeding Mothers With Epilepsy
חישוב מקדם המתאם של פירסון מבוצע בעזרת זוגות רבים של נתונים. (למשל, שני מאפיינים כמותיים של משתתף אחד במחקר, או ריכוז תרופה אצל אם ואצל התינוק שלה). זוגות הנתונים ממורכזים סביב נקודת האפס, ועוברים סטנדרטיזציה (תקנון). לאחר שתי הפעולות האלו, עבור כל זוג נתונים ערך של משתנה אחד מוכפל בערך של המשתנה השני. ככל שהקשר בין שני משתנים חזק יותר, כך תוצאת המכפלה הזו תהיה מספר גדול יותר, וכאשר יסוכמו כל המכפלות עבור כל זוגות הנתונים, ערך מתאם פירסון יהיה בסופו של דבר גבוה יותר.
Correlation
Pearson correlation coefficient
Standardization
Antiepileptic Drug Exposure in Infants of Breastfeeding Mothers With Epilepsy
חישוב מקדם המתאם של פירסון מבוצע בעזרת זוגות רבים של נתונים. (למשל, שני מאפיינים כמותיים של משתתף אחד במחקר, או ריכוז תרופה אצל אם ואצל התינוק שלה). זוגות הנתונים ממורכזים סביב נקודת האפס, ועוברים סטנדרטיזציה (תקנון). לאחר שתי הפעולות האלו, עבור כל זוג נתונים ערך של משתנה אחד מוכפל בערך של המשתנה השני. ככל שהקשר בין שני משתנים חזק יותר, כך תוצאת המכפלה הזו תהיה מספר גדול יותר, וכאשר יסוכמו כל המכפלות עבור כל זוגות הנתונים, ערך מתאם פירסון יהיה בסופו של דבר גבוה יותר.
Correlation
Pearson correlation coefficient
Standardization
https://jamanetwork.com/journals/jamaneurology/fullarticle/2758017Antiepileptic Drug Exposure in Infants of Breastfeeding Mothers With Epilepsy
כאשר ישנם שני משתנים כמותיים, ניתן להתייחס לעצמת הקשר ביניהם בעזרת קורלציה, מתאם. יכול להיות קשר לינארי (קשר ישר) בין שני המשתנים, למשל שערך של משתנה אחד קטן פי שלוש מהערך של המשתנה השני. זהו בערך המתאם שנמצא בין רמת התרופה למוטריגין בדם התינוק היונק, לעומת רמת התרופה בדם האם.
כאשר מתייחסים לאחד המשתנים וחושבים על מצב בו הוא עולה, ישנם שלושה מצבים אפשריים: מתאם חיובי, בו גם המשתנה השני עולה ככל שהראשון עולה, מתאם שלילי, בו המשתנה השני יורד, והעדר מתאם- כאשר אין כלל קשר בין שני המשתנים. מקדם המתאם וינוע בערכים בין אחד למינוס אחד. מקדם מתאם 0, משמעו העדר מתאם בין שני המשתנים. מקדם הקרוב ל 1 או למינוס 1 מתאר מתאם חזק שבו שינוי במשתנה אחד מסביר מצויין את השינוי במשתנה השני. ערכים קרובים יותר לאפס מתארים מתאם חלש יותר. קורלציה בין שני משתנים בדרך כלל לא מוכיחה סיבתיות, כיוון שיכול להיות ערפלן המשפיע על שני המשתנים, אם כי במצב של רמת תרופה בדם האם ובדם התינוק ההגיון הביולוגי חזק מאוד וברור שכן מדובר בסיבתיות.
Correlation
Linear correlation
Strength of correlation
Positive correlation
Negative correlation
Scatter plot
https://jamanetwork.com/journals/jamaneurology/fullarticle/2758017Antiepileptic Drug Exposure in Infants of Breastfeeding Mothers With Epilepsy
כאשר ישנם שני משתנים כמותיים, ניתן להתייחס לעצמת הקשר ביניהם בעזרת קורלציה, מתאם. יכול להיות קשר לינארי (קשר ישר) בין שני המשתנים, למשל שערך של משתנה אחד קטן פי שלוש מהערך של המשתנה השני. זהו בערך המתאם שנמצא בין רמת התרופה למוטריגין בדם התינוק היונק, לעומת רמת התרופה בדם האם.
כאשר מתייחסים לאחד המשתנים וחושבים על מצב בו הוא עולה, ישנם שלושה מצבים אפשריים: מתאם חיובי, בו גם המשתנה השני עולה ככל שהראשון עולה, מתאם שלילי, בו המשתנה השני יורד, והעדר מתאם- כאשר אין כלל קשר בין שני המשתנים. מקדם המתאם וינוע בערכים בין אחד למינוס אחד. מקדם מתאם 0, משמעו העדר מתאם בין שני המשתנים. מקדם הקרוב ל 1 או למינוס 1 מתאר מתאם חזק שבו שינוי במשתנה אחד מסביר מצויין את השינוי במשתנה השני. ערכים קרובים יותר לאפס מתארים מתאם חלש יותר. קורלציה בין שני משתנים בדרך כלל לא מוכיחה סיבתיות, כיוון שיכול להיות ערפלן המשפיע על שני המשתנים, אם כי במצב של רמת תרופה בדם האם ובדם התינוק ההגיון הביולוגי חזק מאוד וברור שכן מדובר בסיבתיות.
Correlation
Linear correlation
Strength of correlation
Positive correlation
Negative correlation
Scatter plot
Rivaroxaban versus Enoxaparin for Thromboprophylaxis after Hip Arthroplasty
מבחן קוקרן- מנטל- הנזל דומה למבחן חי בריבוע בכך שמדובר בשני משתנים קטגוריאליים, אך הוא מאפשר לבצע נטרול ערפלנים. הדרך בה הוא עושה זאת היא חלוקה של המשתתפים במחקר לשכבות שונות, לפי הערפלן (למשל, לפי ארצות שונות, או לפי מצב סוציואקונומי), ביצוע החישוב בכל אחת מהשכבות בנפרד, ואז שקלול של כל החישובים יחד. הפרוצדורה מאפשרת לחשב odds ratio משותף וגם לבצע מבחן סטטיסטי שיתן לנו את ערך ה p. המבחן הסטטיסטי בנוי על מניפולציה מתמטית בכל אחת מהשכבות בנפרד ואז חיבור התוצאות כדי לקבל מספר . ככל שמספר זה גבוה, (למתקדמים- לפי התפלגות חי בריבוע עם דרגת חופש אחת) כך ערך ה p נמוך יותר.
Confounders
Stratification
Odds ratio
Relative risk
Weighting
Cochran–Mantel–Haenszel procedure
Cochran–Mantel–Haenszel test
Rivaroxaban versus Enoxaparin for Thromboprophylaxis after Hip Arthroplasty
מבחן קוקרן- מנטל- הנזל דומה למבחן חי בריבוע בכך שמדובר בשני משתנים קטגוריאליים, אך הוא מאפשר לבצע נטרול ערפלנים. הדרך בה הוא עושה זאת היא חלוקה של המשתתפים במחקר לשכבות שונות, לפי הערפלן (למשל, לפי ארצות שונות, או לפי מצב סוציואקונומי), ביצוע החישוב בכל אחת מהשכבות בנפרד, ואז שקלול של כל החישובים יחד. הפרוצדורה מאפשרת לחשב odds ratio משותף וגם לבצע מבחן סטטיסטי שיתן לנו את ערך ה p. המבחן הסטטיסטי בנוי על מניפולציה מתמטית בכל אחת מהשכבות בנפרד ואז חיבור התוצאות כדי לקבל מספר . ככל שמספר זה גבוה, (למתקדמים- לפי התפלגות חי בריבוע עם דרגת חופש אחת) כך ערך ה p נמוך יותר.
Confounders
Stratification
Odds ratio
Relative risk
Weighting
Cochran–Mantel–Haenszel procedure
Cochran–Mantel–Haenszel test
MRI-Targeted, Systematic, and Combined Biopsy for Prostate Cancer Diagnosis
Risk disclosure in prodromal Parkinson's disease - A survey of neurologists
מבחן מקנמר הוא קרוב משפחה של מבחן חי בריבוע, גם הוא בודק מצב בו ישנם שני משתנים קטגוריאליים, גם המשתנה התלוי וגם הבלתי תלוי. בניגוד למבחן חי בריבוע, הוא מתאים למצבים בהם יש זיווג או תלות בין שתי מדידות - ובכך הוא מזכיר את מבחן t למדגמים מזווגים. מדידות מזווגות למשל הן כאשר יש קבוצה אחת בלבד ומדידה של לפני ואחרי התערבות, כאשר שתי קבוצות מותאמות אחת לשנייה, או במחקרים על בדיקה אבחנתית בהם כל האנשים עברו שתי בדיקות שונות.
הטבלה של מבחן מקנמר שונה מהטבלה של מבחן חי בריבוע: עבור תא אחד במבחן חי בריבוע, בטבלה של מבחן מקנמר יהיו שני תאים- שמופרדים על ידי המשתנה השני. למשל, במחקר שבו בדקו האם נוירולוגים היו משתפים מטופל בחשד למחלה, כאשר הנטייה לשתף נמדד לפני ואחרי התערבות, במקום אחד התאים האופייני לטבלת חי בריבוע (שבו יש רופאים שלפני ההתערבות שיתפו את המטופל), יהיו שני תאים נפרדים כאשר מתבצע מבחן מקנמר- תא עבור אלו שאחרי ההתערבות שיתפו, ותא שני עבור אלו שאחרי ההתערבות לא שיתפו את המטופל. בטבלה כזו יהיו שני תאים בהם יש אי הסכמה, למשל רופאים שלפני ההתערבות שיתפו ואחרי ההתערבות לא שיתפו, או להפך. מבחן מקנמר בנוי על הפער בכמות האנשים בין שני התאים האלו. ככל שהפער גדול יותר, כך ערך ה p קטן יותר.
MRI-Targeted, Systematic, and Combined Biopsy for Prostate Cancer Diagnosis
Risk disclosure in prodromal Parkinson's disease - A survey of neurologists
מבחן מקנמר הוא קרוב משפחה של מבחן חי בריבוע, גם הוא בודק מצב בו ישנם שני משתנים קטגוריאליים, גם המשתנה התלוי וגם הבלתי תלוי. בניגוד למבחן חי בריבוע, הוא מתאים למצבים בהם יש זיווג או תלות בין שתי מדידות - ובכך הוא מזכיר את מבחן t למדגמים מזווגים. מדידות מזווגות למשל הן כאשר יש קבוצה אחת בלבד ומדידה של לפני ואחרי התערבות, כאשר שתי קבוצות מותאמות אחת לשנייה, או במחקרים על בדיקה אבחנתית בהם כל האנשים עברו שתי בדיקות שונות.
הטבלה של מבחן מקנמר שונה מהטבלה של מבחן חי בריבוע: עבור תא אחד במבחן חי בריבוע, בטבלה של מבחן מקנמר יהיו שני תאים- שמופרדים על ידי המשתנה השני. למשל, במחקר שבו בדקו האם נוירולוגים היו משתפים מטופל בחשד למחלה, כאשר הנטייה לשתף נמדד לפני ואחרי התערבות, במקום אחד התאים האופייני לטבלת חי בריבוע (שבו יש רופאים שלפני ההתערבות שיתפו את המטופל), יהיו שני תאים נפרדים כאשר מתבצע מבחן מקנמר- תא עבור אלו שאחרי ההתערבות שיתפו, ותא שני עבור אלו שאחרי ההתערבות לא שיתפו את המטופל. בטבלה כזו יהיו שני תאים בהם יש אי הסכמה, למשל רופאים שלפני ההתערבות שיתפו ואחרי ההתערבות לא שיתפו, או להפך. מבחן מקנמר בנוי על הפער בכמות האנשים בין שני התאים האלו. ככל שהפער גדול יותר, כך ערך ה p קטן יותר.
A Phase 3, Randomized, Controlled Trial of Resmetirom in NASH with Liver Fibrosis
התפלגויות משתנות לפי מספר השחקנים הפעילים שמשתתפים בהן. למשל, במבחן חי בריבוע מדובר בסכום של ערכים בתאים השונים, וההתפלגות של ערך חי בריבוע במצב בו השערת האפס נכונה משתנה לפי מספר התאים שמסוכמים יחד.
Chi square distribution table
A Phase 3, Randomized, Controlled Trial of Resmetirom in NASH with Liver Fibrosis
התפלגויות משתנות לפי מספר השחקנים הפעילים שמשתתפים בהן. למשל, במבחן חי בריבוע מדובר בסכום של ערכים בתאים השונים, וההתפלגות של ערך חי בריבוע במצב בו השערת האפס נכונה משתנה לפי מספר התאים שמסוכמים יחד.
Chi square distribution table
דרגות חופש הן מספר השחקנים הפעילים. זאת אומרת כמה קבוצות או כמה תצפיות דרושות לנו כדי לדעת גם את הנתונים בקבוצות או בתצפיות האחרות. למשל, אם מנהלת מחלקה, רופא אופוזיציונר, ורופא חנפן יושבים בישיבת צוות, יש למעשה רק שחקן פעיל אחד- מנהלת המחלקה. או אם כאשר במדגם שיעור הגברים הוא 50% ושיעור חולי הסכרת הוא 7%, בטבלה של 2X2 שבו המין יוצב אל מול מצב הסכרת, מספיק לדעת כמה יש באחד התאים כדי לדעת כמה יש בכל התאים האחרים. שני המצבים האלו מייצגים דרגת חופש אחת. במקרה של טבלה למבחן חי בריבוע אפשר להבין מה מספר דרגות החופש לפי כמות התאים לאחר הסרת שורה אחת וטור אחד.
Degrees of freedom
דרגות חופש הן מספר השחקנים הפעילים. זאת אומרת כמה קבוצות או כמה תצפיות דרושות לנו כדי לדעת גם את הנתונים בקבוצות או בתצפיות האחרות. למשל, אם מנהלת מחלקה, רופא אופוזיציונר, ורופא חנפן יושבים בישיבת צוות, יש למעשה רק שחקן פעיל אחד- מנהלת המחלקה. או אם כאשר במדגם שיעור הגברים הוא 50% ושיעור חולי הסכרת הוא 7%, בטבלה של 2X2 שבו המין יוצב אל מול מצב הסכרת, מספיק לדעת כמה יש באחד התאים כדי לדעת כמה יש בכל התאים האחרים. שני המצבים האלו מייצגים דרגת חופש אחת. במקרה של טבלה למבחן חי בריבוע אפשר להבין מה מספר דרגות החופש לפי כמות התאים לאחר הסרת שורה אחת וטור אחד.
Degrees of freedom
Drug-Eluting Resorbable Scaffold versus Angioplasty for Infrapopliteal Artery Disease
(פרק מתוקן). מבחן חי בריבוע משתמש בחלוקה של המשתתפים לתאים, בדרך כלל לארבעה תאים (או ארבעה חדרים). זה מתבצע פעמיים. בפעם הראשונה סופרים את האנשים בכל חדר כפי שהתקבל במחקר ("המצוי"). בפעם השנייה, הספירה היא במצב בו השערת האפס נכונה והמדגם מייצג אותה באופן אידילי ("הצפוי").
בכל אחד מהתאים אפשר לבדוק מה הפער בין הספירה בפועל ("המצוי") לבין הספירה במצב הייצוג האידילי של השערת האפס ("הצפוי"). את הפער הזה מעלים בריבוע ומחלקים במספר "הצפוי". כך עושים עבור כל תא או חדר, ואז מחברים את הערכים השונים כדי לקבל את הסטטיסטי, חי בריבוע. ככל שערך זה גדול יותר, כך פחות סביר לקבלו כאשר השערת האפס נכונה.
Chi squared test
Chi squared statistic
Expected values
Observed values
Drug-Eluting Resorbable Scaffold versus Angioplasty for Infrapopliteal Artery Disease
(פרק מתוקן). מבחן חי בריבוע משתמש בחלוקה של המשתתפים לתאים, בדרך כלל לארבעה תאים (או ארבעה חדרים). זה מתבצע פעמיים. בפעם הראשונה סופרים את האנשים בכל חדר כפי שהתקבל במחקר ("המצוי"). בפעם השנייה, הספירה היא במצב בו השערת האפס נכונה והמדגם מייצג אותה באופן אידילי ("הצפוי").
בכל אחד מהתאים אפשר לבדוק מה הפער בין הספירה בפועל ("המצוי") לבין הספירה במצב הייצוג האידילי של השערת האפס ("הצפוי"). את הפער הזה מעלים בריבוע ומחלקים במספר "הצפוי". כך עושים עבור כל תא או חדר, ואז מחברים את הערכים השונים כדי לקבל את הסטטיסטי, חי בריבוע. ככל שערך זה גדול יותר, כך פחות סביר לקבלו כאשר השערת האפס נכונה.
Chi squared test
Chi squared statistic
Expected values
Observed values
Drug-Eluting Resorbable Scaffold versus Angioplasty for Infrapopliteal Artery Disease
מבחן חי בריבוע לאי תלות הוא מבחן נפוץ ביותר במחקרים רפואיים. הוא משמש כאשר גם המשתנה הבלתי תלוי וגם המשתנה התלוי הם קטגוריאליים. למשל, כשמחלקים אנשים לשתי קבוצות ובודקים תוצא דיכוטומי/ בינארי, כמו הצרות מחודשת של עורק אחרי פתיחתו. במחקר מסוג זה אפשר לחלק את האנשים לפי הטיפול שקיבלו ולפי התוצא לארבעה חדרים (למעשה לטבלה שבה מוצלבים הטיפול והתוצא) ולספור כמה אנשים נמצאים בכל חדר. אם הספירה הזו תראה ממצאים דרמטיים, שלא סביר שהתקבלו אם אין תלות בין הטיפול לתוצא, נדחה את השערת האפס ונקבל את ההשערה האלטרנטיבית- שיש תלות כזו.
Chi square test for independence
Drug-Eluting Resorbable Scaffold versus Angioplasty for Infrapopliteal Artery Disease
מבחן חי בריבוע לאי תלות הוא מבחן נפוץ ביותר במחקרים רפואיים. הוא משמש כאשר גם המשתנה הבלתי תלוי וגם המשתנה התלוי הם קטגוריאליים. למשל, כשמחלקים אנשים לשתי קבוצות ובודקים תוצא דיכוטומי/ בינארי, כמו הצרות מחודשת של עורק אחרי פתיחתו. במחקר מסוג זה אפשר לחלק את האנשים לפי הטיפול שקיבלו ולפי התוצא לארבעה חדרים (למעשה לטבלה שבה מוצלבים הטיפול והתוצא) ולספור כמה אנשים נמצאים בכל חדר. אם הספירה הזו תראה ממצאים דרמטיים, שלא סביר שהתקבלו אם אין תלות בין הטיפול לתוצא, נדחה את השערת האפס ונקבל את ההשערה האלטרנטיבית- שיש תלות כזו.
Chi square test for independence
Accuracy and Reliability of Chatbot Responses to Physician Questions
בפרק נדבר על מבחנים סטטיסטיים שהם למעשה קרובי משפחה של מבחנים שכבר הכרנו.
Repeated measures ANOVA דומה ל ANOVA במספר הקטגוריות של המשתנה הבלתי תלוי, ובכך שמדובר במשתנה תלוי שמתפלג בצורה נורמלית, אך שונה ממנו בכך שיש תלות בין קבוצות המדידה, ובכך הוא דומה דווקא ל paired samples t test. למשל, כאשר אותה קבוצת נשים נמדדת שלוש פעמים ברווחים של חצי שנה, והמשתנה התלוי הוא מסת השריר ומסת השומן, אפשר להשוות בין שלוש קבוצות של מדידות: המדידות בזמן אפס, המדידה בזמן 1 והמדידה בזמן 2.
מבחן וילקוקסון למדגמים מזווגים דומה למבחן paired samples t test בכך שמדובר במדגמים מזווגים, והוא קרוב משפחה גם של מבחן מאן-וויטני- כיוון שהמשתנה התלוי לא מתפלג נורמלי. למשל, כאשר צ'ט בינה מלאכותית מנסה לענות שוב על אותן שאלות קליניות לאחר כשבועיים, המשתנה התלוי הוא הדיוק של התשובות (כפי שהוערך על ידי מומחים) והמשתנה הבלתי תלוי הוא התזמון- בפעם הראשונה שנשאל, או שבועיים אחר כך.
שני המבחנים שהוצגו גם הם קרובים רחוקים אחד של השני- הקרבה ביניהם היא התלות בין קבוצות המדידה.
Repeated measures ANOVA
Wilcoxon signed rank test
Accuracy and Reliability of Chatbot Responses to Physician Questions
בפרק נדבר על מבחנים סטטיסטיים שהם למעשה קרובי משפחה של מבחנים שכבר הכרנו.
Repeated measures ANOVA דומה ל ANOVA במספר הקטגוריות של המשתנה הבלתי תלוי, ובכך שמדובר במשתנה תלוי שמתפלג בצורה נורמלית, אך שונה ממנו בכך שיש תלות בין קבוצות המדידה, ובכך הוא דומה דווקא ל paired samples t test. למשל, כאשר אותה קבוצת נשים נמדדת שלוש פעמים ברווחים של חצי שנה, והמשתנה התלוי הוא מסת השריר ומסת השומן, אפשר להשוות בין שלוש קבוצות של מדידות: המדידות בזמן אפס, המדידה בזמן 1 והמדידה בזמן 2.
מבחן וילקוקסון למדגמים מזווגים דומה למבחן paired samples t test בכך שמדובר במדגמים מזווגים, והוא קרוב משפחה גם של מבחן מאן-וויטני- כיוון שהמשתנה התלוי לא מתפלג נורמלי. למשל, כאשר צ'ט בינה מלאכותית מנסה לענות שוב על אותן שאלות קליניות לאחר כשבועיים, המשתנה התלוי הוא הדיוק של התשובות (כפי שהוערך על ידי מומחים) והמשתנה הבלתי תלוי הוא התזמון- בפעם הראשונה שנשאל, או שבועיים אחר כך.
שני המבחנים שהוצגו גם הם קרובים רחוקים אחד של השני- הקרבה ביניהם היא התלות בין קבוצות המדידה.
Repeated measures ANOVA
Wilcoxon signed rank test
Randomized Trial of Medical versus Surgical Treatment for Refractory Heartburn
מבחן קרוסקל- וואליס הוא המקביל למבחן אנובה כאשר המשתנה התלוי מתפלג בצורה שאינה נורמלית. למשל, במחקר על מטופלים עם רפלוקס קיבתי-ושטי קשה, היו שלוש קבוצות טיפול והתוצא היה ציון בסולם חומרת רפלוקס קיבתי ושטי. במלים אחרות המבחן הזה הוא המקבילה הא-פרמטרית של מבחן אנובה. הוא דומה למבחן אנובה בכמות הקבוצות שבו, ובהעדר התלות בין הקבוצות.
Kruskal-wallis test
Nonparamtric tests
Randomized Trial of Medical versus Surgical Treatment for Refractory Heartburn
מבחן קרוסקל- וואליס הוא המקביל למבחן אנובה כאשר המשתנה התלוי מתפלג בצורה שאינה נורמלית. למשל, במחקר על מטופלים עם רפלוקס קיבתי-ושטי קשה, היו שלוש קבוצות טיפול והתוצא היה ציון בסולם חומרת רפלוקס קיבתי ושטי. במלים אחרות המבחן הזה הוא המקבילה הא-פרמטרית של מבחן אנובה. הוא דומה למבחן אנובה בכמות הקבוצות שבו, ובהעדר התלות בין הקבוצות.
Kruskal-wallis test
Nonparamtric tests
במבחן אנובה הנחה מקדימה היא שההתפלגות של הערכים באוכלוסיית המחקר כולה היא נורמלית, וגם שהשונות בתוך קבוצה אחת דומה לשונות בתוך הקבוצות האחרות.
המסקנה שאפשר להסיק כאשר התוצאה מובהקת, היא שלפחות אחת מהקבוצות שונה מהאחרות. כדי לדעת בין אלו קבוצות יש שוני, צריך להשתמש במבחן נוסף, שמותר להשתמש בו רק לאחר הוכחת מובהקות במבחן אנובה עצמו. דוגמה למבחן "אחרי" כזה הוא מבחן טוקי. במבחן זה מייצרים קנה מידה ובעזרתו מחליטים האם הבדל ממוצעים בין שתי קבוצות הוא מובהק.
Post-hoc tests
Tukey test
במבחן אנובה הנחה מקדימה היא שההתפלגות של הערכים באוכלוסיית המחקר כולה היא נורמלית, וגם שהשונות בתוך קבוצה אחת דומה לשונות בתוך הקבוצות האחרות.
המסקנה שאפשר להסיק כאשר התוצאה מובהקת, היא שלפחות אחת מהקבוצות שונה מהאחרות. כדי לדעת בין אלו קבוצות יש שוני, צריך להשתמש במבחן נוסף, שמותר להשתמש בו רק לאחר הוכחת מובהקות במבחן אנובה עצמו. דוגמה למבחן "אחרי" כזה הוא מבחן טוקי. במבחן זה מייצרים קנה מידה ובעזרתו מחליטים האם הבדל ממוצעים בין שתי קבוצות הוא מובהק.
Post-hoc tests
Tukey test
התוצאה של מבחן אנובה הוא ערך ה F. לערך זה יש התפלגות צפויה כאשר השערת האפס נכונה. כשיש ערך F שבלתי סביר לקבל כאשר השערת האפס נכונה, נדחה את השערת האפס. ניתן לכמת את הסבירות לקבל ערך F מסויים כאשר השערת האפס נכונה בעזרת טבלת F. בטבלה זו יש להתחשב גם בכמות הקבוצות (ככל שיש פחות קבוצות, ל F יש סיכוי להיות גדול גם כאשר השערת האפס נכונה), וגם בגודל הקבוצות (ככל שקטנות יותר, ל F יש סיכוי להיות גדול גם כאשר השערת האפס נכונה).
F distibution
F table
התוצאה של מבחן אנובה הוא ערך ה F. לערך זה יש התפלגות צפויה כאשר השערת האפס נכונה. כשיש ערך F שבלתי סביר לקבל כאשר השערת האפס נכונה, נדחה את השערת האפס. ניתן לכמת את הסבירות לקבל ערך F מסויים כאשר השערת האפס נכונה בעזרת טבלת F. בטבלה זו יש להתחשב גם בכמות הקבוצות (ככל שיש פחות קבוצות, ל F יש סיכוי להיות גדול גם כאשר השערת האפס נכונה), וגם בגודל הקבוצות (ככל שקטנות יותר, ל F יש סיכוי להיות גדול גם כאשר השערת האפס נכונה).
F distibution
F table
ההברקה במבחן אנובה היא שמשתמשים בשתי דרכים שונות להעריך את השונות של אוכלוסיית המחקר. הראשונה הנקראת "מתוך" היא שימוש בקבוצות כאילו הן "מדגמים" מתוך כלל אוכלוסיית המחקר, ולכן אומדן של השונות הכללית לפי השונות בתוך הקבוצה עצמה.
השנייה, הנקראת "מבין", היא שימוש בקשר בין שונות של ממוצעים לבין שונות של הערכים המקוריים (כאשר הערכים באוכלוסיה מתפלגים נורמלי)- קשר שאפשר לייצג אותו על ידי הכפלה במספר האנשים בקבוצה.
שתי הדרכים האלו אמורות לאמוד את אותו המספר כאשר השערת האפס נכונה, ולכן אמורות להגיע למספר דומה, ואז חלוקה של שני המספרים האלו תתן לנו מספר הקרוב ל 1. אם הקבוצות מאוד שונות אחת מהשנייה, השונות בין הממוצעים תגדל, והדרך "מבין" תתן לנו הערכה הרבה יותר גדולה של השונות הכללית.
היחס בין שתי הערכות השונות האלו- לפי הממוצעים ("מבין") חלקי לפי הקבוצות ("מתוך") הוא ערך ה-F, וזהו הסטטיסטי של מבחן אנובה. ככל שערך זה גדול יותר, כך ניטה יותר לדחות את השערת האפס.
F statistic
ההברקה במבחן אנובה היא שמשתמשים בשתי דרכים שונות להעריך את השונות של אוכלוסיית המחקר. הראשונה הנקראת "מתוך" היא שימוש בקבוצות כאילו הן "מדגמים" מתוך כלל אוכלוסיית המחקר, ולכן אומדן של השונות הכללית לפי השונות בתוך הקבוצה עצמה.
השנייה, הנקראת "מבין", היא שימוש בקשר בין שונות של ממוצעים לבין שונות של הערכים המקוריים (כאשר הערכים באוכלוסיה מתפלגים נורמלי)- קשר שאפשר לייצג אותו על ידי הכפלה במספר האנשים בקבוצה.
שתי הדרכים האלו אמורות לאמוד את אותו המספר כאשר השערת האפס נכונה, ולכן אמורות להגיע למספר דומה, ואז חלוקה של שני המספרים האלו תתן לנו מספר הקרוב ל 1. אם הקבוצות מאוד שונות אחת מהשנייה, השונות בין הממוצעים תגדל, והדרך "מבין" תתן לנו הערכה הרבה יותר גדולה של השונות הכללית.
היחס בין שתי הערכות השונות האלו- לפי הממוצעים ("מבין") חלקי לפי הקבוצות ("מתוך") הוא ערך ה-F, וזהו הסטטיסטי של מבחן אנובה. ככל שערך זה גדול יותר, כך ניטה יותר לדחות את השערת האפס.
F statistic
במבחן הזה נשתמש כשיש יותר משתי קטגוריות למשתנה הבלתי תלוי, למשל כשיש יותר משתי קבוצות, וכאשר המשתנה התלוי (התוצא) הוא כמותי ומתפלג נורמלית. למשל, כשמשווים קצב הקלדה במחשב בין קבוצות גיל שונות של עובדי בית חולים, או בין התמחויות שונות.
הסיבה שלא להשתמש במבחן הסטודנט עבור כל זוג וזוג של קטגוריות, היא שכך ייווצרו מבחנים מרובים עם השערות אפס מרובות, ולכן סיכוי גבוה לטעות מסוג אחד. במקום להשתמש בהבדל בין ממוצעים, כמו מבחן הסטודנט, מבחן אנובה משתמש בשונויות.
One way ANOVA (analysis of variance)
במבחן הזה נשתמש כשיש יותר משתי קטגוריות למשתנה הבלתי תלוי, למשל כשיש יותר משתי קבוצות, וכאשר המשתנה התלוי (התוצא) הוא כמותי ומתפלג נורמלית. למשל, כשמשווים קצב הקלדה במחשב בין קבוצות גיל שונות של עובדי בית חולים, או בין התמחויות שונות.
הסיבה שלא להשתמש במבחן הסטודנט עבור כל זוג וזוג של קטגוריות, היא שכך ייווצרו מבחנים מרובים עם השערות אפס מרובות, ולכן סיכוי גבוה לטעות מסוג אחד. במקום להשתמש בהבדל בין ממוצעים, כמו מבחן הסטודנט, מבחן אנובה משתמש בשונויות.
One way ANOVA (analysis of variance)
Effect of Longer Family Meals on Children’s Fruit and Vegetable Intake
שונות במובנה העממי היא פיזור רחב של הערכים. אך במובן הפורמלי הסטטיסטי, שונות היא ערך מחושב (שאכן מציין מידת פיזור). במקרה של שונות עבור ממוצע בקבוצה אחת, השונות היא סכום הריבועים של מרחקי הערכים מהממוצע, חלקי (כמעט) מספר המדידות. שונות אינה ערך אינטואיטיבי, והיא לא בקנה המידה של הערכים הנמדדים. השורש של השונות הוא סטיית התקן, שנמצאת בקנה המידה של הערך הנמדד, ולכן קל להבין אותה אינטואיטיבית. בדומה לממוצע, אפשר לדבר על שונות הן במחקר (במדגם) והן באמת שמחוץ למחקר (באוכלוסיה).
Variance- שונות במובן הפורמלי
Variability- שונות במובן האיכותי/עממי
Standard deviation
Sum of squares
Effect of Longer Family Meals on Children’s Fruit and Vegetable Intake
שונות במובנה העממי היא פיזור רחב של הערכים. אך במובן הפורמלי הסטטיסטי, שונות היא ערך מחושב (שאכן מציין מידת פיזור). במקרה של שונות עבור ממוצע בקבוצה אחת, השונות היא סכום הריבועים של מרחקי הערכים מהממוצע, חלקי (כמעט) מספר המדידות. שונות אינה ערך אינטואיטיבי, והיא לא בקנה המידה של הערכים הנמדדים. השורש של השונות הוא סטיית התקן, שנמצאת בקנה המידה של הערך הנמדד, ולכן קל להבין אותה אינטואיטיבית. בדומה לממוצע, אפשר לדבר על שונות הן במחקר (במדגם) והן באמת שמחוץ למחקר (באוכלוסיה).
Variance- שונות במובן הפורמלי
Variability- שונות במובן האיכותי/עממי
Standard deviation
Sum of squares
ציון של ארבעים אלף הורדות פרקים של הפודקאסט והזדמנות לספר על הפודקאסט ואיך התפתח
ציון של ארבעים אלף הורדות פרקים של הפודקאסט והזדמנות לספר על הפודקאסט ואיך התפתח
Effect of Longer Family Meals on Children’s Fruit and Vegetable Intake
מבחן טי למדגמים מזווגים הוא המקביל למבחן הסטודנט במצב בו ניתן לבצע זיווג בין מדידה בקטגוריה אחת של החשיפה למדידה בקטגוריה השנייה. זה קורה כאשר מדובר באותו משתתף שנמדד בשתי החשיפות (לפני-אחרי, עם התערבות אחת ואחר כך התערבות אחרת), או כאשר מתבצעת התאמה של אחד לאחד בין משתתפים בקבוצה אחת למשתתפים בקבוצה אחרת (לדוגמה- שכנים, אחים, התאמה לפי גורמי סיכון). היתרון של מבחן זה על מבחן הסטודנט הרגיל הוא שכאן השונות מחושבת לפי ההפרש במדידות המזווגות ולכן היא קטנה יותר. שונות קטנה יותר מגבירה את העוצמה של המחקר.
במחקר על אורך ארוחת הערב כגורם לצריכת ירקות גבוהה יותר, אותם משתתפים נמדדו עבור שתי החשיפות האפשריות, ואכן בחשיפה לארוחה ארוכה יותר, כמות חתיכות הירק הממוצעת הייתה גדולה יותר באופן מובהק.
Paired samples t-test
Propensity score
Before-after study
Effect of Longer Family Meals on Children’s Fruit and Vegetable Intake
מבחן טי למדגמים מזווגים הוא המקביל למבחן הסטודנט במצב בו ניתן לבצע זיווג בין מדידה בקטגוריה אחת של החשיפה למדידה בקטגוריה השנייה. זה קורה כאשר מדובר באותו משתתף שנמדד בשתי החשיפות (לפני-אחרי, עם התערבות אחת ואחר כך התערבות אחרת), או כאשר מתבצעת התאמה של אחד לאחד בין משתתפים בקבוצה אחת למשתתפים בקבוצה אחרת (לדוגמה- שכנים, אחים, התאמה לפי גורמי סיכון). היתרון של מבחן זה על מבחן הסטודנט הרגיל הוא שכאן השונות מחושבת לפי ההפרש במדידות המזווגות ולכן היא קטנה יותר. שונות קטנה יותר מגבירה את העוצמה של המחקר.
במחקר על אורך ארוחת הערב כגורם לצריכת ירקות גבוהה יותר, אותם משתתפים נמדדו עבור שתי החשיפות האפשריות, ואכן בחשיפה לארוחה ארוכה יותר, כמות חתיכות הירק הממוצעת הייתה גדולה יותר באופן מובהק.
Paired samples t-test
Propensity score
Before-after study
מבחן מאן-וויטני הוא המקביל למבחן הסטודנט עבור מצבים בהם המשתנה התלוי הוא אורדינלי או שהוא כמותי שלא מתפלג נורמלי. המבחן משתמש בדירוג משותף עבור שתי הקבוצות, ולאחר דירוג זה בודק האם סכום הדירוג בכל אחת מהקבוצות שונה בצורה דרמטית. השיטה היא נוסחה שבה מתוך סכום הדירוגים באחת הקבוצות ומגודל הקבוצה מתקבל המספר יו (U). עבור יו יש התפלגות דגימה נורמלית, ולכן אפשר לבצע בדיקת השערות: אם השערת האפס נכונה, מה הסבירות לקבל U כמו במחקר שלנו.
במחקר על כריתת קריש הדם באירוע מוחי גדול, סולם המדידה של התוצא היה אורדינלי (סולם רנקין המשופץ). כאשר נבדק סכום הדירוגים בשתי הקבוצות, היה נראה שאכן בקבוצת הטיפול הסכום היה גבוה יותר בצורה מובהקת.
מבחן מאן-וויטני הוא המקביל למבחן הסטודנט עבור מצבים בהם המשתנה התלוי הוא אורדינלי או שהוא כמותי שלא מתפלג נורמלי. המבחן משתמש בדירוג משותף עבור שתי הקבוצות, ולאחר דירוג זה בודק האם סכום הדירוג בכל אחת מהקבוצות שונה בצורה דרמטית. השיטה היא נוסחה שבה מתוך סכום הדירוגים באחת הקבוצות ומגודל הקבוצה מתקבל המספר יו (U). עבור יו יש התפלגות דגימה נורמלית, ולכן אפשר לבצע בדיקת השערות: אם השערת האפס נכונה, מה הסבירות לקבל U כמו במחקר שלנו.
במחקר על כריתת קריש הדם באירוע מוחי גדול, סולם המדידה של התוצא היה אורדינלי (סולם רנקין המשופץ). כאשר נבדק סכום הדירוגים בשתי הקבוצות, היה נראה שאכן בקבוצת הטיפול הסכום היה גבוה יותר בצורה מובהקת.
במבחנים פרמטרים, כמו מבחן הסטודנט, יש הנחות לגבי התפלגות המשתנה התלוי. אם אי אפשר לוודא שההנחות האלו נכונות, נצטרך להשתמש במבחן חלופי. פרמטר הוא מאפיין של האוכלוסיה או של "האמת" במקרה של מחקר רפואי. המבחנים הפרמטרים משתמשים במאפיינים של האמת הזו. למשל, מבחן הסטודנט משתמש בהשערת האפס לגבי הממוצע האמיתי. במבחן הא-פרמטרי המקביל, מבחן מאן-ויטני, אין השערה לגבי הממוצע האמיתי, ומשתשים אך ורק בדירוג ובמספר המשתתפים במחקר. דוגמאות למבחנים לא פרמטרים הן מבחן חי בריבוע, מאן ויטני וקרוסקל- וואליס.
Non parametric tests
Mann-Whitney U test
במבחנים פרמטרים, כמו מבחן הסטודנט, יש הנחות לגבי התפלגות המשתנה התלוי. אם אי אפשר לוודא שההנחות האלו נכונות, נצטרך להשתמש במבחן חלופי. פרמטר הוא מאפיין של האוכלוסיה או של "האמת" במקרה של מחקר רפואי. המבחנים הפרמטרים משתמשים במאפיינים של האמת הזו. למשל, מבחן הסטודנט משתמש בהשערת האפס לגבי הממוצע האמיתי. במבחן הא-פרמטרי המקביל, מבחן מאן-ויטני, אין השערה לגבי הממוצע האמיתי, ומשתשים אך ורק בדירוג ובמספר המשתתפים במחקר. דוגמאות למבחנים לא פרמטרים הן מבחן חי בריבוע, מאן ויטני וקרוסקל- וואליס.
Non parametric tests
Mann-Whitney U test
יש המון מבחנים סטטיסטים, עם הרבה שמות. אך לא צריך להיבהל מהכמות, רובם עושים את אותה העבודה. ננסה לעשות סדר. הבחירה במבחן מסוים היא לפי מספר מאפיינים של הנתונים שמעניינים אותנו. בעזרת בערך חמישה מאפיינים נוכל להבין באיזה מבחן רצוי להשתמש. חמישה מאפיינים כאלו הם: סוג המשתנה התלוי (ברפואה: התוצא), ההתפלגות שלו, מספר הקטגוריות של המשתנה הבלתי תלוי (ברפואה, פעמים רבות קבוצות הטיפול/ חשיפה), תלות בין מדידה בקבוצה אחת למדידה בקבוצה אחרת, והאם מבוצע תקנון עבור משתנים נוספים (ערפלנים).
מבחן הסטודנט, למשל, הוא כאשר המשתנה התלוי הוא כמותי ומתפלג נורמלית, המשתנה הבלתי תלוי הוא עם שתי קטגוריות, ולא מתבצע תקנון. יש שני מבחנים דומים: כאשר יש תלות בין המדידות (paired t test) וכאשר אין תלות כזו (unpaired t test).
הפניה לתרשים זרימה שיכול לעזור בבחירת המבחן הסטטיסטי המתאים
statistical tests
crème brûlée
unpaired Student’s t test
paired t-test
ANOVA
Mann-Whitney U test
Linear multiple regression
Spearman correlation
יש המון מבחנים סטטיסטים, עם הרבה שמות. אך לא צריך להיבהל מהכמות, רובם עושים את אותה העבודה. ננסה לעשות סדר. הבחירה במבחן מסוים היא לפי מספר מאפיינים של הנתונים שמעניינים אותנו. בעזרת בערך חמישה מאפיינים נוכל להבין באיזה מבחן רצוי להשתמש. חמישה מאפיינים כאלו הם: סוג המשתנה התלוי (ברפואה: התוצא), ההתפלגות שלו, מספר הקטגוריות של המשתנה הבלתי תלוי (ברפואה, פעמים רבות קבוצות הטיפול/ חשיפה), תלות בין מדידה בקבוצה אחת למדידה בקבוצה אחרת, והאם מבוצע תקנון עבור משתנים נוספים (ערפלנים).
מבחן הסטודנט, למשל, הוא כאשר המשתנה התלוי הוא כמותי ומתפלג נורמלית, המשתנה הבלתי תלוי הוא עם שתי קטגוריות, ולא מתבצע תקנון. יש שני מבחנים דומים: כאשר יש תלות בין המדידות (paired t test) וכאשר אין תלות כזו (unpaired t test).
הפניה לתרשים זרימה שיכול לעזור בבחירת המבחן הסטטיסטי המתאים
statistical tests
crème brûlée
unpaired Student’s t test
paired t-test
ANOVA
Mann-Whitney U test
Linear multiple regression
Spearman correlation
משתנים במחקר רפואי קליני הם לרוב מאפיינים של משתתף במחקר או תוצא שנמדד עבורו. למשל, במחקר על טיפול בכריתת קריש תוך מוחי לאחר אירוע מוחי גדול, יש שני משתנים שעניינו במיוחד את החוקרים: האם המטופל קיבל את הטיפול, ומהי רמת המוגבלות שלו לאחר שנה. במקרה הזה, יש משתנה אחד שרוצים לבדוק האם הוא תלוי באחר. האם רמת המוגבלות תלויה בטיפול. לכן, רמת המוגבלות היה המשתנה התלוי, והטיפול- המשתנה הבלתי תלוי.
כדי להבין מהו סוג המשתנה כדאי לשאול מה התשובה המדווחת אצל משתתף בודד. אם מדובר בתשובה שהיא מלה ולא מספר, מדובר במשתנה נומינלי (קטגוריאלי). אם מדובר במספר, יש שתי אפשרויות- האחת שזהו משתנה אורדינלי והשנייה שזהו משתנה כמותי.
משתנה אורדינלי לרוב נקבע לפי סולם כלשהו (למשל סולם רנקין המסווג אדם לאחר אירוע מוחי לפי דרגות הלקות: חסר תסמינים, לקות קלה, לקות קלה אך זקוק לעזרה, לקות בינונית, לקות בינונית-חמורה, ולקות חמורה). משתנה כמותי נקבע פעמים רבות לפי מדידה במכשיר (למשל, רמת הכולסטרול במכשיר מעבדה, לחץ הדם במד לחץ דם, זמן עד הגעה לטיפול רפואי בשעון). בין המשתנים הכמותיים ישנם משתנים בדידים- אלו משתנים שמקבלים רק ערכים שלמים (למשל, מספר אירועים בשנה) ומשתנים רציפים (שיכולים לקבל גם ערכים שאינם שלמים, למשל משקל.
ניתן להפוך משתנה כמותי לאורדינלי ואורדינלי לנומינלי, אך לא להפך. עם הפיכה של משתנה עם יותר מידע (כמותי) למשתנה עם פחות מידע (קטגוריאלי) יש אבדן מידע והעוצמה של המחקר תרד.
כאשר מציגים תוצאות או מדידות במחקר עבור משתתפים רבים, המשתנה הקטגוריאלי יוצג באחוזים, והמשתנה הכמותי/ אורדינלי יוצג כמדד מרכז ומדדי פיזור, למשל חציון וטווח בין רבעוני. לסיווג המשתנים יש חשיבות רבה ביותר בהבנה מתי ומדוע להשתמש במבחן סטטיסטי כלשהו.
Categorical (nominal) variable
Ordinal variable
Quantitative variable
Discrete /continuous quantitative variable
Dependent variable
Independent variable
משתנים במחקר רפואי קליני הם לרוב מאפיינים של משתתף במחקר או תוצא שנמדד עבורו. למשל, במחקר על טיפול בכריתת קריש תוך מוחי לאחר אירוע מוחי גדול, יש שני משתנים שעניינו במיוחד את החוקרים: האם המטופל קיבל את הטיפול, ומהי רמת המוגבלות שלו לאחר שנה. במקרה הזה, יש משתנה אחד שרוצים לבדוק האם הוא תלוי באחר. האם רמת המוגבלות תלויה בטיפול. לכן, רמת המוגבלות היה המשתנה התלוי, והטיפול- המשתנה הבלתי תלוי.
כדי להבין מהו סוג המשתנה כדאי לשאול מה התשובה המדווחת אצל משתתף בודד. אם מדובר בתשובה שהיא מלה ולא מספר, מדובר במשתנה נומינלי (קטגוריאלי). אם מדובר במספר, יש שתי אפשרויות- האחת שזהו משתנה אורדינלי והשנייה שזהו משתנה כמותי.
משתנה אורדינלי לרוב נקבע לפי סולם כלשהו (למשל סולם רנקין המסווג אדם לאחר אירוע מוחי לפי דרגות הלקות: חסר תסמינים, לקות קלה, לקות קלה אך זקוק לעזרה, לקות בינונית, לקות בינונית-חמורה, ולקות חמורה). משתנה כמותי נקבע פעמים רבות לפי מדידה במכשיר (למשל, רמת הכולסטרול במכשיר מעבדה, לחץ הדם במד לחץ דם, זמן עד הגעה לטיפול רפואי בשעון). בין המשתנים הכמותיים ישנם משתנים בדידים- אלו משתנים שמקבלים רק ערכים שלמים (למשל, מספר אירועים בשנה) ומשתנים רציפים (שיכולים לקבל גם ערכים שאינם שלמים, למשל משקל.
ניתן להפוך משתנה כמותי לאורדינלי ואורדינלי לנומינלי, אך לא להפך. עם הפיכה של משתנה עם יותר מידע (כמותי) למשתנה עם פחות מידע (קטגוריאלי) יש אבדן מידע והעוצמה של המחקר תרד.
כאשר מציגים תוצאות או מדידות במחקר עבור משתתפים רבים, המשתנה הקטגוריאלי יוצג באחוזים, והמשתנה הכמותי/ אורדינלי יוצג כמדד מרכז ומדדי פיזור, למשל חציון וטווח בין רבעוני. לסיווג המשתנים יש חשיבות רבה ביותר בהבנה מתי ומדוע להשתמש במבחן סטטיסטי כלשהו.
Categorical (nominal) variable
Ordinal variable
Quantitative variable
Discrete /continuous quantitative variable
Dependent variable
Independent variable
Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis
לאחר קבלת הסטטיסטי מהמבחן, במקרה שלנו ערך הטי (t), אנחנו רוצים לדעת מהו ערך הפי (p). הגאונות בהמצאת המבחן הסטטיסטי היא יצירת נוסחה שההתפלגות של התוצאה שלה צפויה מראש כאשר השערת האפס נכונה. אנחנו יודעים למשל על התפלגות טי שהיא התפלגות סימטרית, דומה מאוד לנורמלית כשהמדגם מספיק גדול. כאשר ההתפלגות צפויה מראש, אפשר להשתמש בטבלה של סבירויות לקבלת תוצאות שונות כשהשערת האפס נכונה. כך המבחן הסטטיסטי מתרגם נתונים גולמיים מהמחקר לסבירות מדוייקת לקבל נתונים אלו כאשר השערת האפס נכונה, במלים אחרות מייצר מתוך הנתונים את ערך הפי.
Statistical test
Student’s t test
Statistic (eg. t statistic=t value)
Sampling distribution- התפלגות הדגימה
Null hypothesis- השערת האפס
Standard error- שגיאת התקן
t table
p value
Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis
לאחר קבלת הסטטיסטי מהמבחן, במקרה שלנו ערך הטי (t), אנחנו רוצים לדעת מהו ערך הפי (p). הגאונות בהמצאת המבחן הסטטיסטי היא יצירת נוסחה שההתפלגות של התוצאה שלה צפויה מראש כאשר השערת האפס נכונה. אנחנו יודעים למשל על התפלגות טי שהיא התפלגות סימטרית, דומה מאוד לנורמלית כשהמדגם מספיק גדול. כאשר ההתפלגות צפויה מראש, אפשר להשתמש בטבלה של סבירויות לקבלת תוצאות שונות כשהשערת האפס נכונה. כך המבחן הסטטיסטי מתרגם נתונים גולמיים מהמחקר לסבירות מדוייקת לקבל נתונים אלו כאשר השערת האפס נכונה, במלים אחרות מייצר מתוך הנתונים את ערך הפי.
Statistical test
Student’s t test
Statistic (eg. t statistic=t value)
Sampling distribution- התפלגות הדגימה
Null hypothesis- השערת האפס
Standard error- שגיאת התקן
t table
p value
Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis
מבחן הסטודנט הוא מבחן סטטיסטי להשוואה בין שני ממוצעים. במבחן זה, כמו בכל מבחן סטטיסטי, אנחנו מנסים להבין האם הממצאים במחקר מספיק דרמטיים כדי לשכנע אותנו שמדובר בתופעה אמיתית. במקרה של מבחן הסטודנט, הבדל אמיתי במציאות ולא סתם הבדל אקראי שהתגלה במחקר שלנו. גודל האפקט וכמות המשתתפים מגבירים את השכנוע שלנו, ולעומתם השונות, ככל שגדולה יותר, מקטינה את השכנוע שלנו. זה יתבטא בנוסחת מבחן הסטודנט, שבסופו של דבר נותן לנו תוצאה בצורת הסטטיטי "t". התוצאה הזו גדלה ככל שגודל האפקט (ההבדל בין הממוצעים) גדול יותר, וככל שכמות המשתתפים גדולה יותר, וקטנה כשסטיית התקן גדלה. דרך אחרת להסתכל על מבחן הסטודנט היא כמבחן שמשתמש בקנה המידה של סטיית התקן, כדי להחליט האם גודל האפקט במחקר הוא דרמטי מספיק כדי לדחות את השערת האפס.
Student’s t test
Statistic (eg. t statistic)
p value
standard deviation
variance- שונות
Effect size
Sample size (n)
Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis
מבחן הסטודנט הוא מבחן סטטיסטי להשוואה בין שני ממוצעים. במבחן זה, כמו בכל מבחן סטטיסטי, אנחנו מנסים להבין האם הממצאים במחקר מספיק דרמטיים כדי לשכנע אותנו שמדובר בתופעה אמיתית. במקרה של מבחן הסטודנט, הבדל אמיתי במציאות ולא סתם הבדל אקראי שהתגלה במחקר שלנו. גודל האפקט וכמות המשתתפים מגבירים את השכנוע שלנו, ולעומתם השונות, ככל שגדולה יותר, מקטינה את השכנוע שלנו. זה יתבטא בנוסחת מבחן הסטודנט, שבסופו של דבר נותן לנו תוצאה בצורת הסטטיטי "t". התוצאה הזו גדלה ככל שגודל האפקט (ההבדל בין הממוצעים) גדול יותר, וככל שכמות המשתתפים גדולה יותר, וקטנה כשסטיית התקן גדלה. דרך אחרת להסתכל על מבחן הסטודנט היא כמבחן שמשתמש בקנה המידה של סטיית התקן, כדי להחליט האם גודל האפקט במחקר הוא דרמטי מספיק כדי לדחות את השערת האפס.
Student’s t test
Statistic (eg. t statistic)
p value
standard deviation
variance- שונות
Effect size
Sample size (n)
Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis
איך מגיעים מנתוני תוצאות במחקר להחלטה האם לדחות את השערת האפס?
מבחן סטטיסטי הוא מתכון (נוסחה) שלתוכו מוכנסים המצרכים (הנתונים מהמחקר שלנו) כך שתתקבל לבסוף עוגה ("הסטטיסטי"). הסטטיסטי עצמו נותן לנו את ערך הפי בעזרת טבלה. ככל שהסטטיסטי גדול יותר, ערך הפי נמוך יותר. אם העוגה תהיה תפוחה מספיק (הסטטיסטי גדול מספיק, לפי טבלה), ערך הפי יהיה קטן יותר ונוכל לדחות את השערת האפס.
Statistical test
Student’s t test
Statistic (eg. t statistic)
p value
null hypothesis
Virtual versus in-person physiotherapy following total knee arthroplasty: a comparative analysis
איך מגיעים מנתוני תוצאות במחקר להחלטה האם לדחות את השערת האפס?
מבחן סטטיסטי הוא מתכון (נוסחה) שלתוכו מוכנסים המצרכים (הנתונים מהמחקר שלנו) כך שתתקבל לבסוף עוגה ("הסטטיסטי"). הסטטיסטי עצמו נותן לנו את ערך הפי בעזרת טבלה. ככל שהסטטיסטי גדול יותר, ערך הפי נמוך יותר. אם העוגה תהיה תפוחה מספיק (הסטטיסטי גדול מספיק, לפי טבלה), ערך הפי יהיה קטן יותר ונוכל לדחות את השערת האפס.
Statistical test
Student’s t test
Statistic (eg. t statistic)
p value
null hypothesis
Maternal singing sustains preterm hospitalized newborns’ autonomic nervous system maturation: an RCT
פרק בפודקאסט- תוצאות בדיקה אבחנתית- הדרך המדויקת יותר
וידאו- הקדמה לסטטיסטיקה בייסיאנית
כאשר יש דלקת קרום המח, ברוב המקרים יש גם חום. אך לא ניתן להפוך את הסדר ולקבל אותה סבירות. "כאשר יש חום, ברוב המקרים יש גם דלקת קרום המח". ערך הפי מעריך את הסבירות לממצא במחקר כאשר היפותזת האפס נכונה. גם כאן, כאשר הופכים את הסדר (“מה הסבירות שהיפותזת האפס נכונה כאשר נתונים לנו הממצאים במחקר”) נקבל מספר שונה מערך הפי. איך נחשב אותו?
לפי השיטה הבייסיאנית, קיימת סבירות לנכונות של טענה עוד לפני קבלת ראיות. הראיות מגבירות או מפחיתות את הסבירות לנכונות הטענה. לכן, בחישוב הסבירות לנכונות טענה, צריך לקחת בחשבון גם את הסבירות שלפני. לדוגמה, במחקר קליני, קיימת סבירות לתועלת של התערבות עוד לפני ביצוע המחקר. סבירות זו נלקחת בחשבון ואז מתייחסים גם לעוצמת המחקר וגם למובהקות שלו כדי להגיע להערכה חדשה לגבי הסבירות שההתערבות עוזרת.
בצורה פשטנית, חישוב הסבירות שהטיפול עוזר יהיה שבר (חלוקה). במונה: הסבירות שהטיפול עוזר וגם שיתקבלו ראיות לטובת הטיפול, ובמכנה: הסבירות שיתקבלו ראיות לטובת הטיפול (בין אם הטיפול עוזר או שלא עוזר).
Bayesian statistics
Prior
Posterior
Pre test probability
Sensitivity
Specificity
Maternal singing sustains preterm hospitalized newborns’ autonomic nervous system maturation: an RCT
פרק בפודקאסט- תוצאות בדיקה אבחנתית- הדרך המדויקת יותר
וידאו- הקדמה לסטטיסטיקה בייסיאנית
כאשר יש דלקת קרום המח, ברוב המקרים יש גם חום. אך לא ניתן להפוך את הסדר ולקבל אותה סבירות. "כאשר יש חום, ברוב המקרים יש גם דלקת קרום המח". ערך הפי מעריך את הסבירות לממצא במחקר כאשר היפותזת האפס נכונה. גם כאן, כאשר הופכים את הסדר (“מה הסבירות שהיפותזת האפס נכונה כאשר נתונים לנו הממצאים במחקר”) נקבל מספר שונה מערך הפי. איך נחשב אותו?
לפי השיטה הבייסיאנית, קיימת סבירות לנכונות של טענה עוד לפני קבלת ראיות. הראיות מגבירות או מפחיתות את הסבירות לנכונות הטענה. לכן, בחישוב הסבירות לנכונות טענה, צריך לקחת בחשבון גם את הסבירות שלפני. לדוגמה, במחקר קליני, קיימת סבירות לתועלת של התערבות עוד לפני ביצוע המחקר. סבירות זו נלקחת בחשבון ואז מתייחסים גם לעוצמת המחקר וגם למובהקות שלו כדי להגיע להערכה חדשה לגבי הסבירות שההתערבות עוזרת.
בצורה פשטנית, חישוב הסבירות שהטיפול עוזר יהיה שבר (חלוקה). במונה: הסבירות שהטיפול עוזר וגם שיתקבלו ראיות לטובת הטיפול, ובמכנה: הסבירות שיתקבלו ראיות לטובת הטיפול (בין אם הטיפול עוזר או שלא עוזר).
Bayesian statistics
Prior
Posterior
Pre test probability
Sensitivity
Specificity
Maternal singing sustains preterm hospitalized newborns’ autonomic nervous system maturation: an RCT
הסבר בוידאו על מדדים של שונות קצב הלב (heart rate variability)
שלוש טעויות נפוצות מאוד בפירוש ערך הפי הן קריאה תמימה המתעלמת מהטיות, כולל הטיות פרסום והטיות דיווח, בלבול בין משמעות סטטיסטית למשמעות קלינית (בעצם, בין מובהקות לבין חשיבות), ופירוש מתמטי שגוי של ערך הפי המתעלם מכך שמדובר בהסתברות מותנית.
bias
publication bias
reporting bias
statistical significance
clinical significance
conditional probability
Maternal singing sustains preterm hospitalized newborns’ autonomic nervous system maturation: an RCT
הסבר בוידאו על מדדים של שונות קצב הלב (heart rate variability)
שלוש טעויות נפוצות מאוד בפירוש ערך הפי הן קריאה תמימה המתעלמת מהטיות, כולל הטיות פרסום והטיות דיווח, בלבול בין משמעות סטטיסטית למשמעות קלינית (בעצם, בין מובהקות לבין חשיבות), ופירוש מתמטי שגוי של ערך הפי המתעלם מכך שמדובר בהסתברות מותנית.
bias
publication bias
reporting bias
statistical significance
clinical significance
conditional probability
Evolocumab and Clinical Outcomes in Patients with Cardiovascular Disease
Automated Insulin Delivery in Women with Pregnancy Complicated by Type 1 Diabetes
רוב הגורמים שיגרמו לנו להסיק מסקנות מוטעות ממחקר משותפים גם לטעות מסוג 1 וגם לטעות מסוג 2. הגורמים שיפחיתו סבירות לשתי הטעויות הם גודל המדגם (וגם מספר האירועים הצפוי), גודל האפקט, ודמיון בין המשתתפים בתוך הקבוצה (שונות נמוכה בתוך הקבוצה). מבין גורמים אלו, לחוקרים יש שליטה על גודל המדגם ובמידה מסוימת על השונות בין המשתתפים. ערך האלפא מיוחד בכך ששינוי שלו יקטין טעות אחת ויגדיל את הסבירות לטעות האחרת.
type I and type II errors
sample size
effect size
within group variation
alpha value
Evolocumab and Clinical Outcomes in Patients with Cardiovascular Disease
Automated Insulin Delivery in Women with Pregnancy Complicated by Type 1 Diabetes
רוב הגורמים שיגרמו לנו להסיק מסקנות מוטעות ממחקר משותפים גם לטעות מסוג 1 וגם לטעות מסוג 2. הגורמים שיפחיתו סבירות לשתי הטעויות הם גודל המדגם (וגם מספר האירועים הצפוי), גודל האפקט, ודמיון בין המשתתפים בתוך הקבוצה (שונות נמוכה בתוך הקבוצה). מבין גורמים אלו, לחוקרים יש שליטה על גודל המדגם ובמידה מסוימת על השונות בין המשתתפים. ערך האלפא מיוחד בכך ששינוי שלו יקטין טעות אחת ויגדיל את הסבירות לטעות האחרת.
type I and type II errors
sample size
effect size
within group variation
alpha value
Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine through 6 Months
Azithromycin during Routine Well-Infant Visits to Prevent Death
עוצמה היא היכולת של מחקר לזהות אפקט או קשר שקיימים במציאות. העוצמה היא הסתברות מותנית, וקשורה רק למצב בו היפותזת החוקר נכונה. במידה והיפותזת החוקר נכונה, מה הסבירות שבבדיקת ההשערות נדחה את השערת האפס ונקבל את היפותזת החוקר. במובן הזה היא למעשה המשלימה של טעות מסוג שתיים. למשל, אם במידה והיפותזת החוקר נכונה, הסבירות לטעות מסוג שתיים היא 20%, אז עצמת המחקר היא 80%. בניגוד לערך ה-p, ובדומה לערך האלפא, העצמה מחושבת לפני קבלת תוצאות המחקר. העוצמה תלויה בין השאר בכמות המשתתפים במחקר, בכמות האירועים הצפויה, למשל כמות הילדים הצפויים להדבק בטייפואיד, ובגודל האפקט המשוער. גודל האפקט המשוער הוא ההבדל או היחס המשוער בין קבוצה אחת לשניה, למשל הפחתה של 75% במקרי הטייפואיד. אפשר להעריכו לפי מחקרים קודמים או להתייחס לאפקט המינימלי שיש לו משמעות קלינית.
העוצמה גוברת כאשר המדגם גדול, אפקט הטיפול גדול, הפיזור של הערכים קטן (על הבט זה נדבר בפרק הבא), וערך אלפא גדול יותר.
Power
Type II error
Estimated effect size
Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine through 6 Months
Azithromycin during Routine Well-Infant Visits to Prevent Death
עוצמה היא היכולת של מחקר לזהות אפקט או קשר שקיימים במציאות. העוצמה היא הסתברות מותנית, וקשורה רק למצב בו היפותזת החוקר נכונה. במידה והיפותזת החוקר נכונה, מה הסבירות שבבדיקת ההשערות נדחה את השערת האפס ונקבל את היפותזת החוקר. במובן הזה היא למעשה המשלימה של טעות מסוג שתיים. למשל, אם במידה והיפותזת החוקר נכונה, הסבירות לטעות מסוג שתיים היא 20%, אז עצמת המחקר היא 80%. בניגוד לערך ה-p, ובדומה לערך האלפא, העצמה מחושבת לפני קבלת תוצאות המחקר. העוצמה תלויה בין השאר בכמות המשתתפים במחקר, בכמות האירועים הצפויה, למשל כמות הילדים הצפויים להדבק בטייפואיד, ובגודל האפקט המשוער. גודל האפקט המשוער הוא ההבדל או היחס המשוער בין קבוצה אחת לשניה, למשל הפחתה של 75% במקרי הטייפואיד. אפשר להעריכו לפי מחקרים קודמים או להתייחס לאפקט המינימלי שיש לו משמעות קלינית.
העוצמה גוברת כאשר המדגם גדול, אפקט הטיפול גדול, הפיזור של הערכים קטן (על הבט זה נדבר בפרק הבא), וערך אלפא גדול יותר.
Power
Type II error
Estimated effect size
כאשר היפותזת החוקר נכונה (היפותזת האפס אינה נכונה) מחקר לא תמיד יגיע למובהקות. תופעה זו נקראת טעות מסוג 2, והיא קורית מארבע סיבות עיקריות: מדגם קטן מדי, אפקט לא דרמטי, פיזור גדול בתוך הקבוצות של ערך שנבדק, וקביעת ערך אלפא נמוך.
Type II error
כאשר היפותזת החוקר נכונה (היפותזת האפס אינה נכונה) מחקר לא תמיד יגיע למובהקות. תופעה זו נקראת טעות מסוג 2, והיא קורית מארבע סיבות עיקריות: מדגם קטן מדי, אפקט לא דרמטי, פיזור גדול בתוך הקבוצות של ערך שנבדק, וקביעת ערך אלפא נמוך.
Type II error
כאשר ערך הפי נמוך, ניתן לדחות את השערת האפס וכך לקבל ראיה לנכונות השערת החוקרים. אך מהו הסף לקביעת "נמוך" לעומת "לא נמוך"? ערך הסף הזה, כאשר נקבע מראש, נקרא "אלפא" ובמחקרים רבים נקבע שאלפא יהיה 0.05. כאשר ערך הפי נמוך מערך האלפא, והשערת האפס נדחית, ניתן לקבל את השערת החוקר והתוצאה מובהקת. כאשר ערך הפי גדול מערך האלפא, לא ניתן לדחות את השערת האפס והתוצאה אינה מובהקת. מה לגבי הבחירה השרירותית של אלפא כ 0.05? נדבר על הבעייתיות הנובעת מכך לגבי הוכחה בעזרת בדיקת השערות. אלפא קשורה באופן הדוק לטעות מסוג 1: מצב שבו השערת האפס נכונה אך הניתוח הסטטיסטי מראה מובהקות. למשל, שבעצם הטיפול לא עוזר בכלום, אך במחקר נמצאה תועלת מובהקת לעומת פלצבו.
Alpha value
Significance
Type I error
כאשר ערך הפי נמוך, ניתן לדחות את השערת האפס וכך לקבל ראיה לנכונות השערת החוקרים. אך מהו הסף לקביעת "נמוך" לעומת "לא נמוך"? ערך הסף הזה, כאשר נקבע מראש, נקרא "אלפא" ובמחקרים רבים נקבע שאלפא יהיה 0.05. כאשר ערך הפי נמוך מערך האלפא, והשערת האפס נדחית, ניתן לקבל את השערת החוקר והתוצאה מובהקת. כאשר ערך הפי גדול מערך האלפא, לא ניתן לדחות את השערת האפס והתוצאה אינה מובהקת. מה לגבי הבחירה השרירותית של אלפא כ 0.05? נדבר על הבעייתיות הנובעת מכך לגבי הוכחה בעזרת בדיקת השערות. אלפא קשורה באופן הדוק לטעות מסוג 1: מצב שבו השערת האפס נכונה אך הניתוח הסטטיסטי מראה מובהקות. למשל, שבעצם הטיפול לא עוזר בכלום, אך במחקר נמצאה תועלת מובהקת לעומת פלצבו.
Alpha value
Significance
Type I error
Liquefied Petroleum Gas or Biomass Cooking and Severe Infant Pneumonia
Long-Term Outcomes of Resynchronization–Defibrillation for Heart Failure
במחקר רפואי, השערת החוקר תהיה בדרך כלל שיש הבדל, קשר או השפעה. השערת האפס תהיה שאין הבדל, קשר או השפעה. המבחן הסטטיסטי בודק האם בנוכחות השערת האפס, הממצאים במחקר סבירים. אם הם אינם סבירים בעליל (ערך p מאוד נמוך), השערת האפס גם היא לא סבירה, ואנו נאלצים לקבל את ההשערה השנייה, השערת החוקר. אם ערך p לא מאוד נמוך, משמעותו היא שבמידה והשערת האפס נכונה, הממצאים במחקר עדיין סבירים, לא נוכל לדחות את השערת האפס. ההגדרה הרשמית של p תהיה- הסבירות לקבל ערך כזה או קיצוני יותר אם השערת האפס נכונה. ובתרגום למחקר רפואי על טיפול: הסבירות לקבל הבדל כזה או קיצוני יותר בין קבוצת הטיפול לקבוצת הביקורת, אם האמת היא שהטיפול כלל לא עוזר.
כאשר ערך ה p נמוך מאוד, השערת האפס נדחית והשערת החוקר מתקבלת- מדובר במחקר חיובי. כאשר השערת האפס לא נדחית, והשערת החוקר לא מתקבלת- נקרא למחקר "שלילי".
טעות נפוצה היא לחשוב שאם ערך ה p גבוה, השערת האפס נכונה. אך העובדה שלא דחינו את השערת האפס אינה מוכיחה את נכונותה. למתקדמים ומתעניינים: אז איך בכל זאת מוכיחים "נכונות העדר הבדל" בין שני טיפולים, זאת אומרת איך מוכיחים שהתערבות אחת דומה להתערבות אחרת באפקט שלה? חפשו פרק ישן בפודקאסט על מחקרי non inferiority.
Hypothesis testing
p value
positive trial
negative trial
Liquefied Petroleum Gas or Biomass Cooking and Severe Infant Pneumonia
Long-Term Outcomes of Resynchronization–Defibrillation for Heart Failure
במחקר רפואי, השערת החוקר תהיה בדרך כלל שיש הבדל, קשר או השפעה. השערת האפס תהיה שאין הבדל, קשר או השפעה. המבחן הסטטיסטי בודק האם בנוכחות השערת האפס, הממצאים במחקר סבירים. אם הם אינם סבירים בעליל (ערך p מאוד נמוך), השערת האפס גם היא לא סבירה, ואנו נאלצים לקבל את ההשערה השנייה, השערת החוקר. אם ערך p לא מאוד נמוך, משמעותו היא שבמידה והשערת האפס נכונה, הממצאים במחקר עדיין סבירים, לא נוכל לדחות את השערת האפס. ההגדרה הרשמית של p תהיה- הסבירות לקבל ערך כזה או קיצוני יותר אם השערת האפס נכונה. ובתרגום למחקר רפואי על טיפול: הסבירות לקבל הבדל כזה או קיצוני יותר בין קבוצת הטיפול לקבוצת הביקורת, אם האמת היא שהטיפול כלל לא עוזר.
כאשר ערך ה p נמוך מאוד, השערת האפס נדחית והשערת החוקר מתקבלת- מדובר במחקר חיובי. כאשר השערת האפס לא נדחית, והשערת החוקר לא מתקבלת- נקרא למחקר "שלילי".
טעות נפוצה היא לחשוב שאם ערך ה p גבוה, השערת האפס נכונה. אך העובדה שלא דחינו את השערת האפס אינה מוכיחה את נכונותה. למתקדמים ומתעניינים: אז איך בכל זאת מוכיחים "נכונות העדר הבדל" בין שני טיפולים, זאת אומרת איך מוכיחים שהתערבות אחת דומה להתערבות אחרת באפקט שלה? חפשו פרק ישן בפודקאסט על מחקרי non inferiority.
Hypothesis testing
p value
positive trial
negative trial
שיטת בדיקת ההשערות בסטטיסטיקה, הקשורה תמיד למבחנים, מובהקות וערך ה"פי", מסתכלת על חיפוש האמת כתחרות בין שתי אפשרויות שאינן יכולות להתממש יחד. במקום להוכיח ישירות את האפשרות שמעניינת אותנו, מבצעים הערכת סבירות לאפשרות השנייה. אי סבירות של האפשרות השנייה היא ראייה לנכונות האפשרות הראשונה.
ובצורה פורמלית: במקום להוכיח שהשערת החוקר היא הנכונה, מראים שאם השערת האפס הייתה נכונה, לא סביר לקבל את הראיות שקיבלנו במחקר. במצב כזה לא סביר שהשערת האפס נכונה, ואנחנו ונאלצים לקבל את השערת החוקר, כיוון שזו האפשרות האחרת היחידה.
Hypothesis testing
Null hypothesis- H0
Alternative hypothesis (usually the researcher hypothesis)-H1
p value
שיטת בדיקת ההשערות בסטטיסטיקה, הקשורה תמיד למבחנים, מובהקות וערך ה"פי", מסתכלת על חיפוש האמת כתחרות בין שתי אפשרויות שאינן יכולות להתממש יחד. במקום להוכיח ישירות את האפשרות שמעניינת אותנו, מבצעים הערכת סבירות לאפשרות השנייה. אי סבירות של האפשרות השנייה היא ראייה לנכונות האפשרות הראשונה.
ובצורה פורמלית: במקום להוכיח שהשערת החוקר היא הנכונה, מראים שאם השערת האפס הייתה נכונה, לא סביר לקבל את הראיות שקיבלנו במחקר. במצב כזה לא סביר שהשערת האפס נכונה, ואנחנו ונאלצים לקבל את השערת החוקר, כיוון שזו האפשרות האחרת היחידה.
Hypothesis testing
Null hypothesis- H0
Alternative hypothesis (usually the researcher hypothesis)-H1
p value
Evaluation of Oseltamivir Used to Prevent Hospitalization in Outpatients With Influenza
פרק מסכם עבור רווח בר סמך: מה נין להסיק מגרף היער במטא אנליזה לגבי מובהקות, אפקט, דיוק, ומדוע יש סימטריה גרפית אך לא סימטריה מספרית ברווח בר סמך עבור ערכים כמו סיכון יחסי
Meta analysis
Evaluation of Oseltamivir Used to Prevent Hospitalization in Outpatients With Influenza
פרק מסכם עבור רווח בר סמך: מה נין להסיק מגרף היער במטא אנליזה לגבי מובהקות, אפקט, דיוק, ומדוע יש סימטריה גרפית אך לא סימטריה מספרית ברווח בר סמך עבור ערכים כמו סיכון יחסי
Meta analysis
בפרקים קודמים ראינו שפעמים רבות התפלגות הדגימה היא התפלגות נורמלית, המאפשרת לחשב שגיאת תקן, רווח בר סמך ועוד. אך כאשר מדובר בסיכון יחסי ובערכים דומים התלויים בחלוקה, לצערנו התפלגות הדגימה היא התפלגות מוטה ימינה. לשמחתנו כאשר מבטאים את הערכים מחדש כלוגריתמים, ההתפלגות הופכת בכל זאת לנורמלית.
חישוב שגיאת התקן ומתוכה גם רווח בר סמך מתבצע על אותה התפלגות נורמלית של הלוגריתמים. אחר כך, כדי שנבין משמעות קלינית אין ברירה אלא לתרגם את כל הערכים חזרה למצבם הטבעי. בתרגום מחדש למצב הטבעי רווח בר סמך עבור הסיכון היחסי יראה לא סימטרי.
Relative risk
Sampling distribution
Re expression/ transformation
Ln
בפרקים קודמים ראינו שפעמים רבות התפלגות הדגימה היא התפלגות נורמלית, המאפשרת לחשב שגיאת תקן, רווח בר סמך ועוד. אך כאשר מדובר בסיכון יחסי ובערכים דומים התלויים בחלוקה, לצערנו התפלגות הדגימה היא התפלגות מוטה ימינה. לשמחתנו כאשר מבטאים את הערכים מחדש כלוגריתמים, ההתפלגות הופכת בכל זאת לנורמלית.
חישוב שגיאת התקן ומתוכה גם רווח בר סמך מתבצע על אותה התפלגות נורמלית של הלוגריתמים. אחר כך, כדי שנבין משמעות קלינית אין ברירה אלא לתרגם את כל הערכים חזרה למצבם הטבעי. בתרגום מחדש למצב הטבעי רווח בר סמך עבור הסיכון היחסי יראה לא סימטרי.
Relative risk
Sampling distribution
Re expression/ transformation
Ln
Immunogenicity and Reactogenicity of Coadministration of COVID-19 and Influenza Vaccines
בספרות הרפואית נפוץ מאוד ביטוי מחדש של ערך בעזרת לוגריתם- ובדוגמה הפשוטה ביותר, במקום לציין את הערך המקורי של מספר, ניתן לציין כמה אפסים נמצאים אחרי הספרה אחת. למשל, 10 יבוטא כ 1, ו 1000 יבוטא כ 3. ביטוי כזה של ערכים הופך פעמים רבות התפלגות מוטה ימינה להתפלגות סימטרית. יש לביטוי מחדש כזה יתרון בנוחיות הבנה וקריאה, בגרפים למשל, וגם חשיבות בהמשך בסטטיסטיקה היסקית, כיוון שאם התפלגות הופכת לנורמלית, אפשר לבצע עליה פעולות רבות.
יש ביטויים מחדש בצורות אחרות- למשל בביטוי השבר שבו הערך המקורי הוא המכנה (נמצא מתחת לקו השבר), כדי להפוך התפלגות מוטה שמאלה להתפלגות סימטרית.
Re expression/ transformation
Logarithm
Ln
Immunogenicity and Reactogenicity of Coadministration of COVID-19 and Influenza Vaccines
בספרות הרפואית נפוץ מאוד ביטוי מחדש של ערך בעזרת לוגריתם- ובדוגמה הפשוטה ביותר, במקום לציין את הערך המקורי של מספר, ניתן לציין כמה אפסים נמצאים אחרי הספרה אחת. למשל, 10 יבוטא כ 1, ו 1000 יבוטא כ 3. ביטוי כזה של ערכים הופך פעמים רבות התפלגות מוטה ימינה להתפלגות סימטרית. יש לביטוי מחדש כזה יתרון בנוחיות הבנה וקריאה, בגרפים למשל, וגם חשיבות בהמשך בסטטיסטיקה היסקית, כיוון שאם התפלגות הופכת לנורמלית, אפשר לבצע עליה פעולות רבות.
יש ביטויים מחדש בצורות אחרות- למשל בביטוי השבר שבו הערך המקורי הוא המכנה (נמצא מתחת לקו השבר), כדי להפוך התפלגות מוטה שמאלה להתפלגות סימטרית.
Re expression/ transformation
Logarithm
Ln
Single-Dose Psilocybin Treatment for Major Depressive Disorder
Baricitinib and β-Cell Function in Patients with New-Onset Type 1 Diabetes
בפרק זה נדגים את השימוש ברווח בר סמך להבנת משמעות תוצאות מחקרים פורצי דרך מהשנה האחרונה. הראשון על פסילוסיבין (חומר המופק מפטריית הזיה) במתן חד פעמי כטיפול בדכאון, והשני על ברסיטיניב המשנה כנראה מהלך מחלה בסוכרת נעורים. נתייחס לסימטריה של רווח בר סמך, לקיומו (תמיד) סביב ההערכה הנקודתית במחקר, ולהבנה מתוכו לגבי רמת הדיוק, הערכת השפעת טיפול במקרה הגרוע ביותר ובמקרה הטוב ביותר, ומובהקות.
Single-Dose Psilocybin Treatment for Major Depressive Disorder
Baricitinib and β-Cell Function in Patients with New-Onset Type 1 Diabetes
בפרק זה נדגים את השימוש ברווח בר סמך להבנת משמעות תוצאות מחקרים פורצי דרך מהשנה האחרונה. הראשון על פסילוסיבין (חומר המופק מפטריית הזיה) במתן חד פעמי כטיפול בדכאון, והשני על ברסיטיניב המשנה כנראה מהלך מחלה בסוכרת נעורים. נתייחס לסימטריה של רווח בר סמך, לקיומו (תמיד) סביב ההערכה הנקודתית במחקר, ולהבנה מתוכו לגבי רמת הדיוק, הערכת השפעת טיפול במקרה הגרוע ביותר ובמקרה הטוב ביותר, ומובהקות.
Semaglutide and Cardiovascular Outcomes in Obesity without Diabetes
רוחב רווח בר סמך מעיד על רמת הדיוק של המחקר (לא להתבלבל עם התקפות או האמינות). קצות רווח בר סמך יכולים לשמש להתייחסות למקרה הגרוע ביותר (בסבירות של 95%) או הטוב ביותר לגבי השפעת טיפול כלשהו אך יש לשים לב שמדובר בערך הגרוע ביותר עבור ממוצע או קבוצה לא עבור מטופל בודד. רווח בר סמך הכולל בתוכו את הערך הניטרלי מעיד על העדר מובהקות. כאשר מדובר ברווח בר סמך ברמת בטחון של 95%, מדובר על מובהקות ברמה של 0.05. ערך ניטרלי לגבי משתנים של יחס הוא 1, וערך ניטרלי לגבי משתנים של הפרשה הוא 0. שתי תפיסות שגויות נפוצות של רווח בר סמך: 1) להתייחס אליו כאילו מתאר פיזור באוכלוסיה ("95% מהמטופלים היו עם ערכים בין 7.5 ל 8.5"), 2) להבין כאילו כדי לחשבו יש לבצע כמות גדולה של מדגמים/ מחקרים.
precision
value of null effect
Semaglutide and Cardiovascular Outcomes in Obesity without Diabetes
רוחב רווח בר סמך מעיד על רמת הדיוק של המחקר (לא להתבלבל עם התקפות או האמינות). קצות רווח בר סמך יכולים לשמש להתייחסות למקרה הגרוע ביותר (בסבירות של 95%) או הטוב ביותר לגבי השפעת טיפול כלשהו אך יש לשים לב שמדובר בערך הגרוע ביותר עבור ממוצע או קבוצה לא עבור מטופל בודד. רווח בר סמך הכולל בתוכו את הערך הניטרלי מעיד על העדר מובהקות. כאשר מדובר ברווח בר סמך ברמת בטחון של 95%, מדובר על מובהקות ברמה של 0.05. ערך ניטרלי לגבי משתנים של יחס הוא 1, וערך ניטרלי לגבי משתנים של הפרשה הוא 0. שתי תפיסות שגויות נפוצות של רווח בר סמך: 1) להתייחס אליו כאילו מתאר פיזור באוכלוסיה ("95% מהמטופלים היו עם ערכים בין 7.5 ל 8.5"), 2) להבין כאילו כדי לחשבו יש לבצע כמות גדולה של מדגמים/ מחקרים.
precision
value of null effect
Semaglutide and Cardiovascular Outcomes in Obesity without Diabetes
Confidence intervals-Cochrane collaboration
רווח בר סמך בשימושו המקובל בספרות הרפואית, הוא טווח המספרים שבתוכו סביר שנמצאת האמת (סביר= 95% בדרך כלל).
הוא מחושב בעזרת התפלגות הדגימה ושגיאת התקן שלה. 95% מהמחקרים הדמיוניים נופלים במרחק מסוים מהאמת הלא ידועה. ניתן להפוך את הכיוון ולהגיד שמחקר בודד הוא כנראה (סבירות של 95%) אחד ממחקרים אלו, ולכן המרחק המקסימלי שלו מהאמת יהיה אותו מרחק. במצבים בהם התפלגות הדגימה היא התפלגות נורמלית או כמעט נורמלית, כ-95% מהמחקרים הדמיוניים יפלו במרחק של שתי שגיאות תקן מהאמת. במצבים אלו, המרחק של האמת (למשל, ההפרש האמיתי בירידה במשקל בין סמגלוטייד לפלצבו) מהתוצאה במחקר הבודד (למשל 8.5 ק"ג יתרון לסמגלוטייד) יהיה שתי שגיאות תקן לכל היותר (במקרה הזה, שתי שגיאות תקן הם רבע ק"ג). לכן רווח בר סמך להפרשה הירידה במשקל בין סמגלוטייד לפלצבו הוא הטווח שבין 8.25 ק"ג ל 8.75 ק"ג. זהו הטווח שבתוכו כנראה נמצאת האמת לגבי השפעת סמגלוטייד, בהנחה שאין הטיות.
Confidence interval
Semaglutide and Cardiovascular Outcomes in Obesity without Diabetes
Confidence intervals-Cochrane collaboration
רווח בר סמך בשימושו המקובל בספרות הרפואית, הוא טווח המספרים שבתוכו סביר שנמצאת האמת (סביר= 95% בדרך כלל).
הוא מחושב בעזרת התפלגות הדגימה ושגיאת התקן שלה. 95% מהמחקרים הדמיוניים נופלים במרחק מסוים מהאמת הלא ידועה. ניתן להפוך את הכיוון ולהגיד שמחקר בודד הוא כנראה (סבירות של 95%) אחד ממחקרים אלו, ולכן המרחק המקסימלי שלו מהאמת יהיה אותו מרחק. במצבים בהם התפלגות הדגימה היא התפלגות נורמלית או כמעט נורמלית, כ-95% מהמחקרים הדמיוניים יפלו במרחק של שתי שגיאות תקן מהאמת. במצבים אלו, המרחק של האמת (למשל, ההפרש האמיתי בירידה במשקל בין סמגלוטייד לפלצבו) מהתוצאה במחקר הבודד (למשל 8.5 ק"ג יתרון לסמגלוטייד) יהיה שתי שגיאות תקן לכל היותר (במקרה הזה, שתי שגיאות תקן הם רבע ק"ג). לכן רווח בר סמך להפרשה הירידה במשקל בין סמגלוטייד לפלצבו הוא הטווח שבין 8.25 ק"ג ל 8.75 ק"ג. זהו הטווח שבתוכו כנראה נמצאת האמת לגבי השפעת סמגלוטייד, בהנחה שאין הטיות.
Confidence interval
Natriuresis-guided diuretic therapy in acute heart failure: a pragmatic randomized trial
כיוון שהתפלגות הדגימה, למשל של ממוצעים, היא נורמלית, כ 95% (נקרא להם "הרוב הגדול") מהמחקרים על הכוכב הדמיוני יפלו במרחק של עד שתי שגיאות תקן מהאמת לכל כיוון. המחקר שלנו (שאנחנו קוראים) הוא אחד המחקרים מתוך אותה התפלגות דגימה, ולכן יש סבירות של 95% שהוא אחד מ"הרוב הגדול". אם פשוט נהפוך את כיוון מדידת המרחק, כאשר בידינו רק הממוצע מהמחקר, נוכל נסיק (בסבירות של 95%) שהאמת תהיה במרחק של עד שתי שגיאות תקן מהתוצאה של המחקר שלנו.
Inferential statistics- סטטיסטיקה היסקית
confidence interval - רווח בר סמך
Natriuresis-guided diuretic therapy in acute heart failure: a pragmatic randomized trial
כיוון שהתפלגות הדגימה, למשל של ממוצעים, היא נורמלית, כ 95% (נקרא להם "הרוב הגדול") מהמחקרים על הכוכב הדמיוני יפלו במרחק של עד שתי שגיאות תקן מהאמת לכל כיוון. המחקר שלנו (שאנחנו קוראים) הוא אחד המחקרים מתוך אותה התפלגות דגימה, ולכן יש סבירות של 95% שהוא אחד מ"הרוב הגדול". אם פשוט נהפוך את כיוון מדידת המרחק, כאשר בידינו רק הממוצע מהמחקר, נוכל נסיק (בסבירות של 95%) שהאמת תהיה במרחק של עד שתי שגיאות תקן מהתוצאה של המחקר שלנו.
Inferential statistics- סטטיסטיקה היסקית
confidence interval - רווח בר סמך
כמו שהבנו כבר, התפלגות הדגימה היא התפלגות תיאורטית בלבד ולא באמת מתבצעים המוני מדגמים שונים. שגיאת התקן היא סטיית התקן של אותה התפלגות תיאורטית. בהגדרה פשטנית: שגיאת התקן היא המרחק הממוצע של הערכים בהתפלגות הדגימה מהאמת (למשל, של ממוצעי מדגמים רבים מהממוצע האמיתי).
למרות שהתפלגות הדגימה היא תיאורטית, ניתן להבין את צורתה מתוך נתונים במחקר. ולמרות שהיא נוגעת למחקרים תיאורטיים מרובים, ניתן להבין את צורתה ממחקר בודד בלבד. למשל, ניתן לחשב שגיאת תקן של ממוצעים בעזרת שני נתונים: סטיית התקן במחקר הבודד ומספר המשתתפים בו. שגיאת תקן מחושבת עבור ערכים שונים ולא רק עבור ממוצע- למשל עבור הפרשי ממוצעים, סיכון, הפרשי סיכונים, ותוצאים רבים אחרים.
כמו שהבנו כבר, התפלגות הדגימה היא התפלגות תיאורטית בלבד ולא באמת מתבצעים המוני מדגמים שונים. שגיאת התקן היא סטיית התקן של אותה התפלגות תיאורטית. בהגדרה פשטנית: שגיאת התקן היא המרחק הממוצע של הערכים בהתפלגות הדגימה מהאמת (למשל, של ממוצעי מדגמים רבים מהממוצע האמיתי).
למרות שהתפלגות הדגימה היא תיאורטית, ניתן להבין את צורתה מתוך נתונים במחקר. ולמרות שהיא נוגעת למחקרים תיאורטיים מרובים, ניתן להבין את צורתה ממחקר בודד בלבד. למשל, ניתן לחשב שגיאת תקן של ממוצעים בעזרת שני נתונים: סטיית התקן במחקר הבודד ומספר המשתתפים בו. שגיאת תקן מחושבת עבור ערכים שונים ולא רק עבור ממוצע- למשל עבור הפרשי ממוצעים, סיכון, הפרשי סיכונים, ותוצאים רבים אחרים.
התופעה הפלאית שעליה בנוי חלק גדול מהסטטיסטיקה ההיסקית היא שהתפלגות הדגימה (התיאורטית) מתנהגת פעמים רבות כמו התפלגות נורמלית, גם כאשר הנתונים המקוריים אינם מתפלגים נורמלית.
נדגים זאת בצורה הקלאסית על ממוצע של ערך מספרי, למשל משקל בננות או ערך המוגלובין מסוכרר. התפלגות הדגימה של הממוצעים, כאשר המדגם מספיק גדול, תהיה התפלגות נורמלית עם כל מאפייניה. נדגיש שוב שהתפלגות זו קורית רק בכוכב הדמיוני.
התופעה הפלאית שעליה בנוי חלק גדול מהסטטיסטיקה ההיסקית היא שהתפלגות הדגימה (התיאורטית) מתנהגת פעמים רבות כמו התפלגות נורמלית, גם כאשר הנתונים המקוריים אינם מתפלגים נורמלית.
נדגים זאת בצורה הקלאסית על ממוצע של ערך מספרי, למשל משקל בננות או ערך המוגלובין מסוכרר. התפלגות הדגימה של הממוצעים, כאשר המדגם מספיק גדול, תהיה התפלגות נורמלית עם כל מאפייניה. נדגיש שוב שהתפלגות זו קורית רק בכוכב הדמיוני.
Tirzepatide versus Semaglutide Once Weekly in Patients with Type 2 Diabetes
מחקר הוא מדגם. כדי להסיק ממנו מסקנות על העולם דרושים שלושה שלבים: ראשית: הבנה מה היה קורה תיאורטית (על כוכב דמיוני שבו היו מבוצעים מחקרים רבים זהים) למדגמים מרובים באותו גודל, שנית: מתוך אותה הבנה חישוב גודל הטעות הצפויה, ושלישית: מתוך גודל הטעות הצפויה- הערכת מידת המרחק של תוצאות המחקר שלנו מהאמת.
בפרק הזה נדון רק בשלב הראשון- מה קורה באותו עולם דמיוני, ואיך ערך (ממוצע, הפרש ממוצעים, אחוז, הפרש אחוזים) שנמדד במחקרים רבים דמיוניים מקבל ערכים שונים אחד מהשני שניתן להסתכל עליהם כהתפלגות עם ממוצע. התפלגות הדגימה היא ההתפלגות של אותו ערך עבור מחקרים רבים מאוד (אך באותו גודל) באותו עולם דמיוני.
Sampling distribution
Tirzepatide versus Semaglutide Once Weekly in Patients with Type 2 Diabetes
מחקר הוא מדגם. כדי להסיק ממנו מסקנות על העולם דרושים שלושה שלבים: ראשית: הבנה מה היה קורה תיאורטית (על כוכב דמיוני שבו היו מבוצעים מחקרים רבים זהים) למדגמים מרובים באותו גודל, שנית: מתוך אותה הבנה חישוב גודל הטעות הצפויה, ושלישית: מתוך גודל הטעות הצפויה- הערכת מידת המרחק של תוצאות המחקר שלנו מהאמת.
בפרק הזה נדון רק בשלב הראשון- מה קורה באותו עולם דמיוני, ואיך ערך (ממוצע, הפרש ממוצעים, אחוז, הפרש אחוזים) שנמדד במחקרים רבים דמיוניים מקבל ערכים שונים אחד מהשני שניתן להסתכל עליהם כהתפלגות עם ממוצע. התפלגות הדגימה היא ההתפלגות של אותו ערך עבור מחקרים רבים מאוד (אך באותו גודל) באותו עולם דמיוני.
Sampling distribution
Individuality of the plasma sodium concentration
Z-score and Probability Converter
רוב האוכלוסיה (68%) ימצא בטווח בין סטיית תקן אחת נמוך מהממוצע לסטיית תקן אחת גבוה מהממוצע. 2.5% בכל כיוון יהיו רחוקים יותר משתי סטיות תקן מהממוצע, ו 0.15% יהיו רחוקים יותר משלוש סטיות תקן מהממוצע. במצבים בהם מדובר במספר לא שלם של סטיות תקן, אפשר להשתמש במחשבוני טבלת Z לקביעת סבירות באחוזים. חריגות מוגדרת פעמים רבות לפי ערך בסבירות נמוכה סטטיסטית. למשל, היפרנתרמיה מוגדרת כריכוז נתרן מעל 145(ערך הגבוה ביותר משתי סטיות תקן מהממוצע עם סבירות של 2.5% לאדם להיות בערכים אלו).
The empirical rule
Z table
Individuality of the plasma sodium concentration
Z-score and Probability Converter
רוב האוכלוסיה (68%) ימצא בטווח בין סטיית תקן אחת נמוך מהממוצע לסטיית תקן אחת גבוה מהממוצע. 2.5% בכל כיוון יהיו רחוקים יותר משתי סטיות תקן מהממוצע, ו 0.15% יהיו רחוקים יותר משלוש סטיות תקן מהממוצע. במצבים בהם מדובר במספר לא שלם של סטיות תקן, אפשר להשתמש במחשבוני טבלת Z לקביעת סבירות באחוזים. חריגות מוגדרת פעמים רבות לפי ערך בסבירות נמוכה סטטיסטית. למשל, היפרנתרמיה מוגדרת כריכוז נתרן מעל 145(ערך הגבוה ביותר משתי סטיות תקן מהממוצע עם סבירות של 2.5% לאדם להיות בערכים אלו).
The empirical rule
Z table
Individuality of the plasma sodium concentration
The Origins of the Normal Distribution
ההתפלגות הנורמלית מופיעה בטבע או בתוך המנועים והמנגנונים של הסטטיסטיקה והיא בעלת מאפיינים ידועים: סימטרית, יונימודלית, בצורת פעמון, עם רוב המשתתפים קרוב יחסית לממוצע. ניתן בעזרת החוק האמפירי לדעת כמה משתתפים יהיו עם מדידות במרחק סטיית תקן אחת, שתיים או שלוש מהממוצע.
Normal distribution
Empirical rule (68-95-99.7 rule)
Individuality of the plasma sodium concentration
The Origins of the Normal Distribution
ההתפלגות הנורמלית מופיעה בטבע או בתוך המנועים והמנגנונים של הסטטיסטיקה והיא בעלת מאפיינים ידועים: סימטרית, יונימודלית, בצורת פעמון, עם רוב המשתתפים קרוב יחסית לממוצע. ניתן בעזרת החוק האמפירי לדעת כמה משתתפים יהיו עם מדידות במרחק סטיית תקן אחת, שתיים או שלוש מהממוצע.
Normal distribution
Empirical rule (68-95-99.7 rule)
Tirzepatide versus Semaglutide Once Weekly in Patients with Type 2 Diabetes
מחקר רפואי הוא למעשה מדגם, שבא לעזור לנו להבין משהו על האמת שמחוץ למחקר. אך במדגם כזה תמיד תהיה סטייה מקרית מאותה אמת. סטייה זו היא שגיאת הדגימה. במחקר מ 2021 נמצא שטירזפטייד מפחית את רמת ההמוגלובין המסוכרר ב 0.45 יחסית לסמגלוטייד. אך בגלל שגיאת הדגימה, אי אפשר להגיד שהאמת מחוץ למחקר היא שההבדל בין שתי התרופות בהורדת ההמוגלובין המסוכרר הוא 0.45.
מה שבכל זאת אפשרי, הוא הסקה סטטיסטית באחת משתי דרכים. דרך אחת היא לבחון היפותזה כמו "טירזפטייד יעיל יותר מסמגלוטייד בהפחתת רמת ההמוגלובין המסוכרר" ולתת ערך פי לאמירה זו, ודרך שניה היא להגיד היכן נמצאת כנראה האמת שמחוץ למחקר, בעזרת רווח בר סמך, למשל "ההפרש בהפחתת ההמוגלובין המסוכרר הממוצעת הוא כנראה בין 0.32 ל 0.57 ".
שגיאת הדגימה- Sampling error
ערך הפי- p value
רווח בר סמך- confidence interval
המוגלובין מסוכרר- HbA1C
Tirzepatide versus Semaglutide Once Weekly in Patients with Type 2 Diabetes
מחקר רפואי הוא למעשה מדגם, שבא לעזור לנו להבין משהו על האמת שמחוץ למחקר. אך במדגם כזה תמיד תהיה סטייה מקרית מאותה אמת. סטייה זו היא שגיאת הדגימה. במחקר מ 2021 נמצא שטירזפטייד מפחית את רמת ההמוגלובין המסוכרר ב 0.45 יחסית לסמגלוטייד. אך בגלל שגיאת הדגימה, אי אפשר להגיד שהאמת מחוץ למחקר היא שההבדל בין שתי התרופות בהורדת ההמוגלובין המסוכרר הוא 0.45.
מה שבכל זאת אפשרי, הוא הסקה סטטיסטית באחת משתי דרכים. דרך אחת היא לבחון היפותזה כמו "טירזפטייד יעיל יותר מסמגלוטייד בהפחתת רמת ההמוגלובין המסוכרר" ולתת ערך פי לאמירה זו, ודרך שניה היא להגיד היכן נמצאת כנראה האמת שמחוץ למחקר, בעזרת רווח בר סמך, למשל "ההפרש בהפחתת ההמוגלובין המסוכרר הממוצעת הוא כנראה בין 0.32 ל 0.57 ".
שגיאת הדגימה- Sampling error
ערך הפי- p value
רווח בר סמך- confidence interval
המוגלובין מסוכרר- HbA1C
BMI, socioeconomic status, and bone mineral density in U.S. adults: Mediation analysis in the NHANES
מדד פיזור שיעזור לנו בהבנת כלים רבים בסטטיסטיקה הוא סטיית התקן- שמייצגת עד כמה המשתתפים במחקר מפוזרים רחוק מהממוצע (עבור ערך מסויים). למשל, כל משתתפת במחקר על צפיפות עצם רחוקה מרחק מסויים מצפיפות העצם הממוצעת. ממוצע המרחקים עבור כל משתתפות המחקר הוא סטיית התקן. זו הדרך הפשטנית להבנה, למרות שמבחינה מתמטית, חישוב ממוצע זה כולל בתוכו גם ריבוע ושורש.
בהבט קליני ולא רק מחקרי, סטיית התקן היא גם קנה מידה: מידת החריגות של מטופל נמדדת בעזרת המרחק מהממוצע בסטיות תקן. לדוגמה, מדד ה Z עבור צפיפות עצם ניתן לתרגום כזה: כמה סטיות תקן רחוקה צפיפות העצם של מטופלת מצפיפות העצם הממוצעת לגילה.
סטיית תקן- standard deviation
BMI, socioeconomic status, and bone mineral density in U.S. adults: Mediation analysis in the NHANES
מדד פיזור שיעזור לנו בהבנת כלים רבים בסטטיסטיקה הוא סטיית התקן- שמייצגת עד כמה המשתתפים במחקר מפוזרים רחוק מהממוצע (עבור ערך מסויים). למשל, כל משתתפת במחקר על צפיפות עצם רחוקה מרחק מסויים מצפיפות העצם הממוצעת. ממוצע המרחקים עבור כל משתתפות המחקר הוא סטיית התקן. זו הדרך הפשטנית להבנה, למרות שמבחינה מתמטית, חישוב ממוצע זה כולל בתוכו גם ריבוע ושורש.
בהבט קליני ולא רק מחקרי, סטיית התקן היא גם קנה מידה: מידת החריגות של מטופל נמדדת בעזרת המרחק מהממוצע בסטיות תקן. לדוגמה, מדד ה Z עבור צפיפות עצם ניתן לתרגום כזה: כמה סטיות תקן רחוקה צפיפות העצם של מטופלת מצפיפות העצם הממוצעת לגילה.
סטיית תקן- standard deviation
Key Statistics for Acute Lymphocytic Leukemia (ALL)
המלצות ממוגרפיה בקרולינה- אוניברסיטת NC.
Age distributions of breast cancer diagnosis and mortality by race and ethnicity in US women
Understanding and Interpreting Serum Protein Electrophoresis
Bimodal/multimodal distribution
כאשר באותו מדגם יש שתי קבוצות שונות מהותית אחת מהשנייה, או שעבור אותו משתנה נמדדות שתי תופעות שונות, נקבל התפלגויות עם יותר משיא אחד.
Key Statistics for Acute Lymphocytic Leukemia (ALL)
המלצות ממוגרפיה בקרולינה- אוניברסיטת NC.
Age distributions of breast cancer diagnosis and mortality by race and ethnicity in US women
Understanding and Interpreting Serum Protein Electrophoresis
Bimodal/multimodal distribution
כאשר באותו מדגם יש שתי קבוצות שונות מהותית אחת מהשנייה, או שעבור אותו משתנה נמדדות שתי תופעות שונות, נקבל התפלגויות עם יותר משיא אחד.
Individuality of the plasma sodium concentration
Lower risk of subarachnoid haemorrhage in diabetes: a nationwide population-based cohort study
Distributions: symmetric, skewed to the right, skewed to the left
התפלגות עם שיא אחד נקראת יונימודלית. שלוש התפלגויות כאלו שכיחות מאוד ברפואה. בהתפלגות סימטרית הממוצע והחציון זהים לשיא, בהתפלגות מוטה ימינה, החציון גבוה מהשיא, והממוצע גבוה מהחציון, ובהתפלגות מוטה שמאלה-בדיוק תמונת המראה: החציון נמוך מהשיא, והממוצע נמוך מהחציון.
Individuality of the plasma sodium concentration
Lower risk of subarachnoid haemorrhage in diabetes: a nationwide population-based cohort study
Distributions: symmetric, skewed to the right, skewed to the left
התפלגות עם שיא אחד נקראת יונימודלית. שלוש התפלגויות כאלו שכיחות מאוד ברפואה. בהתפלגות סימטרית הממוצע והחציון זהים לשיא, בהתפלגות מוטה ימינה, החציון גבוה מהשיא, והממוצע גבוה מהחציון, ובהתפלגות מוטה שמאלה-בדיוק תמונת המראה: החציון נמוך מהשיא, והממוצע נמוך מהחציון.
Lung-Function Trajectories Leading to Chronic Obstructive Pulmonary Disease
דרך ויזואלית נוחה מאוד להבין מהו פיזור הערכים אצל משתתפים במחקר היא היסטוגרמה. כמו בפרק הקודם, גם כאן הקבוצה מחולקת לקבוצות שאינן שוות, לפי טווח ערכים עבור כל קבוצה, אלא שבהיסטוגרמה המרווחים של טווחי הערכים שווים. היסטוגרמה היא ייצוג ישיר של ההתפלגות- ההסתברויות השונות לקבל ערכים בטווחים שונים.
Lung-Function Trajectories Leading to Chronic Obstructive Pulmonary Disease
דרך ויזואלית נוחה מאוד להבין מהו פיזור הערכים אצל משתתפים במחקר היא היסטוגרמה. כמו בפרק הקודם, גם כאן הקבוצה מחולקת לקבוצות שאינן שוות, לפי טווח ערכים עבור כל קבוצה, אלא שבהיסטוגרמה המרווחים של טווחי הערכים שווים. היסטוגרמה היא ייצוג ישיר של ההתפלגות- ההסתברויות השונות לקבל ערכים בטווחים שונים.
Apixaban for Stroke Prevention in Subclinical Atrial Fibrillation
כדי לתאר קבוצה ופיזור ערכים בקבוצה אפשר לבצע חלוקה לפי הערכים שמעניינים אותנו, כאשר בכל קבוצה יכללו אנשים הנמצאים בטווח ערכים מסויים. בצורה זו הדבר הקבוע מראש הוא טווח הערכים, והתוצאה המתקבלת היא שיעור המשתתפים הנמצאים בטווח זה מתוך כלל המשתתפים. זאת לעומת חלוקה לרבעונים, שם שיעור האנשים מכלל הקבוצה קבוע מראש (רבע), והתוצאה המתקבלת היא הערכים המבדילים בין הקבוצות.
נדבר על המושגים הניתנים לעתים להחלפה שיעור, אחוז, או ריסק (risk), עבורם החישוב הוא חלוקה פשוטה: כמות אנשים עם מאפיין מסויים או תוצא מסויים, חלקי כמות האנשים בכל הקבוצה.
Apixaban for Stroke Prevention in Subclinical Atrial Fibrillation
כדי לתאר קבוצה ופיזור ערכים בקבוצה אפשר לבצע חלוקה לפי הערכים שמעניינים אותנו, כאשר בכל קבוצה יכללו אנשים הנמצאים בטווח ערכים מסויים. בצורה זו הדבר הקבוע מראש הוא טווח הערכים, והתוצאה המתקבלת היא שיעור המשתתפים הנמצאים בטווח זה מתוך כלל המשתתפים. זאת לעומת חלוקה לרבעונים, שם שיעור האנשים מכלל הקבוצה קבוע מראש (רבע), והתוצאה המתקבלת היא הערכים המבדילים בין הקבוצות.
נדבר על המושגים הניתנים לעתים להחלפה שיעור, אחוז, או ריסק (risk), עבורם החישוב הוא חלוקה פשוטה: כמות אנשים עם מאפיין מסויים או תוצא מסויים, חלקי כמות האנשים בכל הקבוצה.
Pitavastatin to Prevent Cardiovascular Disease in HIV Infection
Interquartile range
בנוסף לחלוקה לשני חצאים בעזרת החציון, ניתן לחלק משתתפי מחקר גם לחלקים שווים אחרים, בעזרת עשירונים, אחוזונים או רבעונים. מדד פיזור מקובל מאוד לליווי החציון הוא הטווח הבין רבעוני- הטווח בין הרבעון הראשון לשלישי, במלים אחרות שני הרבעים המרכזיים של המשתתפים במחקר.
Pitavastatin to Prevent Cardiovascular Disease in HIV Infection
Interquartile range
בנוסף לחלוקה לשני חצאים בעזרת החציון, ניתן לחלק משתתפי מחקר גם לחלקים שווים אחרים, בעזרת עשירונים, אחוזונים או רבעונים. מדד פיזור מקובל מאוד לליווי החציון הוא הטווח הבין רבעוני- הטווח בין הרבעון הראשון לשלישי, במלים אחרות שני הרבעים המרכזיים של המשתתפים במחקר.
Median
חציון, הוא מדד מרכז נוסף. בניגוד לממוצע אינו מושפע מהערכים הקיצוניים. כמו הממוצע גם אותו ניתן לחשב רק עבור משתנה כמותי, וגם הוא לא נותן לנו מידע לגבי הפיזור.
Median
חציון, הוא מדד מרכז נוסף. בניגוד לממוצע אינו מושפע מהערכים הקיצוניים. כמו הממוצע גם אותו ניתן לחשב רק עבור משתנה כמותי, וגם הוא לא נותן לנו מידע לגבי הפיזור.
AREDS2 Supplementation in Patients with Wet Age-Related Macular Degeneration
mean
ממוצע, מדד מרכז העוזר לתמצת מידע. משמש לתיאור אוכלוסיה, לתיאור תוצאות ובנוסחאות להסקת מסקנות. ניתן לחשבו רק עבור משתנה כמותי/מספרי. חסרונותיו העיקריים- לא מתאר פיזור, ומושפע מערכי קיצון.
AREDS2 Supplementation in Patients with Wet Age-Related Macular Degeneration
mean
ממוצע, מדד מרכז העוזר לתמצת מידע. משמש לתיאור אוכלוסיה, לתיאור תוצאות ובנוסחאות להסקת מסקנות. ניתן לחשבו רק עבור משתנה כמותי/מספרי. חסרונותיו העיקריים- לא מתאר פיזור, ומושפע מערכי קיצון.
Hypermobility spectrum disorders and active migraine in Israeli adolescents: A nationwide study
המאמר פורסם ביולי 2023. ד"ר יאיר זלוף נפל ב 10 לאוקטובר 2023.
רשימת מאמרים נוספים שפרסם יאיר, מתוך PubMed
Hypermobility spectrum disorders and active migraine in Israeli adolescents: A nationwide study
המאמר פורסם ביולי 2023. ד"ר יאיר זלוף נפל ב 10 לאוקטובר 2023.
רשימת מאמרים נוספים שפרסם יאיר, מתוך PubMed
הדרכה מוקלטת- הרפיית שרירים ודמיון מודרך, להפחתת סטרס וחרדה.
פרק מיוחד לשימוש מיידי. משך התרגול- עשר דקות. זהירות- לא להפעלה בזמן נהיגה.
---
נאמנות מסוימת לפודקאסט ותכניו מחייבת בכל זאת לצרף קישור למטא אנליזה שעסקה בטכניקות דומות כטיפול בחרדה:
Relaxation training for anxiety: a ten-years systematic review with meta-analysis
ולצרף גם הדרכה פורמלית בטכניקת הרפיית שרירים הדרגתית:
Progressive Muscle Relaxation and Progressive Relaxation
הדרכה מוקלטת- הרפיית שרירים ודמיון מודרך, להפחתת סטרס וחרדה.
פרק מיוחד לשימוש מיידי. משך התרגול- עשר דקות. זהירות- לא להפעלה בזמן נהיגה.
---
נאמנות מסוימת לפודקאסט ותכניו מחייבת בכל זאת לצרף קישור למטא אנליזה שעסקה בטכניקות דומות כטיפול בחרדה:
Relaxation training for anxiety: a ten-years systematic review with meta-analysis
ולצרף גם הדרכה פורמלית בטכניקת הרפיית שרירים הדרגתית:
Progressive Muscle Relaxation and Progressive Relaxation
מחקרי מטרייה לוקחים תחת חסותם הרבה מטופלים עם אותה מחלה ומחלקים אותם להרבה זרועות מחקר קטנות, כאשר בכל זרוע מתבצע מחקר נפרד על תרופה אחרת.
החלוקה במחקרי מטרייה בסרטן יכולה להתבצע לפי השינוי הגנומי של הסרטן אצל אותו אדם, כאשר במקרה של אדם עם סרטן הנושא שינוי מסויים, לדוגמה RET fusion, המטופל ישתייך לזרוע מהמחקר שבודקת יעילות של תרופה המיועדת בדיוק לאותו שינוי.
מחקר ה lung map הוא דוגמה למחקר מטרייה כזה, שמתבצע ממש כעת במרכזים מרובים ביותר, מגייס מטופלים עם סרטן ריאה מסוג NSCLC מתקדם, מבצע עבורם בדיקה גנומית של תאי הסרטן, ומשייך אותם לזרועות שונות של המחקר, בהתאם לשינוי הגנומי
---
סכמה של מחקר ה lung map ופירוט המחקרים השונים בתוכו נכון ל 2023
Testing the Use of Targeted Treatment for RET Positive Advanced Non-small Cell Lung Cancer
מחקר על Selpercatinib מתוך ה lung map
סקירות שיטתיות על אחוז התגובה בסרטן במחקרי סל או מטריה :
Risk and benefit for umbrella trials in oncology: a systematic review and meta-analysis
מחקרי מטרייה לוקחים תחת חסותם הרבה מטופלים עם אותה מחלה ומחלקים אותם להרבה זרועות מחקר קטנות, כאשר בכל זרוע מתבצע מחקר נפרד על תרופה אחרת.
החלוקה במחקרי מטרייה בסרטן יכולה להתבצע לפי השינוי הגנומי של הסרטן אצל אותו אדם, כאשר במקרה של אדם עם סרטן הנושא שינוי מסויים, לדוגמה RET fusion, המטופל ישתייך לזרוע מהמחקר שבודקת יעילות של תרופה המיועדת בדיוק לאותו שינוי.
מחקר ה lung map הוא דוגמה למחקר מטרייה כזה, שמתבצע ממש כעת במרכזים מרובים ביותר, מגייס מטופלים עם סרטן ריאה מסוג NSCLC מתקדם, מבצע עבורם בדיקה גנומית של תאי הסרטן, ומשייך אותם לזרועות שונות של המחקר, בהתאם לשינוי הגנומי
---
סכמה של מחקר ה lung map ופירוט המחקרים השונים בתוכו נכון ל 2023
Testing the Use of Targeted Treatment for RET Positive Advanced Non-small Cell Lung Cancer
מחקר על Selpercatinib מתוך ה lung map
סקירות שיטתיות על אחוז התגובה בסרטן במחקרי סל או מטריה :
Risk and benefit for umbrella trials in oncology: a systematic review and meta-analysis
הפעם- על מחקרי סל
Basket trials
Selpercatinib הוא מעכב של חלבון ספציפי בסוגי סרטן שונים. הוא נבדק במחקר מסוג כזה. במחקר סל בחירת המטופלים אינה לפי "המחלה" במובן המסורתי שלה, אלא במובן המולקולרי, ומטופלים עם מחלות שונות- למשל גידולים באברים שונים, נכללים באותו סל כיוון שהסרטן שלהם נושא אותו שינוי גנומי.
---
שני מחקרי משנה מתוך מחקר ה libretto 001 – מחקר סל על RET FUSION.
Efficacy of Selpercatinib in RET Fusion–Positive Non–Small-Cell Lung Cancer
קריטריונים להגדרת תגובה לטיפול בסרטן
Response evaluation criteria in solid tumors
נסיון לייצר "זרוע בקרה" עבור מחקר ה libretto, מתוך נתונים שמחוץ לאותו מחקר.
הפעם- על מחקרי סל
Basket trials
Selpercatinib הוא מעכב של חלבון ספציפי בסוגי סרטן שונים. הוא נבדק במחקר מסוג כזה. במחקר סל בחירת המטופלים אינה לפי "המחלה" במובן המסורתי שלה, אלא במובן המולקולרי, ומטופלים עם מחלות שונות- למשל גידולים באברים שונים, נכללים באותו סל כיוון שהסרטן שלהם נושא אותו שינוי גנומי.
---
שני מחקרי משנה מתוך מחקר ה libretto 001 – מחקר סל על RET FUSION.
Efficacy of Selpercatinib in RET Fusion–Positive Non–Small-Cell Lung Cancer
קריטריונים להגדרת תגובה לטיפול בסרטן
Response evaluation criteria in solid tumors
נסיון לייצר "זרוע בקרה" עבור מחקר ה libretto, מתוך נתונים שמחוץ לאותו מחקר.
פרק ראשון מתוך שלושה העוסקים ברפואה מותאמת אישית ובדור חדש של מחקרים קליניים: מחקרי סל ומחקרי מטרייה.
נספר על מנגנונים מולקולריים שעומדים בבסיס הופעת ושגשוג סרטן, ומאפשרים טיפול מוכוון מטרה.
כדוגמה ספציפית נספר על ה RET-Fusion.
---
The next generation of evidence-based medicine
RET Fusion-Positive Non-small Cell Lung Cancer: The Evolving Treatment Landscape
פרק ראשון מתוך שלושה העוסקים ברפואה מותאמת אישית ובדור חדש של מחקרים קליניים: מחקרי סל ומחקרי מטרייה.
נספר על מנגנונים מולקולריים שעומדים בבסיס הופעת ושגשוג סרטן, ומאפשרים טיפול מוכוון מטרה.
כדוגמה ספציפית נספר על ה RET-Fusion.
---
The next generation of evidence-based medicine
RET Fusion-Positive Non-small Cell Lung Cancer: The Evolving Treatment Landscape
האם הוספה של פירקוסיקאם ("ברקסין") ל"גלולת היום שאחרי" תפחית את הסיכוי להריון?
מחקר מבוקר אקראי שפורסם בלאנסט בספטמבר 2023 גילה ממצאים מרשימים, אך יש מספר בעיות במאמר שנדון עליהן בפרק.
---
המאמר העקרי:
מחקר מבוקר אקראי- יעילות לבונורגסטרל נמוכה לעומת אוליפריסטל אצטט.
המודל של טראסל לחישוב סיכוי לכניסה להריון לפי היום במחזור החודשי, 2003 (כמובן הסיכוי תלוי בגורמים רבים נוספים)
Estimating the effectiveness of emergency contraceptive pills
מאמר "לבריאותה" : אמצעי מניעת הריון לשעת חירום
האם הוספה של פירקוסיקאם ("ברקסין") ל"גלולת היום שאחרי" תפחית את הסיכוי להריון?
מחקר מבוקר אקראי שפורסם בלאנסט בספטמבר 2023 גילה ממצאים מרשימים, אך יש מספר בעיות במאמר שנדון עליהן בפרק.
---
המאמר העקרי:
מחקר מבוקר אקראי- יעילות לבונורגסטרל נמוכה לעומת אוליפריסטל אצטט.
המודל של טראסל לחישוב סיכוי לכניסה להריון לפי היום במחזור החודשי, 2003 (כמובן הסיכוי תלוי בגורמים רבים נוספים)
Estimating the effectiveness of emergency contraceptive pills
מאמר "לבריאותה" : אמצעי מניעת הריון לשעת חירום
האם מתן חיסון הקורונה לאחר חשיפה (ולאחר הדבקה) יכול למנוע תמותה מהמחלה? מאמר תצפיתי בדק נתונים מהתקופה בה ניתנו חיסוני הקורונה הראשונים בישראל והממצאים מרשימים.
---
המאמר שנותח בפרק:
Postexposure-vaccine-prophylaxis against COVID-19
j med virology 2022
מאמר דעה lancet reg health Europe - מאי 2021:
Can integrated post-exposure vaccination against SARS-COV2 mitigate severe disease?
המלצות ה NIH וה IDSA העדכניות למניעה וטיפול בקוביד 19 לזמן פרסום הפרק וספציפית לגבי טיפול לאחר חשיפה
האם מתן חיסון הקורונה לאחר חשיפה (ולאחר הדבקה) יכול למנוע תמותה מהמחלה? מאמר תצפיתי בדק נתונים מהתקופה בה ניתנו חיסוני הקורונה הראשונים בישראל והממצאים מרשימים.
---
המאמר שנותח בפרק:
Postexposure-vaccine-prophylaxis against COVID-19
j med virology 2022
מאמר דעה lancet reg health Europe - מאי 2021:
Can integrated post-exposure vaccination against SARS-COV2 mitigate severe disease?
המלצות ה NIH וה IDSA העדכניות למניעה וטיפול בקוביד 19 לזמן פרסום הפרק וספציפית לגבי טיפול לאחר חשיפה
על תוצא מורכב- composite outcome
ועל דרכים בעייתיות להשתמש בו.
---
Empagliflozin in Heart Failure with a Preserved Ejection Fraction
הכתבה הרפואית מהעיתון היומי הישראלי שתיארה את המחקר
על תוצא מורכב- composite outcome
ועל דרכים בעייתיות להשתמש בו.
---
Empagliflozin in Heart Failure with a Preserved Ejection Fraction
הכתבה הרפואית מהעיתון היומי הישראלי שתיארה את המחקר
האם סין הסתירה מידע על תמותה עודפת מקוביד 19 לאחר הסרת מגבלות חמורות בסין בסוף 2022?
מאמר שפורסם בסוף אוגוסט 2023 משתמש במספר מודלים מתמטיים כדי להעריך מה הייתה התמותה העודפת בסין בחודשים דצמבר 22-ינואר 23, מיד לאחר הסרת מדיניות "אפס הדבקה בקורונה".
המאמר חישב ומצא שמדובר בכ- 1.9 מיליון מקרי תמותה עודפת בחודשיים אלו. בפרק נספר על השיטה הסטטיסטית והמודלים בהם השתמשו במאמר, נמצא מה יכול להיות מוטעה במודלים אלו, ונזכיר מקרה אחר של הסתרת מידע על ידי הממסד הרפואי בסין.
---
המאמר שנותח בפרק
https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2808734
Excess All-Cause Mortality in China After Ending the Zero COVID Policy
https://www.youtube.com/watch?v=Ae4OMt0_MpU
Interrupted Time-Series Designs
הסבר וידאו על שיטת מחקר תצפיתית זו
https://academic.oup.com/ije/article/46/1/348/2622842?login=false
Interrupted time series regression for the evaluation of public health interventions: a tutorial
הסבר במאמר על שיטת המחקר
השתלות אברים בסין והסתרת מידע
https://bmjopen.bmj.com/content/9/2/e024473
Compliance with ethical standards in the reporting of donor sources and ethics review in peer-reviewed publications involving organ transplantation in China: a scoping review
האם סין הסתירה מידע על תמותה עודפת מקוביד 19 לאחר הסרת מגבלות חמורות בסין בסוף 2022?
מאמר שפורסם בסוף אוגוסט 2023 משתמש במספר מודלים מתמטיים כדי להעריך מה הייתה התמותה העודפת בסין בחודשים דצמבר 22-ינואר 23, מיד לאחר הסרת מדיניות "אפס הדבקה בקורונה".
המאמר חישב ומצא שמדובר בכ- 1.9 מיליון מקרי תמותה עודפת בחודשיים אלו. בפרק נספר על השיטה הסטטיסטית והמודלים בהם השתמשו במאמר, נמצא מה יכול להיות מוטעה במודלים אלו, ונזכיר מקרה אחר של הסתרת מידע על ידי הממסד הרפואי בסין.
---
המאמר שנותח בפרק
https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2808734
Excess All-Cause Mortality in China After Ending the Zero COVID Policy
https://www.youtube.com/watch?v=Ae4OMt0_MpU
Interrupted Time-Series Designs
הסבר וידאו על שיטת מחקר תצפיתית זו
https://academic.oup.com/ije/article/46/1/348/2622842?login=false
Interrupted time series regression for the evaluation of public health interventions: a tutorial
הסבר במאמר על שיטת המחקר
השתלות אברים בסין והסתרת מידע
https://bmjopen.bmj.com/content/9/2/e024473
Compliance with ethical standards in the reporting of donor sources and ethics review in peer-reviewed publications involving organ transplantation in China: a scoping review
במחקרים על טיפול בסרטן מתקדם, תוצא נפוץ ביותר הוא שרידות ללא חזרת המחלה-
Progression free survival.
האם תוצא זה אכן ראוי לשמש שתחזית עבור תוצאים החשובים יותר למטופלת, כמו שרידות בכלל?
נציג תוצאים שונים הנמדדים במחקרים על סרטן, ומחקרים שונים שבדקו את הקשר בין שרידות ללא חזרה לבין שרידות כללית.
Progression free survival Vs. Overall survival
---
Disease-Free Survival As a Clinical Trial Endpoint: Does It Matter, and to Whom?
במחקרים על טיפול בסרטן מתקדם, תוצא נפוץ ביותר הוא שרידות ללא חזרת המחלה-
Progression free survival.
האם תוצא זה אכן ראוי לשמש שתחזית עבור תוצאים החשובים יותר למטופלת, כמו שרידות בכלל?
נציג תוצאים שונים הנמדדים במחקרים על סרטן, ומחקרים שונים שבדקו את הקשר בין שרידות ללא חזרה לבין שרידות כללית.
Progression free survival Vs. Overall survival
---
Disease-Free Survival As a Clinical Trial Endpoint: Does It Matter, and to Whom?
טיפול הן לפני והן אחרי ניתוח לסרטן הריאה בפמברוליזומאב הפחית משמעותית סיכוי להתקדמות או חזרת מחלה. נדבר על מעכבי מנגנון הבקרה, על תוצאים נמדדים במחקר על סרטן, ועל חישוב ה NNT.
---
Perioperative Pembrolizumab for Early-Stage Non–Small-Cell Lung Cancer
https://www.nejm.org/doi/full/10.1056/NEJMoa2302983?query=featured_home
טיפול הן לפני והן אחרי ניתוח לסרטן הריאה בפמברוליזומאב הפחית משמעותית סיכוי להתקדמות או חזרת מחלה. נדבר על מעכבי מנגנון הבקרה, על תוצאים נמדדים במחקר על סרטן, ועל חישוב ה NNT.
---
Perioperative Pembrolizumab for Early-Stage Non–Small-Cell Lung Cancer
https://www.nejm.org/doi/full/10.1056/NEJMoa2302983?query=featured_home
תרופות ביוסימילריות הן העתקה של תרופות ביולוגיות. בניגוד לתרופות גנריות, שהן העתק מדויק של מולקולה קטנה עם כל קשריה,
כאן מדובר בחומר ביולוגי, מולקולה גדולה ומורכבת, שלא צפויה להיות זהה לחלוטין, ולכן נדרוש הוכחה שמבחינה ביולוגית, ואף קלינית, השפעתה דומה מאוד לתרופה המקורית.
כדוגמה נדבר על תרופות ביוסימילריות נוגדות קרישה, אחת מהן הזכרנו כבר בפרק הקודם על הריון במצב של קרישיות יתר גנטית, והשנייה נוגדת דלקת.
---
תהליך ה- EMA (הרשות האירופית לתרופות) לאישור תרופות ביוסימילריות.
Idacio
Inhixa
Cristalia
על תהליך ייצור ההפרין:
From Farm to Pharma: An Overview of Industrial Heparin Manufacturing Methods
תרופות ביוסימילריות הן העתקה של תרופות ביולוגיות. בניגוד לתרופות גנריות, שהן העתק מדויק של מולקולה קטנה עם כל קשריה,
כאן מדובר בחומר ביולוגי, מולקולה גדולה ומורכבת, שלא צפויה להיות זהה לחלוטין, ולכן נדרוש הוכחה שמבחינה ביולוגית, ואף קלינית, השפעתה דומה מאוד לתרופה המקורית.
כדוגמה נדבר על תרופות ביוסימילריות נוגדות קרישה, אחת מהן הזכרנו כבר בפרק הקודם על הריון במצב של קרישיות יתר גנטית, והשנייה נוגדת דלקת.
---
תהליך ה- EMA (הרשות האירופית לתרופות) לאישור תרופות ביוסימילריות.
Idacio
Inhixa
Cristalia
על תהליך ייצור ההפרין:
From Farm to Pharma: An Overview of Industrial Heparin Manufacturing Methods
מחקר חשוב שפורסם ביולי 23 גייס נשים עם אבדן הריון חוזר ונטייה גנטית לקרישיות יתר, ובדק האם מתן נוגדי קרישה מפחית את הסיכוי לאבדן הריון נוסף.
---
תודה רבה לד"ר מתן אלעמי סוזין שהעיר על טיוטת הפרק.
מחקר ה ALIFE2, Lancet 7-2023
מטא אנליזה מ 2004- קשר בין תרומבופיליות מולדות ואבדן הריון
קווים מנחים בריטיים מ 2011
קווים מנחים בריטיים מ 2023, חודש לפני פרסום המאמר
מחקר חשוב שפורסם ביולי 23 גייס נשים עם אבדן הריון חוזר ונטייה גנטית לקרישיות יתר, ובדק האם מתן נוגדי קרישה מפחית את הסיכוי לאבדן הריון נוסף.
---
תודה רבה לד"ר מתן אלעמי סוזין שהעיר על טיוטת הפרק.
מחקר ה ALIFE2, Lancet 7-2023
מטא אנליזה מ 2004- קשר בין תרומבופיליות מולדות ואבדן הריון
קווים מנחים בריטיים מ 2011
קווים מנחים בריטיים מ 2023, חודש לפני פרסום המאמר
בסתיו 2020 התפרסם מחקר שבו קולכיצין, תרופה נוגדת דלקת ותיקה, ניתנה לאנשים עם מחלת לב איסכמית יציבה והראתה תועלת בהפחתת אירועים עתידיים.
נדבר על בעיות במחקר זה, נציג מחקר תצפיתי שהראה רמז לתועלת של כולכיצין כמניעה ראשונית, ונזכיר מחקרים שבדקו תרופות נוגדות דלקת אחרות למניעת אירועים לבביים
---
Colchicine in Patients with Chronic Coronary Disease
Efficacy and Safety of Low-Dose Colchicine after Myocardial Infarction
Antiinflammatory Therapy with Canakinumab for Atherosclerotic Disease
Low-Dose Methotrexate for the Prevention of Atherosclerotic Events
Colchicine Use and Incident Coronary Artery Disease in Male Patients With Gout
Allopurinol use and the risk of acute cardiovascular events in patients with gout and diabetes
בסתיו 2020 התפרסם מחקר שבו קולכיצין, תרופה נוגדת דלקת ותיקה, ניתנה לאנשים עם מחלת לב איסכמית יציבה והראתה תועלת בהפחתת אירועים עתידיים.
נדבר על בעיות במחקר זה, נציג מחקר תצפיתי שהראה רמז לתועלת של כולכיצין כמניעה ראשונית, ונזכיר מחקרים שבדקו תרופות נוגדות דלקת אחרות למניעת אירועים לבביים
---
Colchicine in Patients with Chronic Coronary Disease
Efficacy and Safety of Low-Dose Colchicine after Myocardial Infarction
Antiinflammatory Therapy with Canakinumab for Atherosclerotic Disease
Low-Dose Methotrexate for the Prevention of Atherosclerotic Events
Colchicine Use and Incident Coronary Artery Disease in Male Patients With Gout
Allopurinol use and the risk of acute cardiovascular events in patients with gout and diabetes
בפרק זה נסכם את ארבעת הפרקים הקודמים שעסקו בתופעת צבירת המשקל המחודשת.
דיון על צורך בירידה במשקל צריך להתבצע רק לעתים ותוך שיקול דעת משמעותי ביותר. צבירה מחדש של משקל היא תופעה ברורה ומוכחת היטב לאחר ניסיונות מוצלחים לרדת במשקל. לתופעה הזו יש הסברים ביולוגיים, פסיכולוגיים וחברתיים. יש טענות לנזקים לטווח ארוך של תופעת הירידה-עליה מחדש שקראנו לה "יו-יו", אך העדויות המחקריות לנזקים אלו, בעיני- חלשות: מדובר במחקרים תצפיתיים עם סיכון גבוה להטיות, וסבירות גבוהה שישנם ערפלנים שגורמים הן לניסיונות חוזרים לרדת במשקל והן לנזקים בעתיד. אך אם נחזור להקשר, במקרים בהם יש מטרה בריאותית לרדת במשקל, כמובן שהעלייה מחדש אינה רצויה, ולכן ניסיונות לרדת במשקל צריכים לכלול שינויים קבועים ותמיכה קבועה.
---
מס הסוכר מיותר? בעולם הוא מציל חיים (מתוך "כלכליסט")
בפרק זה נסכם את ארבעת הפרקים הקודמים שעסקו בתופעת צבירת המשקל המחודשת.
דיון על צורך בירידה במשקל צריך להתבצע רק לעתים ותוך שיקול דעת משמעותי ביותר. צבירה מחדש של משקל היא תופעה ברורה ומוכחת היטב לאחר ניסיונות מוצלחים לרדת במשקל. לתופעה הזו יש הסברים ביולוגיים, פסיכולוגיים וחברתיים. יש טענות לנזקים לטווח ארוך של תופעת הירידה-עליה מחדש שקראנו לה "יו-יו", אך העדויות המחקריות לנזקים אלו, בעיני- חלשות: מדובר במחקרים תצפיתיים עם סיכון גבוה להטיות, וסבירות גבוהה שישנם ערפלנים שגורמים הן לניסיונות חוזרים לרדת במשקל והן לנזקים בעתיד. אך אם נחזור להקשר, במקרים בהם יש מטרה בריאותית לרדת במשקל, כמובן שהעלייה מחדש אינה רצויה, ולכן ניסיונות לרדת במשקל צריכים לכלול שינויים קבועים ותמיכה קבועה.
---
מס הסוכר מיותר? בעולם הוא מציל חיים (מתוך "כלכליסט")
ירידה ועליה מחדש במשקל עלולים תיאורטית לחזק את מנגנוני הפיצוי ולגרום לנזקים בהמשך. יש מחקרים תצפיתיים בבני אדם שהדגימו אכן נזקים אלו, אך האם להאמין להם? האם מדובר בראיות חזקות? יש קורלציה חזקה מאוד בין משקל יתר בבסיס לבין תופעת היו-יו, וכנראה גם בין גורמים נוספים למשקל יתר לבין תופעת היו-יו, ולכן אי אפשר להסיק סיבתיות.
---
Weight Cycling and the Risk of Developing Type 2 Diabetes among Adult Women in the United States
Body-Weight Fluctuations and Outcomes in Coronary Disease
ירידה ועליה מחדש במשקל עלולים תיאורטית לחזק את מנגנוני הפיצוי ולגרום לנזקים בהמשך. יש מחקרים תצפיתיים בבני אדם שהדגימו אכן נזקים אלו, אך האם להאמין להם? האם מדובר בראיות חזקות? יש קורלציה חזקה מאוד בין משקל יתר בבסיס לבין תופעת היו-יו, וכנראה גם בין גורמים נוספים למשקל יתר לבין תופעת היו-יו, ולכן אי אפשר להסיק סיבתיות.
---
Weight Cycling and the Risk of Developing Type 2 Diabetes among Adult Women in the United States
Body-Weight Fluctuations and Outcomes in Coronary Disease
כמה מהמשקל שירדנו נעלה מחדש? מטא אנליזה של מחקרים מבוקרים אקראיים ומתוכה מחקר אחד שנתעמק בו מדגימים מה קנה המידה של צבירת המשקל מחדש שלוש שנים לאחר התערבות תזונתית.
---
The effect of rate of weight loss on long-term weight management: a randomised controlled trial
כמה מהמשקל שירדנו נעלה מחדש? מטא אנליזה של מחקרים מבוקרים אקראיים ומתוכה מחקר אחד שנתעמק בו מדגימים מה קנה המידה של צבירת המשקל מחדש שלוש שנים לאחר התערבות תזונתית.
---
The effect of rate of weight loss on long-term weight management: a randomised controlled trial
האם דיאטה, בגלל אותם מנגנוני פיצוי שדברנו עליהם בפרק הקודם, תגרום בטווח רחוק דווקא לצבירת משקל? נדבר על סיבות לפקפק בתצפיות ובמחקרים שמדגימים תופעה זו.
---
האם דיאטה, בגלל אותם מנגנוני פיצוי שדברנו עליהם בפרק הקודם, תגרום בטווח רחוק דווקא לצבירת משקל? נדבר על סיבות לפקפק בתצפיות ובמחקרים שמדגימים תופעה זו.
---
פרק ראשון בסדרה על צבירת משקל מחדש. נדבר על מנגנונים ביולוגיים, פסיכולוגיים וסוציאליים שגורמים לעליה מחדש במשקל לאחר ירידת משקל
---
European Journal of Internal Medicine 2021
Non-exercise activity thermogenesis (NEAT): a component of total daily energy expenditure
פרק ראשון בסדרה על צבירת משקל מחדש. נדבר על מנגנונים ביולוגיים, פסיכולוגיים וסוציאליים שגורמים לעליה מחדש במשקל לאחר ירידת משקל
---
European Journal of Internal Medicine 2021
Non-exercise activity thermogenesis (NEAT): a component of total daily energy expenditure
הפרק נועד למעבר מהיר על מושגים הקשורים לאבחנה ולטיפול בהקשר של אפידמיולוגיה ורפואה נתמכת ראיות. אין כאן חזרה מלאה על החומר אלא תזכורת חלקית.
החלק הראשון על תחלואה ואבחנה, והשני על טיפול ועל סוגי מחקרים בשאלה על טיפול/ נזק.
בחלק הראשון יוזכרו המושגים:
שכיחות prevalence
היארעות incidence
רגישות sensitivity
ספציפיות, סגוליות specificity
ערך מנבא חיובי, ערך מנבא שלילי (positive predictive value, negative predictive value)
pre test probability, post test probability
likelihood ratio
ROC curve
/
בחלק השני-
דרכים שונות למדוד תוצאות במחקר על טיפול: קצב היארעות (rate), שוני בערך מספרי, risk
absolute risk reduction
relative risk
relative risk reduction
number needed to treat
confidence interval
randomized controlled trial
cohort (comparative)
case-control study
cross sectional study
meta analysis
הפרק לא יכול להקיף את כל החומר בתחום זה לבחינת שלב א' ברפואת המשפחה- למי שיש זמן, בפודקאסט פרקים אחרים שיכולים להיות לעזר, בעקר הפרק "אין לתאר במלים" על סטטיסטיקה תיאורית, והפרקים העוסקים בתקפות ובניתוח תוצאות מאמרים מסוגים שונים (ראו אינדקס בפרק 100). מאחל בהצלחה.
.
הערה לאתיקה של הוראה ובחינה: בשנת תשפ"ג לא השתתפתי בכתיבת שאלות לבחינת שלב א'.
הפרק נועד למעבר מהיר על מושגים הקשורים לאבחנה ולטיפול בהקשר של אפידמיולוגיה ורפואה נתמכת ראיות. אין כאן חזרה מלאה על החומר אלא תזכורת חלקית.
החלק הראשון על תחלואה ואבחנה, והשני על טיפול ועל סוגי מחקרים בשאלה על טיפול/ נזק.
בחלק הראשון יוזכרו המושגים:
שכיחות prevalence
היארעות incidence
רגישות sensitivity
ספציפיות, סגוליות specificity
ערך מנבא חיובי, ערך מנבא שלילי (positive predictive value, negative predictive value)
pre test probability, post test probability
likelihood ratio
ROC curve
/
בחלק השני-
דרכים שונות למדוד תוצאות במחקר על טיפול: קצב היארעות (rate), שוני בערך מספרי, risk
absolute risk reduction
relative risk
relative risk reduction
number needed to treat
confidence interval
randomized controlled trial
cohort (comparative)
case-control study
cross sectional study
meta analysis
הפרק לא יכול להקיף את כל החומר בתחום זה לבחינת שלב א' ברפואת המשפחה- למי שיש זמן, בפודקאסט פרקים אחרים שיכולים להיות לעזר, בעקר הפרק "אין לתאר במלים" על סטטיסטיקה תיאורית, והפרקים העוסקים בתקפות ובניתוח תוצאות מאמרים מסוגים שונים (ראו אינדקס בפרק 100). מאחל בהצלחה.
.
הערה לאתיקה של הוראה ובחינה: בשנת תשפ"ג לא השתתפתי בכתיבת שאלות לבחינת שלב א'.
בחולים שאושפזו בארצות הברית עם אחת משתי מחלות אלו בסתיו- חורף 2023 הסיכון לתמותה בחולי קוביד היה עדיין גדול יותר מאשר בשפעת (HR 1.6). מדובר בשלב מאוחר בהיסטוריה של המגפה בו קוביד מסוכן הרבה פחות ממה שהיה בתחילתה, עקב חיסוניות, ידע, טיפולים, ואופי הוריאנט.
ננצל את המחקר הזה כדי לדון בשאלה האם בכלל מותר לדבר "באחוזים" כאשר מדובר במטופל.
---
Risk of Death in Patients Hospitalized for COVID-19 vs Seasonal Influenza in Fall-Winter 2022-2023
נספח עם השיטות המלאות של המחקר
בחולים שאושפזו בארצות הברית עם אחת משתי מחלות אלו בסתיו- חורף 2023 הסיכון לתמותה בחולי קוביד היה עדיין גדול יותר מאשר בשפעת (HR 1.6). מדובר בשלב מאוחר בהיסטוריה של המגפה בו קוביד מסוכן הרבה פחות ממה שהיה בתחילתה, עקב חיסוניות, ידע, טיפולים, ואופי הוריאנט.
ננצל את המחקר הזה כדי לדון בשאלה האם בכלל מותר לדבר "באחוזים" כאשר מדובר במטופל.
---
Risk of Death in Patients Hospitalized for COVID-19 vs Seasonal Influenza in Fall-Winter 2022-2023
נספח עם השיטות המלאות של המחקר
הרואין וגזע. מחקר תצפיתי גדול שעסק באיכות הטיפול שמקבלים חולים בהתמכרות לאופיואידים בארצות הברית הראה הבדלים דרמטיים באיכות הטיפול בין שחורים ללבנים.
---
Racial Inequality in Receipt of Medications for Opioid Use Disorder
הרואין וגזע. מחקר תצפיתי גדול שעסק באיכות הטיפול שמקבלים חולים בהתמכרות לאופיואידים בארצות הברית הראה הבדלים דרמטיים באיכות הטיפול בין שחורים ללבנים.
---
Racial Inequality in Receipt of Medications for Opioid Use Disorder
איך לתרגם מתוצאות מטא אנליזה לתועלת או נזק למטופל?
פעמים רבות תוצאות מטא אנליזה מוצגות כסיכון יחסי, relative risk, או, כאשר מדובר בתוצאות הנוגעות לתמותה או לשרידות, כ hazard ratio. במקרה הראשון התוצאה המוצגת כך נראית תמיד יותר מרשימה מהתועלת האבסולוטית למטופל הבודד, וצריך לחשב את התועלת האבסולוטית לפי הסיכון מראש של המטופל. במקרה השני נטעה לטובה אם נתרגם את ה hazard ratio בצורה פשטנית לסיכון יחסי. נדגים את החישובים והתופעות האלו בעזרת מטא אנליזה שעוסקת בסרטן הערמונית, שהשוותה בין טיפול סירוס (androgen deprivation therapy) מידי לבין טיפול מושהה.
---
On the Interpretation of the Hazard Ratio and Communication of Survival Benefit
ולמאזיני התכנית בעוד חמש שנים, בנושא שונה מאוד:
Association Between Gender-Affirming Surgeries and Mental Health Outcomes
איך לתרגם מתוצאות מטא אנליזה לתועלת או נזק למטופל?
פעמים רבות תוצאות מטא אנליזה מוצגות כסיכון יחסי, relative risk, או, כאשר מדובר בתוצאות הנוגעות לתמותה או לשרידות, כ hazard ratio. במקרה הראשון התוצאה המוצגת כך נראית תמיד יותר מרשימה מהתועלת האבסולוטית למטופל הבודד, וצריך לחשב את התועלת האבסולוטית לפי הסיכון מראש של המטופל. במקרה השני נטעה לטובה אם נתרגם את ה hazard ratio בצורה פשטנית לסיכון יחסי. נדגים את החישובים והתופעות האלו בעזרת מטא אנליזה שעוסקת בסרטן הערמונית, שהשוותה בין טיפול סירוס (androgen deprivation therapy) מידי לבין טיפול מושהה.
---
On the Interpretation of the Hazard Ratio and Communication of Survival Benefit
ולמאזיני התכנית בעוד חמש שנים, בנושא שונה מאוד:
Association Between Gender-Affirming Surgeries and Mental Health Outcomes
בפרק זה יינתן חיסון דרך האזנה. זהירות! יש להקשיב לפרק בצורה ביקורתית או בייעוץ רפואי בלבד. נדבר על שלוש דרכים בהן אפשר להפיץ מידע בצורה לא הגונה: בחירה סלקטיבית, סילוף או פירוש שגוי של עובדות נכונות, והשענות על תיאוריות לא מבוססות. נבצע חיסון כנגד מידע מסולף.
---
המאמר עליו דיברנו בפרק
A Population-Based Study of Measles, Mumps, and Rubella Vaccination and Autism
מחקר תצפיתי (NEJM 2002) שהדגים העדר קשר בין החיסון המשולש לאוטיזם
שתי מטא אנליזות שהדגימו העדר קשר בין החיסון המשולש לאוטיזם
אבישי בן ששון-גורדיס, מכתבים למערכת, הארץ, 3/3/2023
בפרק זה יינתן חיסון דרך האזנה. זהירות! יש להקשיב לפרק בצורה ביקורתית או בייעוץ רפואי בלבד. נדבר על שלוש דרכים בהן אפשר להפיץ מידע בצורה לא הגונה: בחירה סלקטיבית, סילוף או פירוש שגוי של עובדות נכונות, והשענות על תיאוריות לא מבוססות. נבצע חיסון כנגד מידע מסולף.
---
המאמר עליו דיברנו בפרק
A Population-Based Study of Measles, Mumps, and Rubella Vaccination and Autism
מחקר תצפיתי (NEJM 2002) שהדגים העדר קשר בין החיסון המשולש לאוטיזם
שתי מטא אנליזות שהדגימו העדר קשר בין החיסון המשולש לאוטיזם
אבישי בן ששון-גורדיס, מכתבים למערכת, הארץ, 3/3/2023
הפרק מציג חילוקי דעות לגבי שימוש בהורמונים בגיל המעבר למניעת מחלות כרוניות, ומציג מחקר מבוקר אקראי מ- 2012 שהדגים הפחתה במחלות לב וכלי דם אצל נשים שהחלו טיפול זמן קצר לאחר הפסקת המחזור. מסקנות מחקר זה הפוכות למסקנות כוח המשימה האמריקאי לרפואה מונעת.
---
סקירת קוקרן (2017):
Long-term hormone therapy for perimenopausal and postmenopausal women
המלצות כח המשימה האמריקאי (2022):
Hormone Therapy in Postmenopausal Persons: Primary Prevention of Chronic Conditions
המלצות כח המשימה האמריקאי- מאמר, כולל התייחסות לגיל או תזמון הטיפול לאחר הפסקת המחזור:
מחקר ה DOPS (2012)
מחקר ה WHI (2002)
Risks and Benefits of Estrogen Plus Progestin in Healthy Postmenopausal Women
הפרק מציג חילוקי דעות לגבי שימוש בהורמונים בגיל המעבר למניעת מחלות כרוניות, ומציג מחקר מבוקר אקראי מ- 2012 שהדגים הפחתה במחלות לב וכלי דם אצל נשים שהחלו טיפול זמן קצר לאחר הפסקת המחזור. מסקנות מחקר זה הפוכות למסקנות כוח המשימה האמריקאי לרפואה מונעת.
---
סקירת קוקרן (2017):
Long-term hormone therapy for perimenopausal and postmenopausal women
המלצות כח המשימה האמריקאי (2022):
Hormone Therapy in Postmenopausal Persons: Primary Prevention of Chronic Conditions
המלצות כח המשימה האמריקאי- מאמר, כולל התייחסות לגיל או תזמון הטיפול לאחר הפסקת המחזור:
מחקר ה DOPS (2012)
מחקר ה WHI (2002)
Risks and Benefits of Estrogen Plus Progestin in Healthy Postmenopausal Women
במחקר איטלקי שהתפרסם בפברואר, באנשים שעברו קולונוסקופיה כחלק מתכנית סקירה, הסיכוי לסרטן בעתיד ירד ככל שהרופא.ה מבצע הבדיקה היה עם נטייה גבוהה יותר לזהות אדנומות בבדיקה.
---
במחקר איטלקי שהתפרסם בפברואר, באנשים שעברו קולונוסקופיה כחלק מתכנית סקירה, הסיכוי לסרטן בעתיד ירד ככל שהרופא.ה מבצע הבדיקה היה עם נטייה גבוהה יותר לזהות אדנומות בבדיקה.
---
האם המומחיות היא טיעון שנמצא נמוך מאוד בהיררכיית המידע, או שהיא מרכיב הכרחי בביצוע רפואה נתמכת ראיות נכונה?
---
Clinical expertise in the era of evidence-based medicine and patient choice
מומחה כשוזר רכיבים, 2002
Evidence based medicine: what it is and what it isn't
מומחיות כאחד משלושת הרכיבים, 1996
Evidence-Based Medicine and Clinical Expertise
דוגמאות לשימוש במומחיות
Expertise in evidence-based medicine: a tale of three models
היסטוריה של ההתייחסות למומחיות בתוך רפואה נתמכת ראיות
האם המומחיות היא טיעון שנמצא נמוך מאוד בהיררכיית המידע, או שהיא מרכיב הכרחי בביצוע רפואה נתמכת ראיות נכונה?
---
Clinical expertise in the era of evidence-based medicine and patient choice
מומחה כשוזר רכיבים, 2002
Evidence based medicine: what it is and what it isn't
מומחיות כאחד משלושת הרכיבים, 1996
Evidence-Based Medicine and Clinical Expertise
דוגמאות לשימוש במומחיות
Expertise in evidence-based medicine: a tale of three models
היסטוריה של ההתייחסות למומחיות בתוך רפואה נתמכת ראיות
תיאור מקרה נמצא נמוך בפירמידת המידע, אך מה לגבי תיאור מקרה דרמטי, בו תינוקת שהייתה אמורה לסבול ממחלה קשה וקטלנית, קיבלה טיפול בעודה בתוך הרחם ובשנת החיים הראשונה גדלה כתינוקת רגילה?
בפרק זה נסביר על מחלת פופמה, מחלת אגירה ליזוזומלית, נספר על הטיפול שנשמע ממש כמדע בדיוני, ונחשוב מתי תיאור מקרה יכול להיות בסיס להמלצות.
---
In Utero Enzyme-Replacement Therapy for Infantile-Onset Pompe’s Disease
קווים מנחים לקריאה וכתיבת תיאור מקרה
תיאור מקרה נמצא נמוך בפירמידת המידע, אך מה לגבי תיאור מקרה דרמטי, בו תינוקת שהייתה אמורה לסבול ממחלה קשה וקטלנית, קיבלה טיפול בעודה בתוך הרחם ובשנת החיים הראשונה גדלה כתינוקת רגילה?
בפרק זה נסביר על מחלת פופמה, מחלת אגירה ליזוזומלית, נספר על הטיפול שנשמע ממש כמדע בדיוני, ונחשוב מתי תיאור מקרה יכול להיות בסיס להמלצות.
---
In Utero Enzyme-Replacement Therapy for Infantile-Onset Pompe’s Disease
קווים מנחים לקריאה וכתיבת תיאור מקרה
Association of a Low-Carbohydrate High-Fat Diet With Plasma Lipid Levels and Cardiovascular Risk*
מחקר תצפיתי, שבינתיים הוצג בכנס ועדיין לא פורסם*, השווה בין משתתפות שהתזונה שלהן כללה מעט מאוד פחמימות למשתתפות עם תזונה "רגילה". התוצא הראשוני היה תוצא מעבדתי, כולסטרול, אך התוצא שתפס כותרות בעיתונות הלא רפואית ובאתרי רפואה הוא התוצא השניוני, הופעת מחלה קרדיווסקולרית.
---
תקציר המחקר כפי שהוצג בכנס הקולג' האמריקאי לקרדיולוגיה (בעברית נשמע קצת קיקיוני, אך זהו אחד מארגוני המומחים החשובים בעולם).
*הקישור למעלה למאמר כפי שהתפרסם בסופו של דבר והוסף בדיעבד, שנתיים לאחר פרסום הפרק, אך הפרק עצמו התייחס לפרה-פרינט.
Association of a Low-Carbohydrate High-Fat Diet With Plasma Lipid Levels and Cardiovascular Risk*
מחקר תצפיתי, שבינתיים הוצג בכנס ועדיין לא פורסם*, השווה בין משתתפות שהתזונה שלהן כללה מעט מאוד פחמימות למשתתפות עם תזונה "רגילה". התוצא הראשוני היה תוצא מעבדתי, כולסטרול, אך התוצא שתפס כותרות בעיתונות הלא רפואית ובאתרי רפואה הוא התוצא השניוני, הופעת מחלה קרדיווסקולרית.
---
תקציר המחקר כפי שהוצג בכנס הקולג' האמריקאי לקרדיולוגיה (בעברית נשמע קצת קיקיוני, אך זהו אחד מארגוני המומחים החשובים בעולם).
*הקישור למעלה למאמר כפי שהתפרסם בסופו של דבר והוסף בדיעבד, שנתיים לאחר פרסום הפרק, אך הפרק עצמו התייחס לפרה-פרינט.
במחקר מבוקר אקראי שהתפרסם בתחילת 2023, דיאטה רבת שומנים (לעומת דיאטה רבת פחמימות, הסטנדרט המקובל) בחולי סוכרת הביאה ליתרון בטווח קצר במשקל, ברמת ההמוגלובין המסוכרר, וייתכן אפילו במצב הכבד השומני לפי ביופסיות שבוצעו בבסיס ולאחר ששה חודשים. מצד שני דיאטה זו הייתה פחות טובה מבחינת תופעות לואי ומבחינת רמת כולסטרול LDL. למחקר חסרונות משמעותיים מבחינת תקפות, וכרגיל במחקרים מסוג זה, לא הייתה התערבות מספיק ארוכה ולכן לא נבדקו תוצאים חשובים למטופל כמו הופעת מחלת לב איסכמית.
---
במחקר מבוקר אקראי שהתפרסם בתחילת 2023, דיאטה רבת שומנים (לעומת דיאטה רבת פחמימות, הסטנדרט המקובל) בחולי סוכרת הביאה ליתרון בטווח קצר במשקל, ברמת ההמוגלובין המסוכרר, וייתכן אפילו במצב הכבד השומני לפי ביופסיות שבוצעו בבסיס ולאחר ששה חודשים. מצד שני דיאטה זו הייתה פחות טובה מבחינת תופעות לואי ומבחינת רמת כולסטרול LDL. למחקר חסרונות משמעותיים מבחינת תקפות, וכרגיל במחקרים מסוג זה, לא הייתה התערבות מספיק ארוכה ולכן לא נבדקו תוצאים חשובים למטופל כמו הופעת מחלת לב איסכמית.
---
השימוש במילה "חיובי" יכול לבלבל מאוד. המלה יכולה לציין מספר גדול מאפס, דבר טוב מוסרית או רגשית, תוצאות של מחקר, תוצאות של בדיקה, וקיום מחלה. ננסה להפריד בין כל אלה בעזרת פינצטה, ונקווה שהפינצטה לא תהיה נגועה בנגיף מדבק (גם על זה נדבר בפרק). נדבר גם על בדיקות חיוביות כוזבות לקוביד, הדבקה באבעבועות הקוף דרך קעקועים, הבטים חיוביים של התקפי לב, מה גרם למאמרים להראות תוצאות שליליות החל משנת 2000, האם רופאי שיניים נמצאים בסיכון מוגבר להדבקה בקוביד , וגם את צורת ההתנסחות בפניה אלקטרונית לרופאות.
---
מאמרים שהוזכרו בפרק:
Continuous positive airway pressure as potential treatment of atrial fibrillation
.
False-Positive Results in Rapid Antigen Tests for SARS-CoV-2
.
Likelihood of Null Effects of Large NHLBI Clinical Trials Has Increased over Time
.
MPXV Transmission at a Tattoo Parlor
.
.
Association of Electronic Health Record Inbasket Message Characteristics With Physician Burnout
.
Positive effects of illness reported by myocardial infarction and breast cancer patients
השימוש במילה "חיובי" יכול לבלבל מאוד. המלה יכולה לציין מספר גדול מאפס, דבר טוב מוסרית או רגשית, תוצאות של מחקר, תוצאות של בדיקה, וקיום מחלה. ננסה להפריד בין כל אלה בעזרת פינצטה, ונקווה שהפינצטה לא תהיה נגועה בנגיף מדבק (גם על זה נדבר בפרק). נדבר גם על בדיקות חיוביות כוזבות לקוביד, הדבקה באבעבועות הקוף דרך קעקועים, הבטים חיוביים של התקפי לב, מה גרם למאמרים להראות תוצאות שליליות החל משנת 2000, האם רופאי שיניים נמצאים בסיכון מוגבר להדבקה בקוביד , וגם את צורת ההתנסחות בפניה אלקטרונית לרופאות.
---
מאמרים שהוזכרו בפרק:
Continuous positive airway pressure as potential treatment of atrial fibrillation
.
False-Positive Results in Rapid Antigen Tests for SARS-CoV-2
.
Likelihood of Null Effects of Large NHLBI Clinical Trials Has Increased over Time
.
MPXV Transmission at a Tattoo Parlor
.
.
Association of Electronic Health Record Inbasket Message Characteristics With Physician Burnout
.
Positive effects of illness reported by myocardial infarction and breast cancer patients
מחקר בריטי גייס כ 1600 איש עם סרטן ערמונית, רובם בסיכון נמוך. המשתתפים חולקו אקראית לשלוש קבוצות: מעקב פעיל, ניתוח או טיפול בקרינה. כעת יש תוצאות לאחר מעקב חציוני של 15 שנה. התוצא העקרי, שיעור התמותה מסרטן הערמונית, לא היה שונה באופן מובהק בין הקבוצות, ובשלושתן היה נמוך. גרורות, לאו דווקא תסמיניות, היו שכיחות יותר בקבוצת המעקב הפעיל (עלייה מוחלטת של 5% בסיכוי לגרורות לאחר 15 שנות מעקב).
---
Fifteen-Year Outcomes after Monitoring, Surgery, or Radiotherapy for Prostate Cancer
Patient-Reported Outcomes 12 Years after Localized Prostate Cancer Treatment
מחקר בריטי גייס כ 1600 איש עם סרטן ערמונית, רובם בסיכון נמוך. המשתתפים חולקו אקראית לשלוש קבוצות: מעקב פעיל, ניתוח או טיפול בקרינה. כעת יש תוצאות לאחר מעקב חציוני של 15 שנה. התוצא העקרי, שיעור התמותה מסרטן הערמונית, לא היה שונה באופן מובהק בין הקבוצות, ובשלושתן היה נמוך. גרורות, לאו דווקא תסמיניות, היו שכיחות יותר בקבוצת המעקב הפעיל (עלייה מוחלטת של 5% בסיכוי לגרורות לאחר 15 שנות מעקב).
---
Fifteen-Year Outcomes after Monitoring, Surgery, or Radiotherapy for Prostate Cancer
Patient-Reported Outcomes 12 Years after Localized Prostate Cancer Treatment
מתי לא מומלץ לטפל בסרטן הערמונית? איגוד האורולוגים האמריקאי והאיגוד האמריקאי לרדיו-אונקולוגים פרסמו (יולי 2022) קווים מנחים לגבי סרטן ערמונית ממוקם. קווים מנחים אלו מדגישים את הצורך במעורבות המטופל בהחלטות, ואת הצורך בהערכת סיכון לצורך קבלת החלטה. ישנה המלצה חזקה שלהם למעקב פעיל בלבד כאשר מדובר בסרטן ערמונית בדרגת סיכון נמוכה.
---
Clinically Localized Prostate Cancer: AUA/ASTRO Guideline (2022)
מאמר ששווה לדון עליו עם מטופלים המתלבטים בין טיפול למעקב פעיל בלבד:
10Year Outcomes after Monitoring, Surgery, or Radiotherapy for Localized Prostate Cancer
מקורות מידע להערכת רמת הסיכון בסרטן הערמונית (מדגם מצומצם של מקורות)
Risk Groups for Localized Prostate Cancer
Prostate Cancer Risk Assessment and the UCSF-CAPRA Score
מתי לא מומלץ לטפל בסרטן הערמונית? איגוד האורולוגים האמריקאי והאיגוד האמריקאי לרדיו-אונקולוגים פרסמו (יולי 2022) קווים מנחים לגבי סרטן ערמונית ממוקם. קווים מנחים אלו מדגישים את הצורך במעורבות המטופל בהחלטות, ואת הצורך בהערכת סיכון לצורך קבלת החלטה. ישנה המלצה חזקה שלהם למעקב פעיל בלבד כאשר מדובר בסרטן ערמונית בדרגת סיכון נמוכה.
---
Clinically Localized Prostate Cancer: AUA/ASTRO Guideline (2022)
מאמר ששווה לדון עליו עם מטופלים המתלבטים בין טיפול למעקב פעיל בלבד:
10Year Outcomes after Monitoring, Surgery, or Radiotherapy for Localized Prostate Cancer
מקורות מידע להערכת רמת הסיכון בסרטן הערמונית (מדגם מצומצם של מקורות)
Risk Groups for Localized Prostate Cancer
Prostate Cancer Risk Assessment and the UCSF-CAPRA Score
ההחלטות סביב סקירה, אבחנה וטיפול בסרטן הערמונית הן מורכבות ביותר ומחייבות הכרות עם הנושא, שילוב המטופל בהחלטות, והבנה מעמיקה במושגים הקשורים לרפואה נתמכת ראיות: תועלת של בדיקות סקירה, רגישות, ספציפיות, תקפות של מאמרים על בדיקה אבחנתית, ועוד. במסגרת תהליך זה יש שלוש צמתי החלטה עיקריות: האם לבצע סקירה (בעזרת PSA), האם לאחר בדיקת סקירה חיובית להמשיך לביופסיית ערמונית, והאם לאחר הוכחת סרטן בביופסיה לטפל בסרטן או לבצע מעקב בלבד. לאחרונה קיימות בשוק מספר בדיקות חדשות ויקרות, שעוזרות להחליט בצומת ההחלטה השנייה. בפרק הנוכחי נדבר על אחת מהן, ה IsoPSA.
---
Clinical Validation of IsoPSA™, a Single Parameter, Structure Based Assay for Improved Detection of High Grade Prostate Cancer
https://pubmed.ncbi.nlm.nih.gov/30810464/
המלצות כח המשימה האמריקאי לגבי סקירה לסרטן הערמונית
https://www.uspreventiveservicestaskforce.org/uspstf/recommendation/prostate-cancer-screening
ההחלטות סביב סקירה, אבחנה וטיפול בסרטן הערמונית הן מורכבות ביותר ומחייבות הכרות עם הנושא, שילוב המטופל בהחלטות, והבנה מעמיקה במושגים הקשורים לרפואה נתמכת ראיות: תועלת של בדיקות סקירה, רגישות, ספציפיות, תקפות של מאמרים על בדיקה אבחנתית, ועוד. במסגרת תהליך זה יש שלוש צמתי החלטה עיקריות: האם לבצע סקירה (בעזרת PSA), האם לאחר בדיקת סקירה חיובית להמשיך לביופסיית ערמונית, והאם לאחר הוכחת סרטן בביופסיה לטפל בסרטן או לבצע מעקב בלבד. לאחרונה קיימות בשוק מספר בדיקות חדשות ויקרות, שעוזרות להחליט בצומת ההחלטה השנייה. בפרק הנוכחי נדבר על אחת מהן, ה IsoPSA.
---
Clinical Validation of IsoPSA™, a Single Parameter, Structure Based Assay for Improved Detection of High Grade Prostate Cancer
https://pubmed.ncbi.nlm.nih.gov/30810464/
המלצות כח המשימה האמריקאי לגבי סקירה לסרטן הערמונית
https://www.uspreventiveservicestaskforce.org/uspstf/recommendation/prostate-cancer-screening
תרופה חדשה לקורונה, VV116, הושוותה לטיפול בנירמטרלביר-ריטונאביר (פקסלוביד) במטופלים עם גורם סיכון למחלה חמורה, כאשר התוצא שנבדק היה זמן עד החלמה מתסמינים. נראה לכאורה שהתרופה החדשה לא פחות טובה, אך מבט מפוקח במה שידוע לנו עד כה, מראה שגם תרופת ההשוואה לא הוכיחה עצמה כמקצרת זמן עד החלמה.
---
VV116 versus Nirmatrelvir–Ritonavir for Oral Treatment of Covid-19
סקירת קוקרן (נכון לדצמבר 2022) לא מצאה עדויות להשפעת פקסלוביד על זמן עד החלמה מתסמינים
מחקר ה EPIC HR- פקסלוביד (במטופלים שאינם מחוסנים, ובסיכון גבוה) מפחית אשפוז או תמותה יחסית לפלצבו. לא דווח בו על זמן עד החלמה מתסמינים
מחקר ה EPIC SR- כפי שמוצג ברשם המחקרים (clinicaltrials.gov) שבדק זמן עד החלמה מתסמינים במטופלים בסיכון רגיל, הופסק ביולי 2022 ותוצאותיו עדיין לא פורסמו
תרופה חדשה לקורונה, VV116, הושוותה לטיפול בנירמטרלביר-ריטונאביר (פקסלוביד) במטופלים עם גורם סיכון למחלה חמורה, כאשר התוצא שנבדק היה זמן עד החלמה מתסמינים. נראה לכאורה שהתרופה החדשה לא פחות טובה, אך מבט מפוקח במה שידוע לנו עד כה, מראה שגם תרופת ההשוואה לא הוכיחה עצמה כמקצרת זמן עד החלמה.
---
VV116 versus Nirmatrelvir–Ritonavir for Oral Treatment of Covid-19
סקירת קוקרן (נכון לדצמבר 2022) לא מצאה עדויות להשפעת פקסלוביד על זמן עד החלמה מתסמינים
מחקר ה EPIC HR- פקסלוביד (במטופלים שאינם מחוסנים, ובסיכון גבוה) מפחית אשפוז או תמותה יחסית לפלצבו. לא דווח בו על זמן עד החלמה מתסמינים
מחקר ה EPIC SR- כפי שמוצג ברשם המחקרים (clinicaltrials.gov) שבדק זמן עד החלמה מתסמינים במטופלים בסיכון רגיל, הופסק ביולי 2022 ותוצאותיו עדיין לא פורסמו
התמקדות עלולה להפריע בראיית התמונה הגדולה. נדבר על חשיבות התמונה הגדולה בהקשר של לימודי הרפואה, הביקורת כנגד רפואה נתמכת ראיות, והטיפול במחלת ריאות חסימתית.
---
עקרונות הטיפול במחלת ריאות חסימתית יציבה (מתוך UTD)- background information.
Your Brain Can Only Take So Much Focus
מאמר דעה מ- Harvard business review
‘Background’ and ‘foreground’ knowledge: targeting learning materials to trainees' needs
התמקדות עלולה להפריע בראיית התמונה הגדולה. נדבר על חשיבות התמונה הגדולה בהקשר של לימודי הרפואה, הביקורת כנגד רפואה נתמכת ראיות, והטיפול במחלת ריאות חסימתית.
---
עקרונות הטיפול במחלת ריאות חסימתית יציבה (מתוך UTD)- background information.
Your Brain Can Only Take So Much Focus
מאמר דעה מ- Harvard business review
‘Background’ and ‘foreground’ knowledge: targeting learning materials to trainees' needs
האם ניתוח כריתה מניעתית של אבר כדי למנוע סרטן מוצדק עבור אישה בסיכון רגיל?
נדבר על הנושא הזה ממספר זוויות: כיצד מצוטטים מאמרים בעיתונות הלא רפואית, אפשרויות למניעת תחלואה או תמותה מסרטן, מה הנזקים האפשריים והתועלת האפשרית של ניתוח כריתה מניעתית, מתי ניתוח נחשב אופורטוניסטי, ומספר מחקרים שיכולים לעזור בהבנת הנושא המורכב.
---
JAMA Open network 2022: מחקר תצפיתי גדול שהראה בקבוצת החשיפה (כריתת חצוצרות אופורטוניסטית) ירידה דרמטית בשיעור סרטן שחלה מסוג HGSOC לעומת קבוצת בקרה.
נייר עמדה- OCRA- איחוד המחקר בסרטן השחלה, מעודד נשים שעוברות ניתוח גינקולוגי לשקול גם הסרת חצוצרות אופורטוניטסית
סקירה לסרטן שחלה לא הצליחה להפחית תמותה מהמחלה גם במעקב של 16 שנה.
קיום נגעים טרום סרטניים בחצוצרות שהוסרו מסיבה אחרת
מחקר קטן רטרוספקטיבי: אין הבדלים בסיבוכים לטווח קצר בין קשירה לכריתת חצוצרות
ACOG 2019- נייר עמדה: כריתה אופורטוניסטית היא פרוצדורה בטוחה
AJOG 2019: מחקר תצפיתי על אלפי נשים: עלייה בסיכון לתסמיני מנופאוזה כשנה לאחר כריתת חצוצרות
מחקר תצפיתי שלא הראה עלייה בסיכון למנופאוזה מוקדמת
סקירת קוקרן 2019 על מחקרים מבוקרים של כריתת רחם אל מול כריתת רחם וחצוצרות: תוצאי בטיחות ורמות AMH.
האם ניתוח כריתה מניעתית של אבר כדי למנוע סרטן מוצדק עבור אישה בסיכון רגיל?
נדבר על הנושא הזה ממספר זוויות: כיצד מצוטטים מאמרים בעיתונות הלא רפואית, אפשרויות למניעת תחלואה או תמותה מסרטן, מה הנזקים האפשריים והתועלת האפשרית של ניתוח כריתה מניעתית, מתי ניתוח נחשב אופורטוניסטי, ומספר מחקרים שיכולים לעזור בהבנת הנושא המורכב.
---
JAMA Open network 2022: מחקר תצפיתי גדול שהראה בקבוצת החשיפה (כריתת חצוצרות אופורטוניסטית) ירידה דרמטית בשיעור סרטן שחלה מסוג HGSOC לעומת קבוצת בקרה.
נייר עמדה- OCRA- איחוד המחקר בסרטן השחלה, מעודד נשים שעוברות ניתוח גינקולוגי לשקול גם הסרת חצוצרות אופורטוניטסית
סקירה לסרטן שחלה לא הצליחה להפחית תמותה מהמחלה גם במעקב של 16 שנה.
קיום נגעים טרום סרטניים בחצוצרות שהוסרו מסיבה אחרת
מחקר קטן רטרוספקטיבי: אין הבדלים בסיבוכים לטווח קצר בין קשירה לכריתת חצוצרות
ACOG 2019- נייר עמדה: כריתה אופורטוניסטית היא פרוצדורה בטוחה
AJOG 2019: מחקר תצפיתי על אלפי נשים: עלייה בסיכון לתסמיני מנופאוזה כשנה לאחר כריתת חצוצרות
מחקר תצפיתי שלא הראה עלייה בסיכון למנופאוזה מוקדמת
סקירת קוקרן 2019 על מחקרים מבוקרים של כריתת רחם אל מול כריתת רחם וחצוצרות: תוצאי בטיחות ורמות AMH.
שמעתי על טיפול במחלת ריאות חסימתית בעזרת יוגה, והצלחתי למצוא מטא אנליזה בנושא. האם יש ראיות חזקות ליעילות ההתערבות? ומה הבעיה העיקרית עם מטא אנליזות?
---
Adjunct treatment with yoga in chronic severe airways obstruction.
שמעתי על טיפול במחלת ריאות חסימתית בעזרת יוגה, והצלחתי למצוא מטא אנליזה בנושא. האם יש ראיות חזקות ליעילות ההתערבות? ומה הבעיה העיקרית עם מטא אנליזות?
---
Adjunct treatment with yoga in chronic severe airways obstruction.
הפרק מוקדש למורתי ורבתי ד"ר דלית בלום שלימדה אותי איך למצוא, לסנן ולהבין מחקרים.
---
קישורים למנועי עדכון רפואי
EvidenceAlerts is a continuously updated repository of current best evidence from research to support evidence-based clinical decisions.
(מתוך UpToDate, מאגר בתשלום אך זמין בכל מערכות הבריאות והפקולטות לרפואה בישראל)
הפרק מוקדש למורתי ורבתי ד"ר דלית בלום שלימדה אותי איך למצוא, לסנן ולהבין מחקרים.
---
קישורים למנועי עדכון רפואי
EvidenceAlerts is a continuously updated repository of current best evidence from research to support evidence-based clinical decisions.
(מתוך UpToDate, מאגר בתשלום אך זמין בכל מערכות הבריאות והפקולטות לרפואה בישראל)
בפרק הזה תשמעו תקציר חשוב וחדש, אך לא בגלל הממצאים במחקר אלא בגלל סיבה מסקרנת ומדאיגה. למטה תוכלו גם לקרוא תקציר זה.
מחקר ממשי, בדק יכולת אנושית לזהות תקצירים מסוג דומה וגם תוצאותיו מדאיגות. נציע כלים ראשוניים להתמודדות עם התופעה הזו.
---
המאמר (פורסם עד כה רק ברשת, pre print)
מנוע הכתיבה
detector (מזהה טקסט מלאכותי)
התקציר המלאכותי:
Background: Alzheimer's disease is a progressive neurodegenerative disorder that affects millions of people worldwide. Despite advances in our understanding of the disease, current treatments are largely ineffective in slowing its progression.
Objective: To evaluate the efficacy of a new biologic treatment for Alzheimer's disease.
Methods: A randomized, double-blind, placebo-controlled trial was conducted in patients with mild to moderate Alzheimer's disease. The treatment group received the biologic treatment, while the control group received a placebo. The primary outcome measure was change in cognitive function, as assessed by the Alzheimer's Disease Assessment Scale-Cognitive Subscale (ADAS-Cog). Secondary outcome measures included functional ability, as assessed by the Disability Assessment for Dementia scale, and quality of life, as assessed by the Quality of Life-Alzheimer's Disease
Results: The treatment group showed a minimal advantage in cognitive function compared to the control group (p=0.05). There were no statistically significant differences in functional ability and quality of life between the treatment and control groups. Adverse events were similar between the two groups.
Conclusion: The new biologic treatment shows a minimal advantage in cognitive function in patients with mild to moderate Alzheimer's disease. While the results of this trial suggests that the treatment may have potential as an adjunctive therapy in management of the disease, the minimal advantage observed in cognitive function, further research with larger sample sizes and longer duration of treatment are needed to confirm these findings and determine the true clinical impact of the treatment.
בפרק הזה תשמעו תקציר חשוב וחדש, אך לא בגלל הממצאים במחקר אלא בגלל סיבה מסקרנת ומדאיגה. למטה תוכלו גם לקרוא תקציר זה.
מחקר ממשי, בדק יכולת אנושית לזהות תקצירים מסוג דומה וגם תוצאותיו מדאיגות. נציע כלים ראשוניים להתמודדות עם התופעה הזו.
---
המאמר (פורסם עד כה רק ברשת, pre print)
מנוע הכתיבה
detector (מזהה טקסט מלאכותי)
התקציר המלאכותי:
Background: Alzheimer's disease is a progressive neurodegenerative disorder that affects millions of people worldwide. Despite advances in our understanding of the disease, current treatments are largely ineffective in slowing its progression.
Objective: To evaluate the efficacy of a new biologic treatment for Alzheimer's disease.
Methods: A randomized, double-blind, placebo-controlled trial was conducted in patients with mild to moderate Alzheimer's disease. The treatment group received the biologic treatment, while the control group received a placebo. The primary outcome measure was change in cognitive function, as assessed by the Alzheimer's Disease Assessment Scale-Cognitive Subscale (ADAS-Cog). Secondary outcome measures included functional ability, as assessed by the Disability Assessment for Dementia scale, and quality of life, as assessed by the Quality of Life-Alzheimer's Disease
Results: The treatment group showed a minimal advantage in cognitive function compared to the control group (p=0.05). There were no statistically significant differences in functional ability and quality of life between the treatment and control groups. Adverse events were similar between the two groups.
Conclusion: The new biologic treatment shows a minimal advantage in cognitive function in patients with mild to moderate Alzheimer's disease. While the results of this trial suggests that the treatment may have potential as an adjunctive therapy in management of the disease, the minimal advantage observed in cognitive function, further research with larger sample sizes and longer duration of treatment are needed to confirm these findings and determine the true clinical impact of the treatment.
איך להסתדר עם צ'קליסט אינסופי עבור בן הזוג המושלם?
מבין התרופות לסוכרת העוזרות במניעת אירועים קרדיווסקולרים, איזו יעילה יותר? בגלל אינטרסים כלכליים, אין לנו בינתיים מחקר מבוקר אקראי שעונה על השאלה הזו, לכן נאלץ להסתפק במחקרים תצפיתיים. אבל יש ערפלנים המטים את התוצאות, למשל אינסולין. שיעור מקבלי אינסולין במטופלים המקבלים לירגלוטייד גבוה יחסית לשיעור באלו המקבלים אמפגליפוזין.
השיטה שנדבר עליה בפרק זה משתמשת בכל המשתנים שנמדדו בבסיס (מלבד התרופה הנבדקת) כדי לתת ציון , propensity score, לכל אחד מהמשתתפים. עבור כל משתתף מקבוצת הלירגלוטייד מותאם משתתף מקבוצת האמפגליפוזין עם ציון זהה, וכך שתי הקבוצות הופכות לדומות מאוד מבחינת הערפלנים, למשל שיעור מקבלי האינסולין. בשיטה הזו, בניגוד לרגרסיה לוגיסטית, אפשר להשתמש במשתנים רבים מאוד, וגם לחשב הבדלי סיכונים, הפחתת סיכון אבסולוטית ועוד.
---
המחקר שנזכר בפרק
מאמר הסבר מצוין על propensity score, וכן שיטות נוספות להשתמש בו מלבד matching
---
למתקדמים:
ה propensity score הוא הסבירות להיות שייך לאחת הקבוצות (במקרה שלנו, הסבירות להיות שייך לקבוצת האמפגליפוזין, ללא קשר לקבלת התרופה בפועל), כפי שמחושבות משקלול כל המשתנים האחרים בתחילת המחקר. הסבירות הזו מחושבת בעזרת רגרסיה לוגיסטית, שבה לכל משתנה מוענק משקל שונה בתחזית לאיזו קבוצה המטופל ישתייך (במקרה שלנו, שקלול של מחלות, מין, גיל, מספר אשפוזים, תרופות אחרות ועוד, כדי לחזות האם מטופל יקבל אמפגליפוזין לעומת לירגלוטייד)
איך להסתדר עם צ'קליסט אינסופי עבור בן הזוג המושלם?
מבין התרופות לסוכרת העוזרות במניעת אירועים קרדיווסקולרים, איזו יעילה יותר? בגלל אינטרסים כלכליים, אין לנו בינתיים מחקר מבוקר אקראי שעונה על השאלה הזו, לכן נאלץ להסתפק במחקרים תצפיתיים. אבל יש ערפלנים המטים את התוצאות, למשל אינסולין. שיעור מקבלי אינסולין במטופלים המקבלים לירגלוטייד גבוה יחסית לשיעור באלו המקבלים אמפגליפוזין.
השיטה שנדבר עליה בפרק זה משתמשת בכל המשתנים שנמדדו בבסיס (מלבד התרופה הנבדקת) כדי לתת ציון , propensity score, לכל אחד מהמשתתפים. עבור כל משתתף מקבוצת הלירגלוטייד מותאם משתתף מקבוצת האמפגליפוזין עם ציון זהה, וכך שתי הקבוצות הופכות לדומות מאוד מבחינת הערפלנים, למשל שיעור מקבלי האינסולין. בשיטה הזו, בניגוד לרגרסיה לוגיסטית, אפשר להשתמש במשתנים רבים מאוד, וגם לחשב הבדלי סיכונים, הפחתת סיכון אבסולוטית ועוד.
---
המחקר שנזכר בפרק
מאמר הסבר מצוין על propensity score, וכן שיטות נוספות להשתמש בו מלבד matching
---
למתקדמים:
ה propensity score הוא הסבירות להיות שייך לאחת הקבוצות (במקרה שלנו, הסבירות להיות שייך לקבוצת האמפגליפוזין, ללא קשר לקבלת התרופה בפועל), כפי שמחושבות משקלול כל המשתנים האחרים בתחילת המחקר. הסבירות הזו מחושבת בעזרת רגרסיה לוגיסטית, שבה לכל משתנה מוענק משקל שונה בתחזית לאיזו קבוצה המטופל ישתייך (במקרה שלנו, שקלול של מחלות, מין, גיל, מספר אשפוזים, תרופות אחרות ועוד, כדי לחזות האם מטופל יקבל אמפגליפוזין לעומת לירגלוטייד)
סקירה לסרטן ריאה היא בדיקה מומלצת על ידי כוח המשימה האמריקאי לרפואה מונעת. בפרק הזה נדבר על שני המחקרים הגדולים שעל בסיסם ניתנה המלצה זו- מחקר ה NLST האמריקאי, כולל המעקב המוארך שלו שהתפרסם ב 2019, ומחקר ה NELSON הבלגי-הולנדי, שהתפרסם ב 2020.
---
מחקר ה NLST -הפרסום הראשון
מחקר ה NLST- מעקב מוארך, עם ממצאים לאחר 11 שנה
מחקר ה NELSON
המלצות כח המשימה האמריקאי לרפואה מונעת- סקירה לסרטן הריאה
סקירה לסרטן ריאה היא בדיקה מומלצת על ידי כוח המשימה האמריקאי לרפואה מונעת. בפרק הזה נדבר על שני המחקרים הגדולים שעל בסיסם ניתנה המלצה זו- מחקר ה NLST האמריקאי, כולל המעקב המוארך שלו שהתפרסם ב 2019, ומחקר ה NELSON הבלגי-הולנדי, שהתפרסם ב 2020.
---
מחקר ה NLST -הפרסום הראשון
מחקר ה NLST- מעקב מוארך, עם ממצאים לאחר 11 שנה
מחקר ה NELSON
המלצות כח המשימה האמריקאי לרפואה מונעת- סקירה לסרטן הריאה
כדי להבין מה משמעות תוצאה מספרית של בדיקה אצל מטופל ספציפי, למשל הציון "8" בסולם שנועד לעזור באבחון גאוט, או "הצרות של 20%" בצנתור וירטואלי, נצטרך למצוא את הנקודה על עקומת הרוק שמייצגת את אותה תוצאה מספרית, אך ההמשך אינו מובן מאליו. מיקום נקודה זו בתוך מסגרת הגרף מייצג את הרגישות והספציפיות לנקודה זו כערך סף (כאשר כל הערכים שנמוכים ממנה נחשבים כבדיקה שלילית, וכל הערכים שמעליה כבדיקה חיובית), ולא את המשמעות למטופל כאשר תוצאת הבדיקה היא בדיוק אותו ערך. לעומת זאת, אם הצלחנו למצוא על הגרף את הנקודה המייצגת את ערך הבדיקה אצל המטופל, שיפוע הגרף בדיוק בנקודה זו, הוא ה likelihood ratio עבור מחלה. פרק שלישי בנושא עקומת הרוק, מומלץ לשמוע לפניו לפחות את הפרק הראשון בנושא.
פרק 103
---
המאמרים שהוזכרו בפרק (ובסוף גם הסולם ששימש לאבחון גאוט ללא ניקור)
Slopes of a Receiver Operating Characteristic Curve and Likelihood Ratios for a Diagnostic Test
Diagnostic Performance of Coronary Angiography by 64-Row CT
המחקר ששימש ליצירת סולם לאבחון גאוט
A diagnostic rule for acute gouty arthritis in primary care without joint fluid analysis
המחקר שבו תוקף הסולם לאבחון גאוט
The validation of a diagnostic rule for gout without joint fluid analysis: a prospective study
מתוך מאמר זה, סולם לחיזוי אבחנה של גאוט (הציון נע בין 0 ל 13 נקודות):
חומצה אורית מעל 5.9- 3.5 נקודות
מעורבות מפרק MTP ראשון- 2.5 נקודות
גבר- 2
אירוע של ארטריטיס בעבר- 2
יתר לחץ דם או מחלת לב- 1.5
אודם מעל המפרק- 1
הופעת תסמינים תוך יום - 0.5
כדי להבין מה משמעות תוצאה מספרית של בדיקה אצל מטופל ספציפי, למשל הציון "8" בסולם שנועד לעזור באבחון גאוט, או "הצרות של 20%" בצנתור וירטואלי, נצטרך למצוא את הנקודה על עקומת הרוק שמייצגת את אותה תוצאה מספרית, אך ההמשך אינו מובן מאליו. מיקום נקודה זו בתוך מסגרת הגרף מייצג את הרגישות והספציפיות לנקודה זו כערך סף (כאשר כל הערכים שנמוכים ממנה נחשבים כבדיקה שלילית, וכל הערכים שמעליה כבדיקה חיובית), ולא את המשמעות למטופל כאשר תוצאת הבדיקה היא בדיוק אותו ערך. לעומת זאת, אם הצלחנו למצוא על הגרף את הנקודה המייצגת את ערך הבדיקה אצל המטופל, שיפוע הגרף בדיוק בנקודה זו, הוא ה likelihood ratio עבור מחלה. פרק שלישי בנושא עקומת הרוק, מומלץ לשמוע לפניו לפחות את הפרק הראשון בנושא.
פרק 103
---
המאמרים שהוזכרו בפרק (ובסוף גם הסולם ששימש לאבחון גאוט ללא ניקור)
Slopes of a Receiver Operating Characteristic Curve and Likelihood Ratios for a Diagnostic Test
Diagnostic Performance of Coronary Angiography by 64-Row CT
המחקר ששימש ליצירת סולם לאבחון גאוט
A diagnostic rule for acute gouty arthritis in primary care without joint fluid analysis
המחקר שבו תוקף הסולם לאבחון גאוט
The validation of a diagnostic rule for gout without joint fluid analysis: a prospective study
מתוך מאמר זה, סולם לחיזוי אבחנה של גאוט (הציון נע בין 0 ל 13 נקודות):
חומצה אורית מעל 5.9- 3.5 נקודות
מעורבות מפרק MTP ראשון- 2.5 נקודות
גבר- 2
אירוע של ארטריטיס בעבר- 2
יתר לחץ דם או מחלת לב- 1.5
אודם מעל המפרק- 1
הופעת תסמינים תוך יום - 0.5
אם נעמיד שוער בפינה הימנית התחתונה של מסגרת עקומת הרוק ונבקש ממנו לנסות לקפוץ שמאלה ולמעלה, כדי להדוף כדורים הנבעטים לאזורים שונים בתוך המסגרת, נוכל לצייר עקומה המציינת את המקום הרחוק ביותר אליו השוער מצליח להגיע בכל אחת מזוויות הקפיצה שלו. עקומה זו תהיה דומה מאוד בצורתה לעקומת הרוק, ROC, והשטח אותו מצליח לכסות השוער, יהיה למעשה השטח מתחת לעקומה זו. ככל שהשוער טוב יותר, כך היחס בין השטח מתחת לעקומה לבין שטח המסגרת יהיה גדול יותר. באותה מידה, כשנראה עקומת רוק עבור בדיקה אבחנתית, היחס בין השטח מתחת לעקומה לבין שטח המסגרת, יחס הנקרא בקיצור "השטח תחת העקומה" או area under the curve, AUC, יהיה גדול יותר. יחס המתקרב ל 1 (השטח תחת העקומה מכסה את הרוב הגדול של המסגרת) מעיד על בדיקה מצוינת, ויחס של 0.5 מעיד על בדיקה גרועה. ישנם כללי אצבע מתי בדיקה מצוינת (למשל, עם AUC מעל 0.9 או מעל 0.85) ומתי היא גרועה (למשל, AUC קטן מ 0.6) אך אלו כללים שרירותיים, ולא תמיד מעידים על שימושיות קלינית של הבדיקה. פרק שני בנושא, מומלץ להקשיב לפרק הראשון קודם.
פרק 102
---
המאמרים שהוזכרו בפרק:
Diagnostic Performance of Coronary Angiography by 64-Row CT
A diagnostic rule for acute gouty arthritis in primary care without joint fluid analysis
אם נעמיד שוער בפינה הימנית התחתונה של מסגרת עקומת הרוק ונבקש ממנו לנסות לקפוץ שמאלה ולמעלה, כדי להדוף כדורים הנבעטים לאזורים שונים בתוך המסגרת, נוכל לצייר עקומה המציינת את המקום הרחוק ביותר אליו השוער מצליח להגיע בכל אחת מזוויות הקפיצה שלו. עקומה זו תהיה דומה מאוד בצורתה לעקומת הרוק, ROC, והשטח אותו מצליח לכסות השוער, יהיה למעשה השטח מתחת לעקומה זו. ככל שהשוער טוב יותר, כך היחס בין השטח מתחת לעקומה לבין שטח המסגרת יהיה גדול יותר. באותה מידה, כשנראה עקומת רוק עבור בדיקה אבחנתית, היחס בין השטח מתחת לעקומה לבין שטח המסגרת, יחס הנקרא בקיצור "השטח תחת העקומה" או area under the curve, AUC, יהיה גדול יותר. יחס המתקרב ל 1 (השטח תחת העקומה מכסה את הרוב הגדול של המסגרת) מעיד על בדיקה מצוינת, ויחס של 0.5 מעיד על בדיקה גרועה. ישנם כללי אצבע מתי בדיקה מצוינת (למשל, עם AUC מעל 0.9 או מעל 0.85) ומתי היא גרועה (למשל, AUC קטן מ 0.6) אך אלו כללים שרירותיים, ולא תמיד מעידים על שימושיות קלינית של הבדיקה. פרק שני בנושא, מומלץ להקשיב לפרק הראשון קודם.
פרק 102
---
המאמרים שהוזכרו בפרק:
Diagnostic Performance of Coronary Angiography by 64-Row CT
A diagnostic rule for acute gouty arthritis in primary care without joint fluid analysis
עקומת הרוק, ROC , מתייחסת לבדיקה שיש לה תוצאה כמותית- רצף תוצאות אפשריות ולא תוצאה של כן/לא. בבדיקה כזו צריך לבחור ערך סף שמעליו נאמר שהבדיקה חיובית, ותחתיו שהיא שלילית. עבור כל ערך סף כזה, תהיה לבדיקה רגישות וספציפיות. עבור ערך אחר, הרגישות והספציפיות משתנות. העקומה מציבה אחד מול השני את הרגישות והספציפיות עבור כל אותם ערכים. למשל, עבור צנתור וירטואלי (בעזרת CT אנגיוגרפיה של העורקים הקורונרים), בדיקה עם תוצאה כמותית (מידת ההיצרות בעורק) , אפשר לבדוק עבור תוצאות שונות (מידת הצרות שונה ב CT) מהי רגישות וספציפיות הבדיקה כאשר משתמשים בסף הזה לאבחון מחלת לב קורונרית משמעותית. עקומת הרוק מצוירת בתור מסגרת רבועה, שבה הציר הרוחבי מציין את הספציפיות והציר האנכי את הרגישות, כאשר הכיוונים למעלה ושמאלה מייצגים בדיקה טובה: ככל שהנקודה נמצאת משמאל, כך הספציפיות גבוהה יותר, וככל שהיא נמצאת למעלה, הרגישות גבוהה יותר. כמעט תמיד, כאשר מדובר בבדיקה כמותית, יש trade off בין הרגישות לספציפיות- ככל שהאחת עולה, השנייה יורדת. חיבור כל הנקודות אחת לשנייה מייצר קו הנראה כמו מפרש שמחובר בפינה הימנית העליונה, שם הרגישות מצוינת והספציפיות גרועה, ובפינה השמאלית התחתונה, שם הספציפיות מצוינת והרגישות גרועה. ככל שהבדיקה יותר טובה, המפרש הזה יהיה נפוח יותר לכוון שמאלה ולמעלה.
פרק 101
---
המאמר שדיברנו עליו בפרק:
Diagnostic Performance of Coronary Angiography by 64-Row CT
עקומת הרוק, ROC , מתייחסת לבדיקה שיש לה תוצאה כמותית- רצף תוצאות אפשריות ולא תוצאה של כן/לא. בבדיקה כזו צריך לבחור ערך סף שמעליו נאמר שהבדיקה חיובית, ותחתיו שהיא שלילית. עבור כל ערך סף כזה, תהיה לבדיקה רגישות וספציפיות. עבור ערך אחר, הרגישות והספציפיות משתנות. העקומה מציבה אחד מול השני את הרגישות והספציפיות עבור כל אותם ערכים. למשל, עבור צנתור וירטואלי (בעזרת CT אנגיוגרפיה של העורקים הקורונרים), בדיקה עם תוצאה כמותית (מידת ההיצרות בעורק) , אפשר לבדוק עבור תוצאות שונות (מידת הצרות שונה ב CT) מהי רגישות וספציפיות הבדיקה כאשר משתמשים בסף הזה לאבחון מחלת לב קורונרית משמעותית. עקומת הרוק מצוירת בתור מסגרת רבועה, שבה הציר הרוחבי מציין את הספציפיות והציר האנכי את הרגישות, כאשר הכיוונים למעלה ושמאלה מייצגים בדיקה טובה: ככל שהנקודה נמצאת משמאל, כך הספציפיות גבוהה יותר, וככל שהיא נמצאת למעלה, הרגישות גבוהה יותר. כמעט תמיד, כאשר מדובר בבדיקה כמותית, יש trade off בין הרגישות לספציפיות- ככל שהאחת עולה, השנייה יורדת. חיבור כל הנקודות אחת לשנייה מייצר קו הנראה כמו מפרש שמחובר בפינה הימנית העליונה, שם הרגישות מצוינת והספציפיות גרועה, ובפינה השמאלית התחתונה, שם הספציפיות מצוינת והרגישות גרועה. ככל שהבדיקה יותר טובה, המפרש הזה יהיה נפוח יותר לכוון שמאלה ולמעלה.
פרק 101
---
המאמר שדיברנו עליו בפרק:
Diagnostic Performance of Coronary Angiography by 64-Row CT
קישורים למאה הפרקים הראשונים, החל מהפרק הטרי ביותר עד הפרק הראשון, ובפרק אני מדבר על הפודקאסט עצמו ועל קורסים קטנים שמתחבאים בתוכו.
פרק 100 (...)
למה מחקר הקולונוסקופיה יצא שלילי
קולונוסקופיה במחקר מבוקר אקראי
פנקייק עם חמאת בטנים לתינוק הקטן
על קווים מנחים:
הרחבות על מטא אנליזה:
והכדור ברשת- network meta analysis
סיפור ארוך (על long covid)
הדבר היחיד שנעשה ב 2023 (מאמר מבוקר אקראי על tirzepatide)
על רגרסיית קוקס ופתיחת סתימות בצנרת
סדרה חדשה (על תיאור התחלואה באבעבועות הקוף)
כשהעשירים מתחרים בעלייה (על hazard ratio)
לקחת סטטין עם קצפת- על פיצוי הסיכון
לעצור באמצע הכביש- הפסקה מוקדמת של מחקרים
הזמן בו אף אחד לא מת (על immortality bias)
הקשר בין זהום EBV לטרשת נפוצה (עם ד"ר אייל רוזנברג)
ארבעה מי יודע? על המנה הרביעית בחיסון הקורונה
מה, זה לא עזר? על איברמקטין ומחקרים שליליים
בלי רגשי נחיתות- non inferiority trials
מבוא לסטטיסטיקה:
קאוביים, אינדיאנים ומבחנים סטטיסטיים
לבחור סטנדאפ ביוטיוב- על התפלגות הדגימה, הסקה סטטיסטית ואסטמה
מה נשתנה? סוגי משתנים וטיפול באסטמה בילדים
אין לתאר במלים- על סטטיסטיקה תיאורית
כח המשימה האמריקאי יוצא לחפש (60)
מה זה בכלל "ראיות"? פרק פילוסופי עם ארנון קרן
מהיר ועצבני (איך לקרוא במהירות מאמר רפואי)
יעקב ועשיו- מולנופיראויר לטיפול בקורונה
חופשי ומאושר- על אישור החירום לפקסלוביד
האם תסכימי לענות על כמה שאלות?
קוביד 19 בן שנתיים- וסוגי מחקרים
הפעם זה עקרוני- על אתיקה ורפואה נתמכת ראיות
כשאת הכל שומעים דרך הסטטוסקופ- על מדיקליזציה
קדימה להזדרז- arrive והמומחיות הקלינית
מחקר חיסון בני 5-11-ג'- יעילות ואימונוגניות
מחקר חיסון בני 5-11- ב'- בטיחות החיסון
מחקר חיסון בני 5-11 א'- המחקר ולמה כדאי לפרום אותו
שאלה טובה (איך לנסח שאלה קלינית ממוקדת)
מאמרים תצפיתיים:
תקפות מאמר המשתמש ברגרסיה לוגיסטית
פרדוקס סימפסון- וכמה מבין החולים קשה מחוסנים
קפלן- מאייר והמסע לקוטב הדרומי
תופעות הלואי של חיסון הקורונה בישראל- ומחקרי קוהורט (30)
Odds ratio- יחס גורר יחס ושחיקת ברכיים
וירוסים ותדירות יחסי מין- מבוא למחקרים תצפיתיים
דיוק בדיקת אנטיגן מהירה לאבחון קורונה
לא תמיד הגדולים חכמים יותר- real world ו- big data
בטיחות חיסון קורונה במתבגרים ולהעיף את הסטטיסטיקה מטבלה 1 (20)
בלשים נגד גנבים והסקה סטטיסטית
שרלוק הולמס, מי מלח, וטבלה מס' 1
הפרקים הראשונים: עקרונות בסיס, ניתוח מאמרי RCT וניתוח מאמרים על בדיקה אבחנתית
הציוצים של טראמפ, סוגי מחקרים ופירמידת המידע
פרדוקס הצנחן ואיך להבין תוצאות מחקר על טיפול
רווח בר סמך, תל אביבים שלא יוצאים מהעיר ושבץ אחורי
כבר לא ספר בישול- האם מאמר טיפול רלוונטי למטופל מסויים
תוצאות בדיקה אבחנתית- הדרך המדויקת יותר
תוצאות מאמר על בדיקה אבחנתית- הדרך הקלה
תקפות מאמר על בדיקה אבחנתית- מיפוי לאבחון מחלת פרקינסון (10)
פרק רגיש וספציפי- מושגים להבנת בדיקה אבחנתית
תווי האיכות הנוספים של מאמר מבוקר אקראי
על העיוורון- סמיות במחקרים מבוקרים
מבוא למאמר מבוקר אקראי- דקסמתזון למאושפזים עם קוביד 19
למה עדיין כדאי להבין רפואה נתמכת ראיות
אפשר גם לחפש לפי נושאים באתר הפודקאסט: ebm.podbean.com
לקבלת פרקים נוספים ניתן להירשם דרך אתר הפודקאסט, ספוטיפיי, אפל מיוזיק ואפליקציות פודקאסטים נוספות.
תודה שהאזנתם!
קישורים למאה הפרקים הראשונים, החל מהפרק הטרי ביותר עד הפרק הראשון, ובפרק אני מדבר על הפודקאסט עצמו ועל קורסים קטנים שמתחבאים בתוכו.
פרק 100 (...)
למה מחקר הקולונוסקופיה יצא שלילי
קולונוסקופיה במחקר מבוקר אקראי
פנקייק עם חמאת בטנים לתינוק הקטן
על קווים מנחים:
הרחבות על מטא אנליזה:
והכדור ברשת- network meta analysis
סיפור ארוך (על long covid)
הדבר היחיד שנעשה ב 2023 (מאמר מבוקר אקראי על tirzepatide)
על רגרסיית קוקס ופתיחת סתימות בצנרת
סדרה חדשה (על תיאור התחלואה באבעבועות הקוף)
כשהעשירים מתחרים בעלייה (על hazard ratio)
לקחת סטטין עם קצפת- על פיצוי הסיכון
לעצור באמצע הכביש- הפסקה מוקדמת של מחקרים
הזמן בו אף אחד לא מת (על immortality bias)
הקשר בין זהום EBV לטרשת נפוצה (עם ד"ר אייל רוזנברג)
ארבעה מי יודע? על המנה הרביעית בחיסון הקורונה
מה, זה לא עזר? על איברמקטין ומחקרים שליליים
בלי רגשי נחיתות- non inferiority trials
מבוא לסטטיסטיקה:
קאוביים, אינדיאנים ומבחנים סטטיסטיים
לבחור סטנדאפ ביוטיוב- על התפלגות הדגימה, הסקה סטטיסטית ואסטמה
מה נשתנה? סוגי משתנים וטיפול באסטמה בילדים
אין לתאר במלים- על סטטיסטיקה תיאורית
כח המשימה האמריקאי יוצא לחפש (60)
מה זה בכלל "ראיות"? פרק פילוסופי עם ארנון קרן
מהיר ועצבני (איך לקרוא במהירות מאמר רפואי)
יעקב ועשיו- מולנופיראויר לטיפול בקורונה
חופשי ומאושר- על אישור החירום לפקסלוביד
האם תסכימי לענות על כמה שאלות?
קוביד 19 בן שנתיים- וסוגי מחקרים
הפעם זה עקרוני- על אתיקה ורפואה נתמכת ראיות
כשאת הכל שומעים דרך הסטטוסקופ- על מדיקליזציה
קדימה להזדרז- arrive והמומחיות הקלינית
מחקר חיסון בני 5-11-ג'- יעילות ואימונוגניות
מחקר חיסון בני 5-11- ב'- בטיחות החיסון
מחקר חיסון בני 5-11 א'- המחקר ולמה כדאי לפרום אותו
שאלה טובה (איך לנסח שאלה קלינית ממוקדת)
מאמרים תצפיתיים:
תקפות מאמר המשתמש ברגרסיה לוגיסטית
פרדוקס סימפסון- וכמה מבין החולים קשה מחוסנים
קפלן- מאייר והמסע לקוטב הדרומי
תופעות הלואי של חיסון הקורונה בישראל- ומחקרי קוהורט (30)
Odds ratio- יחס גורר יחס ושחיקת ברכיים
וירוסים ותדירות יחסי מין- מבוא למחקרים תצפיתיים
דיוק בדיקת אנטיגן מהירה לאבחון קורונה
לא תמיד הגדולים חכמים יותר- real world ו- big data
בטיחות חיסון קורונה במתבגרים ולהעיף את הסטטיסטיקה מטבלה 1 (20)
בלשים נגד גנבים והסקה סטטיסטית
שרלוק הולמס, מי מלח, וטבלה מס' 1
הפרקים הראשונים: עקרונות בסיס, ניתוח מאמרי RCT וניתוח מאמרים על בדיקה אבחנתית
הציוצים של טראמפ, סוגי מחקרים ופירמידת המידע
פרדוקס הצנחן ואיך להבין תוצאות מחקר על טיפול
רווח בר סמך, תל אביבים שלא יוצאים מהעיר ושבץ אחורי
כבר לא ספר בישול- האם מאמר טיפול רלוונטי למטופל מסויים
תוצאות בדיקה אבחנתית- הדרך המדויקת יותר
תוצאות מאמר על בדיקה אבחנתית- הדרך הקלה
תקפות מאמר על בדיקה אבחנתית- מיפוי לאבחון מחלת פרקינסון (10)
פרק רגיש וספציפי- מושגים להבנת בדיקה אבחנתית
תווי האיכות הנוספים של מאמר מבוקר אקראי
על העיוורון- סמיות במחקרים מבוקרים
מבוא למאמר מבוקר אקראי- דקסמתזון למאושפזים עם קוביד 19
למה עדיין כדאי להבין רפואה נתמכת ראיות
אפשר גם לחפש לפי נושאים באתר הפודקאסט: ebm.podbean.com
לקבלת פרקים נוספים ניתן להירשם דרך אתר הפודקאסט, ספוטיפיי, אפל מיוזיק ואפליקציות פודקאסטים נוספות.
תודה שהאזנתם!
הפעם אציג מאמר שהשתתפתי בכתיבתו ושהתפרסם לאחרונה. שמש אמורה להגביר ייצור ויטמין די, ובכך, לפחות תיאורטית, לתרום לבריאות העצם. המחקר שלנו בדק האם באוכלוסיה החרדית בישראל, שבשל סיבות תרבותיות נחשפת פחות לשמש, קצב הופעת השברים האוסטאופורוטיים גבוה יותר. המחקר נשען על בסיס נתונים ענק, המדגם היה גדול מאוד, בוצע תקנון לערפלנים מרובים, והתוצאות של המחקר מפתיעות, אך המחקר (כמו כל מחקר תצפיתי שמבוסס על בסיס נתונים) סובל מהבעיות הצפויות: חלוקה לא מדויקת לקבוצות, תקנון לא מלא (עם residual confounding) ומדידה לא מדויקת שמבוססת על נתונים מהתיק הממוחשב בלבד.
---
Risk of major osteoporotic fractures among ultra-orthodox Jews
הפעם אציג מאמר שהשתתפתי בכתיבתו ושהתפרסם לאחרונה. שמש אמורה להגביר ייצור ויטמין די, ובכך, לפחות תיאורטית, לתרום לבריאות העצם. המחקר שלנו בדק האם באוכלוסיה החרדית בישראל, שבשל סיבות תרבותיות נחשפת פחות לשמש, קצב הופעת השברים האוסטאופורוטיים גבוה יותר. המחקר נשען על בסיס נתונים ענק, המדגם היה גדול מאוד, בוצע תקנון לערפלנים מרובים, והתוצאות של המחקר מפתיעות, אך המחקר (כמו כל מחקר תצפיתי שמבוסס על בסיס נתונים) סובל מהבעיות הצפויות: חלוקה לא מדויקת לקבוצות, תקנון לא מלא (עם residual confounding) ומדידה לא מדויקת שמבוססת על נתונים מהתיק הממוחשב בלבד.
---
Risk of major osteoporotic fractures among ultra-orthodox Jews
בנשים שעישנו בתחילת הריון, התערבות פשוטה העלתה את הסבירות להפסיק לעשן פי שניים וחצי לפחות. נדבר גם על ההתערבות הזו וגם על משמעות "בדיקת הזהב"- ה gold standard.
בדיקת הזהב היא הדרך המדויקת ביותר להחליט האם קיימת מחלה כלשהי, אך נגלה שלמרות ההגדרה הפשוטה, החיים לעתים מסובכים יותר.
---
Overview of Cotinine Cutoff Values for Smoking Status Classification
מהו סף רמת הקוטינין לאבחון עישון? אין אחידות בספרות
בנשים שעישנו בתחילת הריון, התערבות פשוטה העלתה את הסבירות להפסיק לעשן פי שניים וחצי לפחות. נדבר גם על ההתערבות הזו וגם על משמעות "בדיקת הזהב"- ה gold standard.
בדיקת הזהב היא הדרך המדויקת ביותר להחליט האם קיימת מחלה כלשהי, אך נגלה שלמרות ההגדרה הפשוטה, החיים לעתים מסובכים יותר.
---
Overview of Cotinine Cutoff Values for Smoking Status Classification
מהו סף רמת הקוטינין לאבחון עישון? אין אחידות בספרות
מחקר תצפיתי ללא הקצאה אקראית גייס תינוקות שזה עתה נולדו, ובדק קשר בין התזונה בחודשיים הראשונים לבין התפתחות אלרגיה לחלב פרה.
קבוצה אחת הייתה התינוקות לאימהות שתכננו לתת תזונה מבוססת חלב אם בלבד, והקבוצה השנייה תינוקות לאימהות שתכננו לתת תזונה הכוללת (גם או רק) פורמולה מחלב פרה.
התוצא העיקרי שנבדק היה הופעת אלרגיה לחלב פרה , מתווכת IgE ומוכחת במבחן אובייקטיבי במרפאה, עד גיל שנה.
לא ניגע בכל הנקודות האפשריות, אך ננסה לתאר את המחקר ואת השיטות ולספר גם על התוצאות הדרמטיות וגם על מקורות אפשריים להטיות בחירה, טיפול ומדידה.
---
Early, Continuing Exposure to Cow's Milk Formula and Cow's Milk Allergy: The COMEET study
מחקר תצפיתי ללא הקצאה אקראית גייס תינוקות שזה עתה נולדו, ובדק קשר בין התזונה בחודשיים הראשונים לבין התפתחות אלרגיה לחלב פרה.
קבוצה אחת הייתה התינוקות לאימהות שתכננו לתת תזונה מבוססת חלב אם בלבד, והקבוצה השנייה תינוקות לאימהות שתכננו לתת תזונה הכוללת (גם או רק) פורמולה מחלב פרה.
התוצא העיקרי שנבדק היה הופעת אלרגיה לחלב פרה , מתווכת IgE ומוכחת במבחן אובייקטיבי במרפאה, עד גיל שנה.
לא ניגע בכל הנקודות האפשריות, אך ננסה לתאר את המחקר ואת השיטות ולספר גם על התוצאות הדרמטיות וגם על מקורות אפשריים להטיות בחירה, טיפול ומדידה.
---
Early, Continuing Exposure to Cow's Milk Formula and Cow's Milk Allergy: The COMEET study
הפרק מספר על הקולונוסקופיה הוירטואלית ולמה לא הופיעה בפרקים הקודמים. יש שני סוגי מחקרים שאפשר לחקור בהם בדיקה אבחנתית: מחקר מסוג אחד, על דיוק (רגישות למשל), בו קבוצה אחת מבצעת שתי בדיקות, ללא רנדומיזציה, ומבוצעת השוואה בין שתי הבדיקות, ומחקר מסוג שני, על תועלת: מחקר מבוקר אקראי.
בדרך כלל, כדי להשתמש בבדיקת סקירה בשימוש נרחב, נרצה לראות גם עדויות לתועלת, ולכן מחקר על דיוק הבדיקה האבחנתית לא יספיק.
---
מחקר על דיוק של "קולונוסקופיה וירטואלית" (קולונוגרפיה) לאבחון פוליפים וסרטן במעי הגס
Accuracy of CT Colonography for Detection of Large Adenomas and Cancers
מחקר על תועלת של "צנטור וירטואלי" (CT אנגיוגרפיה) במטופלים עם כאב חזה יציב
המלצות כח המשימה האמריקאי מ 2021 לסקירה לגילוי מוקדם של סרטן המעי הגס
מאמר עם ההמלצות המפורטות של כח המשימה
רשימת הבדיקות האפשריות ומרווח הזמן המומלץ בין בדיקות (מתוך אתר כח המשימה האמריקאי)
הפרק מספר על הקולונוסקופיה הוירטואלית ולמה לא הופיעה בפרקים הקודמים. יש שני סוגי מחקרים שאפשר לחקור בהם בדיקה אבחנתית: מחקר מסוג אחד, על דיוק (רגישות למשל), בו קבוצה אחת מבצעת שתי בדיקות, ללא רנדומיזציה, ומבוצעת השוואה בין שתי הבדיקות, ומחקר מסוג שני, על תועלת: מחקר מבוקר אקראי.
בדרך כלל, כדי להשתמש בבדיקת סקירה בשימוש נרחב, נרצה לראות גם עדויות לתועלת, ולכן מחקר על דיוק הבדיקה האבחנתית לא יספיק.
---
מחקר על דיוק של "קולונוסקופיה וירטואלית" (קולונוגרפיה) לאבחון פוליפים וסרטן במעי הגס
Accuracy of CT Colonography for Detection of Large Adenomas and Cancers
מחקר על תועלת של "צנטור וירטואלי" (CT אנגיוגרפיה) במטופלים עם כאב חזה יציב
המלצות כח המשימה האמריקאי מ 2021 לסקירה לגילוי מוקדם של סרטן המעי הגס
מאמר עם ההמלצות המפורטות של כח המשימה
רשימת הבדיקות האפשריות ומרווח הזמן המומלץ בין בדיקות (מתוך אתר כח המשימה האמריקאי)
כמו שסיפרנו בפרק עבר ("על איברמקטין ומחקרים שליליים") יש כמה דברים שצריך לשים לב אליהם במחקר עם תוצאות שליליות (לא מובהקות): ביאס לטובת קבוצת הבקרה, מהילה של האפקט (ולצורך כך כדאי לראות גם ניתוח לפי פרוטוקול) ועוצמה לא מספיקה. נראה שבשלושת התחומים האלו יש למחקר הקולונוסקופיה חסרונות משמעותיים. בנוסף, ייתכן שזמן המעקב לא היה ארוך מספיק- נקודה קריטית במחקרים על בדיקות סקירה.
---
זימון לקולונוסקופיה לעומת העדר זימון- מחקר מבוקר אקראי, NEJM 10/2022
מטא אנליזה מ JAMA 2016 : סקירה לסרטן המעי הגס ויעילות בדיקת דם סמוי בצואה או סיגמואידוסקופיה להפחתת התמותה מסרטן המעי הגס.
כמו שסיפרנו בפרק עבר ("על איברמקטין ומחקרים שליליים") יש כמה דברים שצריך לשים לב אליהם במחקר עם תוצאות שליליות (לא מובהקות): ביאס לטובת קבוצת הבקרה, מהילה של האפקט (ולצורך כך כדאי לראות גם ניתוח לפי פרוטוקול) ועוצמה לא מספיקה. נראה שבשלושת התחומים האלו יש למחקר הקולונוסקופיה חסרונות משמעותיים. בנוסף, ייתכן שזמן המעקב לא היה ארוך מספיק- נקודה קריטית במחקרים על בדיקות סקירה.
---
זימון לקולונוסקופיה לעומת העדר זימון- מחקר מבוקר אקראי, NEJM 10/2022
מטא אנליזה מ JAMA 2016 : סקירה לסרטן המעי הגס ויעילות בדיקת דם סמוי בצואה או סיגמואידוסקופיה להפחתת התמותה מסרטן המעי הגס.
מחקר מבוקר אקראי בדק מהי התועלת בזימון לקולונוסקופיה (אל מול העדר זימון) במדגם של כ 85 אלף אירופאים ותוצאותיו בינתיים- מאכזבות.
המדגם כלל אנשים בני 55-64, והמעקב נמשך עשר שנים. כ- 30 אלף זומנו לקולונוסקופיה, השאר השתייכו לקבוצת הבקר, והניתוח היה לפי הכוונה לבצע סקירה (intention to screen). התוצאים העיקריים שנבדקו היו שיעור מצטבר של חולים עם סרטן המעי הגס, ושיעור התמותה מסרטן המעי הגס בכל אחת מהקבוצות. חישוב האחוזים בוצע לפי עקומת קפלן- מאייר. לא הייתה סמיות, ובמאמר העיקרי לא הוצגו נתונים המאפשרים להשוות בין הקבוצות בבסיס.
בנוסף, בוצעה רגרסיה לוגיסטית על מדגם המחקר כדי להעריך השפעת ביצוע הבדיקה עם תקנון לגיל, מין, ארץ מגורים ומשך המעקב.
היה שיעור גדול של אבחון אדנומות אך מעט מקרי סרטן (62 איש) שהתגלו בקולונוסקופיית הסקירה. שיעור אבחנת הסרטן היה גבוה יותר בקבוצת ההתערבות בשש השנים הראשונות, אך לאחר עשר שנים היה נמוך יותר בקבוצה זו- 0.98% עם אבחנה של סרטן המעי הגס, לעומת 1.2% בקבוצת הבקרה (RR=0.82). לאחר עשר שנות מעקב לא נמצא הבדל מובהק בשיעור התמותה מסרטן המעי הגס (RR=0.9, לא מובהק).
ברגרסיה הלוגיסטית (שם הרנדומיזציה לא באה לידי ביטוי) התקבלו ממצאים מעודדים יותר לגבי יעילות הבדיקה בשיעור מצטבר של המחלה (RR=0.69) ובהפחתת תמותה (RR=0.5) מסרטן המעי.
בפרק הבא ננסה להסביר את התוצאות השליליות של המחקר, ובפרק שאחריו נדבר גם על קולונוגרפיה, וננסה להגיע למסקנות מעשיות.
---
Effect of Colonoscopy Screening on Risks of Colorectal Cancer and Related Death
מטא אנליזה מ 2016 JAMA : יעילות בדיקת דם סמוי בצואה או סיגמואידוסקופיה להפחתת התמותה מסרטן המעי הגס.
מחקר מבוקר אקראי בדק מהי התועלת בזימון לקולונוסקופיה (אל מול העדר זימון) במדגם של כ 85 אלף אירופאים ותוצאותיו בינתיים- מאכזבות.
המדגם כלל אנשים בני 55-64, והמעקב נמשך עשר שנים. כ- 30 אלף זומנו לקולונוסקופיה, השאר השתייכו לקבוצת הבקר, והניתוח היה לפי הכוונה לבצע סקירה (intention to screen). התוצאים העיקריים שנבדקו היו שיעור מצטבר של חולים עם סרטן המעי הגס, ושיעור התמותה מסרטן המעי הגס בכל אחת מהקבוצות. חישוב האחוזים בוצע לפי עקומת קפלן- מאייר. לא הייתה סמיות, ובמאמר העיקרי לא הוצגו נתונים המאפשרים להשוות בין הקבוצות בבסיס.
בנוסף, בוצעה רגרסיה לוגיסטית על מדגם המחקר כדי להעריך השפעת ביצוע הבדיקה עם תקנון לגיל, מין, ארץ מגורים ומשך המעקב.
היה שיעור גדול של אבחון אדנומות אך מעט מקרי סרטן (62 איש) שהתגלו בקולונוסקופיית הסקירה. שיעור אבחנת הסרטן היה גבוה יותר בקבוצת ההתערבות בשש השנים הראשונות, אך לאחר עשר שנים היה נמוך יותר בקבוצה זו- 0.98% עם אבחנה של סרטן המעי הגס, לעומת 1.2% בקבוצת הבקרה (RR=0.82). לאחר עשר שנות מעקב לא נמצא הבדל מובהק בשיעור התמותה מסרטן המעי הגס (RR=0.9, לא מובהק).
ברגרסיה הלוגיסטית (שם הרנדומיזציה לא באה לידי ביטוי) התקבלו ממצאים מעודדים יותר לגבי יעילות הבדיקה בשיעור מצטבר של המחלה (RR=0.69) ובהפחתת תמותה (RR=0.5) מסרטן המעי.
בפרק הבא ננסה להסביר את התוצאות השליליות של המחקר, ובפרק שאחריו נדבר גם על קולונוגרפיה, וננסה להגיע למסקנות מעשיות.
---
Effect of Colonoscopy Screening on Risks of Colorectal Cancer and Related Death
מטא אנליזה מ 2016 JAMA : יעילות בדיקת דם סמוי בצואה או סיגמואידוסקופיה להפחתת התמותה מסרטן המעי הגס.
מחקר סקנדינבי עם רנדומיזציה בצברים (קלאסטרים) הראה שהכנסת מזונות אלרגנים (בטנים, חלב פרה, דייסת חיטה וביצה) לתזונת תינוקות בין גיל שלושה לארבעה חודשים מפחיתה אלרגיה למזון בגיל שלוש שנים. במחקר בוצעה רנדומיזצייה פקטוריאלית: בדיקת יותר מהתערבות אחת במקביל- ההתערבות השנייה הייתה מריחת קרם לחות.
---
קישור למאמר:
מחקר סקנדינבי עם רנדומיזציה בצברים (קלאסטרים) הראה שהכנסת מזונות אלרגנים (בטנים, חלב פרה, דייסת חיטה וביצה) לתזונת תינוקות בין גיל שלושה לארבעה חודשים מפחיתה אלרגיה למזון בגיל שלוש שנים. במחקר בוצעה רנדומיזצייה פקטוריאלית: בדיקת יותר מהתערבות אחת במקביל- ההתערבות השנייה הייתה מריחת קרם לחות.
---
קישור למאמר:
פרק שלישי העוסק בקווים מנחים, הפעם על GRADE
Grading of Recommendations Assessment, Development and Evaluation
זו שיטה בכתיבת קווים מנחים המתבצעת בשני שלבים: הערכת חוזק הראיות ולאחר מכן קביעת חוזק ההמלצה.
חוזק הראיות נקבע על ידי מספר גורמים: תקפות המחקרים, הדיוק שלהם (הסיכוי לטעות מדגם), ההומוגניות בין המחקרים השונים, קשר ישיר בין הממצאים לבין השאלה הקלינית (directness), והעדר הטיית פרסום.
חוזק ההמלצה תלוי כמובן בחוזק הראיות אך גם בשיקולי תועלת מול נזק, דעת המטופלים (דורש מעורבות של מטופלים בתהליך כתיבת הקווים המנחים!), ושיקולי פרקטיות ושוויון.
חוזק הראיות מוצג בסולם של ארבע דרגות, מ very low עד high , וחוזק ההמלצות- בסולם של שתי דרגות: המלצה חזקה או המלצה חלשה.
---
סיכום קצר של שיטת ה GRADE
קווים מנחים למדיניות בתי ספר וגנים למניעה וטיפול באלרגיות למזון, Journal of Allergy and Clinical Immunology 2021
סיכום מפורט של שיטת ה GRADE
פירוט השיטה לעומק בשני מאמרים (BMJ 2016):
פרק שלישי העוסק בקווים מנחים, הפעם על GRADE
Grading of Recommendations Assessment, Development and Evaluation
זו שיטה בכתיבת קווים מנחים המתבצעת בשני שלבים: הערכת חוזק הראיות ולאחר מכן קביעת חוזק ההמלצה.
חוזק הראיות נקבע על ידי מספר גורמים: תקפות המחקרים, הדיוק שלהם (הסיכוי לטעות מדגם), ההומוגניות בין המחקרים השונים, קשר ישיר בין הממצאים לבין השאלה הקלינית (directness), והעדר הטיית פרסום.
חוזק ההמלצה תלוי כמובן בחוזק הראיות אך גם בשיקולי תועלת מול נזק, דעת המטופלים (דורש מעורבות של מטופלים בתהליך כתיבת הקווים המנחים!), ושיקולי פרקטיות ושוויון.
חוזק הראיות מוצג בסולם של ארבע דרגות, מ very low עד high , וחוזק ההמלצות- בסולם של שתי דרגות: המלצה חזקה או המלצה חלשה.
---
סיכום קצר של שיטת ה GRADE
קווים מנחים למדיניות בתי ספר וגנים למניעה וטיפול באלרגיות למזון, Journal of Allergy and Clinical Immunology 2021
סיכום מפורט של שיטת ה GRADE
פירוט השיטה לעומק בשני מאמרים (BMJ 2016):
מדוע חשוב שלא תמיד נלך לפי הקווים המנחים? הקווים המנחים אמורים להיות רלוונטיים לרוב המטופלים במצב קליני מסוים, אך תמיד יהיו גם מטופלים יוצאי דופן – במטופלים אלו יש סיבה לפעול אחרת- סיבה קלינית, רגשית, כלכלית, או שקשורה לערכים ולציפיות של המטופל. באופן כללי כאשר קווים מנחים טובים נותנים המלצה חזקה, רצוי שבדרך כלל המטופל יקבל מהקלינאי.ת המלצה זו. כאשר ההמלצה חלשה, חובה לחשוב היטב, להבין את הנימוקים בעד ונגד ההמלצה אצל המטופל הספציפי, ולשתף אותו בהחלטה. דרך פעולה אחרת, למשל ציות קבוע לקווים מנחים, לא רק שהופכת את הרפואה לפחות מעניינת, אלא עלולה לגרום נזק רב למטופלים
מדוע חשוב שלא תמיד נלך לפי הקווים המנחים? הקווים המנחים אמורים להיות רלוונטיים לרוב המטופלים במצב קליני מסוים, אך תמיד יהיו גם מטופלים יוצאי דופן – במטופלים אלו יש סיבה לפעול אחרת- סיבה קלינית, רגשית, כלכלית, או שקשורה לערכים ולציפיות של המטופל. באופן כללי כאשר קווים מנחים טובים נותנים המלצה חזקה, רצוי שבדרך כלל המטופל יקבל מהקלינאי.ת המלצה זו. כאשר ההמלצה חלשה, חובה לחשוב היטב, להבין את הנימוקים בעד ונגד ההמלצה אצל המטופל הספציפי, ולשתף אותו בהחלטה. דרך פעולה אחרת, למשל ציות קבוע לקווים מנחים, לא רק שהופכת את הרפואה לפחות מעניינת, אלא עלולה לגרום נזק רב למטופלים
על קווים מנחים ועל אלרגיה למזון בתינוקות. רוב הקלינאים לא הולכים וסוקרים את הספרות בעצמם, אלא קוראים ומיישמים המלצות של קווים מנחים. לקראת הצגה של מחקר חשוב שהולך לשנות את ההמלצות לתזונת תינוקות, נתחיל לדבר על אלרגיה למזון ודרכים למניעתה, וניתן דוגמה של כמה הנחיות שונות בנושא. נדבר על מה נדרש מהנחיות כדי שנוכל לסמוך עליהן: תהליך ברור, שאלות בהירות, איסוף ראיות שיטתי, הערכת ראיות שקופה, המלצות שקופות, והפחתת ניגוד אינטרסים
---
מאמרים שהוזכרו בפרק
כלי מפורט מאוד להערכת איכות של קווים מנחים, לפי ששה קריטריונים עיקריי שיטת פיתוח, מעורבות בעלי העניין, בהירות ההצגה, ישימות, ונטרול ניגוד עניינים
קווים מנחים שונים לגבי מניעת אלרגיה למזון, וספציפית לבוטנים
NIAID, 2016
הנחיה לתזונת תינוקות באתר משרד הבריאות- נצפה ב - 9/5/2022
AAAAI, 2022
על קווים מנחים ועל אלרגיה למזון בתינוקות. רוב הקלינאים לא הולכים וסוקרים את הספרות בעצמם, אלא קוראים ומיישמים המלצות של קווים מנחים. לקראת הצגה של מחקר חשוב שהולך לשנות את ההמלצות לתזונת תינוקות, נתחיל לדבר על אלרגיה למזון ודרכים למניעתה, וניתן דוגמה של כמה הנחיות שונות בנושא. נדבר על מה נדרש מהנחיות כדי שנוכל לסמוך עליהן: תהליך ברור, שאלות בהירות, איסוף ראיות שיטתי, הערכת ראיות שקופה, המלצות שקופות, והפחתת ניגוד אינטרסים
---
מאמרים שהוזכרו בפרק
כלי מפורט מאוד להערכת איכות של קווים מנחים, לפי ששה קריטריונים עיקריי שיטת פיתוח, מעורבות בעלי העניין, בהירות ההצגה, ישימות, ונטרול ניגוד עניינים
קווים מנחים שונים לגבי מניעת אלרגיה למזון, וספציפית לבוטנים
NIAID, 2016
הנחיה לתזונת תינוקות באתר משרד הבריאות- נצפה ב - 9/5/2022
AAAAI, 2022
בשני הפרקים הקודמים הצגנו את הבעיה וראינו גם דרך להדגים אותה בפועל בעזרת גרף המשפך, והפעם נספר על אחד ההישגים הגדולים של תנועת רפואה נתמכת ראיות- מרשם המחקרים.
---
מרשם המחקרים העולמי- ClinicalTrials
בשני הפרקים הקודמים הצגנו את הבעיה וראינו גם דרך להדגים אותה בפועל בעזרת גרף המשפך, והפעם נספר על אחד ההישגים הגדולים של תנועת רפואה נתמכת ראיות- מרשם המחקרים.
---
מרשם המחקרים העולמי- ClinicalTrials
גרף משפך הוא קסם: מאפשר להעריך האם ישנם מחקרים שמעולם לא פורסמו או שלא נמצאו כלל במטא אנליזה, זאת אומרת מצליח לראות את הנסתר. השיטה היא זיהוי הבדל בין הפיזור הצפוי של תוצאות מחקרים לבין הפיזור בפועל.
---
אומגה 3 לטיפול בדיכאון- מטא אנליזה עם גרף משפך. שימו לב לשני המחקרים החורגים שמאלה מהמשולש, אך בכל זאת, סך הכל מדובר בגרף די סימטרי, ולכן לא מעיד על הטיית פרסום.
גרף משפך הוא קסם: מאפשר להעריך האם ישנם מחקרים שמעולם לא פורסמו או שלא נמצאו כלל במטא אנליזה, זאת אומרת מצליח לראות את הנסתר. השיטה היא זיהוי הבדל בין הפיזור הצפוי של תוצאות מחקרים לבין הפיזור בפועל.
---
אומגה 3 לטיפול בדיכאון- מטא אנליזה עם גרף משפך. שימו לב לשני המחקרים החורגים שמאלה מהמשולש, אך בכל זאת, סך הכל מדובר בגרף די סימטרי, ולכן לא מעיד על הטיית פרסום.
מחקרים שמראים תוצאות שליליות, או תוצאות לא מרשימות מתפרסמים פחות. התופעה הזו נקראת "הטיית פרסום", וכאשר קיימת היא תוביל אותנו לתפיסה שגויה של תופעות רפואיות- ביניהן תפיסה שטיפול יעיל כאשר היעילות האמיתית שלו פחותה או לא קיימת. נספר על הסיבות המרובות להטיה זו, המופיעה אפילו בסקירות שיטתיות ומטא-אנליזות.
מחקרים שמראים תוצאות שליליות, או תוצאות לא מרשימות מתפרסמים פחות. התופעה הזו נקראת "הטיית פרסום", וכאשר קיימת היא תוביל אותנו לתפיסה שגויה של תופעות רפואיות- ביניהן תפיסה שטיפול יעיל כאשר היעילות האמיתית שלו פחותה או לא קיימת. נספר על הסיבות המרובות להטיה זו, המופיעה אפילו בסקירות שיטתיות ומטא-אנליזות.
כשיש אפשרויות טיפול שונות לאותו מצב רפואי, וכשלא כל הטיפולים הושוו ישירות אחד לשני במחקרים מבוקרים, תבוצע מטא אנליזה רשתית. זו שיטה סטטיסטית המאפשרת להשוות בצורה לא ישירה בין שני טיפולים ויותר. כדי שמחקר מסוג זה יהיה תקיף צריך שני תנאים: transitivity - העדר שוני באפקט התרופה הבודדת בין שני מחקרים שונים, ו-consistency- התאמה בין האפקט הישיר לאפקט המחושב העקיף.
מאמר על טיפול תרופתי באוסטאופורוזיס השווה בין התרופות המרובות לבעיה זו. מטא אנליזה רשתית, למרות שמה המפוצץ, לא מבוססת על רנדומיזציה אמיתית, לכן תהיה לרוב תקפה פחות ממחקר מבוקר אקראי טוב וגדול.
---
מידע וטבלאות נוספות עבור המאמר
Denosumab in Postmenopausal Women with Low Bone Mineral Density
מחקר ( NEJM 2006) שהשווה ישירות בין דנוסומאב לאלנדרונט
Pharmacological Management of Osteoporosis in Postmenopausal Women Guideline Resources
כשיש אפשרויות טיפול שונות לאותו מצב רפואי, וכשלא כל הטיפולים הושוו ישירות אחד לשני במחקרים מבוקרים, תבוצע מטא אנליזה רשתית. זו שיטה סטטיסטית המאפשרת להשוות בצורה לא ישירה בין שני טיפולים ויותר. כדי שמחקר מסוג זה יהיה תקיף צריך שני תנאים: transitivity - העדר שוני באפקט התרופה הבודדת בין שני מחקרים שונים, ו-consistency- התאמה בין האפקט הישיר לאפקט המחושב העקיף.
מאמר על טיפול תרופתי באוסטאופורוזיס השווה בין התרופות המרובות לבעיה זו. מטא אנליזה רשתית, למרות שמה המפוצץ, לא מבוססת על רנדומיזציה אמיתית, לכן תהיה לרוב תקפה פחות ממחקר מבוקר אקראי טוב וגדול.
---
מידע וטבלאות נוספות עבור המאמר
Denosumab in Postmenopausal Women with Low Bone Mineral Density
מחקר ( NEJM 2006) שהשווה ישירות בין דנוסומאב לאלנדרונט
Pharmacological Management of Osteoporosis in Postmenopausal Women Guideline Resources
מחקר הולנדי מרשים (שהרשים גם את עורכי הלאנסט באוגוסט 2022) מתאר לראשונה במחקר משווה את הלונג-קוביד.
המחקר כלל כאלפיים אנשים שנדבקו בקוביד ותיעדו בעזרת שאלונים תסמינים בין שלושה חודשים לחמישה חודשים לאחר ההדבקות, עם השוואה לאנשים שלא נדבקו בהתאמה למין ולגיל. נדבר על המונח attributable risk, שהוא למעשה ה Absolute risk reduction של מחקרי קוהורט, ונגלה שכאן היה מדובר ב-10%. זאת אומרת, בכ 10% מהאנשים שנדבקו, מספר חודשים לאחר הזיהום, יש לפחות תסמין אחד (בעצמה בינונית ומעלה) שניתן לייחס להידבקות עצמה ולא למקריות.
---
Persistence of somatic symptoms after COVID-19 in the Netherlands: an observational cohort study
מחקר הולנדי מרשים (שהרשים גם את עורכי הלאנסט באוגוסט 2022) מתאר לראשונה במחקר משווה את הלונג-קוביד.
המחקר כלל כאלפיים אנשים שנדבקו בקוביד ותיעדו בעזרת שאלונים תסמינים בין שלושה חודשים לחמישה חודשים לאחר ההדבקות, עם השוואה לאנשים שלא נדבקו בהתאמה למין ולגיל. נדבר על המונח attributable risk, שהוא למעשה ה Absolute risk reduction של מחקרי קוהורט, ונגלה שכאן היה מדובר ב-10%. זאת אומרת, בכ 10% מהאנשים שנדבקו, מספר חודשים לאחר הזיהום, יש לפחות תסמין אחד (בעצמה בינונית ומעלה) שניתן לייחס להידבקות עצמה ולא למקריות.
---
Persistence of somatic symptoms after COVID-19 in the Netherlands: an observational cohort study
זיהום בזן האומיקרון מסוכן הרבה פחות מזיהום בזן הדלתא... ביולי 2022 , ששה חודשים לאחר איסוף הנתונים, התפרסם ב BMJ מחקר שהראה (בדיעבד), שזיהום בזן האומיקרון היה מסוכן הרבה פחות מזיהום בזן הדלתא (לאחר תקנון למשתנים מרובים, HR=0.33). נדבר על המחקר ועל השיטה שלו (שיטה שהוצגה לא מזמן בפודקאסט, רגרסיית קוקס), ותוצע הצעה מהפכנית שיכולה לשנות את צורת המחקר והפרסומים הרפואיים בזמן מגפות (כמובן ההצעה היא למאזיני הפודקאסט בלבד. אין לי מחשבות גדלות בשלב זה)
---
זיהום בזן האומיקרון מסוכן הרבה פחות מזיהום בזן הדלתא... ביולי 2022 , ששה חודשים לאחר איסוף הנתונים, התפרסם ב BMJ מחקר שהראה (בדיעבד), שזיהום בזן האומיקרון היה מסוכן הרבה פחות מזיהום בזן הדלתא (לאחר תקנון למשתנים מרובים, HR=0.33). נדבר על המחקר ועל השיטה שלו (שיטה שהוצגה לא מזמן בפודקאסט, רגרסיית קוקס), ותוצע הצעה מהפכנית שיכולה לשנות את צורת המחקר והפרסומים הרפואיים בזמן מגפות (כמובן ההצעה היא למאזיני הפודקאסט בלבד. אין לי מחשבות גדלות בשלב זה)
---
הוא... לשוחח עם אנשים על "התרופה החדשה לירידה במשקל".
הסיבה היא מאמר שהתפרסם ביולי 2022 ב NEJM, ושתוצאותיו דרמטיות. טירזפטייד (אולי עדיף לכתוב תרזה פטייד) במינונים שונים גרם לירידה של 15-21% במשקל הגוף באנשים עם השמנה משמעותית, לעומת 3% ירידה במשקל הגוף בקבוצת הפלצבו.
"תרזה" היא תרופה חדשה שפועלת כאגוניסט לקולטנים של שני אינקרטינים שונים. במחקר גוייסו אנשים עם השמנה (BMI ממוצע 38) וללא סכרת, שני שליש מהם נשים, ובגיל 45 בממוצע. כ 2500 איש גויסו והוגרלו לארבע קבוצות: פלצבו, טירזפטייד 5 מ"ג בשבוע, 10 מ"ג או 15 מ"ג. התוצא העקרי חושב לפי המשקל לאחר 72 שבועות מעקב. איסוף הנתונים וניתוחם בוצעו על ידי חברת התרופות, וישנן מספר בעיות בשיטת המחקר- בעיה מובנית בסמיות, חשד קל לבעייה בהסתרת הרנדומיזציה, אך בעקר אובדן משמעותי ממעקב.
---
Tirzepatide Once Weekly for the Treatment of Obesity
https://www.nejm.org/doi/full/10.1056/NEJMoa2206038
אתר העדכונים הרפואיים Medicine matters
https://diabetes.medicinematters.com/
הוא... לשוחח עם אנשים על "התרופה החדשה לירידה במשקל".
הסיבה היא מאמר שהתפרסם ביולי 2022 ב NEJM, ושתוצאותיו דרמטיות. טירזפטייד (אולי עדיף לכתוב תרזה פטייד) במינונים שונים גרם לירידה של 15-21% במשקל הגוף באנשים עם השמנה משמעותית, לעומת 3% ירידה במשקל הגוף בקבוצת הפלצבו.
"תרזה" היא תרופה חדשה שפועלת כאגוניסט לקולטנים של שני אינקרטינים שונים. במחקר גוייסו אנשים עם השמנה (BMI ממוצע 38) וללא סכרת, שני שליש מהם נשים, ובגיל 45 בממוצע. כ 2500 איש גויסו והוגרלו לארבע קבוצות: פלצבו, טירזפטייד 5 מ"ג בשבוע, 10 מ"ג או 15 מ"ג. התוצא העקרי חושב לפי המשקל לאחר 72 שבועות מעקב. איסוף הנתונים וניתוחם בוצעו על ידי חברת התרופות, וישנן מספר בעיות בשיטת המחקר- בעיה מובנית בסמיות, חשד קל לבעייה בהסתרת הרנדומיזציה, אך בעקר אובדן משמעותי ממעקב.
---
Tirzepatide Once Weekly for the Treatment of Obesity
https://www.nejm.org/doi/full/10.1056/NEJMoa2206038
אתר העדכונים הרפואיים Medicine matters
https://diabetes.medicinematters.com/
בפרק הזה נדבר על השיטה הסטטיסטית שהפכה בשנים האחרונות לשיטה הנפוצה ביותר במחקרים אקראיים מבוקרים טובים/חשובים.
רגרסיה היא שיטה סטטיסטית שעוזרת לקחת בחשבון ערפלנים, ולתת תשובה ש"מנטרלת" את השפעתם. באופן כללי החוקרים משתמשים ברגרסיות כאשר הם חוששים שיהיו ערפלנים שיפריעו להבנת ממצאי המחקר.
ברגרסיית קוקס (לעומת רגרסיה לוגיסטית, למשל) משתמשים כאשר יש לחוקרים מידע מתי קרה כל אירוע רע אצל מטופל. הרגרסיה מחשבת את ה hazard ratio (HR) בין שתי הקבוצות (במקרה שלנו, צנטור אל מול מעקפים), אך לוקחת בחשבון גם משתנים נוספים. או במלים אחרות, מחשבת את ה HR כאילו שאר המשתנים זהים. למשל, במקרה שלנו- ה-HR היה 1.5 , לאחר רגרסייה שכללה את מצב הסוכרת. זאת אומרת, HR הוא 1.5 גם כאשר לוקחים את הסוכרת בחשבון.
---
המאמר בפרק
Fractional Flow Reserve–Guided PCI as Compared with Coronary Bypass Surgery
בפרק הזה נדבר על השיטה הסטטיסטית שהפכה בשנים האחרונות לשיטה הנפוצה ביותר במחקרים אקראיים מבוקרים טובים/חשובים.
רגרסיה היא שיטה סטטיסטית שעוזרת לקחת בחשבון ערפלנים, ולתת תשובה ש"מנטרלת" את השפעתם. באופן כללי החוקרים משתמשים ברגרסיות כאשר הם חוששים שיהיו ערפלנים שיפריעו להבנת ממצאי המחקר.
ברגרסיית קוקס (לעומת רגרסיה לוגיסטית, למשל) משתמשים כאשר יש לחוקרים מידע מתי קרה כל אירוע רע אצל מטופל. הרגרסיה מחשבת את ה hazard ratio (HR) בין שתי הקבוצות (במקרה שלנו, צנטור אל מול מעקפים), אך לוקחת בחשבון גם משתנים נוספים. או במלים אחרות, מחשבת את ה HR כאילו שאר המשתנים זהים. למשל, במקרה שלנו- ה-HR היה 1.5 , לאחר רגרסייה שכללה את מצב הסוכרת. זאת אומרת, HR הוא 1.5 גם כאשר לוקחים את הסוכרת בחשבון.
---
המאמר בפרק
Fractional Flow Reserve–Guided PCI as Compared with Coronary Bypass Surgery
על אבעבועות הקוף בגרסתם הנוכחית, לפי סדרת מקרים שהתפרסמה ביולי 2022.
מסדרת מקרים נצפה (בין השאר) לשאלה מחקרית/קלינית מוגדרת היטב, הגדרה מדוייקת של המחלה, התחלת מעקב בנקודת זמן מוגדרת במהלך המחלה, תיאור מדויק ואחיד של האוכלוסייה ושל ההסתמנות, כולל משך התסמינים, והתייחסות לנתונים חסרים או למעקב חסר.
במחקר שנדבר עליו תוארו 528 מטופלים מ 16 מדינות אצלם הוגדרה מחלת אבעבועות הקוף (monkeypox) לפי בדיקת PCR. ההסתמנות העורית הייתה שכיחה ביותר, עם נגעים מגוונים, לא תמיד בשלב אחד. הסתמנות דמוית שפעת, נגעים בריריות ולימפאדנופתיה היו בכחצי מהמטופלים, וסיבוכים קשים היו נדירים מאוד.
---
Monkeypox Virus Infection in Humans across 16 Countries — April–June 2022
צ'קליסט לבקרת איכות של סדרת מקרים
על אבעבועות הקוף בגרסתם הנוכחית, לפי סדרת מקרים שהתפרסמה ביולי 2022.
מסדרת מקרים נצפה (בין השאר) לשאלה מחקרית/קלינית מוגדרת היטב, הגדרה מדוייקת של המחלה, התחלת מעקב בנקודת זמן מוגדרת במהלך המחלה, תיאור מדויק ואחיד של האוכלוסייה ושל ההסתמנות, כולל משך התסמינים, והתייחסות לנתונים חסרים או למעקב חסר.
במחקר שנדבר עליו תוארו 528 מטופלים מ 16 מדינות אצלם הוגדרה מחלת אבעבועות הקוף (monkeypox) לפי בדיקת PCR. ההסתמנות העורית הייתה שכיחה ביותר, עם נגעים מגוונים, לא תמיד בשלב אחד. הסתמנות דמוית שפעת, נגעים בריריות ולימפאדנופתיה היו בכחצי מהמטופלים, וסיבוכים קשים היו נדירים מאוד.
---
Monkeypox Virus Infection in Humans across 16 Countries — April–June 2022
צ'קליסט לבקרת איכות של סדרת מקרים
HR , Hazard ratio, דומה מאוד ל- RR, relative risk. אך השני הוא היחס בין שתי כמויות או שני אחוזים, ו- HR הוא היחס בין שתי מהירויות. במקרה של מחקרים רפואיים, מדובר כמעט תמיד על המהירות של הצטברות אירועים רעים בקבוצה אחת לעומת מהירות הצטברות אירועים אלו בקבוצה אחרת.
נזכיר מחקר מהתקופה האחרונה שהשווה בין צנטור עם סטנטים לבין ניתוח מעקפים. יחס המהירויות במקרה של המאמר שלנו הוא 1.5, וזה אומר שהמהירות בה הצטברו אירועים רעים (תמותה, התקף לב או אירוע מוחי) בקבוצת הצנטור הייתה גדולה פי 1.5 מהמהירות בה הצטברו אירועים אלו בקבוצת ניתוח המעקפים.
---
המאמר בפרק
Fractional Flow Reserve–Guided PCI as Compared with Coronary Bypass Surgery
HR , Hazard ratio, דומה מאוד ל- RR, relative risk. אך השני הוא היחס בין שתי כמויות או שני אחוזים, ו- HR הוא היחס בין שתי מהירויות. במקרה של מחקרים רפואיים, מדובר כמעט תמיד על המהירות של הצטברות אירועים רעים בקבוצה אחת לעומת מהירות הצטברות אירועים אלו בקבוצה אחרת.
נזכיר מחקר מהתקופה האחרונה שהשווה בין צנטור עם סטנטים לבין ניתוח מעקפים. יחס המהירויות במקרה של המאמר שלנו הוא 1.5, וזה אומר שהמהירות בה הצטברו אירועים רעים (תמותה, התקף לב או אירוע מוחי) בקבוצת הצנטור הייתה גדולה פי 1.5 מהמהירות בה הצטברו אירועים אלו בקבוצת ניתוח המעקפים.
---
המאמר בפרק
Fractional Flow Reserve–Guided PCI as Compared with Coronary Bypass Surgery
מחקר שפורסם במאי 2022 כנראה ישנה את הטיפול בלחץ דם כרוני בהריון. נשים בהריון עם יתר לחץ דם כרוני, לפני שבוע 23 להריון, עברו רנדומיזציה לקבוצה אחת בה מטרת לחץ הדם הייתה פחות מ- 140/90 לעומת טיפול להפחתת לחץ הדם לפחות מ- 160/105. המחקר היה ללא סמיות, והתוצא העיקרי היה תוצא מורכב של פרה-אקלמפסיה עם מאפיינים חמורים, לידה מוקדמת בהוראה רפואית, הפרדות שלייה או מוות של הילוד. בקבוצת ההתערבות 30% הגיעו לתוצא העקרי, לעומת 37% בקבוצת הבקרה. המחקר מרשים ביותר וכנראה ישנה את ההנחיות, אך האם יש בעיה בתוצאים שנבדקו?
---
Treatment for Mild Chronic Hypertension during Pregnancy
מחקר שפורסם במאי 2022 כנראה ישנה את הטיפול בלחץ דם כרוני בהריון. נשים בהריון עם יתר לחץ דם כרוני, לפני שבוע 23 להריון, עברו רנדומיזציה לקבוצה אחת בה מטרת לחץ הדם הייתה פחות מ- 140/90 לעומת טיפול להפחתת לחץ הדם לפחות מ- 160/105. המחקר היה ללא סמיות, והתוצא העיקרי היה תוצא מורכב של פרה-אקלמפסיה עם מאפיינים חמורים, לידה מוקדמת בהוראה רפואית, הפרדות שלייה או מוות של הילוד. בקבוצת ההתערבות 30% הגיעו לתוצא העקרי, לעומת 37% בקבוצת הבקרה. המחקר מרשים ביותר וכנראה ישנה את ההנחיות, אך האם יש בעיה בתוצאים שנבדקו?
---
Treatment for Mild Chronic Hypertension during Pregnancy
יעילות סטטינים למניעה ראשונית של אירועים לבביים (באנשים עם מחלת לב איסכמית) וגם למניעה שניונית, חוזרת על עצמה במחקרים רבים, ונעה סביב 33% הפחתת סיכון יחסית אל מול פלצבו. אך אותה הפחתת סיכון יחסית משמעותה שונה לחלוטין, כתלות בסיכון מראש של המטופל במחקר או מולנו.
לו הסיכון של המטופל מראש היה קרוב ל 30%, כמו במחקר ה 4S, הפחתת סיכון יחסית בשליש משמעותה ירידה של 10% בסיכון שלו לאירוע לבבי.
לו הסיכון שלו מראש היה 2.5%, כמו במחקר שפורסם לאחרונה ובדק מניעה ראשונית בחולי דלקת פרקים , אותה הפחתת סיכון יחסי מביאה לירידה של פחות מ 1% בסיכון עבור המטופל (לזמן מעקב של שנתיים וחצי).
---
Statins for the primary prevention of cardiovascular disease- cochrane
combined fatal and non-fatal CHD events: RR 0.73 (95% CI 0.67 to 0.80)
מחשבון סיכון להחלטה על טיפול בסטטין
יעילות סטטינים למניעה ראשונית של אירועים לבביים (באנשים עם מחלת לב איסכמית) וגם למניעה שניונית, חוזרת על עצמה במחקרים רבים, ונעה סביב 33% הפחתת סיכון יחסית אל מול פלצבו. אך אותה הפחתת סיכון יחסית משמעותה שונה לחלוטין, כתלות בסיכון מראש של המטופל במחקר או מולנו.
לו הסיכון של המטופל מראש היה קרוב ל 30%, כמו במחקר ה 4S, הפחתת סיכון יחסית בשליש משמעותה ירידה של 10% בסיכון שלו לאירוע לבבי.
לו הסיכון שלו מראש היה 2.5%, כמו במחקר שפורסם לאחרונה ובדק מניעה ראשונית בחולי דלקת פרקים , אותה הפחתת סיכון יחסי מביאה לירידה של פחות מ 1% בסיכון עבור המטופל (לזמן מעקב של שנתיים וחצי).
---
Statins for the primary prevention of cardiovascular disease- cochrane
combined fatal and non-fatal CHD events: RR 0.73 (95% CI 0.67 to 0.80)
מחשבון סיכון להחלטה על טיפול בסטטין
מחקר שפורסם ב 2021 גייס מטופלים שסבלו מתופעות לוואי של סטטין, ובוצע בשיטת cross over עם רנדומיזציה לחודשי טיפול שונים. בוצעה השוואה בעצמת תסמינים ובהפסקת הטיפול התרופתי בין חודשי סטטינים (אטורבסטטין 20 מ"ג), פלצבו, והעדר מוחלט של טיפול. הממצאים מעניינים ביותר ומרמזים לכך שחלק גדול מתופעות הלוואי של הסטטינים נובעות מאפקט הנוצבו.
---
Side Effect Patterns in a Crossover Trial of Statin, Placebo, and No Treatment
תמונה גרפית מתוך אותו מחקר (שהתפרסם גם כמכתב ב NEJM)
גם בפלצבו וגם בסטטין היו יותר תופעות לואי. הציון הממוצע- 16.3 בחודשי סטטין, 15.4 בחודשי פלצבו, ו 8 בחודשים ללא טיפול, בסולם בין 1 ל 100 בו 100 הוא "בלתי נסבל".
מחקר שפורסם ב 2021 גייס מטופלים שסבלו מתופעות לוואי של סטטין, ובוצע בשיטת cross over עם רנדומיזציה לחודשי טיפול שונים. בוצעה השוואה בעצמת תסמינים ובהפסקת הטיפול התרופתי בין חודשי סטטינים (אטורבסטטין 20 מ"ג), פלצבו, והעדר מוחלט של טיפול. הממצאים מעניינים ביותר ומרמזים לכך שחלק גדול מתופעות הלוואי של הסטטינים נובעות מאפקט הנוצבו.
---
Side Effect Patterns in a Crossover Trial of Statin, Placebo, and No Treatment
תמונה גרפית מתוך אותו מחקר (שהתפרסם גם כמכתב ב NEJM)
גם בפלצבו וגם בסטטין היו יותר תופעות לואי. הציון הממוצע- 16.3 בחודשי סטטין, 15.4 בחודשי פלצבו, ו 8 בחודשים ללא טיפול, בסולם בין 1 ל 100 בו 100 הוא "בלתי נסבל".
זהירות! התופעה שנדבר עליה אינה מאפסת את האפקט של התערבות. זהו מיהול ולא ביטול. כל ההתערבויות שנדבר עליהן בפרק מומלצות מאוד, למרות התופעה.
כשיש התערבות שמפחיתה סיכון, אנחנו עלולים להתנהג בצורה שמגבירה סיכון. התופעה הזו, שנקראת פיצוי הסיכון- risk compensation - מופיעה בצורות רבות בעולם וברפואה, ויש לה גם עדויות מחקריות, למשל טיפול למניעת הדבקות ב HIV קשור ליותר התנהגות מינית בסיכון, וחובת עטיית מסכות קשורה להגברת ניידות.
---
המחקר מניו ג'רסי: קשר בין חובת חגורות בטיחות – לפחות נפגעים אך ליותר תאונות
מחקר אקראי מבוקר ללא סמיות, PreP לגברים המקיימים יחסי מין עם גברים- Lancet 2016
קשר בין חובת מסכה בבנגלדש לבין מוביליות
סטטינים ואבחנת סכרת- ללא סמיות
Statins and new-onset diabetes: a retrospective longitudinal cohort study
סטטינים ואבחנת סכרת- מטא אנליזה של מחקרים עם סמיות
Statins and risk of incident diabetes: a collaborative meta-analysis of randomised statin trials
מאמר דיעה המזהיר ממתן משקל יתר לתופעה עליה אנחנו מדברים
זהירות! התופעה שנדבר עליה אינה מאפסת את האפקט של התערבות. זהו מיהול ולא ביטול. כל ההתערבויות שנדבר עליהן בפרק מומלצות מאוד, למרות התופעה.
כשיש התערבות שמפחיתה סיכון, אנחנו עלולים להתנהג בצורה שמגבירה סיכון. התופעה הזו, שנקראת פיצוי הסיכון- risk compensation - מופיעה בצורות רבות בעולם וברפואה, ויש לה גם עדויות מחקריות, למשל טיפול למניעת הדבקות ב HIV קשור ליותר התנהגות מינית בסיכון, וחובת עטיית מסכות קשורה להגברת ניידות.
---
המחקר מניו ג'רסי: קשר בין חובת חגורות בטיחות – לפחות נפגעים אך ליותר תאונות
מחקר אקראי מבוקר ללא סמיות, PreP לגברים המקיימים יחסי מין עם גברים- Lancet 2016
קשר בין חובת מסכה בבנגלדש לבין מוביליות
סטטינים ואבחנת סכרת- ללא סמיות
Statins and new-onset diabetes: a retrospective longitudinal cohort study
סטטינים ואבחנת סכרת- מטא אנליזה של מחקרים עם סמיות
Statins and risk of incident diabetes: a collaborative meta-analysis of randomised statin trials
מאמר דיעה המזהיר ממתן משקל יתר לתופעה עליה אנחנו מדברים
יש מחקרים המופסקים מוקדם מהמתוכנן. אחת הסיבות להפסקה כזו היא "בשל יעילות". הפסקה בשל יעילות יכולה להיות מעשה נכון ומוסרי, אך גם לגרום לבעיות, בעקר רושם מוגזם לגבי האפקט של ההתערבות, או "גילוי" אפקט שלא באמת קיים.
מחקר שפורסם ב 2020, והופסק מוקדם בשל יעילות, הראה שבמטופלים עם פרפור עליות יש חשיבות להחזרה לקצב סינוס. האם העובדה שהמחקר הופסק מוקדם מראה עד כמה האפקט של ההתערבות הוא דרמטי, או מעלה חשד שהאפקט עלול להיות מקרי?
---
המחקר שהוזכר בפרק:
Early Rhythm-Control Therapy in Patients with Atrial Fibrillation
הסבר מתומצת (Lancet 1999) מדוע הפסקה מוקדמת עבור יעילות יכולה לייצר תוצאות שגויות
סקירה נרחבת לגבי הבעיות בהפסקה מוקדמת של מחקר:
Early stopping of randomized clinical trials for overt efficacy is problematic
האם מחקרים שהופסקו מוקדם עושים זאת כמו שצריך?
Randomized trials stopped early for benefit: a systematic review
מונטורי וחבריו אספו מחקרים מבוקרים שהופסקו מוקדם בשל יעילות. רוב המחקרים נכשלו בדיווח על עוצמת המחקר, חוקי עצירה, או תקנון סטטיסטי עבור העצירה המוקדמת.
האם מחקרים שהופסקו מוקדם מראים אפקט שונה/ מוטה של ההתערבות?
המחברים השוו תוצאות של 91 מחקרים שהופסקו מוקדם בשל יעילות למחקרים תואמים באותה שאלה שלא הופסקו מוקדם.
אפקט הטיפול במחקרים שהופסקו מוקדם היה גדול יותר, ובצורה דרמטית ביותר במקרים של מחקרים עם מספר אירועים נמוך (עד כמה עשרות אירועים). בנוסף, עבור רוב השאלות הקליניות, לעומת אפקט מועיל של התערבות במחקר שהופסק מוקדם, סיכום של תוצאות כל המחקרים האחרים נכשל בהדגמת אפקט זה.
יש מחקרים המופסקים מוקדם מהמתוכנן. אחת הסיבות להפסקה כזו היא "בשל יעילות". הפסקה בשל יעילות יכולה להיות מעשה נכון ומוסרי, אך גם לגרום לבעיות, בעקר רושם מוגזם לגבי האפקט של ההתערבות, או "גילוי" אפקט שלא באמת קיים.
מחקר שפורסם ב 2020, והופסק מוקדם בשל יעילות, הראה שבמטופלים עם פרפור עליות יש חשיבות להחזרה לקצב סינוס. האם העובדה שהמחקר הופסק מוקדם מראה עד כמה האפקט של ההתערבות הוא דרמטי, או מעלה חשד שהאפקט עלול להיות מקרי?
---
המחקר שהוזכר בפרק:
Early Rhythm-Control Therapy in Patients with Atrial Fibrillation
הסבר מתומצת (Lancet 1999) מדוע הפסקה מוקדמת עבור יעילות יכולה לייצר תוצאות שגויות
סקירה נרחבת לגבי הבעיות בהפסקה מוקדמת של מחקר:
Early stopping of randomized clinical trials for overt efficacy is problematic
האם מחקרים שהופסקו מוקדם עושים זאת כמו שצריך?
Randomized trials stopped early for benefit: a systematic review
מונטורי וחבריו אספו מחקרים מבוקרים שהופסקו מוקדם בשל יעילות. רוב המחקרים נכשלו בדיווח על עוצמת המחקר, חוקי עצירה, או תקנון סטטיסטי עבור העצירה המוקדמת.
האם מחקרים שהופסקו מוקדם מראים אפקט שונה/ מוטה של ההתערבות?
המחברים השוו תוצאות של 91 מחקרים שהופסקו מוקדם בשל יעילות למחקרים תואמים באותה שאלה שלא הופסקו מוקדם.
אפקט הטיפול במחקרים שהופסקו מוקדם היה גדול יותר, ובצורה דרמטית ביותר במקרים של מחקרים עם מספר אירועים נמוך (עד כמה עשרות אירועים). בנוסף, עבור רוב השאלות הקליניות, לעומת אפקט מועיל של התערבות במחקר שהופסק מוקדם, סיכום של תוצאות כל המחקרים האחרים נכשל בהדגמת אפקט זה.
מחקר יפה עסק בקשר אפשרי בין זריקה אפידורלית בלידה לבין הבונדינג בין האם לתינוק. במאמר הושקעו מאמצים רבים והוא התפרסם בעיתון רפואי חשוב. עם זאת, הכותרת בעיתונות הלא רפואית הייתה מרחיקת לכת ודרמטית, והציגה מסקנות שלא ניתן להגיע אליהן מתוך תוצאות המחקר עצמו.
---
הכותרת בעיתונות הלא רפואית:
פגיעה בקשר עם התינוק - ודיכאון אחרי לידה: מחקר חדש על השפעת לידה ללא אפידורל
המאמר כפי שפורסם בעיתונות הרפואית
The association between epidural analgesia during labor and mother-infant bonding
מטא- אנליזה של קוקרן שמוכיחה שניתן לבצע מחקרי RCT כאשר ההתערבות היא אלחוש אפידורלי
Epidural versus non-epidural or no analgesia for pain management in labour
מחקר יפה עסק בקשר אפשרי בין זריקה אפידורלית בלידה לבין הבונדינג בין האם לתינוק. במאמר הושקעו מאמצים רבים והוא התפרסם בעיתון רפואי חשוב. עם זאת, הכותרת בעיתונות הלא רפואית הייתה מרחיקת לכת ודרמטית, והציגה מסקנות שלא ניתן להגיע אליהן מתוך תוצאות המחקר עצמו.
---
הכותרת בעיתונות הלא רפואית:
פגיעה בקשר עם התינוק - ודיכאון אחרי לידה: מחקר חדש על השפעת לידה ללא אפידורל
המאמר כפי שפורסם בעיתונות הרפואית
The association between epidural analgesia during labor and mother-infant bonding
מטא- אנליזה של קוקרן שמוכיחה שניתן לבצע מחקרי RCT כאשר ההתערבות היא אלחוש אפידורלי
Epidural versus non-epidural or no analgesia for pain management in labour
ספין במאמרים רפואיים הוא לא שקר גס אלא שימוש באמיתות מסוימות בצורה סלקטיבית ומטעה- למשל, לצורך הסטת תשומת הלב מהעיקר, או הדגשת ממצאים חיוביים במחקר שלמעשה הוא שלילי. ספינים נפוצים מאוד במאמרים רפואיים. הספינים הם בעקר בתיאור התוצאות ובמסקנות. נספר מהם הספינים השכיחים במאמרים על טיפול ומאמרי מטא-אנליזה, ונציג שני מחקרים שהשתמשו בצורה בוטה בספין- אחד על גורמי סיכון למחלת ריאה חמורה בפגים, ואחד על הפוגה ממחלת קרוהן ותזונה מסוימת.
---
שני מחקרים שהשתמשו בספין מרגיז:
מחקרים שבדקו שכיחות ספין במחקרים מסוגים שונים
(ב 70% מהמחקרים בנושא זה היה לפחות ספין אחד)
Evaluating spin in the abstracts of systematic reviews and meta-analyses on cannabis use disorder
(ב 66% מהמטא אנליזות בנושא זה היה לפחות ספין אחד)
מאמר שמסכם את סוגי הספין השונים שנוכל להתקל בהם במטא אנליזות
הספינים מתרחשים בדיווח, בפרשנות, ובהכללה (אקסטראפולציה)
הספינים החמורים ביותר לפי סיווג זה: המלצה שאינה נתמכת בממצאים (כמו בשני המחקרים שהצגנו בפרק), כותרת מטעה, ודווח סלקטיבי.
ספין במאמרים רפואיים הוא לא שקר גס אלא שימוש באמיתות מסוימות בצורה סלקטיבית ומטעה- למשל, לצורך הסטת תשומת הלב מהעיקר, או הדגשת ממצאים חיוביים במחקר שלמעשה הוא שלילי. ספינים נפוצים מאוד במאמרים רפואיים. הספינים הם בעקר בתיאור התוצאות ובמסקנות. נספר מהם הספינים השכיחים במאמרים על טיפול ומאמרי מטא-אנליזה, ונציג שני מחקרים שהשתמשו בצורה בוטה בספין- אחד על גורמי סיכון למחלת ריאה חמורה בפגים, ואחד על הפוגה ממחלת קרוהן ותזונה מסוימת.
---
שני מחקרים שהשתמשו בספין מרגיז:
מחקרים שבדקו שכיחות ספין במחקרים מסוגים שונים
(ב 70% מהמחקרים בנושא זה היה לפחות ספין אחד)
Evaluating spin in the abstracts of systematic reviews and meta-analyses on cannabis use disorder
(ב 66% מהמטא אנליזות בנושא זה היה לפחות ספין אחד)
מאמר שמסכם את סוגי הספין השונים שנוכל להתקל בהם במטא אנליזות
הספינים מתרחשים בדיווח, בפרשנות, ובהכללה (אקסטראפולציה)
הספינים החמורים ביותר לפי סיווג זה: המלצה שאינה נתמכת בממצאים (כמו בשני המחקרים שהצגנו בפרק), כותרת מטעה, ודווח סלקטיבי.
הפודקאסט חוגג 10,000 הורדות של פרקים. תודה לכל המאזינים!
בפרק הפעם נדבר על "מרוץ החימוש" בין החוקרים שרוצים להגיע במהירות לתוצאות מרשימות לבין הקוראות שמחפשות תרופות עם תועלת אמיתית למטופלים שלהן. כקוראים ביקורתיים אנחנו נלחמים בין השאר שהמחקרים יהיו עם אוכלוסייה מגוונת, תוצאים המודדים ישירות את איכות או אורך חיי המטופלת, וניתוח התוצאות לפי כוונת הטיפול.
להזמנת הספר "רפואה נתמכת ראיות"
הפודקאסט חוגג 10,000 הורדות של פרקים. תודה לכל המאזינים!
בפרק הפעם נדבר על "מרוץ החימוש" בין החוקרים שרוצים להגיע במהירות לתוצאות מרשימות לבין הקוראות שמחפשות תרופות עם תועלת אמיתית למטופלים שלהן. כקוראים ביקורתיים אנחנו נלחמים בין השאר שהמחקרים יהיו עם אוכלוסייה מגוונת, תוצאים המודדים ישירות את איכות או אורך חיי המטופלת, וניתוח התוצאות לפי כוונת הטיפול.
להזמנת הספר "רפואה נתמכת ראיות"
במצבים רבים ברפואה, הסף שבו בדיקה הופכת לחיובית הוא גמיש. ככל שהסף יהיה נמוך יותר (כל ממצא חשוד בצילום החזה יגרום לצילום להיות "חיובי" לגבי דלקת ריאות), כך רגישות הבדיקה תעלה אך הספציפיות שלה תרד. בפרק אני מעלה ספקולציה, לא נתמכת ראיות, שבדיקת אנטיגן המבוצעת בבית רגישה פחות מבדיקת אנטיגן המבוצעת במחקרים. זהו מקרה מיוחד שבו למרות שהרגישות יורדת, הספציפיות כנראה תישאר גבוהה.
---
קביעת ערך סף של פריטין לאבחנת חסר ברזל עבור קשישים בקהילה.
https://pubmed.ncbi.nlm.nih.gov/15789229/
הסכמה מצויינת אך לא מושלמת בין האשה לבין הצוות לגבי תוצאת בדיקת שתן ביתית להריון.
https://pubmed.ncbi.nlm.nih.gov/18082665/
---
שימו לב ששימוש בפריטין כדוגמה עלול לבלבל... הפחתת הערך בו בדיקת פריטין נחשבת "חיובית" הוא עלייה בסף. זאת אומרת, בהחלטה שפריטין 15 הוא הסף לקביעת חסר ברזל לעומת 20, אנחנו מחמירים את הקריטריונים להגדרת חסר ברזל הסף לבדיקה חיובית "קשה יותר" להשגה. זה קורה בבדיקות שבהן דווקא ערך נמוך יותר הוא בדיקה חיובית (סוכר להיפוגליקמיה, טווח תנועה למגבלת תנועה במפרק וכו'). בבדיקות אחרות, שבהן דווקא ערך גבוה משמעותו בדיקה חיובית (למשל, CRP לאבחון זהום חיידקי, רמת אנזימי כבד לאבחון פגיעה כבדית) המצב אינטואיטיבי יותר- קביעת סף גבוה יותר היא גם קביעת ערך גבוה יותר של CRP כמבדיל בין בדיקה חיובית לשלילית.
במצבים רבים ברפואה, הסף שבו בדיקה הופכת לחיובית הוא גמיש. ככל שהסף יהיה נמוך יותר (כל ממצא חשוד בצילום החזה יגרום לצילום להיות "חיובי" לגבי דלקת ריאות), כך רגישות הבדיקה תעלה אך הספציפיות שלה תרד. בפרק אני מעלה ספקולציה, לא נתמכת ראיות, שבדיקת אנטיגן המבוצעת בבית רגישה פחות מבדיקת אנטיגן המבוצעת במחקרים. זהו מקרה מיוחד שבו למרות שהרגישות יורדת, הספציפיות כנראה תישאר גבוהה.
---
קביעת ערך סף של פריטין לאבחנת חסר ברזל עבור קשישים בקהילה.
https://pubmed.ncbi.nlm.nih.gov/15789229/
הסכמה מצויינת אך לא מושלמת בין האשה לבין הצוות לגבי תוצאת בדיקת שתן ביתית להריון.
https://pubmed.ncbi.nlm.nih.gov/18082665/
---
שימו לב ששימוש בפריטין כדוגמה עלול לבלבל... הפחתת הערך בו בדיקת פריטין נחשבת "חיובית" הוא עלייה בסף. זאת אומרת, בהחלטה שפריטין 15 הוא הסף לקביעת חסר ברזל לעומת 20, אנחנו מחמירים את הקריטריונים להגדרת חסר ברזל הסף לבדיקה חיובית "קשה יותר" להשגה. זה קורה בבדיקות שבהן דווקא ערך נמוך יותר הוא בדיקה חיובית (סוכר להיפוגליקמיה, טווח תנועה למגבלת תנועה במפרק וכו'). בבדיקות אחרות, שבהן דווקא ערך גבוה משמעותו בדיקה חיובית (למשל, CRP לאבחון זהום חיידקי, רמת אנזימי כבד לאבחון פגיעה כבדית) המצב אינטואיטיבי יותר- קביעת סף גבוה יותר היא גם קביעת ערך גבוה יותר של CRP כמבדיל בין בדיקה חיובית לשלילית.
מדוע דבר שמובן מאליו שיעזור, כמו עזרים לבטיחות ביתית למניעת נפילות בקשישים, מפחית רק לפעמים ורק בצורה מתונה את שיעור הקשישים עם נפילה? נדבר על מטא אנליזה בנושא ונגלה הבדלים גדולים בין מחקרים שונים.
---
המטא אנליזה:
שני מאמרים שהוכללו בסקירה השיטתית ונזכרו בפרק
המאמר של Campbell (בקשישים עם הפרעת ראייה משמעותית)
המאמר של Day (בפרק התייחסנו לעזרי בטיחות ביתית בנפרד)
מדוע דבר שמובן מאליו שיעזור, כמו עזרים לבטיחות ביתית למניעת נפילות בקשישים, מפחית רק לפעמים ורק בצורה מתונה את שיעור הקשישים עם נפילה? נדבר על מטא אנליזה בנושא ונגלה הבדלים גדולים בין מחקרים שונים.
---
המטא אנליזה:
שני מאמרים שהוכללו בסקירה השיטתית ונזכרו בפרק
המאמר של Campbell (בקשישים עם הפרעת ראייה משמעותית)
המאמר של Day (בפרק התייחסנו לעזרי בטיחות ביתית בנפרד)
Immortal time bias
נספר על מחקר תצפיתי שכלל מבוגרים באשפוז עם התקף אסטמה, ומצא (לכאורה) שמתן אנטיביוטיקה קשור לזמן אשפוז ארוך יותר. בערך שנתיים אחרי פרסום המאמר, בעקבות מכתב למערכת שהזכיר את הטיית תקופת האל-מוות, החוקרים בדקו מחדש וגידלו שהתוצאות המקוריות היו מוטות על ידי הטייה זו, ושאם מתחשבים בה, לא הודגם קשר משמעותי בין מתן אנטיביוטיקה לזמן אשפוז.
---
מאמר מקורי , JAMA int med 2019
אורך אשפוז חציוני, גם לאחר התאמה בין קבוצות- יום אחד יותר באלו שהחלו אנטיביוטיקה ביומיים הראשונים ונטלו אותה לפחות יומיים.
(median [IQR], 4 [3-5] vs 3 [2-4] days)
מכתב למערכת, תומס ניומן- ינואר 2021
אם אנטיביוטיקה החלה ביום השני לאשפוז, ואם נלקחה לפחות יומיים, יש יומיים עד ארבעה בהם אנשים בקבוצה זו היו בהכרח מאושפזים.
תוצאות המחקר לאחר ניתוח מחודש (ולאחר הודאה בטעות והתנצלות)
ינואר 2021
unadjusted mean [SD], 2.81 [2.27] vs 2.57 [2.45] days
median [IQR] 2 [1-4] vs 2 [1-3] days
קטלוג ההטיות של המרכז לרפואה נתמכת ראיות באוקספורד עם הסבר על ההטייה
https://catalogofbias.org/biases/immortal-time-bias
Immortal time bias
נספר על מחקר תצפיתי שכלל מבוגרים באשפוז עם התקף אסטמה, ומצא (לכאורה) שמתן אנטיביוטיקה קשור לזמן אשפוז ארוך יותר. בערך שנתיים אחרי פרסום המאמר, בעקבות מכתב למערכת שהזכיר את הטיית תקופת האל-מוות, החוקרים בדקו מחדש וגידלו שהתוצאות המקוריות היו מוטות על ידי הטייה זו, ושאם מתחשבים בה, לא הודגם קשר משמעותי בין מתן אנטיביוטיקה לזמן אשפוז.
---
מאמר מקורי , JAMA int med 2019
אורך אשפוז חציוני, גם לאחר התאמה בין קבוצות- יום אחד יותר באלו שהחלו אנטיביוטיקה ביומיים הראשונים ונטלו אותה לפחות יומיים.
(median [IQR], 4 [3-5] vs 3 [2-4] days)
מכתב למערכת, תומס ניומן- ינואר 2021
אם אנטיביוטיקה החלה ביום השני לאשפוז, ואם נלקחה לפחות יומיים, יש יומיים עד ארבעה בהם אנשים בקבוצה זו היו בהכרח מאושפזים.
תוצאות המחקר לאחר ניתוח מחודש (ולאחר הודאה בטעות והתנצלות)
ינואר 2021
unadjusted mean [SD], 2.81 [2.27] vs 2.57 [2.45] days
median [IQR] 2 [1-4] vs 2 [1-3] days
קטלוג ההטיות של המרכז לרפואה נתמכת ראיות באוקספורד עם הסבר על ההטייה
https://catalogofbias.org/biases/immortal-time-bias
מאמר שהתפרסם ב science בינואר 2022, הדגים קשר חזק מאוד בין הידבקות בווירוס ה EBV לבין הופעה של טרשת נפוצה. נשוחח על טרשת נפוצה ועל המאמר עם ד"ר איל רוזנברג, רופא בכיר במחלקה לנוירולוגיה ברמב"ם ואחראי מרפאת טרשת נפוצה ומחלות נוירואימונולוגיות.
---
המאמר ששוחחנו עליו
https://www.science.org/doi/epdf/10.1126/science.abj8222
Longitudinal analysis reveals high prevalence of Epstein-Barr virus associated with multiple sclerosis
מאמר נוסף שהוזכר בסוף הפרק, המתאר מנגנון אפשרי המקשר בין זהום ב EBV לבין טרשת נפוצה.
https://www.nature.com/articles/s41586-022-04432-7
Clonally expanded B cells in multiple sclerosis bind EBV EBNA1 and GlialCAM
מאמר שהתפרסם ב science בינואר 2022, הדגים קשר חזק מאוד בין הידבקות בווירוס ה EBV לבין הופעה של טרשת נפוצה. נשוחח על טרשת נפוצה ועל המאמר עם ד"ר איל רוזנברג, רופא בכיר במחלקה לנוירולוגיה ברמב"ם ואחראי מרפאת טרשת נפוצה ומחלות נוירואימונולוגיות.
---
המאמר ששוחחנו עליו
https://www.science.org/doi/epdf/10.1126/science.abj8222
Longitudinal analysis reveals high prevalence of Epstein-Barr virus associated with multiple sclerosis
מאמר נוסף שהוזכר בסוף הפרק, המתאר מנגנון אפשרי המקשר בין זהום ב EBV לבין טרשת נפוצה.
https://www.nature.com/articles/s41586-022-04432-7
Clonally expanded B cells in multiple sclerosis bind EBV EBNA1 and GlialCAM
נדבר על מחקר קוהורט ישראלי שבדק האם מנה רביעית של חיסון מפחיתה הידבקות, תחלואה חמורה ותמותה מ COVID-19. ננסה להבין איך בתקופת הקורונה מתפרסמים גם מחקרים מ"אמצע הפירמידה", ומה המשמעות של פרסומים אלו ביישום רפואה נתמכת ראיות, נספר על התוצאות העיקריות וננתח את תקפות המחקר.
---
Fourth Dose of BNT162b2 mRNA Covid-19 Vaccine in a Nationwide Setting
קישור ישיר לתוסף (אפנדיקס) המאמר
בשאלת מחקר דומה- מחקר מקרה בקרה test negative design- פורסם כ pre print, במרץ 2022.
Relative Effectiveness of Four Doses Compared to Three Dose of the BNT162b2 Vaccine in Israel
מחקר רנדומלי ראשון על יעילות מנה שלישית של החיסון - פורסם רק במרץ השנה...
Safety and Efficacy of a Third Dose of BNT162b2 Covid-19 Vaccine
נדבר על מחקר קוהורט ישראלי שבדק האם מנה רביעית של חיסון מפחיתה הידבקות, תחלואה חמורה ותמותה מ COVID-19. ננסה להבין איך בתקופת הקורונה מתפרסמים גם מחקרים מ"אמצע הפירמידה", ומה המשמעות של פרסומים אלו ביישום רפואה נתמכת ראיות, נספר על התוצאות העיקריות וננתח את תקפות המחקר.
---
Fourth Dose of BNT162b2 mRNA Covid-19 Vaccine in a Nationwide Setting
קישור ישיר לתוסף (אפנדיקס) המאמר
בשאלת מחקר דומה- מחקר מקרה בקרה test negative design- פורסם כ pre print, במרץ 2022.
Relative Effectiveness of Four Doses Compared to Three Dose of the BNT162b2 Vaccine in Israel
מחקר רנדומלי ראשון על יעילות מנה שלישית של החיסון - פורסם רק במרץ השנה...
Safety and Efficacy of a Third Dose of BNT162b2 Covid-19 Vaccine
מחקרים שליליים, כאלו שהתוצאות שלהם מראות שהתערבות לא עזרה, דומים מאוד למחקרים מבוקרים אחרים, אך חשובה בהם מאוד העוצמה (power), חלק מהקריטריונים צריכים להיבחן מזווית אחרת, ונרצה לראות את ניתוח התוצאות לפי הטיפול בפועל ולא רק לפי כוונת הטיפול (intention to treat).
---
---
לרכישת הספר "רפואה נתמכת ראיות"
https://www.probook.co.il/0015802475543.html
מחקרים שליליים, כאלו שהתוצאות שלהם מראות שהתערבות לא עזרה, דומים מאוד למחקרים מבוקרים אחרים, אך חשובה בהם מאוד העוצמה (power), חלק מהקריטריונים צריכים להיבחן מזווית אחרת, ונרצה לראות את ניתוח התוצאות לפי הטיפול בפועל ולא רק לפי כוונת הטיפול (intention to treat).
---
---
לרכישת הספר "רפואה נתמכת ראיות"
https://www.probook.co.il/0015802475543.html
במחקרים "רגילים", המטרה הסטטיסטית היא להראות יתרון מובהק של התערבות אחת מול התערבות אחרת או מול פלצבו. מחקרי "לא פחות טוב" (non inferiority trials) מעט שונים. הוכחת ה non inferiority מתבצעת בעזרת קביעת ערך סף שמומחים הגדירו אותו כגבול התחתון לתוצא "לא פחות טוב", ותוצאה מובהקת מתקבלת כשהרווח ברך סמך להבדל לא חוצה את אותו סף.
מחקר מבוקר אקראי שהתפרסם בנובמבר 2021 בדק האם בילדים עם דלקת ריאות שהגיעו למיון, מינון נמוך של מוקסיפן יעיל לא פחות ממינון גבוה. התוצא היה שיעור הילדים שנזקקו לטיפול אנטיביוטי נוסף בחודש שלאחר מכן. החוקרים קבעו מראש סף של 8% הבדל לרעת הטיפול במינון הנמוך יותר, שהוגדר כסף בין תוצאה "פחות טובה" לתוצאה "לא פחות טובה", והראו שהרווח בר סמך להבדל בין הקבוצות אינו חוצה סף זה.
---
מאמר הסבר על non inferiority trials מ- JAMA
במחקרים "רגילים", המטרה הסטטיסטית היא להראות יתרון מובהק של התערבות אחת מול התערבות אחרת או מול פלצבו. מחקרי "לא פחות טוב" (non inferiority trials) מעט שונים. הוכחת ה non inferiority מתבצעת בעזרת קביעת ערך סף שמומחים הגדירו אותו כגבול התחתון לתוצא "לא פחות טוב", ותוצאה מובהקת מתקבלת כשהרווח ברך סמך להבדל לא חוצה את אותו סף.
מחקר מבוקר אקראי שהתפרסם בנובמבר 2021 בדק האם בילדים עם דלקת ריאות שהגיעו למיון, מינון נמוך של מוקסיפן יעיל לא פחות ממינון גבוה. התוצא היה שיעור הילדים שנזקקו לטיפול אנטיביוטי נוסף בחודש שלאחר מכן. החוקרים קבעו מראש סף של 8% הבדל לרעת הטיפול במינון הנמוך יותר, שהוגדר כסף בין תוצאה "פחות טובה" לתוצאה "לא פחות טובה", והראו שהרווח בר סמך להבדל בין הקבוצות אינו חוצה סף זה.
---
מאמר הסבר על non inferiority trials מ- JAMA
פרק רביעי מתוך ארבעה פרקים ברצף המסבירים מונחי יסוד בסטטיסטיקה. מהם מבחנים סטטיסטיים? כמעט בכל מחקר, יתבצע חישוב יחסית פשוט כמו חיסור או חילוק, כדי לתת לנו ערך, למשל odds ratio או absolute risk reduction, ערך שמעיד על הבדל בין קבוצות או על קשר בין שני משתנים במחקר, ואז מבחן סטטיסטי כדי לבחון האם ייתכן שהבדל בין הקבוצות או הקשר בין שני משתנים שהתקבל במחקר עלול להיות מקרי. נדגים את זה על מחקר שעסק בהבדל בהתקדמות של ילידים אמריקאים לעומת לבנים במסלול החינוך הרפואי, שבו המבחן הסטטיסטי היה Fisher exact test.
---
Representation of American Indian and Alaska Native Individuals in Academic Medical Training
פרק רביעי מתוך ארבעה פרקים ברצף המסבירים מונחי יסוד בסטטיסטיקה. מהם מבחנים סטטיסטיים? כמעט בכל מחקר, יתבצע חישוב יחסית פשוט כמו חיסור או חילוק, כדי לתת לנו ערך, למשל odds ratio או absolute risk reduction, ערך שמעיד על הבדל בין קבוצות או על קשר בין שני משתנים במחקר, ואז מבחן סטטיסטי כדי לבחון האם ייתכן שהבדל בין הקבוצות או הקשר בין שני משתנים שהתקבל במחקר עלול להיות מקרי. נדגים את זה על מחקר שעסק בהבדל בהתקדמות של ילידים אמריקאים לעומת לבנים במסלול החינוך הרפואי, שבו המבחן הסטטיסטי היה Fisher exact test.
---
Representation of American Indian and Alaska Native Individuals in Academic Medical Training
בפרק נדבר על התפלגות הדגימה והסקה. נראה שיש לנו אינטואיציה טבעית של הסקה סטטיסטית לגבי מובהקות, ונסביר איך זה קורה במבחנים סטטיסטיים לפי התפלגות דגימה (sampling distribution) צפויה בנוכחות השערת ה-0. ובונוס- המלצה על סטאנד-אפ מצויין.
יצא לאור ספרי "רפואה נתמכת ראיות" בהוצאת דיונון-פרובוק. לרכישה: https://www.probook.co.il/0015802475543.html
---
קישור לג'ימי או יאנג ביוטיוב
המאמר שהוזכר בפרק הזה ובפרק הקודם
Dupilumab in Children with Uncontrolled Moderate-to-Severe Asthma
---
בפרק נדבר על התפלגות הדגימה והסקה. נראה שיש לנו אינטואיציה טבעית של הסקה סטטיסטית לגבי מובהקות, ונסביר איך זה קורה במבחנים סטטיסטיים לפי התפלגות דגימה (sampling distribution) צפויה בנוכחות השערת ה-0. ובונוס- המלצה על סטאנד-אפ מצויין.
יצא לאור ספרי "רפואה נתמכת ראיות" בהוצאת דיונון-פרובוק. לרכישה: https://www.probook.co.il/0015802475543.html
---
קישור לג'ימי או יאנג ביוטיוב
המאמר שהוזכר בפרק הזה ובפרק הקודם
Dupilumab in Children with Uncontrolled Moderate-to-Severe Asthma
---
נדבר על הדרך להבדיל בין משתנה כמותי למשתנה קטגוריאלי (נומינלי)- שיהיה (במחקר רפואי) פעמים רבות דיכוטומי. ההקשר הוא מחקר מבוקר אקראי שבחן את הטיפול בנוגדן ההומני דופילומאב בילדים עם אסטמה בינונית עד חמורה.
---
תרגום המושגים:
משתנה קטגוריאלי, נומינלי- nominal variable
משתנה כמותי- quantitative variable
משתנה דיכוטומי- dichotomus (binary) variable
המחקר שהוזכר בפרק:
Dupilumab in Children with Uncontrolled Moderate-to-Severe Asthma
נדבר על הדרך להבדיל בין משתנה כמותי למשתנה קטגוריאלי (נומינלי)- שיהיה (במחקר רפואי) פעמים רבות דיכוטומי. ההקשר הוא מחקר מבוקר אקראי שבחן את הטיפול בנוגדן ההומני דופילומאב בילדים עם אסטמה בינונית עד חמורה.
---
תרגום המושגים:
משתנה קטגוריאלי, נומינלי- nominal variable
משתנה כמותי- quantitative variable
משתנה דיכוטומי- dichotomus (binary) variable
המחקר שהוזכר בפרק:
Dupilumab in Children with Uncontrolled Moderate-to-Severe Asthma
מחקר בריטי גדול בדק את ההשפעה של סגרי הקורונה על בריאות נפשית ובדידות אצל אנשים מבוגרים. איך המאמר מתאר את מאפייני האנשים ואת רמת הבדידות שלהם? כמו כל מאמר רפואי כמעט: בעזרת "סטטיסטיקה תיאורית". נדבר על:
היסטוגרמה, מדדי אמצע ומדדי פיזור: ממוצע, חציון, טווח, סטיית תקן והטווח הבין רבעוני.
---
המחקר שנזכר בפרק- מ- JAMA Psychiatry 12/2021
מחקר בריטי גדול בדק את ההשפעה של סגרי הקורונה על בריאות נפשית ובדידות אצל אנשים מבוגרים. איך המאמר מתאר את מאפייני האנשים ואת רמת הבדידות שלהם? כמו כל מאמר רפואי כמעט: בעזרת "סטטיסטיקה תיאורית". נדבר על:
היסטוגרמה, מדדי אמצע ומדדי פיזור: ממוצע, חציון, טווח, סטיית תקן והטווח הבין רבעוני.
---
המחקר שנזכר בפרק- מ- JAMA Psychiatry 12/2021
בדיקות סקירה כמו ממוגרפיה לאבחון מוקדם של סרטן השד, או בדיקת הדופק לאבחון פרפור עליות במטופלת ללא תסמינים, הן בדיקות שנועדו לאבחן מחלה בשלב הסמוי שלה, בו עדיין אין לה תסמינים.
ניגש לנושא זה דרך המלצות חדשות של כוח המשימה האמריקאי לרפואה מונעת לגבי סקירה לפרפור עליות. כוח המשימה הגדיר מספר שאלות: האם יש תועלת קלינית בסקירה? מה ה yield? מה דיוק הבדיקות? מהם נזקי הסקירה? מהי התועלת בטיפול? ומהם נזקי הטיפול?
נדבר על הדירוג של ההמלצות מ-A ועד D, ונגלה שעבור סקירה לפרפור עליות ההמלצה שלהם היא...
---
סיכום ההמלצות והנימוקים באתר כוח המשימה האמריקאי:
Screening for Atrial Fibrillation
בדיקות סקירה כמו ממוגרפיה לאבחון מוקדם של סרטן השד, או בדיקת הדופק לאבחון פרפור עליות במטופלת ללא תסמינים, הן בדיקות שנועדו לאבחן מחלה בשלב הסמוי שלה, בו עדיין אין לה תסמינים.
ניגש לנושא זה דרך המלצות חדשות של כוח המשימה האמריקאי לרפואה מונעת לגבי סקירה לפרפור עליות. כוח המשימה הגדיר מספר שאלות: האם יש תועלת קלינית בסקירה? מה ה yield? מה דיוק הבדיקות? מהם נזקי הסקירה? מהי התועלת בטיפול? ומהם נזקי הטיפול?
נדבר על הדירוג של ההמלצות מ-A ועד D, ונגלה שעבור סקירה לפרפור עליות ההמלצה שלהם היא...
---
סיכום ההמלצות והנימוקים באתר כוח המשימה האמריקאי:
Screening for Atrial Fibrillation
פרק מורחב העוסק בשאלות יסוד של רפואה נתמכת ראיות ורפואה בכלל: על מה או על מי אנחנו סומכים כדי להאמין למידע? (ולמה הרבה אנשים סמכו על טראמפ, למשל?) מהן בכלל ראיות? למה ראיות מסוימות תקפות יותר מאחרות? אלו שאלות בתחום הפילוסוספיה, ובעקר אפיסטמולוגיה (תורת ההכרה: מה אנחנו יודעים ואיך אנחנו יודעים) והפילוסופיה של המדע. שיחה עם ארנון קרן, מרצה בכיר במחלקה לפילוסופיה באוניברסיטת חיפה.
פרק מורחב העוסק בשאלות יסוד של רפואה נתמכת ראיות ורפואה בכלל: על מה או על מי אנחנו סומכים כדי להאמין למידע? (ולמה הרבה אנשים סמכו על טראמפ, למשל?) מהן בכלל ראיות? למה ראיות מסוימות תקפות יותר מאחרות? אלו שאלות בתחום הפילוסוספיה, ובעקר אפיסטמולוגיה (תורת ההכרה: מה אנחנו יודעים ואיך אנחנו יודעים) והפילוסופיה של המדע. שיחה עם ארנון קרן, מרצה בכיר במחלקה לפילוסופיה באוניברסיטת חיפה.
בפרק הזה אציג שיטה לקריאת מאמר במהירות. גם אם לאנשים המטפלים באנשים אחרים יהיה לפעמים זמן לקרוא מאמר חשוב, לא תמיד הזמן יאפשר קריאה מעמיקה מתחילת המאמר עד סופו. אך למרות המהירות, השיטה חייבת לאפשר ניתוח תקפות טוב והבנת התוצאות.
בשיטה שאני משתמש בה, הקריאה מתחילה מהכותרת והתקציר כדי לדעת האם מדובר בנושא ושיטות המוכרים לי, ואז אני מדלג (מתוך אידאולוגיה!) על פרקי ההקדמה, הדיון והמסקנות, משקיע מאמץ בפרק השיטות, שחשוב ביותר להערכת התקפות של מאמר, וקורא חלקים נבחרים מתוך פרק התוצאות.
המאמר שנדבר עליו עוסק בכאב גב כרוני ובדרך אפשרית להתמודד ולהתגבר עליו.
---
המאמר שניתחנו (במהירות!) בפרק
https://jamanetwork.com/journals/jamapsychiatry/fullarticle/2784694
Effect of Pain Reprocessing Therapy vs Placebo and Usual Care for Patients With Chronic Back Pain
הערה: במאמר הטיפול הפעיל הושווה לטיפול רגיל וכן להזרקה תת עורית של מי מלח (normal saline). זוהי שיטה הנקראת מזותרפיה שלעתים משמשת כטיפול בכאבי שריר-שלד. עם זאת, כותרת המאמר מתייחסת לטיפול זה כפלצבו.
למתעניינים בתחום ספציפי זה, של כאב גב כרוני וטיפול בעזרת לימוד מחדש, אני ממליץ להיכנס לדף הפייסבוק של דר' אמיר צבעוני- הפרק הזה הוקלט לפני פוסט שדר' צבעוני כתב על אותו מאמר. הגישה שלו כמומחה מרתקת, יכולה לתרום להבנה מלאה יותר של נושא המאמר, ומהווה דוגמה לרפואה כוללנית ומעמיקה כמו שלימדו אותנו מורינו ברפואת המשפחה.
בפרק הזה אציג שיטה לקריאת מאמר במהירות. גם אם לאנשים המטפלים באנשים אחרים יהיה לפעמים זמן לקרוא מאמר חשוב, לא תמיד הזמן יאפשר קריאה מעמיקה מתחילת המאמר עד סופו. אך למרות המהירות, השיטה חייבת לאפשר ניתוח תקפות טוב והבנת התוצאות.
בשיטה שאני משתמש בה, הקריאה מתחילה מהכותרת והתקציר כדי לדעת האם מדובר בנושא ושיטות המוכרים לי, ואז אני מדלג (מתוך אידאולוגיה!) על פרקי ההקדמה, הדיון והמסקנות, משקיע מאמץ בפרק השיטות, שחשוב ביותר להערכת התקפות של מאמר, וקורא חלקים נבחרים מתוך פרק התוצאות.
המאמר שנדבר עליו עוסק בכאב גב כרוני ובדרך אפשרית להתמודד ולהתגבר עליו.
---
המאמר שניתחנו (במהירות!) בפרק
https://jamanetwork.com/journals/jamapsychiatry/fullarticle/2784694
Effect of Pain Reprocessing Therapy vs Placebo and Usual Care for Patients With Chronic Back Pain
הערה: במאמר הטיפול הפעיל הושווה לטיפול רגיל וכן להזרקה תת עורית של מי מלח (normal saline). זוהי שיטה הנקראת מזותרפיה שלעתים משמשת כטיפול בכאבי שריר-שלד. עם זאת, כותרת המאמר מתייחסת לטיפול זה כפלצבו.
למתעניינים בתחום ספציפי זה, של כאב גב כרוני וטיפול בעזרת לימוד מחדש, אני ממליץ להיכנס לדף הפייסבוק של דר' אמיר צבעוני- הפרק הזה הוקלט לפני פוסט שדר' צבעוני כתב על אותו מאמר. הגישה שלו כמומחה מרתקת, יכולה לתרום להבנה מלאה יותר של נושא המאמר, ומהווה דוגמה לרפואה כוללנית ומעמיקה כמו שלימדו אותנו מורינו ברפואת המשפחה.
האזנה לריאות היא בדיקה (יש יאמרו טקס) מקובלת מאוד לאבחנה או לשלילת דלקת ריאות, אך האם שני בודקים שונים יסכימו ביניהם על ממצאי ההאזנה?
נדבר על שתיים מהבדיקות שנועדו לבדוק האם קיימת דלקת ריאות, ברונכופוניה ואגופוניה, נספר איך הן מתבצעות, ועל מחקר מאוד מעניין שבדק גם את הרגישות והספציפיות של בדיקות אלו, וגם את ההסכמה בין בודקים שונים לגבי נוכחות הממצאים האלו.
ערך הקאפא ( Cohen’s kappa) הוא "מדד ההסכמה". הוא מחושב לגבי ממצא המתחלק קטגורית (למשל: "יש צהבת" לעומת "אין צהבת"). החישוב עצמו משתמש בשיעור ההסכמה בפועל בין בודקים שונים , אך לוקח בחשבון גם את ההסכמה הצפויה מתוך מקריות.
---
Diagnosing Pneumonia by Physical Examination- relevant or relic?
https://jamanetwork.com/journals/jamainternalmedicine/article-abstract/485032
במחקר זה, שלושה רופאים מומחים ומנוסים האזינו לריאות אצל כ 50 מטופלים שונים, ערך הקאפא עבור הבדיקות אגופוני (egophony) וברונכופוני (bronchophony) נעו בין הסכמה מקרית בלבד, לבין הסכמה מזערית.
האזנה לריאות היא בדיקה (יש יאמרו טקס) מקובלת מאוד לאבחנה או לשלילת דלקת ריאות, אך האם שני בודקים שונים יסכימו ביניהם על ממצאי ההאזנה?
נדבר על שתיים מהבדיקות שנועדו לבדוק האם קיימת דלקת ריאות, ברונכופוניה ואגופוניה, נספר איך הן מתבצעות, ועל מחקר מאוד מעניין שבדק גם את הרגישות והספציפיות של בדיקות אלו, וגם את ההסכמה בין בודקים שונים לגבי נוכחות הממצאים האלו.
ערך הקאפא ( Cohen’s kappa) הוא "מדד ההסכמה". הוא מחושב לגבי ממצא המתחלק קטגורית (למשל: "יש צהבת" לעומת "אין צהבת"). החישוב עצמו משתמש בשיעור ההסכמה בפועל בין בודקים שונים , אך לוקח בחשבון גם את ההסכמה הצפויה מתוך מקריות.
---
Diagnosing Pneumonia by Physical Examination- relevant or relic?
https://jamanetwork.com/journals/jamainternalmedicine/article-abstract/485032
במחקר זה, שלושה רופאים מומחים ומנוסים האזינו לריאות אצל כ 50 מטופלים שונים, ערך הקאפא עבור הבדיקות אגופוני (egophony) וברונכופוני (bronchophony) נעו בין הסכמה מקרית בלבד, לבין הסכמה מזערית.
מתוך שתי התרופות שניתן לתת דרך הפה למטופלים עם מחלה קלה או בינונית בימים הראשונים של המחלה, הטיפול הבכור אך המקובל כרגע רק כעדיפות שנייה הוא מולנופיראוויר. בפרק נציג את התרופה ואת המחקר שבדק אותה. המחקר כלל חולים לא מחוסנים עם קורונה "טרייה" ועם גורמי סיכון להתדרדרות. קבוצת הבקרה קיבלה פלצבו, והתוצא העיקרי היה תמותה או אשפוז ב 29 הימים לאחר הרנדומיזציה. תוצא זה התרחש אצל 9.7% מהמשתתפים בקבוצת הפלצבו, ואצל 6.8% בקבוצת הטיפול הפעיל. שיעור תופעות הלוואי היה דומה בין הטיפול הפעיל לפלצבו. נצלול לעומק השיטות ונגלה סיכוי שהסמיות (bliniding) לא הייתה מושלמת.
---
תיקון חשוב לטעות בפרק- כמובן ה NNT מספר האנשים שיש לטפל בהם כדי למנוע אירוע אחד נמדד ב"אנשים" ולא ב"אחוז".
---
קישור למאמר מ NEJM, דצמבר 2021:
Molnupiravir for Oral Treatment of Covid-19 in Nonhospitalized Patients
מתוך שתי התרופות שניתן לתת דרך הפה למטופלים עם מחלה קלה או בינונית בימים הראשונים של המחלה, הטיפול הבכור אך המקובל כרגע רק כעדיפות שנייה הוא מולנופיראוויר. בפרק נציג את התרופה ואת המחקר שבדק אותה. המחקר כלל חולים לא מחוסנים עם קורונה "טרייה" ועם גורמי סיכון להתדרדרות. קבוצת הבקרה קיבלה פלצבו, והתוצא העיקרי היה תמותה או אשפוז ב 29 הימים לאחר הרנדומיזציה. תוצא זה התרחש אצל 9.7% מהמשתתפים בקבוצת הפלצבו, ואצל 6.8% בקבוצת הטיפול הפעיל. שיעור תופעות הלוואי היה דומה בין הטיפול הפעיל לפלצבו. נצלול לעומק השיטות ונגלה סיכוי שהסמיות (bliniding) לא הייתה מושלמת.
---
תיקון חשוב לטעות בפרק- כמובן ה NNT מספר האנשים שיש לטפל בהם כדי למנוע אירוע אחד נמדד ב"אנשים" ולא ב"אחוז".
---
קישור למאמר מ NEJM, דצמבר 2021:
Molnupiravir for Oral Treatment of Covid-19 in Nonhospitalized Patients
פקסלוביד- תרופה דרך הפה למניעת סיבוכי קורונה- אושרה לשימוש במהירות מאוד חריגה: לפני פרסום המאמר שהדגים את יעילות ובטיחות התרופה.
האישור בוצע על סמך מידע שנמסר למנהל התרופות והמזון האמריקאי ולמקבילה האירופאית שלו לגבי המחקר שבו נבדקה התרופה. המידע שנוכל לקרוא כעת (סוף ינואר 2022) על המחקר נמצא באתר clinicaltrials.gov, ומתוכו אפשר להסיק בעקר לגבי תקפות חיצונית של המחקר. תקפות חיצונית היא היכולת להכליל מתוך אוכלוסיית המחקר גם על אנשים אחרים- המטופלים שלנו.
---
אישור חירום לתרופה של סוכנות התרופות האירופאית- ינואר 2022
אישור חירום לתרופה של מנהל התרופות והמזון האמריקאי- דצמבר 2022
נתוני המחקר לפי הרישום ב clinicaltrials.gov
EPIC-HR: Study of Oral PF-07321332/Ritonavir Compared With Placebo in Nonhospitalized High Risk Adults With COVID-19
מאמר על התרופה מ science, שפורסם על ידי צוות המחקר של פייזר, נובמבר 2021, כולל תיאור של מחקרי מעבדה
פקסלוביד- תרופה דרך הפה למניעת סיבוכי קורונה- אושרה לשימוש במהירות מאוד חריגה: לפני פרסום המאמר שהדגים את יעילות ובטיחות התרופה.
האישור בוצע על סמך מידע שנמסר למנהל התרופות והמזון האמריקאי ולמקבילה האירופאית שלו לגבי המחקר שבו נבדקה התרופה. המידע שנוכל לקרוא כעת (סוף ינואר 2022) על המחקר נמצא באתר clinicaltrials.gov, ומתוכו אפשר להסיק בעקר לגבי תקפות חיצונית של המחקר. תקפות חיצונית היא היכולת להכליל מתוך אוכלוסיית המחקר גם על אנשים אחרים- המטופלים שלנו.
---
אישור חירום לתרופה של סוכנות התרופות האירופאית- ינואר 2022
אישור חירום לתרופה של מנהל התרופות והמזון האמריקאי- דצמבר 2022
נתוני המחקר לפי הרישום ב clinicaltrials.gov
EPIC-HR: Study of Oral PF-07321332/Ritonavir Compared With Placebo in Nonhospitalized High Risk Adults With COVID-19
מאמר על התרופה מ science, שפורסם על ידי צוות המחקר של פייזר, נובמבר 2021, כולל תיאור של מחקרי מעבדה
עד כמה מדוייקת בדיקת האנטיגן לאבחון זיהום בזן האומיקרון?
המצאה חדשה שפורסמה כמכתב לBMJ evidence based medicine אינה גילוי מדעי מרעיש, אלא סתם ראשי תיבות שיעזרו לנסח שאלה על בדיקה אבחנתית בצורה טובה יותר, ולגלות מחקר שעוסק בדיוק בשאלה שמעניינת אותנו.
ראשי התיבות PTSD עבור ניסוח שאלה על בדיקה אבחנתית כוללים את המלים:
Population/Patient
Test
Standard
Disease
במטופלים שנחשפו למאומתים או עם תסמינים, בשיא גל האומיקרון בקליפורניה, מתוך 731 איש, אצל כ- 40% בדיקת PCR הייתה חיובית. רגישות בדיקת אנטיגן מהיר (סף Rt-PCR , הסטנדרט להשוואה, היה Ct-40) הייתה 65%, והספציפיות 99%.
---
המחקר המקורי בטקסט מלא (עדיין ללא פרסום או peer reviow)
בשינוי סף הסטנדרט ל- Ct-30, רגישות בדיקת האנטיגן הייתה 95%, והספציפיות 96%.
ובשינוי הסף לערך ביניים- Ct-35: רגישות 82%, ספציפיות 99%.
הקישור למכתב ב- BMJ evidence medicine:
Replacing PICO in non-interventional studies
עד כמה מדוייקת בדיקת האנטיגן לאבחון זיהום בזן האומיקרון?
המצאה חדשה שפורסמה כמכתב לBMJ evidence based medicine אינה גילוי מדעי מרעיש, אלא סתם ראשי תיבות שיעזרו לנסח שאלה על בדיקה אבחנתית בצורה טובה יותר, ולגלות מחקר שעוסק בדיוק בשאלה שמעניינת אותנו.
ראשי התיבות PTSD עבור ניסוח שאלה על בדיקה אבחנתית כוללים את המלים:
Population/Patient
Test
Standard
Disease
במטופלים שנחשפו למאומתים או עם תסמינים, בשיא גל האומיקרון בקליפורניה, מתוך 731 איש, אצל כ- 40% בדיקת PCR הייתה חיובית. רגישות בדיקת אנטיגן מהיר (סף Rt-PCR , הסטנדרט להשוואה, היה Ct-40) הייתה 65%, והספציפיות 99%.
---
המחקר המקורי בטקסט מלא (עדיין ללא פרסום או peer reviow)
בשינוי סף הסטנדרט ל- Ct-30, רגישות בדיקת האנטיגן הייתה 95%, והספציפיות 96%.
ובשינוי הסף לערך ביניים- Ct-35: רגישות 82%, ספציפיות 99%.
הקישור למכתב ב- BMJ evidence medicine:
Replacing PICO in non-interventional studies
בפרק הזה נטען שבספרות רפואית יש רק שתי טעויות אפשריות: טעות מדגם (אקראית) או הטיה. תמיד יהיו טעויות מדגם, ותמיד טעויות אלו הן מקריות והכיוון שלהן יהיה לשני הצדדים, ואילו הטיות תלויות בשיטת המחקר, ולרוב יהיה להן כיוון מסוים.
נדגים את העיקרון הזה על מאמר שבדק יעילות של איברמקטין לארדיקציה של נגיף הקורונה כפי שנמדדה בבדיקת PCR, ונבחן מהן הטעויות האפשריות במחקר זה.
---
המאמר שהופיע בפרק
---
מידע נוסף הקשור לפרק
מחקר מצויין, שפורסם ב JAMA, עם גודל מדגם גדול שלא הראה הבדל בהבראה בין אלו שקיבלו איברמקטין לאלו שקיבלו פלצבו
מחשבון לחישוב רווח בר סמך לתוצאות מאמרים
מאמר הדן בתופעות לואי נוירולוגיות חמורות משנית לאיברמקטין.
בפרק הזה נטען שבספרות רפואית יש רק שתי טעויות אפשריות: טעות מדגם (אקראית) או הטיה. תמיד יהיו טעויות מדגם, ותמיד טעויות אלו הן מקריות והכיוון שלהן יהיה לשני הצדדים, ואילו הטיות תלויות בשיטת המחקר, ולרוב יהיה להן כיוון מסוים.
נדגים את העיקרון הזה על מאמר שבדק יעילות של איברמקטין לארדיקציה של נגיף הקורונה כפי שנמדדה בבדיקת PCR, ונבחן מהן הטעויות האפשריות במחקר זה.
---
המאמר שהופיע בפרק
---
מידע נוסף הקשור לפרק
מחקר מצויין, שפורסם ב JAMA, עם גודל מדגם גדול שלא הראה הבדל בהבראה בין אלו שקיבלו איברמקטין לאלו שקיבלו פלצבו
מחשבון לחישוב רווח בר סמך לתוצאות מאמרים
מאמר הדן בתופעות לואי נוירולוגיות חמורות משנית לאיברמקטין.
הפרק הזה עוסק במחקרי סקר (survey), בוויתור על טיפולים רפואיים בתקופת התפרצות הקורונה, וגם בשחיקת מתמחים/ות.
סקרים, בנייתם, ביצועם ודיווח עליהם הם מקצוע בפני עצמו, ולא ננסה להבין את כל מורכבות הנושא, אך יש מספר כשלים נפוצים במיוחד בביצוע ודיווח על מחקרי סקר: מדגם שאינו מייצג, שאלות או שאלון בעייתיים, ותוצאות המוצגות ללא ייצוג אי הוודאות.
---
מאמר סקירה עם פירוט רב כיצד אמור להתבצע מחקר סקר/ שאלון טוב ומה צריך להופיע בו.
הסבר פשוט על reliability ו-validity.
הנחיות לביצוע ודיווח על סקר (למי שמעוניין לבצע אחד כזה).
---
מחקרים שהוזכרו בפרק:
התכנית הלאומית לחיזוק עובדי מערכת הבריאות ולמניעת שחיקה
ממצאי הסקר הלאומי- עבור רופא מתמחה, אפריל 2019
הפרק הזה עוסק במחקרי סקר (survey), בוויתור על טיפולים רפואיים בתקופת התפרצות הקורונה, וגם בשחיקת מתמחים/ות.
סקרים, בנייתם, ביצועם ודיווח עליהם הם מקצוע בפני עצמו, ולא ננסה להבין את כל מורכבות הנושא, אך יש מספר כשלים נפוצים במיוחד בביצוע ודיווח על מחקרי סקר: מדגם שאינו מייצג, שאלות או שאלון בעייתיים, ותוצאות המוצגות ללא ייצוג אי הוודאות.
---
מאמר סקירה עם פירוט רב כיצד אמור להתבצע מחקר סקר/ שאלון טוב ומה צריך להופיע בו.
הסבר פשוט על reliability ו-validity.
הנחיות לביצוע ודיווח על סקר (למי שמעוניין לבצע אחד כזה).
---
מחקרים שהוזכרו בפרק:
התכנית הלאומית לחיזוק עובדי מערכת הבריאות ולמניעת שחיקה
ממצאי הסקר הלאומי- עבור רופא מתמחה, אפריל 2019
קוביד בן שנתיים ולצערנו ממשיך להתפתח. בעזרת אוסף של מחקרים חשובים שפורסמו מאז הולדתו, נדבר גם על מה שעבר עלינו (לפחות מבחינת ממצאי מחקר...) בשנתיים אלו, וגם על סוגי מחקרים שונים:
סדרת מקרים, מחקר קוהורט, מחקר מבוקר ללא חלוקה אקראית, מחקר מבוקר אקראי (RCT), מחקר חתך, מחקר מקרה בקרה, ומטא אנליזה.
---
על כל אחד מסוגי מחקר אלו יש בפודקאסט לפחות פרק אחד, והפרק "הציוצים של טראמפ וסוגי מחקרים" עוסק בנושא סוגי מחקרים שונים מזווית מעט שונה- זווית התקפות. הירשמו דרך אפליקציית הפודקאסטים שלכם לקבלת כל הפרקים הקודמים.
---
המאמרים שהוזכרו בפרק:
סטרואידים בקוביד 19: קוהורט מאיטליה שהדגים תמותה גבוהה יותר במטופלים שקיבלו סטרואידים
סטרואידים בקוביד 19: המחקר המבוקר האקראי (RCT) על דקסמתזון במאושפזים– שהדגים הפחתת תמותה עם הטיפול
סטרואידים בקוביד 19: מטא אנליזה מ 2021 שבדקה רק מחקרים מבוקרים אקראיים. הטיפול הפחית תמותה
מחקר מבוקר אקראי של חיסון פייזר ביונטק- בטיחות ויעילות משך חצי שנה
קוהורט ישראלי על מועילות החיסון
קוהורט ישראלי על בטיחות החיסון
הידרוקסיכלורוקוין בקוביד 19: מחקר מבוקר לא אקראי שהראה הפחתה בעומס הנגיפי בקבוצת הטיפול
הידרוקסיכלורוקוין בקוביד 19: מחקר מבוקר אקראי בנחשפים, שלא הדגים תועלת במניעת מחלה
מחקר מקרה-בקרה (case control) על מועילות החיסון נגד זן האומיקרון
מחקר חתך- דיוק בדיקת אנטיגן בנחשפים לחולה מאומת
קוביד בן שנתיים ולצערנו ממשיך להתפתח. בעזרת אוסף של מחקרים חשובים שפורסמו מאז הולדתו, נדבר גם על מה שעבר עלינו (לפחות מבחינת ממצאי מחקר...) בשנתיים אלו, וגם על סוגי מחקרים שונים:
סדרת מקרים, מחקר קוהורט, מחקר מבוקר ללא חלוקה אקראית, מחקר מבוקר אקראי (RCT), מחקר חתך, מחקר מקרה בקרה, ומטא אנליזה.
---
על כל אחד מסוגי מחקר אלו יש בפודקאסט לפחות פרק אחד, והפרק "הציוצים של טראמפ וסוגי מחקרים" עוסק בנושא סוגי מחקרים שונים מזווית מעט שונה- זווית התקפות. הירשמו דרך אפליקציית הפודקאסטים שלכם לקבלת כל הפרקים הקודמים.
---
המאמרים שהוזכרו בפרק:
סטרואידים בקוביד 19: קוהורט מאיטליה שהדגים תמותה גבוהה יותר במטופלים שקיבלו סטרואידים
סטרואידים בקוביד 19: המחקר המבוקר האקראי (RCT) על דקסמתזון במאושפזים– שהדגים הפחתת תמותה עם הטיפול
סטרואידים בקוביד 19: מטא אנליזה מ 2021 שבדקה רק מחקרים מבוקרים אקראיים. הטיפול הפחית תמותה
מחקר מבוקר אקראי של חיסון פייזר ביונטק- בטיחות ויעילות משך חצי שנה
קוהורט ישראלי על מועילות החיסון
קוהורט ישראלי על בטיחות החיסון
הידרוקסיכלורוקוין בקוביד 19: מחקר מבוקר לא אקראי שהראה הפחתה בעומס הנגיפי בקבוצת הטיפול
הידרוקסיכלורוקוין בקוביד 19: מחקר מבוקר אקראי בנחשפים, שלא הדגים תועלת במניעת מחלה
מחקר מקרה-בקרה (case control) על מועילות החיסון נגד זן האומיקרון
מחקר חתך- דיוק בדיקת אנטיגן בנחשפים לחולה מאומת
רפואה נתמכת ראיות היא כלי חד, חשוב ומקובל מאוד. עם זאת, כמו לכל כלי יש גם לה נזקים אפשריים, שבפרק הזה נדבר על חלק מהם: מחיר ההזדמנות בחינוך ובהתמקצעות אישית, השפעות שליליות על המחקר והספרות הרפואית, ושימוש מזיק בקווים מנחים.
---
לקריאה נוספת
Evidence-Based Medicine in Theory and Practice: Epistemological and Normative Issues
ניתוח של הבעייתיות של רפואה נתמכת ראיות מנקודת מבט פילוסופית ואתית
Evidence based medicine: what it is and what it isn't
כתב הגנה לרפואה נתמכת ראיות, שכתבו מייסדי השיטה, כולל סאקט (sackett)
Evidence based medicine: a movement in crisis?
מאמר מה BMJ משנת 2014 שמתאר הן נזקים של השיטה והן פתרונות אפשריים
רפואה נתמכת ראיות היא כלי חד, חשוב ומקובל מאוד. עם זאת, כמו לכל כלי יש גם לה נזקים אפשריים, שבפרק הזה נדבר על חלק מהם: מחיר ההזדמנות בחינוך ובהתמקצעות אישית, השפעות שליליות על המחקר והספרות הרפואית, ושימוש מזיק בקווים מנחים.
---
לקריאה נוספת
Evidence-Based Medicine in Theory and Practice: Epistemological and Normative Issues
ניתוח של הבעייתיות של רפואה נתמכת ראיות מנקודת מבט פילוסופית ואתית
Evidence based medicine: what it is and what it isn't
כתב הגנה לרפואה נתמכת ראיות, שכתבו מייסדי השיטה, כולל סאקט (sackett)
Evidence based medicine: a movement in crisis?
מאמר מה BMJ משנת 2014 שמתאר הן נזקים של השיטה והן פתרונות אפשריים
אחת הגישות לפתרון דילמות אתיות ברפואה היא גישת העקרונות. גישה זו בוחנת את הבעיה מארבעה כיוונים: עשיית הטוב, הימנעות מעשיית נזק, אוטונומיה, וצדק. בפרק ננסה להבין למה רפואה נתמכת ראיות חשובה מאוד ליישום העקרונות האלו.
---
הסבר קצר על ארבעת העקרונות
https://depts.washington.edu/bhdept/ethics-medicine/bioethics-topics/articles/principles-bioethics
מאמר על יישום העקרונות בעזרת רפואה נתמכת ראיות
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6207438/
אחת הגישות לפתרון דילמות אתיות ברפואה היא גישת העקרונות. גישה זו בוחנת את הבעיה מארבעה כיוונים: עשיית הטוב, הימנעות מעשיית נזק, אוטונומיה, וצדק. בפרק ננסה להבין למה רפואה נתמכת ראיות חשובה מאוד ליישום העקרונות האלו.
---
הסבר קצר על ארבעת העקרונות
https://depts.washington.edu/bhdept/ethics-medicine/bioethics-topics/articles/principles-bioethics
מאמר על יישום העקרונות בעזרת רפואה נתמכת ראיות
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6207438/
מחקר ראשון על מועילות החיסונים הקיימים נגד זן האומיקרון בעולם האמיתי, התפרסם כ preprint.
המחקר שבוצע בשיטת TND (test negative design) , הוא למעשה מחקר מקרה-בקרה, ולכן חשוף להטיות של מחקרים תצפיתיים מסוג זה. המחקר בדק גם את מועילות חיסון פייזר-ביונטק נגד זן האומיקרון, בעזרת מידע ממאגר המידע הממוחשב לגבי אנשים אצלם אובחן האומיקרון לעומת אנשים עם בדיקה שלילית. המחקר כלל רק משתתפים עם תסמינים, ומצא שלאחר כשלושה חודשים מחיסון כפול, יעילות החיסון נגד זן האומיקרון הייתה 48% (CI: 24%-65%), לאחר כארבעה חודשים כ 34% (CI: 10%-50%), ולאחר בוסטר כ 75% (CI: 56%-86%)
נדבר על הטיות אפשריות במחקר זה ועל משמעות ה confidence interval.
---
Effectiveness of COVID-19 vaccines against the Omicron (B.1.1.529) variant of concern
מחקר ראשון על מועילות החיסונים הקיימים נגד זן האומיקרון בעולם האמיתי, התפרסם כ preprint.
המחקר שבוצע בשיטת TND (test negative design) , הוא למעשה מחקר מקרה-בקרה, ולכן חשוף להטיות של מחקרים תצפיתיים מסוג זה. המחקר בדק גם את מועילות חיסון פייזר-ביונטק נגד זן האומיקרון, בעזרת מידע ממאגר המידע הממוחשב לגבי אנשים אצלם אובחן האומיקרון לעומת אנשים עם בדיקה שלילית. המחקר כלל רק משתתפים עם תסמינים, ומצא שלאחר כשלושה חודשים מחיסון כפול, יעילות החיסון נגד זן האומיקרון הייתה 48% (CI: 24%-65%), לאחר כארבעה חודשים כ 34% (CI: 10%-50%), ולאחר בוסטר כ 75% (CI: 56%-86%)
נדבר על הטיות אפשריות במחקר זה ועל משמעות ה confidence interval.
---
Effectiveness of COVID-19 vaccines against the Omicron (B.1.1.529) variant of concern
על מחקר מעבדתי שהתפרסם בינתיים רק כ preprint, ומרמז על האפשרות שזן האומיקרון עלול לחמוק מהחיסונים הניתנים היום. מחקר שמקורו מפרנקפורט, ובו נגיף מזן האומיקרון שבודד מחולה שחזר מאפריקה עומת נגד סרום של אנשים שקיבלו חיסונים שונים. נבדקה יכולת הסרום לנטרל את הנגיף הזה לעומת יכולת הסרום לנטרל נגיף מזן דלתא.
מדובר במחקר שמצד אחד מראה סימנים מדאיגים, אך מצד שני מחקר מעבדתי שבדק תוצא שהוא סרוגייט: יכולת הסרום לנטרל נגיף בתרבית תאים לא בהכרח מעידה על יכולת האדם להימנע מזיהום, או להימנע מזיהום חמור. ימים יגידו.
פרקים ישנים בפודקאסט בנושאים קשורים היו על סרוגייט ומחלת צליאק ועל כנים ופנסי ראש.
---
המחקר שעליו דובר, התפרסם ברשת כ preprint:
Reduced Neutralization of SARS-CoV-2 Omicron Variant by Vaccine Sera and Monoclonal Antibodies
מחקר שהתפרסם ב-lancet בנובמבר 2021: יכולת הנטרול של הסרום מנבאת יעילות של חיסון
מחקר אחר- שהתפרסם ב cell בדצמבר 2020, הראה קורלציה בין יכולת הנטרול של הסרום לסבירות לזיהום חמור ב covid 19.
על מחקר מעבדתי שהתפרסם בינתיים רק כ preprint, ומרמז על האפשרות שזן האומיקרון עלול לחמוק מהחיסונים הניתנים היום. מחקר שמקורו מפרנקפורט, ובו נגיף מזן האומיקרון שבודד מחולה שחזר מאפריקה עומת נגד סרום של אנשים שקיבלו חיסונים שונים. נבדקה יכולת הסרום לנטרל את הנגיף הזה לעומת יכולת הסרום לנטרל נגיף מזן דלתא.
מדובר במחקר שמצד אחד מראה סימנים מדאיגים, אך מצד שני מחקר מעבדתי שבדק תוצא שהוא סרוגייט: יכולת הסרום לנטרל נגיף בתרבית תאים לא בהכרח מעידה על יכולת האדם להימנע מזיהום, או להימנע מזיהום חמור. ימים יגידו.
פרקים ישנים בפודקאסט בנושאים קשורים היו על סרוגייט ומחלת צליאק ועל כנים ופנסי ראש.
---
המחקר שעליו דובר, התפרסם ברשת כ preprint:
Reduced Neutralization of SARS-CoV-2 Omicron Variant by Vaccine Sera and Monoclonal Antibodies
מחקר שהתפרסם ב-lancet בנובמבר 2021: יכולת הנטרול של הסרום מנבאת יעילות של חיסון
מחקר אחר- שהתפרסם ב cell בדצמבר 2020, הראה קורלציה בין יכולת הנטרול של הסרום לסבירות לזיהום חמור ב covid 19.
איך לבחור טיפול תרופתי לכאב חריף? ואיך לקרוא מאמר סקירה תיאורית (narrative review) לעומק?
כשאנחנו קוראים מאמרי סקירה או פרקים בספרים, ננסה לא להבין דברים כפשוטם, אלא לראות דרך הטקסט ולחפש מה מסתתר מאחוריו. נדבר על שלושה סוגי העמקה:
סקפטיות לגבי הקשר בין ממצאי המחקר הרפואי לבין מה שנכתב לנו במאמר הספציפי; הבנה כמותית- מה אומרים המספרים ומאילו סוגי מחקרים הם נאספו; והשוואה בין הידע במאמר לבין הידע והעשייה הרפואית היומיומית, עם מוכנות לשנות את העשייה אם יש ראיות שהשינוי כדאי.
---
מאמרים שהוזכרו בפרק
המאמר העקרי שהוזכר בפרק:
Pharmacologic Therapy for Acute Pain
מאמר שצוטט במאמר העיקרי (כמקור לאמירה שטיפול בכאב חריף יכול למנוע התקדמות לכאב כרוני). סקירה תיאורית.
Poorly controlled postoperative pain: prevalence, consequences, and prevention
סקירת ספרות שיטתית של קוקרן: טיפול תרופתי בכאב לאחר ניתוח למניעת כאב כרוני (עוזר מעט, אם בכלל, למניעת כאב כרוני לפי סקירה זו)
Systemic drugs for the prevention of chronic pain after surgery
סקירת קוקרן: טיפול בנוגדי דלקת למריחה מקומית לכאב שריר-שלד
Topical non-steroidal anti-inflammatory drugs for acute musculoskeletal pain in adults
מטה אנליזה המשווה בין תרופות נוגדות דלקת שונות והסיכון לדמם מערכת העיכול
איך לבחור טיפול תרופתי לכאב חריף? ואיך לקרוא מאמר סקירה תיאורית (narrative review) לעומק?
כשאנחנו קוראים מאמרי סקירה או פרקים בספרים, ננסה לא להבין דברים כפשוטם, אלא לראות דרך הטקסט ולחפש מה מסתתר מאחוריו. נדבר על שלושה סוגי העמקה:
סקפטיות לגבי הקשר בין ממצאי המחקר הרפואי לבין מה שנכתב לנו במאמר הספציפי; הבנה כמותית- מה אומרים המספרים ומאילו סוגי מחקרים הם נאספו; והשוואה בין הידע במאמר לבין הידע והעשייה הרפואית היומיומית, עם מוכנות לשנות את העשייה אם יש ראיות שהשינוי כדאי.
---
מאמרים שהוזכרו בפרק
המאמר העקרי שהוזכר בפרק:
Pharmacologic Therapy for Acute Pain
מאמר שצוטט במאמר העיקרי (כמקור לאמירה שטיפול בכאב חריף יכול למנוע התקדמות לכאב כרוני). סקירה תיאורית.
Poorly controlled postoperative pain: prevalence, consequences, and prevention
סקירת ספרות שיטתית של קוקרן: טיפול תרופתי בכאב לאחר ניתוח למניעת כאב כרוני (עוזר מעט, אם בכלל, למניעת כאב כרוני לפי סקירה זו)
Systemic drugs for the prevention of chronic pain after surgery
סקירת קוקרן: טיפול בנוגדי דלקת למריחה מקומית לכאב שריר-שלד
Topical non-steroidal anti-inflammatory drugs for acute musculoskeletal pain in adults
מטה אנליזה המשווה בין תרופות נוגדות דלקת שונות והסיכון לדמם מערכת העיכול
מדיקליזציה היא תופעה חברתית, שבה מקצוע הרפואה ואנשי הרפואה "לוקחים על עצמם" (או לעצמם) תחום מסוים, התנהגות או הבט מסוים בחיי האדם או החברה. היא יכולה להיות בעלת השפעות חיוביות (כמו במקרה של מחלת נפש, שלפני המדיקליזציה שלה הייתה נחשבת לעתים כפשע), או שליליות (כמו במקרה של הומוסקסואליות שלבושתנו, בעקבות מדיקליזציה, הוגדרה בעבר על ידי הממסד הרפואי כ"מחלה").
כמובן שלמדיקליזציה בתחומים שונים של חיי האדם והחברה יש יתרונות, החשוב ביניהם הוא האפשרות להועיל- למנוע סבל, להקל את הסבל אצל אנשים, לאבחן מצבים ולתת להם שם. אך חשוב להבין גם מה חסרונות המדיקליזציה. נדבר על שלושה מהם: הסטת משאבים של החברה לממסד הרפואי, איבוד הביטחון של אדם בעצמו ובגופו, ומתן אשליה של הבנה ובטחון.
---
Medicalization and Social Control
סקירה של מדיקליזציה מ 1992 על ידי אחד הסוציולוגים החשובים בתחום.
Labor Induction versus Expectant Management in Low-Risk Nulliparous Women
מחקר ה arrive- שהתפרסם ב 2018
על המדיקליזציה של לידה- מאמר דעה (opinion)
על מדיקליזציה ורה-מדיקליזציה (התהליך ההפוך) של הומוסקסוקאליות- מאמר היסטוריה רפואית.
מדיקליזציה היא תופעה חברתית, שבה מקצוע הרפואה ואנשי הרפואה "לוקחים על עצמם" (או לעצמם) תחום מסוים, התנהגות או הבט מסוים בחיי האדם או החברה. היא יכולה להיות בעלת השפעות חיוביות (כמו במקרה של מחלת נפש, שלפני המדיקליזציה שלה הייתה נחשבת לעתים כפשע), או שליליות (כמו במקרה של הומוסקסואליות שלבושתנו, בעקבות מדיקליזציה, הוגדרה בעבר על ידי הממסד הרפואי כ"מחלה").
כמובן שלמדיקליזציה בתחומים שונים של חיי האדם והחברה יש יתרונות, החשוב ביניהם הוא האפשרות להועיל- למנוע סבל, להקל את הסבל אצל אנשים, לאבחן מצבים ולתת להם שם. אך חשוב להבין גם מה חסרונות המדיקליזציה. נדבר על שלושה מהם: הסטת משאבים של החברה לממסד הרפואי, איבוד הביטחון של אדם בעצמו ובגופו, ומתן אשליה של הבנה ובטחון.
---
Medicalization and Social Control
סקירה של מדיקליזציה מ 1992 על ידי אחד הסוציולוגים החשובים בתחום.
Labor Induction versus Expectant Management in Low-Risk Nulliparous Women
מחקר ה arrive- שהתפרסם ב 2018
על המדיקליזציה של לידה- מאמר דעה (opinion)
על מדיקליזציה ורה-מדיקליזציה (התהליך ההפוך) של הומוסקסוקאליות- מאמר היסטוריה רפואית.
בפרק נדבר על מחקר שבחן האם בנשים בלידה ראשונה, בסיכון נמוך לסיבוכים, השראת לידה (labor induction) אלקטיבית לפני שבוע 40 להריון מפחיתה סיכון לניתוח קיסרי ולסיבוכים לילוד.
למרות רושם ראשוני של מחקר תקף עם תוצאות די משכנעות, קריאה של המאמר בעזרת מומחה בתחום, תוך הבנת ההקשר בו נערך המחקר וההקשר הקליני של יישומו, מעלה שאלות רבות.
רפואה נתמכת ראיות היא לא "המחקר שהוכיח שהתערבות מסוימת מועילה" אלא שיטה שחייבת לכלול, בנוסף לערכי ומטרות המטופלת, גם את מומחיות המטפל/ת.
תודה רבה לדר' מתן אלעמי-סוזין, מומחה ביילוד וגינקולוגיה.
---
מחקר ה arrive- שהתפרסם ב 2018
Labor Induction versus Expectant Management in Low-Risk Nulliparous Women
---
דוגמאות להתערבויות נוספות להפחתת שיעור הניתוחים הקיסריים:
סקירת קוקרן ב -2017 הראתה שנוכחות מלווה בלידה (דולה) מפחיתה קיסריים
בכ- 25% (הפחתת סיכון יחסית, relative risk). הסוקרים הגדירו את המחקרים שעסקו בתחום כ- low quality.
שני מחקרים בדרגת תקפות נמוכה יחסית, ללא קבוצת בקרה, שבדקו התערבות מערכתית להפחתת ניתוחים קיסריים בארצות הברית. אלה היו בעקרן התערבויות חינוכיות לצוות הרפואי בחדרי הלידה, בהתאם לקווים מנחים. במרילנד ההתערבות הפחיתה שיעור ניתוחים קיסריים מ 28.5% ל 27%. ובקליפורניה מ 26% ל 23%.
בפרק נדבר על מחקר שבחן האם בנשים בלידה ראשונה, בסיכון נמוך לסיבוכים, השראת לידה (labor induction) אלקטיבית לפני שבוע 40 להריון מפחיתה סיכון לניתוח קיסרי ולסיבוכים לילוד.
למרות רושם ראשוני של מחקר תקף עם תוצאות די משכנעות, קריאה של המאמר בעזרת מומחה בתחום, תוך הבנת ההקשר בו נערך המחקר וההקשר הקליני של יישומו, מעלה שאלות רבות.
רפואה נתמכת ראיות היא לא "המחקר שהוכיח שהתערבות מסוימת מועילה" אלא שיטה שחייבת לכלול, בנוסף לערכי ומטרות המטופלת, גם את מומחיות המטפל/ת.
תודה רבה לדר' מתן אלעמי-סוזין, מומחה ביילוד וגינקולוגיה.
---
מחקר ה arrive- שהתפרסם ב 2018
Labor Induction versus Expectant Management in Low-Risk Nulliparous Women
---
דוגמאות להתערבויות נוספות להפחתת שיעור הניתוחים הקיסריים:
סקירת קוקרן ב -2017 הראתה שנוכחות מלווה בלידה (דולה) מפחיתה קיסריים
בכ- 25% (הפחתת סיכון יחסית, relative risk). הסוקרים הגדירו את המחקרים שעסקו בתחום כ- low quality.
שני מחקרים בדרגת תקפות נמוכה יחסית, ללא קבוצת בקרה, שבדקו התערבות מערכתית להפחתת ניתוחים קיסריים בארצות הברית. אלה היו בעקרן התערבויות חינוכיות לצוות הרפואי בחדרי הלידה, בהתאם לקווים מנחים. במרילנד ההתערבות הפחיתה שיעור ניתוחים קיסריים מ 28.5% ל 27%. ובקליפורניה מ 26% ל 23%.
פרק 3 ואחרון על מאמר זה, ובו נציג את נתוני היעילות הקלינית והאימונוגנית, ונדבר על שיטת immunobrdging לבדיקה עקיפה של יעילות חיסונים (דרך בדיקת האימונוגניות של החיסון).
---
Evaluation of the BNT162b2 Covid-19 Vaccine in Children 5 to 11 Years of Ageלאחר העלאת הפרק שמתי לב שחישוב הפחתת הסיכון היחסית (יעילות החיסון, vaccine efficacy) כפי שהצגתי בפרק היה בקירוב ולא במספרים מדויקים. למעשה, באוכלוסייה הרלבנטית שהוגדרה עבור החישוב (ללא עדות לזיהום בעבר, השלימו שני חיסונים) היו 1305 ילדים בקבוצת החיסון ו 637 בקבוצת הפלצבו. בקבוצות היו 3 ו 16 מקרים של זהום חדש, בהתאמה- המתרגמים לסיכון של 0.22% בקבוצת החיסון, ו 2.5% בקבוצת הפלצבו. במספרים אלו יעילות החיסון המחושבת אפילו גדולה ממה שדווחה במחקר, אך כיוון שהחוקרים השתמשו בחישוב הסיכון גם בזמן המעקב, בסופו של דבר היעילות שחישבו הייתה קרובה מאוד לזו שהוצגה בפרק- 90.7%.
פרק 3 ואחרון על מאמר זה, ובו נציג את נתוני היעילות הקלינית והאימונוגנית, ונדבר על שיטת immunobrdging לבדיקה עקיפה של יעילות חיסונים (דרך בדיקת האימונוגניות של החיסון).
---
Evaluation of the BNT162b2 Covid-19 Vaccine in Children 5 to 11 Years of Ageלאחר העלאת הפרק שמתי לב שחישוב הפחתת הסיכון היחסית (יעילות החיסון, vaccine efficacy) כפי שהצגתי בפרק היה בקירוב ולא במספרים מדויקים. למעשה, באוכלוסייה הרלבנטית שהוגדרה עבור החישוב (ללא עדות לזיהום בעבר, השלימו שני חיסונים) היו 1305 ילדים בקבוצת החיסון ו 637 בקבוצת הפלצבו. בקבוצות היו 3 ו 16 מקרים של זהום חדש, בהתאמה- המתרגמים לסיכון של 0.22% בקבוצת החיסון, ו 2.5% בקבוצת הפלצבו. במספרים אלו יעילות החיסון המחושבת אפילו גדולה ממה שדווחה במחקר, אך כיוון שהחוקרים השתמשו בחישוב הסיכון גם בזמן המעקב, בסופו של דבר היעילות שחישבו הייתה קרובה מאוד לזו שהוצגה בפרק- 90.7%.
חלק שני מתוך שלושה: בפרק נפרט את הממצאים בשלב 1 (phase 1) במחקר, את תקפות חלק המאמר שבוצע כמאמר מבוקר אקראי, ואת תוצאות בטיחות החיסון בשלב 2-3 (phase 2-3).
---
קישור למאמר:
Evaluation of the BNT162b2 Covid-19 Vaccine in Children 5 to 11 Years of Age
נספח למאמר ובו פירוט של חלק מהנושאים שעלו בפרק
(כולל טבלאות של משך תופעות הלוואי השונות בקבוצת החיסון)
חלק שני מתוך שלושה: בפרק נפרט את הממצאים בשלב 1 (phase 1) במחקר, את תקפות חלק המאמר שבוצע כמאמר מבוקר אקראי, ואת תוצאות בטיחות החיסון בשלב 2-3 (phase 2-3).
---
קישור למאמר:
Evaluation of the BNT162b2 Covid-19 Vaccine in Children 5 to 11 Years of Age
נספח למאמר ובו פירוט של חלק מהנושאים שעלו בפרק
(כולל טבלאות של משך תופעות הלוואי השונות בקבוצת החיסון)
בפרק נציג את המחקר שהתפרסם ב NEJM ב 9/11/21 ובדק אימונוגניות, בטיחות ויעילות של חיסון הקורונה של פייזר- ביונטק בילדים בני 5-11. פרק ראשון מתוך שלושה על מאמר זה.
בפרק הזה נסביר מעט על שלבי מחקר קליני - במקרה שלנו מחקר phase 1 ומחקר phase 2-3 , ונבין שבמאמר שלפנינו יש לפחות חמישה מחקרים שונים...
---
קישור למאמר:
Evaluation of the BNT162b2 Covid-19 Vaccine in Children 5 to 11 Years of Age
בפרק נציג את המחקר שהתפרסם ב NEJM ב 9/11/21 ובדק אימונוגניות, בטיחות ויעילות של חיסון הקורונה של פייזר- ביונטק בילדים בני 5-11. פרק ראשון מתוך שלושה על מאמר זה.
בפרק הזה נסביר מעט על שלבי מחקר קליני - במקרה שלנו מחקר phase 1 ומחקר phase 2-3 , ונבין שבמאמר שלפנינו יש לפחות חמישה מחקרים שונים...
---
קישור למאמר:
Evaluation of the BNT162b2 Covid-19 Vaccine in Children 5 to 11 Years of Age
למה לא שולחים את המטופל לבדיקה שאותה הוא מבקש? לפעמים מדובר לא בקמצנות כספית, אלא בקמצנות לבריאות המטופל, ורצון לחסוך לו צרות.
כאשר הסבירות למחלה נמוכה, וכאשר יש אפשרות לבדיקה חיובית כוזבת (ובכל בדיקה ישנה אפשרות כזו), רוב הבדיקות החיוביות יהיו מטעות- ואז המטופלים יצטרכו לעבור בדיקות נוספות שעלולות לסכן אותם, או לקבל טיפולים שלא לצורך. במצב כזה של סבירות נמוכה למחלה, רק חלק קטן מהבדיקות החיובית מייצג באמת מחלה, כזו שגילויה יעזור למטופל.
---
מחשבון סיכון למחלה קרדיווסקולרית
http://www.cvriskcalculator.com
---
המאמרים שהוזכרו בפרק
CT coronary angiography vs. invasive coronary angiography in CHD
רגישות הבדיקה (בדיקת ההשוואה- צנטור רגיל) - 96%, הספציפיות- 86%
מאמר נוסף דומה
המלצת כח המשימה האמריקאי מ 2004
נגד סקירה למחלת לב איסכמית כאשר הסיכון למחלה נמוך
למה לא שולחים את המטופל לבדיקה שאותה הוא מבקש? לפעמים מדובר לא בקמצנות כספית, אלא בקמצנות לבריאות המטופל, ורצון לחסוך לו צרות.
כאשר הסבירות למחלה נמוכה, וכאשר יש אפשרות לבדיקה חיובית כוזבת (ובכל בדיקה ישנה אפשרות כזו), רוב הבדיקות החיוביות יהיו מטעות- ואז המטופלים יצטרכו לעבור בדיקות נוספות שעלולות לסכן אותם, או לקבל טיפולים שלא לצורך. במצב כזה של סבירות נמוכה למחלה, רק חלק קטן מהבדיקות החיובית מייצג באמת מחלה, כזו שגילויה יעזור למטופל.
---
מחשבון סיכון למחלה קרדיווסקולרית
http://www.cvriskcalculator.com
---
המאמרים שהוזכרו בפרק
CT coronary angiography vs. invasive coronary angiography in CHD
רגישות הבדיקה (בדיקת ההשוואה- צנטור רגיל) - 96%, הספציפיות- 86%
מאמר נוסף דומה
המלצת כח המשימה האמריקאי מ 2004
נגד סקירה למחלת לב איסכמית כאשר הסיכון למחלה נמוך
פרק שני על מחקרי אשכולות. אחד ממחקרי האשכולות המרשימים ביותר פורסם ב- NEJM בספטמבר 2021. האם באנשים בסיכון גבוה לאירוע מוחי, אספקה ביתית של תחליף מלח מפחיתה את הסיכון לאירוע כזה במעקב של מספר שנים? והאם להאמין למחקר?
הקריטריונים לניתוח תקפות של מחקר כזה מוכרים גם מניתוח מאמר מבוקר אקראי (RCT) "רגיל" , אך כאן צפויות בעיות ייחודיות: כאשר ישנם אשכולות שלא השלימו את המעקב, צפויה הטיה משמעותית, לרוב לא אפשרית סמיות (blinding), כמעט תמיד יהיה שוני בין האשכולות שיחייב רנדומיזציה משוכללת כדי לייצר שתי קבוצות דומות במאפייני המשתתפים, וכמעט תמיד ישנה בעיה בהסתרת השיוך. המחקר הנוכחי התמודד עם בעיות אלו בצורה מעוררת התפעלות.
---
המאמר שהוזכר בפרק
Effect of Salt Substitution on Cardiovascular Events and Death
מאמר הדרכה מפורט לניתוח מחקר עם רנדומיזציה באשכולות
פרק שני על מחקרי אשכולות. אחד ממחקרי האשכולות המרשימים ביותר פורסם ב- NEJM בספטמבר 2021. האם באנשים בסיכון גבוה לאירוע מוחי, אספקה ביתית של תחליף מלח מפחיתה את הסיכון לאירוע כזה במעקב של מספר שנים? והאם להאמין למחקר?
הקריטריונים לניתוח תקפות של מחקר כזה מוכרים גם מניתוח מאמר מבוקר אקראי (RCT) "רגיל" , אך כאן צפויות בעיות ייחודיות: כאשר ישנם אשכולות שלא השלימו את המעקב, צפויה הטיה משמעותית, לרוב לא אפשרית סמיות (blinding), כמעט תמיד יהיה שוני בין האשכולות שיחייב רנדומיזציה משוכללת כדי לייצר שתי קבוצות דומות במאפייני המשתתפים, וכמעט תמיד ישנה בעיה בהסתרת השיוך. המחקר הנוכחי התמודד עם בעיות אלו בצורה מעוררת התפעלות.
---
המאמר שהוזכר בפרק
Effect of Salt Substitution on Cardiovascular Events and Death
מאמר הדרכה מפורט לניתוח מחקר עם רנדומיזציה באשכולות
פרק ראשון על "מחקר אשכולות": מחקר מבוקר אקראי עם רנדומיזציה באשכולות (clustered randomized controlled trial).
מחקרים כאלה מבוצעים כשמדובר בטיפול הניתן ברמת הקבוצה (מרפאה למשל), או כשיש סיכוי גבוה לקונטמינציה בין שתי הקבוצות- קבוצת ההתערבות וקבוצת הבקרה. נתאר את החסרונות העיקריים של השיטה, ובפרק הבא נבין איך לקרוא מאמר על מחקר שבוצע בשיטה הזו.
---
המאמר שהוצג בפרק
Randomized trial of vitamin D supplementation and risk of acute respiratory infection in Mongolia
פרק ראשון על "מחקר אשכולות": מחקר מבוקר אקראי עם רנדומיזציה באשכולות (clustered randomized controlled trial).
מחקרים כאלה מבוצעים כשמדובר בטיפול הניתן ברמת הקבוצה (מרפאה למשל), או כשיש סיכוי גבוה לקונטמינציה בין שתי הקבוצות- קבוצת ההתערבות וקבוצת הבקרה. נתאר את החסרונות העיקריים של השיטה, ובפרק הבא נבין איך לקרוא מאמר על מחקר שבוצע בשיטה הזו.
---
המאמר שהוצג בפרק
Randomized trial of vitamin D supplementation and risk of acute respiratory infection in Mongolia
בפרק הזה נסביר איך לנסח שאלה הנוגעת לטיפול או להתערבות רפואית.
שאלה כזו ננסח בתמציתיות בעזרת ראשי התיבות PICO:
P עבור patient, מיהם המטופל ומחלתו, או population- באיזה אוכלוסיית מטופלים אנחנו מתעניינים.
I עבור intervention, ההתערבות שמעניינת אותנו.
C עבור comparison, למה נרצה להשוות את ההתערבות, למשל לפלצבו.
O עבור outcome, תוצא- מה אנחנו רוצים למדוד ולבדוק- תמותה? שיפור בערכי סוכר? תפקוד הברך?
---
דוגמא לניסוח שאלה, לשרשרת חיפוש ולמאמר רלוונטי למטופל:
נאמר שמטופל בן 30 סובל מכאבים בברך לאחר תנועה סיבובית בכדורסל, מאובחן קרע מניסקוס, אורתופד אחד מציע ניתוח והשני מציע להתחיל בפיזיותרפיה.
שאלת ה PICO המתומצתת:
P- מטופלים עם קרע מניסקוס, I- פיזיותרפיה, C- כריתת מניסקוס, O- תפקוד
ובמשפט: במטופלים עם קרע במניסקוס, האם פיזיותרפיה יעילה כמו ניתוח מבחינת שיפור בתפקוד.
מאמר שעונה על השאלה הזו:
מדובר במחקר מבוקר אקראי, שהתפרסם ב JAMA ב 2018.
האוכלוסייה הייתה מטופלים עם קרע מניסקוס, ללא נעילת ברך.
ההתערבות הייתה פיזיותרפיה- שני טיפולים בשבוע למשך שמונה שבועות, עם ניתוח באלו שלא השתפרו.
ההשוואה הייתה לניתוח מיידי שבו בוצעה כריתת מניסקוס חלקית.
התוצא- שיפור בתפקוד הברך לאחר שנתיים בסולם של 0-100.
המחקר כלל כ 160 איש בכל קבוצה. כ 30% מקבוצת הפיזיותרפיה בסופו של דבר עברו בכל זאת ניתוח.
בניתוח התוצאות לפי כוונת הטיפול (intention to treat) ההבדל בשיפור תפקוד הברך בין שתי הקבוצות היה 3 נקודות מתוך 100, לרעת קבוצת הפיזיותרפיה. זהו הבדל שלא נחשב משמעותי קלינית. היו יותר תופעות לואי בקבוצת הניתוח המיידי.
בפרק הזה נסביר איך לנסח שאלה הנוגעת לטיפול או להתערבות רפואית.
שאלה כזו ננסח בתמציתיות בעזרת ראשי התיבות PICO:
P עבור patient, מיהם המטופל ומחלתו, או population- באיזה אוכלוסיית מטופלים אנחנו מתעניינים.
I עבור intervention, ההתערבות שמעניינת אותנו.
C עבור comparison, למה נרצה להשוות את ההתערבות, למשל לפלצבו.
O עבור outcome, תוצא- מה אנחנו רוצים למדוד ולבדוק- תמותה? שיפור בערכי סוכר? תפקוד הברך?
---
דוגמא לניסוח שאלה, לשרשרת חיפוש ולמאמר רלוונטי למטופל:
נאמר שמטופל בן 30 סובל מכאבים בברך לאחר תנועה סיבובית בכדורסל, מאובחן קרע מניסקוס, אורתופד אחד מציע ניתוח והשני מציע להתחיל בפיזיותרפיה.
שאלת ה PICO המתומצתת:
P- מטופלים עם קרע מניסקוס, I- פיזיותרפיה, C- כריתת מניסקוס, O- תפקוד
ובמשפט: במטופלים עם קרע במניסקוס, האם פיזיותרפיה יעילה כמו ניתוח מבחינת שיפור בתפקוד.
מאמר שעונה על השאלה הזו:
מדובר במחקר מבוקר אקראי, שהתפרסם ב JAMA ב 2018.
האוכלוסייה הייתה מטופלים עם קרע מניסקוס, ללא נעילת ברך.
ההתערבות הייתה פיזיותרפיה- שני טיפולים בשבוע למשך שמונה שבועות, עם ניתוח באלו שלא השתפרו.
ההשוואה הייתה לניתוח מיידי שבו בוצעה כריתת מניסקוס חלקית.
התוצא- שיפור בתפקוד הברך לאחר שנתיים בסולם של 0-100.
המחקר כלל כ 160 איש בכל קבוצה. כ 30% מקבוצת הפיזיותרפיה בסופו של דבר עברו בכל זאת ניתוח.
בניתוח התוצאות לפי כוונת הטיפול (intention to treat) ההבדל בשיפור תפקוד הברך בין שתי הקבוצות היה 3 נקודות מתוך 100, לרעת קבוצת הפיזיותרפיה. זהו הבדל שלא נחשב משמעותי קלינית. היו יותר תופעות לואי בקבוצת הניתוח המיידי.
אנחנו רוצים לחשוב שכאשר יש ממצאים חשובים ואמינים ממחקרים קליניים, הרופאים יאמצו את מסקנות המחקרים. פעמים רבות זה כך, אך לעתים ישנם מצבים בהם הרופאים אינם משתמשים בהתערבויות שהוכחו כיעילות. ישנם גם מצבים בהם טיפול הוכח במחקר קליני כמזיק או כלא יעיל, והרופאים ממשיכים להשתמש בו.
למעשה יש כאן מצב של העדר הסכמה בין המידע המחקרי לדעתו של הרופא. התופעה קשורה להיבטים חברתיים ופסיכולוגיים, אך לעתים מדובר דווקא ביישום נכון של רפואה נתמכת ראיות: החלטה המשלבת לא רק ממצאי מחקר אלא גם את המאפיינים הספציפיים של המטופל, כפי שמובנים על ידי המומחה, ואת מטרות המטופל וערכיו.
בפרק זה, עוד יותר מפרקים אחרים, יש לשים לב שלא מדובר בייעוץ רפואי: לעתים אצל מטופל מסוים, עם מאפיינים מסוימים, הטיפול הנכון יהיה דווקא טיפול שמנוגד לראיות המקובלות.
-----
מחקר ה COURAGE – משנת 2007- העדר תועלת בביצוע צינטור התערבותי באנשים עם מחלת לב קורונרית יציבה
מעקב 13 שנה של מחקר ה WHI - כאשר מדובר במניעת מחלות, נזקי טיפול הורמונלי חליפי עולים על התועלת.
מחקר על טיפול בפריצת דיסק- המתנה וטיפול שמרני לפני החלטה על ניתוח יעילה להפחתת כאב בטווח ארוך כמו ניתוח מידי
אנחנו רוצים לחשוב שכאשר יש ממצאים חשובים ואמינים ממחקרים קליניים, הרופאים יאמצו את מסקנות המחקרים. פעמים רבות זה כך, אך לעתים ישנם מצבים בהם הרופאים אינם משתמשים בהתערבויות שהוכחו כיעילות. ישנם גם מצבים בהם טיפול הוכח במחקר קליני כמזיק או כלא יעיל, והרופאים ממשיכים להשתמש בו.
למעשה יש כאן מצב של העדר הסכמה בין המידע המחקרי לדעתו של הרופא. התופעה קשורה להיבטים חברתיים ופסיכולוגיים, אך לעתים מדובר דווקא ביישום נכון של רפואה נתמכת ראיות: החלטה המשלבת לא רק ממצאי מחקר אלא גם את המאפיינים הספציפיים של המטופל, כפי שמובנים על ידי המומחה, ואת מטרות המטופל וערכיו.
בפרק זה, עוד יותר מפרקים אחרים, יש לשים לב שלא מדובר בייעוץ רפואי: לעתים אצל מטופל מסוים, עם מאפיינים מסוימים, הטיפול הנכון יהיה דווקא טיפול שמנוגד לראיות המקובלות.
-----
מחקר ה COURAGE – משנת 2007- העדר תועלת בביצוע צינטור התערבותי באנשים עם מחלת לב קורונרית יציבה
מעקב 13 שנה של מחקר ה WHI - כאשר מדובר במניעת מחלות, נזקי טיפול הורמונלי חליפי עולים על התועלת.
מחקר על טיפול בפריצת דיסק- המתנה וטיפול שמרני לפני החלטה על ניתוח יעילה להפחתת כאב בטווח ארוך כמו ניתוח מידי
אנשי צוות המטפלים בחולי קורונה סובלים בשכיחות גבוהה מאוד מבעיות נפשיות: חרדה, דכאון, שימוש מופרז באלכוהול ותסמונת פוסט טראומטית (PTSD). כך נמצא במחקר אנגלי שפורסם ביוני 2021.
פגיעה נפשית משמעותית עלולה להיגרם עקב "פציעה מוסרית". הכוונה היא לחשיפה לפעולות שנוגדות את המוסר של הנפגע: פעולות שהוא נאלץ לבצע, בוחר לבצע או רואה שאחרים מבצעים.
סולם למדידת פציעה מוסרית, שנקרא MIES (Moral injury exposure score) מודד את הפציעה הזו לפי מענה על תשע שאלות.
החוקרים העריכו שפציעה מוסרית קשורה (ואולי אף עלולה להיות סיבה) לפגיעה נפשית משמעותית בזמן הטיפול בחולי קורונה.
הם בדקו את שכיחות הבעיות הנפשיות בצוות שטיפול בחולי קורונה בגל הראשון של המחלה בבריטניה, והשתמשו במודל רגרסיה לוגיסטית כדי לבדוק אם גיל, מין, תפקיד (רופאה, אחות, צוות לא רפואי), ופציעה מוסרית הם גורמים שיכולים לנבא פגיעה נפשית.
המחקר הדגים שכיחות גבוהה מאוד של בעיות נפשיות, וכן קשר חזק מאוד בין פציעה מוסרית לבין בעיות נפשיות, ובעקר PTSD, שם ה odds ratio עבור אנשים שחוו פציעה מוסרית היה 4.2, לעומת אנשים שחוו פחות פציעה מוסרית. גורמים אחרים שהיו קשורים לפגיעה נפשית היו עיסוק כאחים/אחיות, מין המטפל, וגיל.
בפרק ננתח את תקפות המאמר ואת התוצאות לפי שיטה שהסברנו לעומק בשני הפרקים הקודמים. הפעם נתייחס גם לרווח בר סמך של ה- odds ratio בתוך מודל הרגרסיה.
---
המאמר שהוזכר בפרק:
הסבר על פציעה מוסרית
https://www.ptsd.va.gov/professional/treat/cooccurring/moral_injury.asp
אנשי צוות המטפלים בחולי קורונה סובלים בשכיחות גבוהה מאוד מבעיות נפשיות: חרדה, דכאון, שימוש מופרז באלכוהול ותסמונת פוסט טראומטית (PTSD). כך נמצא במחקר אנגלי שפורסם ביוני 2021.
פגיעה נפשית משמעותית עלולה להיגרם עקב "פציעה מוסרית". הכוונה היא לחשיפה לפעולות שנוגדות את המוסר של הנפגע: פעולות שהוא נאלץ לבצע, בוחר לבצע או רואה שאחרים מבצעים.
סולם למדידת פציעה מוסרית, שנקרא MIES (Moral injury exposure score) מודד את הפציעה הזו לפי מענה על תשע שאלות.
החוקרים העריכו שפציעה מוסרית קשורה (ואולי אף עלולה להיות סיבה) לפגיעה נפשית משמעותית בזמן הטיפול בחולי קורונה.
הם בדקו את שכיחות הבעיות הנפשיות בצוות שטיפול בחולי קורונה בגל הראשון של המחלה בבריטניה, והשתמשו במודל רגרסיה לוגיסטית כדי לבדוק אם גיל, מין, תפקיד (רופאה, אחות, צוות לא רפואי), ופציעה מוסרית הם גורמים שיכולים לנבא פגיעה נפשית.
המחקר הדגים שכיחות גבוהה מאוד של בעיות נפשיות, וכן קשר חזק מאוד בין פציעה מוסרית לבין בעיות נפשיות, ובעקר PTSD, שם ה odds ratio עבור אנשים שחוו פציעה מוסרית היה 4.2, לעומת אנשים שחוו פחות פציעה מוסרית. גורמים אחרים שהיו קשורים לפגיעה נפשית היו עיסוק כאחים/אחיות, מין המטפל, וגיל.
בפרק ננתח את תקפות המאמר ואת התוצאות לפי שיטה שהסברנו לעומק בשני הפרקים הקודמים. הפעם נתייחס גם לרווח בר סמך של ה- odds ratio בתוך מודל הרגרסיה.
---
המאמר שהוזכר בפרק:
הסבר על פציעה מוסרית
https://www.ptsd.va.gov/professional/treat/cooccurring/moral_injury.asp
איך נדע אם להאמין למאמר שמשתמש בשיטה נפוצה ביותר בספרות הרפואית?
בפרק על פציעות ברצים חובבים הוסבר מהי בעצם הקללה הזו (או הברכה), "רגרסיה לוגיסטית", ואיך לקרוא את התוצאות שלה. בפרק הזה נמשיך לנתח אותו מאמר. נשתמש בכלי לניתוח תקפות שנקרא QUIP, שכולל שישה קריטריונים כדי להחליט האם מאמר שעוסק בפרוגנוזה (ובהשפעת גורמים שונים על תוצא מסוים בעתיד) הוא תקף.
הקריטריונים הם בחירה נכונה של משתתפים למחקר, מעקב מלא ככל האפשר, הגדרה ומדידה נכונים של גורמי הסיכון לתוצא (המאפיינים של המטופל שאולי קשורים לפציעת ריצה), הגדרה ומדידה נכונים של התוצא (פציעת הריצה), מדידה של כל הערפלנים החשובים, ומודל נכון.
לגבי מודל הרגרסיה נפרט שלוש דרישות חשובות ממנו: מספר משתנים (מאפייני מטופל) שאינו רב מדי עבור גודל המחקר, העדר קשרים חזקים בין שני משתנים שונים באותו מודל, וזהירות ממצב בו יש משתנה כמותי (למשל, גיל המטופל) עם השפעה שמשתנה לאורך הטווח, למשל אם גיל גדול בעשר שנים בצעירים משפיע על פציעת ריצה אחרת מתוספת עשר שנים לגיל אצל מבוגרים יותר.
---
מאמרים שהוזכרו בפרק
Risk factors for overuse injuries in short- and long-distance running: A systematic review
---
כלי ה QUIP בצורתו המפורטת.
לקריאה נוספת על תקפות מודל הרגרסיה והדרישות ממנו מתוך סדרת מאמרי הסבר של JAMA
Logistic Regression Diagnostics: Understanding How Well a Model Predicts Outcomes
איך נדע אם להאמין למאמר שמשתמש בשיטה נפוצה ביותר בספרות הרפואית?
בפרק על פציעות ברצים חובבים הוסבר מהי בעצם הקללה הזו (או הברכה), "רגרסיה לוגיסטית", ואיך לקרוא את התוצאות שלה. בפרק הזה נמשיך לנתח אותו מאמר. נשתמש בכלי לניתוח תקפות שנקרא QUIP, שכולל שישה קריטריונים כדי להחליט האם מאמר שעוסק בפרוגנוזה (ובהשפעת גורמים שונים על תוצא מסוים בעתיד) הוא תקף.
הקריטריונים הם בחירה נכונה של משתתפים למחקר, מעקב מלא ככל האפשר, הגדרה ומדידה נכונים של גורמי הסיכון לתוצא (המאפיינים של המטופל שאולי קשורים לפציעת ריצה), הגדרה ומדידה נכונים של התוצא (פציעת הריצה), מדידה של כל הערפלנים החשובים, ומודל נכון.
לגבי מודל הרגרסיה נפרט שלוש דרישות חשובות ממנו: מספר משתנים (מאפייני מטופל) שאינו רב מדי עבור גודל המחקר, העדר קשרים חזקים בין שני משתנים שונים באותו מודל, וזהירות ממצב בו יש משתנה כמותי (למשל, גיל המטופל) עם השפעה שמשתנה לאורך הטווח, למשל אם גיל גדול בעשר שנים בצעירים משפיע על פציעת ריצה אחרת מתוספת עשר שנים לגיל אצל מבוגרים יותר.
---
מאמרים שהוזכרו בפרק
Risk factors for overuse injuries in short- and long-distance running: A systematic review
---
כלי ה QUIP בצורתו המפורטת.
לקריאה נוספת על תקפות מודל הרגרסיה והדרישות ממנו מתוך סדרת מאמרי הסבר של JAMA
Logistic Regression Diagnostics: Understanding How Well a Model Predicts Outcomes
נדבר על הרגרסיה הלוגיסטית ואיך להבין את תוצאותיה במאמר, ועל גורמי סיכון לפציעות ריצה ברצים חובבים.
כאשר יש מחקר שבו רוצים לנבא תוצא מסוים, כמו האם למשל רץ חובב יחווה פציעת ריצה, וכאשר יש יותר מגורם מנבא אפשרי אחד, משתמשים בשיטת מחקר הנקראת רגרסיה לוגיסטית. אפשר לבצע שיטה זו על מחקר קוהורט, כמו במחקר שנציג כאן.
ברגרסיה לוגיסטית ניתן משקל שונה לכל אחד מהמאפיינים של המטופל, בתוך נוסחה שמטרתה לחזות מה הסיכוי שאותו מטופל יחווה את התוצא. למשל, במאמר שנציג, המשקל שמקבלת פציעה קודמת רב יותר מהמשקל שמקבל משך אימון הריצה, בחיזוי פציעת ריצה נוספת.
---
למתעניינים במבנה נוסחת הרגרסיה ובמתמטיקה מאחוריה:
ברגרסיה לוגיסטית המשקל עבור כל מאפיין מבוטא על ידי המקדם (שמצוין באות היוונית בטא). את המקדם הזה מכפילים בערך של המאפיין עצמו. למשל, המאפיין "פציעה קודמת" יקבל את הערך "1" אם אכן יש פציעה קודמת, ואם אין- יקבל את הערך "0". אם המקדם (beta) עבור פציעה קודמת הוא 4, ואם המטופל אכן נפצע בעבר (המאפיין קיבל את הערך "1"), המכפלה תהיה 4X1. אם משך האימון הוא 20 דקות, וערך המקדם עבור מאפיין זה הוא 0.05, שני הערכים יוכפלו והמספר שיוכנס למכפלה הוא 1.
בנוסחות הרגרסיה מאפיינים ("משתנים") רבים, למשל, משך האימון, נוכחות פציעה קודמת, סוג המשטח עליו רצים, ועוד. לכל מאפיין מקדם משלו בנוסחה. עבור מטופל (מתאמן במקרה שלנו) מסוים, כל מאפיין מקבל ערך מסוים לפי הנתונים של אותו מטופל, ומוכפל במקדם שהוא קבוע בנוסחה. כל המכפלות מסוכמות והמספר המתקבל אמור לחזות את התוצא- במקרה שלנו לחזות מה הסיכוי לפציעת ריצה.
המספר הסופי הזה לצערנו לא מתקבל כערך פשוט של "סיכון" אלא כלוג (log) של ה odds. נשמע מפחיד, אבל עקר האינפורמציה ממחקרים מסוג זה מגיע מערכי הבטא השונים בנוסחה.
את המקדם (beta) עבור כל מאפיין ניתן להפוך בקלות ל odds ratio, וכותבי מאמרים, (אלא אם הם סדיסטים שמעוניינים להתעלל בפיזיותרפיסטים וברופאים) בדרך כלל יתרגמו את המקדם (beta) ל exp(beta) , שהוא למעשה ה odds ratio לתוצא. למשל, ה odds ratio לפציעת ריצה אם המטופל כבר חווה פציעה קודמת הוא 1.9.
Odds ratio הגדול מ 1 משמעותו הגברת סיכון, וכאשר הוא קטן מ 1 משמעותו הפחתת סיכון לתוצא. במקרה שלנו, ה odds ratio לפציעת ריצה הוא 2, והמשמעות היא כך:
אם כל שאר המשתנים זהים, פציעת ריצה קודמת מגבירה את ה odds לפציעה נוספת פי 2.
ניתן לחזור לפרק "יחס גורר יחס" כדי להיזכר מה משמעות ה odds ומה משמעות ה-odds ratio.
---
המאמר שהוזכר בפרק התפרסם ב journal of physiotherapy ב 2013.
הסבר פשוט וקצר על רגרסיה לוגיסטית
מאמר המסביר לעומק רגרסיה לוגיסטית בקוהורט ובמחקר מקרה-בקרה (כולל מעט מתמטיקה)
---
החישוב שבוצע בפרק:
שימוש ב odds ratio להבנת הסיכון המשתנה בנוכחות ערך של משתנה מסוים.
במאמר שלנו ה odds ratio לפציעת ריצה אם המטופל חווה פציעה קודמת היה 1.9. איך נשתמש בו?
נאמר שכל שאר המשתנים זהים, ונאמר שהסיכון לפציעה ללא פציעה קודמת הוא 33%,
נתרגם 33% ל odds, ויצא לנו 1:2, או במלים אחרות 0.5.
מספר זה נכפיל ב odds ratio,
0.5 X1.9
ונקבל את ה odds החדש- שהוא בערך 1.
נתרגם odds זה שהוא למעשה 1:1 חזרה ל risk, ויצא לנו 50%.
כך שאם הסיכון ללא פציעה קודמת הוא 33%, בנוכחות פציעה קודמת הסיכון עולה ל 50%.
---
נדבר על הרגרסיה הלוגיסטית ואיך להבין את תוצאותיה במאמר, ועל גורמי סיכון לפציעות ריצה ברצים חובבים.
כאשר יש מחקר שבו רוצים לנבא תוצא מסוים, כמו האם למשל רץ חובב יחווה פציעת ריצה, וכאשר יש יותר מגורם מנבא אפשרי אחד, משתמשים בשיטת מחקר הנקראת רגרסיה לוגיסטית. אפשר לבצע שיטה זו על מחקר קוהורט, כמו במחקר שנציג כאן.
ברגרסיה לוגיסטית ניתן משקל שונה לכל אחד מהמאפיינים של המטופל, בתוך נוסחה שמטרתה לחזות מה הסיכוי שאותו מטופל יחווה את התוצא. למשל, במאמר שנציג, המשקל שמקבלת פציעה קודמת רב יותר מהמשקל שמקבל משך אימון הריצה, בחיזוי פציעת ריצה נוספת.
---
למתעניינים במבנה נוסחת הרגרסיה ובמתמטיקה מאחוריה:
ברגרסיה לוגיסטית המשקל עבור כל מאפיין מבוטא על ידי המקדם (שמצוין באות היוונית בטא). את המקדם הזה מכפילים בערך של המאפיין עצמו. למשל, המאפיין "פציעה קודמת" יקבל את הערך "1" אם אכן יש פציעה קודמת, ואם אין- יקבל את הערך "0". אם המקדם (beta) עבור פציעה קודמת הוא 4, ואם המטופל אכן נפצע בעבר (המאפיין קיבל את הערך "1"), המכפלה תהיה 4X1. אם משך האימון הוא 20 דקות, וערך המקדם עבור מאפיין זה הוא 0.05, שני הערכים יוכפלו והמספר שיוכנס למכפלה הוא 1.
בנוסחות הרגרסיה מאפיינים ("משתנים") רבים, למשל, משך האימון, נוכחות פציעה קודמת, סוג המשטח עליו רצים, ועוד. לכל מאפיין מקדם משלו בנוסחה. עבור מטופל (מתאמן במקרה שלנו) מסוים, כל מאפיין מקבל ערך מסוים לפי הנתונים של אותו מטופל, ומוכפל במקדם שהוא קבוע בנוסחה. כל המכפלות מסוכמות והמספר המתקבל אמור לחזות את התוצא- במקרה שלנו לחזות מה הסיכוי לפציעת ריצה.
המספר הסופי הזה לצערנו לא מתקבל כערך פשוט של "סיכון" אלא כלוג (log) של ה odds. נשמע מפחיד, אבל עקר האינפורמציה ממחקרים מסוג זה מגיע מערכי הבטא השונים בנוסחה.
את המקדם (beta) עבור כל מאפיין ניתן להפוך בקלות ל odds ratio, וכותבי מאמרים, (אלא אם הם סדיסטים שמעוניינים להתעלל בפיזיותרפיסטים וברופאים) בדרך כלל יתרגמו את המקדם (beta) ל exp(beta) , שהוא למעשה ה odds ratio לתוצא. למשל, ה odds ratio לפציעת ריצה אם המטופל כבר חווה פציעה קודמת הוא 1.9.
Odds ratio הגדול מ 1 משמעותו הגברת סיכון, וכאשר הוא קטן מ 1 משמעותו הפחתת סיכון לתוצא. במקרה שלנו, ה odds ratio לפציעת ריצה הוא 2, והמשמעות היא כך:
אם כל שאר המשתנים זהים, פציעת ריצה קודמת מגבירה את ה odds לפציעה נוספת פי 2.
ניתן לחזור לפרק "יחס גורר יחס" כדי להיזכר מה משמעות ה odds ומה משמעות ה-odds ratio.
---
המאמר שהוזכר בפרק התפרסם ב journal of physiotherapy ב 2013.
הסבר פשוט וקצר על רגרסיה לוגיסטית
מאמר המסביר לעומק רגרסיה לוגיסטית בקוהורט ובמחקר מקרה-בקרה (כולל מעט מתמטיקה)
---
החישוב שבוצע בפרק:
שימוש ב odds ratio להבנת הסיכון המשתנה בנוכחות ערך של משתנה מסוים.
במאמר שלנו ה odds ratio לפציעת ריצה אם המטופל חווה פציעה קודמת היה 1.9. איך נשתמש בו?
נאמר שכל שאר המשתנים זהים, ונאמר שהסיכון לפציעה ללא פציעה קודמת הוא 33%,
נתרגם 33% ל odds, ויצא לנו 1:2, או במלים אחרות 0.5.
מספר זה נכפיל ב odds ratio,
0.5 X1.9
ונקבל את ה odds החדש- שהוא בערך 1.
נתרגם odds זה שהוא למעשה 1:1 חזרה ל risk, ויצא לנו 50%.
כך שאם הסיכון ללא פציעה קודמת הוא 33%, בנוכחות פציעה קודמת הסיכון עולה ל 50%.
---
הנתון "שיעור המחוסנים מבין החולים קשה" הוא נתון שיכול להטעות מאוד, משתי סיבות:
א) גם אם יש חיסון יעיל ביותר, ככל ששיעור המחוסנים באוכלוסייה גובר , כך יעלה שיעור המחוסנים בין החולים קשה.
ב) אין התייחסות לערפלן חשוב וכך נוצר לנו פרדוקס סימפסון.
---
לקריאה נוספת על פרדוקס סימפסון:
https://pubmed.ncbi.nlm.nih.gov/21454324/
הנתון "שיעור המחוסנים מבין החולים קשה" הוא נתון שיכול להטעות מאוד, משתי סיבות:
א) גם אם יש חיסון יעיל ביותר, ככל ששיעור המחוסנים באוכלוסייה גובר , כך יעלה שיעור המחוסנים בין החולים קשה.
ב) אין התייחסות לערפלן חשוב וכך נוצר לנו פרדוקס סימפסון.
---
לקריאה נוספת על פרדוקס סימפסון:
https://pubmed.ncbi.nlm.nih.gov/21454324/
בפרק זה נדבר על שיטות המחקר השונות לזיהוי תופעות לוואי של תרופה, ונדבר על שני מחקרים גדולים שבדקו בשיטות שונות תופעות לוואי של חיסוני mRNA לקורונה.
לאחר מחקרים ראשוניים על בטיחות התרופה בחיות מעבדה ובכמות קטנה של בני אדם מתנדבים, מתבצע בדרך כלל מחקר גדול מבוקר מסוג RCT. יש קריטריונים רבים לגבי זיהוי, ניתוח סטטיסטי של תופעות הלוואי ודיווח עליהן במחקרי RCT, למשל מדידת חומרת התופעה, משך התופעה, התייחסות רק לאלו שקיבלו את הטיפול בפועל כדי לחשב שכיחות, השוואת שכיחות תופעה בין שתי זרועות המחקר, ועוד. Adverse effect היא כל תופעה (רעה) המופיעה במשתתף במחקר. היא יכולה להיות קשורה לטיפול או לא קשורה לטיפול, ולכן נמדדת גם בקבוצת הפלצבו. Adverse drug reaction לעומת זאת, הוא תופעה המיוחסת לתרופה עצמה. מחקר כזה מאפשר לזהות באמינות גבוהה מהי שכיחות התופעה שאכן קשורה לטיפול ולא הופיעה באופן מקרי אחריו.
בדרך כלל מחקר RCT לא יהיה מספיק גדול כדי לזהות תופעות לוואי נדירות, ולא מספיק ממושך כדי לזהות תופעות מאוחרות. לכן משתמשים גם בדיווחי מקרים (תיאור מקרה, סדרות מקרים), במחקרים על בסיסי נתונים (למשל, המחקר שדובר עליו בשני הפרקים הקודמים בפודקאסט), ובמרשמים (registries) שבהם מתבצע מעקב פעיל אחר אנשים שקיבלו את הטיפול, עם או ללא קבוצת השוואה.
בפרק נספר על מחקר שסקר מחקרי RCT שפורסמו בשנים האחרונות בעיתונים רפואיים מובילים בעולם, וגילה שלרוב(!) יש בעיות: הזיהוי, הדיווח והניתוח סטטיסטי של תופעות הלוואי מתבצע ברמה בינונית ומטה. נרחיב על מחקר ה RCT של חיסון הקורונה של מודרנה, ונגלה שבמחקר זה דווקא הצליחו להגיע לרמה גבוהה של שיטות ועמידה בסטנדרטים. נספר גם על מרשם (registry) ה V-safe שעוקב בצורה פעילה אחר תופעות לואי בקרב מיליוני מחוסנים בארצות הברית, ועל מאמר שהתפרסם מתוכו.
---
מאמרים שהוזכרו בפרק
מחקר ה RCT על חיסון הקורונה של מודרנה, כולל תופעות לוואי
Efficacy and Safety of the mRNA-1273 SARS-CoV-2 Vaccine
מחקר ה V-safe מרשם (registry) של מיליוני אנשים שקיבלו חיסון מודרנה או פייזר, עם מעקב יזום אחר תופעות לואי. שני מאמרים מ JAMA.
1) תופעות הלוואי של השבוע הראשון- כולל השוואה בין חיסוני פייזר ומודרנה (יוני 2021)-
כ 3.5 מיליון מחוסנים עם מעקב אקטיבי
Reactogenicity Following Receipt of mRNA-Based COVID-19 Vaccines
2) דיווחים על תופעות לואי נדירות, כולל מיוקרדיטיס (ספטמבר 2021)- מעל 6 מיליון מחוסנים עם מעקב אקטיבי (לא הוזכר בפרק)
Surveillance for Adverse Events After COVID-19 mRNA Vaccination
הסבר על השיטות המחקריות השונות לגילוי תופעות לוואי של תרופות
Adverse Event Detection in Drug Development: Recommendations and Obligations Beyond Phase 3
המלצות להגדרה, בדיקה ודיווח על תופעות לוואי במחקרים מבוקרים (2003)
The CONSORT extension for reporting harms outcomes
האם מחקרים מבוקרים שפורסמו בעיתונים הנחשבים בעולם בשנים האחרונות הגדירו, בדקו ודיווחו על תופעות לוואי לפי ההמלצות האלו?
Analysis and reporting of adverse events in randomised controlled trials: a review
בפרק זה נדבר על שיטות המחקר השונות לזיהוי תופעות לוואי של תרופה, ונדבר על שני מחקרים גדולים שבדקו בשיטות שונות תופעות לוואי של חיסוני mRNA לקורונה.
לאחר מחקרים ראשוניים על בטיחות התרופה בחיות מעבדה ובכמות קטנה של בני אדם מתנדבים, מתבצע בדרך כלל מחקר גדול מבוקר מסוג RCT. יש קריטריונים רבים לגבי זיהוי, ניתוח סטטיסטי של תופעות הלוואי ודיווח עליהן במחקרי RCT, למשל מדידת חומרת התופעה, משך התופעה, התייחסות רק לאלו שקיבלו את הטיפול בפועל כדי לחשב שכיחות, השוואת שכיחות תופעה בין שתי זרועות המחקר, ועוד. Adverse effect היא כל תופעה (רעה) המופיעה במשתתף במחקר. היא יכולה להיות קשורה לטיפול או לא קשורה לטיפול, ולכן נמדדת גם בקבוצת הפלצבו. Adverse drug reaction לעומת זאת, הוא תופעה המיוחסת לתרופה עצמה. מחקר כזה מאפשר לזהות באמינות גבוהה מהי שכיחות התופעה שאכן קשורה לטיפול ולא הופיעה באופן מקרי אחריו.
בדרך כלל מחקר RCT לא יהיה מספיק גדול כדי לזהות תופעות לוואי נדירות, ולא מספיק ממושך כדי לזהות תופעות מאוחרות. לכן משתמשים גם בדיווחי מקרים (תיאור מקרה, סדרות מקרים), במחקרים על בסיסי נתונים (למשל, המחקר שדובר עליו בשני הפרקים הקודמים בפודקאסט), ובמרשמים (registries) שבהם מתבצע מעקב פעיל אחר אנשים שקיבלו את הטיפול, עם או ללא קבוצת השוואה.
בפרק נספר על מחקר שסקר מחקרי RCT שפורסמו בשנים האחרונות בעיתונים רפואיים מובילים בעולם, וגילה שלרוב(!) יש בעיות: הזיהוי, הדיווח והניתוח סטטיסטי של תופעות הלוואי מתבצע ברמה בינונית ומטה. נרחיב על מחקר ה RCT של חיסון הקורונה של מודרנה, ונגלה שבמחקר זה דווקא הצליחו להגיע לרמה גבוהה של שיטות ועמידה בסטנדרטים. נספר גם על מרשם (registry) ה V-safe שעוקב בצורה פעילה אחר תופעות לואי בקרב מיליוני מחוסנים בארצות הברית, ועל מאמר שהתפרסם מתוכו.
---
מאמרים שהוזכרו בפרק
מחקר ה RCT על חיסון הקורונה של מודרנה, כולל תופעות לוואי
Efficacy and Safety of the mRNA-1273 SARS-CoV-2 Vaccine
מחקר ה V-safe מרשם (registry) של מיליוני אנשים שקיבלו חיסון מודרנה או פייזר, עם מעקב יזום אחר תופעות לואי. שני מאמרים מ JAMA.
1) תופעות הלוואי של השבוע הראשון- כולל השוואה בין חיסוני פייזר ומודרנה (יוני 2021)-
כ 3.5 מיליון מחוסנים עם מעקב אקטיבי
Reactogenicity Following Receipt of mRNA-Based COVID-19 Vaccines
2) דיווחים על תופעות לואי נדירות, כולל מיוקרדיטיס (ספטמבר 2021)- מעל 6 מיליון מחוסנים עם מעקב אקטיבי (לא הוזכר בפרק)
Surveillance for Adverse Events After COVID-19 mRNA Vaccination
הסבר על השיטות המחקריות השונות לגילוי תופעות לוואי של תרופות
Adverse Event Detection in Drug Development: Recommendations and Obligations Beyond Phase 3
המלצות להגדרה, בדיקה ודיווח על תופעות לוואי במחקרים מבוקרים (2003)
The CONSORT extension for reporting harms outcomes
האם מחקרים מבוקרים שפורסמו בעיתונים הנחשבים בעולם בשנים האחרונות הגדירו, בדקו ודיווחו על תופעות לוואי לפי ההמלצות האלו?
Analysis and reporting of adverse events in randomised controlled trials: a review
בפרק זה נדבר על אומדן קפלן- מאייר, ונחזור לתוצאות המחקר הישראלי הגדול שבדק את תופעות הלוואי של חיסון הקורונה.
לפעמים, במסע לקוטב הדרומי, או במחקרים רפואיים, זמן המעקב אחר המשתתפים אינו זהה: חלק מהמשתתפים עוברים את כל המסע, וחלקם משתתפים רק בחלק מהמסע.
כדי לאפשר מדגם גדול שכולל את כל המשתתפים, אך לא לטעות בחישובים, משתמשים במקרים כאלו באומדן קפלן מאייר ובעקומת קפלן מאייר. האומדן הזה פועל לפי עקרון הייצוג. אם יש משתתפים עם זמן מעקב ארוך ואחרים עם זמן מעקב קצר, עבור התקופה המשותפת (תחילת זמן המעקב עבור כל משתתף) התוצאות יחושבו עבור כל הקבוצה, אך עבור המשך המעקב בו רק חלק מהמטופלים משתתפים, הם ייצגו גם את חבריהם שכבר אינם משתתפים. כל זמן נפרד כזה נקרא מרווח (interval), ובכל מרווח המדגם הולך וקטן, והקבוצה הנותרת מייצגת את אותם משתתפים שזמן המעקב אצלם קצר יותר.
התוצאה של אומדן קפלן מאייר היא לא שיעור האנשים מכלל הקבוצה שחוו תופעת לואי (או תוצא אחר כלשהו), אלא האומדן לשיעור האנשים שמתבצע בעזרת הייצוג. ככל שאנחנו מתקדמים בזמן המעקב, וגודל המדגם קטן, כך האומדן פחות מדויק.
---
המאמר המקורי
Safety of the BNT162b2 mRNA Covid-19 Vaccine in a Nationwide Setting
הנספח למאמר, בו אפשר להסתכל על עקומות קפלן-מאייר עבור כל אחת מתופעות הלוואי בקבוצת המתחסנים מול קבוצת אלו שלא קיבלו חיסון
המסע של סקוט לקוטב הדרומי, מתוך ויקיפדיה
בפרק זה נדבר על אומדן קפלן- מאייר, ונחזור לתוצאות המחקר הישראלי הגדול שבדק את תופעות הלוואי של חיסון הקורונה.
לפעמים, במסע לקוטב הדרומי, או במחקרים רפואיים, זמן המעקב אחר המשתתפים אינו זהה: חלק מהמשתתפים עוברים את כל המסע, וחלקם משתתפים רק בחלק מהמסע.
כדי לאפשר מדגם גדול שכולל את כל המשתתפים, אך לא לטעות בחישובים, משתמשים במקרים כאלו באומדן קפלן מאייר ובעקומת קפלן מאייר. האומדן הזה פועל לפי עקרון הייצוג. אם יש משתתפים עם זמן מעקב ארוך ואחרים עם זמן מעקב קצר, עבור התקופה המשותפת (תחילת זמן המעקב עבור כל משתתף) התוצאות יחושבו עבור כל הקבוצה, אך עבור המשך המעקב בו רק חלק מהמטופלים משתתפים, הם ייצגו גם את חבריהם שכבר אינם משתתפים. כל זמן נפרד כזה נקרא מרווח (interval), ובכל מרווח המדגם הולך וקטן, והקבוצה הנותרת מייצגת את אותם משתתפים שזמן המעקב אצלם קצר יותר.
התוצאה של אומדן קפלן מאייר היא לא שיעור האנשים מכלל הקבוצה שחוו תופעת לואי (או תוצא אחר כלשהו), אלא האומדן לשיעור האנשים שמתבצע בעזרת הייצוג. ככל שאנחנו מתקדמים בזמן המעקב, וגודל המדגם קטן, כך האומדן פחות מדויק.
---
המאמר המקורי
Safety of the BNT162b2 mRNA Covid-19 Vaccine in a Nationwide Setting
הנספח למאמר, בו אפשר להסתכל על עקומות קפלן-מאייר עבור כל אחת מתופעות הלוואי בקבוצת המתחסנים מול קבוצת אלו שלא קיבלו חיסון
המסע של סקוט לקוטב הדרומי, מתוך ויקיפדיה
מחקר ישראלי חשוב ומרשים, שבדק את בטיחות חיסון הקורונה, התפרסם בסוף אוגוסט. ננצל מחקר זה כדי לדבר על תקפות ותוצאות של מחקרי קוהורט.
במחקר קוהורט יש השוואה בין שתי קבוצות- אחת שנחשפה לגורם ואחת שלא נחשפה, ומדידת תוצאים (בדרך כלל תחלואה) בכל אחת מהקבוצות, עם השוואה ביניהן. במקרה שלנו, השוואה בין קבוצה שנחשפה לחיסון (קיבלה חיסון קורונה בישראל), לבין קבוצה שלא נחשפה להתערבות זו, ומדידת מגוון רחב מאוד של תופעות לואי אפשריות.
במחקרים מסוג זה האתגרים הגדולים הם מדידה נכונה ומדויקת של החשיפה ושל התוצאים, ונטרול של ערפלנים (confounders) אפשריים. במחקר הזה, שיטת נטרול הערפלנים הייתה התאמה (matching) של מטופל לא מחוסן עבור כל מטופל מחוסן, כדי ליצור שתי קבוצות דומות מאוד מבחינת הערפלנים. במחקרים מסוג זה תמיד נשארים גם ערפלנים שלא נמדדו.
נזכיר חלק מתוצאות המחקר, ובעקר מיוקרדיטיס כסיבוך נדיר של החיסון, ונדבר על סיכון יחסי (risk ratio, relative risk) ועל ההשפעה האבסולוטית של חשיפה מסוימת על מטופל (attributable risk, המקביל ל absolute risk reduction). השפעה מחושבת זו עבור מיוקרדיטיס הייתה 2.7 מקרים עבור כל מאה אלף מחוסנים. להשוואה- השפעת זיהום (תחלואה) בקורונה על מיוקרדיטיס הייתה דרמטית הרבה יותר.
---
המאמר:
Safety of the BNT162b2 mRNA Covid-19 Vaccine in a Nationwide Setting
---
חישובים:
Risk=patients with outcome/all patients in group
Risk ratio=relative risk=Risk in exposure group/Risk in control group
Attributable risk(“=absolute risk increase”)= Risk in exposure group-Risk in control group
לדוגמה: אם יש מאה אנשים שהקשיבו לפרק הזה, ואלף שלא נחשפו (לא הקשיבו), ובכל אחת מהקבוצות נרדמו 50.
Risk (listeners) =50/100=0.5
Risk (non listeners) =50/1000=0.05
Risk ratio=0.5/0.05=10 (ההאזנה מגבירה פי 10 את הסיכון להירדם)
Attributable risk=0.5-0.05=0.45 (הסבירות שאדם המאזין לפרק יירדם בגלל הפרק עצמו היא 45%)
מחקר ישראלי חשוב ומרשים, שבדק את בטיחות חיסון הקורונה, התפרסם בסוף אוגוסט. ננצל מחקר זה כדי לדבר על תקפות ותוצאות של מחקרי קוהורט.
במחקר קוהורט יש השוואה בין שתי קבוצות- אחת שנחשפה לגורם ואחת שלא נחשפה, ומדידת תוצאים (בדרך כלל תחלואה) בכל אחת מהקבוצות, עם השוואה ביניהן. במקרה שלנו, השוואה בין קבוצה שנחשפה לחיסון (קיבלה חיסון קורונה בישראל), לבין קבוצה שלא נחשפה להתערבות זו, ומדידת מגוון רחב מאוד של תופעות לואי אפשריות.
במחקרים מסוג זה האתגרים הגדולים הם מדידה נכונה ומדויקת של החשיפה ושל התוצאים, ונטרול של ערפלנים (confounders) אפשריים. במחקר הזה, שיטת נטרול הערפלנים הייתה התאמה (matching) של מטופל לא מחוסן עבור כל מטופל מחוסן, כדי ליצור שתי קבוצות דומות מאוד מבחינת הערפלנים. במחקרים מסוג זה תמיד נשארים גם ערפלנים שלא נמדדו.
נזכיר חלק מתוצאות המחקר, ובעקר מיוקרדיטיס כסיבוך נדיר של החיסון, ונדבר על סיכון יחסי (risk ratio, relative risk) ועל ההשפעה האבסולוטית של חשיפה מסוימת על מטופל (attributable risk, המקביל ל absolute risk reduction). השפעה מחושבת זו עבור מיוקרדיטיס הייתה 2.7 מקרים עבור כל מאה אלף מחוסנים. להשוואה- השפעת זיהום (תחלואה) בקורונה על מיוקרדיטיס הייתה דרמטית הרבה יותר.
---
המאמר:
Safety of the BNT162b2 mRNA Covid-19 Vaccine in a Nationwide Setting
---
חישובים:
Risk=patients with outcome/all patients in group
Risk ratio=relative risk=Risk in exposure group/Risk in control group
Attributable risk(“=absolute risk increase”)= Risk in exposure group-Risk in control group
לדוגמה: אם יש מאה אנשים שהקשיבו לפרק הזה, ואלף שלא נחשפו (לא הקשיבו), ובכל אחת מהקבוצות נרדמו 50.
Risk (listeners) =50/100=0.5
Risk (non listeners) =50/1000=0.05
Risk ratio=0.5/0.05=10 (ההאזנה מגבירה פי 10 את הסיכון להירדם)
Attributable risk=0.5-0.05=0.45 (הסבירות שאדם המאזין לפרק יירדם בגלל הפרק עצמו היא 45%)
האם ריצה עלולה לסכן את בריאות הברכיים ולגרום לאוסטאוארטריטיס (osteoarthritis) בהמשך החיים? מחקרים תצפיתיים שעוסקים בשאלה זו בדרך כלל נותנים לנו תוצאה בצורת odds ratio (OR). זהו מספר שאינו אינטואיטיבי להבנה וליישום. למשל כאשר הסיכון הוא 20% בקבוצה אחת לעומת 33% בקבוצה שנייה, ה OR הוא 2. כאשר הסיכונים הם 50% באחת ו 80% בשנייה, ה OR הוא 4.
בפרק זה נסביר כיצד מחושב ה odds ratio, מדוע משתמשים בו במחקרי מקרה-בקרה (case-control studies), מתי עוד אנחנו צפויים לפגוש אותו (במטא אנליזה ובמחקרים משווים בהם בוצע תקנון למשתנים נוספים) ואיך ליישם אותו בחישובי סיכון עבור מטופל. לגבי השאלה הקלינית שלנו, נגלה שמחקרים שונים הגיעו למסקנות סותרות, זאת אומרת, חלקם מצאו שהריצה מהווה גורם מגן.
---
להסבר בסיסי על odds מול risk
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4640017/
---
חישובים:
כאשר הסבירות למחלה נמוכה מאוד בשתי הקבוצות, פחות מ 10%, ה OR קרוב מאוד ל relative risk ואז אפשר להתייחס אליו כאילו מדובר ב relative risk. זאת אומרת – אם OR הוא 2, הסיכון למחלה עולה פי 2. אם הוא 0.5, הסיכון יורד פי 2.
כאשר הסבירות למחלה נעה בין 10% ל 50%, כלל ה 15-30-45 יכול לעזור לנו לקבל קירוב סביר של הגברת הסיכון.
כש OR הוא 2, הסבירות עולה ב 15%, כש OR הוא 5, הסבירות עולה ב 30%, וכשהוא 10, הסבירות עולה ב 45%.
למשל, אם הסיכון לאוסטאוארטריטיס של הברך באוכלוסיה מסויימת הוא 20%, וה OR עבור אנשים שעובדים בכריעה או על הברכיים הוא 5 לעומת אלו שעובדים בישיבה, נשתמש בכלל 5-> 30%, ואז הסבירות למחלה באלו שעבדו בכריעה היא
20%+30%=50%
יש גם כלל דומה לגבי OR קטן מ 1 וכאשר הסבירות מראש היא סביב 50% או יותר. כאשר OR הוא 0.5, הסבירות יורדת ב 15%, כאשר הוא 0.2, הסבירות יורדת ב 30%, וכאשר הוא 0.1, הסבירות יורדת ב 45%.
לחובבי מתמטיקה- שמעו את הפרק על likelihood ratio ("תוצאות בדיקה אבחנתית- הדרך המדוייקת יותר"). מדובר בדיוק באותה תופעה מתמטית. גם שם אפשר להשתמש בחוק ה 15-30-45 כדי להגיע לסבירות מקורבת למחלה, כאשר הסבירות למחלה היא סביב 50% לפני הבדיקה וה LR הוא 2, 5 או 10.
---
קישורים למאמרים שהוזכרו בפרק
מחקר קוהורט ב Clinical rheumatology משנת 2018 בדק האם באנשים עם OA ריצה מחמירה את המצב ומצא קשר הפוך בין ריצה לכאבים: OR מתוקנן לכאב ברך חדש 0.9 (לא מובהק) OR מתוקנן להפסקת כאבים תכופים 1.7
מחקר מקרה-בקרה השווה בין אנשים עם OA לאנשים ללא OA, שם OR מתוקנן לג'וגינג של 1500-3000 שעות בחיים היה 1.9.
בסקירה שיטתית על הנושא ב American journal of sport medicine משנת 2017, נמצאו תוצאות סותרות במחקרים שונים. אחד התוצאים שנבדק במטא אנליזה היה קשר בין ריצה לניתוח ברך עבור אוסטאוארטריטיס בהמשך החיים. ה OR לריצה באלו שנותחו היה 0.46 , זאת אומרת ריצה כאן הייתה גורם מגן ולא פוגע.
Running and Knee Osteoarthritis: A Systematic Review and Meta-analysis
האם ריצה עלולה לסכן את בריאות הברכיים ולגרום לאוסטאוארטריטיס (osteoarthritis) בהמשך החיים? מחקרים תצפיתיים שעוסקים בשאלה זו בדרך כלל נותנים לנו תוצאה בצורת odds ratio (OR). זהו מספר שאינו אינטואיטיבי להבנה וליישום. למשל כאשר הסיכון הוא 20% בקבוצה אחת לעומת 33% בקבוצה שנייה, ה OR הוא 2. כאשר הסיכונים הם 50% באחת ו 80% בשנייה, ה OR הוא 4.
בפרק זה נסביר כיצד מחושב ה odds ratio, מדוע משתמשים בו במחקרי מקרה-בקרה (case-control studies), מתי עוד אנחנו צפויים לפגוש אותו (במטא אנליזה ובמחקרים משווים בהם בוצע תקנון למשתנים נוספים) ואיך ליישם אותו בחישובי סיכון עבור מטופל. לגבי השאלה הקלינית שלנו, נגלה שמחקרים שונים הגיעו למסקנות סותרות, זאת אומרת, חלקם מצאו שהריצה מהווה גורם מגן.
---
להסבר בסיסי על odds מול risk
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4640017/
---
חישובים:
כאשר הסבירות למחלה נמוכה מאוד בשתי הקבוצות, פחות מ 10%, ה OR קרוב מאוד ל relative risk ואז אפשר להתייחס אליו כאילו מדובר ב relative risk. זאת אומרת – אם OR הוא 2, הסיכון למחלה עולה פי 2. אם הוא 0.5, הסיכון יורד פי 2.
כאשר הסבירות למחלה נעה בין 10% ל 50%, כלל ה 15-30-45 יכול לעזור לנו לקבל קירוב סביר של הגברת הסיכון.
כש OR הוא 2, הסבירות עולה ב 15%, כש OR הוא 5, הסבירות עולה ב 30%, וכשהוא 10, הסבירות עולה ב 45%.
למשל, אם הסיכון לאוסטאוארטריטיס של הברך באוכלוסיה מסויימת הוא 20%, וה OR עבור אנשים שעובדים בכריעה או על הברכיים הוא 5 לעומת אלו שעובדים בישיבה, נשתמש בכלל 5-> 30%, ואז הסבירות למחלה באלו שעבדו בכריעה היא
20%+30%=50%
יש גם כלל דומה לגבי OR קטן מ 1 וכאשר הסבירות מראש היא סביב 50% או יותר. כאשר OR הוא 0.5, הסבירות יורדת ב 15%, כאשר הוא 0.2, הסבירות יורדת ב 30%, וכאשר הוא 0.1, הסבירות יורדת ב 45%.
לחובבי מתמטיקה- שמעו את הפרק על likelihood ratio ("תוצאות בדיקה אבחנתית- הדרך המדוייקת יותר"). מדובר בדיוק באותה תופעה מתמטית. גם שם אפשר להשתמש בחוק ה 15-30-45 כדי להגיע לסבירות מקורבת למחלה, כאשר הסבירות למחלה היא סביב 50% לפני הבדיקה וה LR הוא 2, 5 או 10.
---
קישורים למאמרים שהוזכרו בפרק
מחקר קוהורט ב Clinical rheumatology משנת 2018 בדק האם באנשים עם OA ריצה מחמירה את המצב ומצא קשר הפוך בין ריצה לכאבים: OR מתוקנן לכאב ברך חדש 0.9 (לא מובהק) OR מתוקנן להפסקת כאבים תכופים 1.7
מחקר מקרה-בקרה השווה בין אנשים עם OA לאנשים ללא OA, שם OR מתוקנן לג'וגינג של 1500-3000 שעות בחיים היה 1.9.
בסקירה שיטתית על הנושא ב American journal of sport medicine משנת 2017, נמצאו תוצאות סותרות במחקרים שונים. אחד התוצאים שנבדק במטא אנליזה היה קשר בין ריצה לניתוח ברך עבור אוסטאוארטריטיס בהמשך החיים. ה OR לריצה באלו שנותחו היה 0.46 , זאת אומרת ריצה כאן הייתה גורם מגן ולא פוגע.
Running and Knee Osteoarthritis: A Systematic Review and Meta-analysis
פרק זה הוא מבוא למחקרים תצפיתיים, בו נסביר את ההבדלים בין מחקר קוהורט, מחקר מקרה-בקרה, ומחקר קוהורט רטרוספקטיבי.
ב 1983 עדיין לא הבינו מהי דרך העברת מחלת האיידס. מחקר תצפיתי מסוג מקרה-בקרה היה חשוב ביותר להבנה זו. לאחר כמה שנים מחקר קוהורט פרוספקטיבי הדגים ממצא מפתיע – גברים נימולים נדבקו פחות באיידס. בהקשר אחר לגמרי, ושנים רבות אחר כך, תדירות יחסי מין גבוהה יותר הייתה קשורה לתוחלת חיים ארוכה יותר אצל קשישים בטאיוואן.
בכל המקרים האלו, מחקר התערבותי כמו RCT לא היה אפשרי, מסיבות פרקטיות או מוסריות, והיה צורך בביצוע מחקר תצפיתי. מחקרים תצפיתיים יכולים להתבצע בשיטות שונות. המאפיין אותם הוא שהחוקרים לא מבצעים את ההתערבות (לדוגמה מתן תרופה, החלטה על תדירות יחסי מין, החלטה על עישון, או חיתוך העורלה), אלא מתצפתים על אנשים שנחשפו להתערבות או לגורם סיכון מסוים. נדבר על שלושת המחקרים התצפיתיים השכיחים ביותר בספרות הרפואית, ונסביר את הדומה והשונה ביניהם.
מחקר קוהורט פרוספקטיבי, בו יש השוואה בין קבוצה שנחשפה לגורם מסויים לקבוצה שלא נחשפה לאותו גורם, ומעקב של החוקר לאורך זמן אחר שתי הקבוצות כדי לבחון האם היה שוני בהמשך בתוצא כמו למשל מחלה.
מחקר קוהורט רטרוספקטיבי, בו יש השוואה זהה, אך החוקר משתמש במידע שכבר נאסף קודם, כיום בדרך כלל מדובר על מידע מתוך תיקים רפואיים ממוחשבים- מידע שלא נאסף לצרכי מחקר אלא לצרכים מנהלתיים ורפואיים.
מחקר מקרה בקרה, בו ההשוואה שונה- בין קבוצה שחוותה תוצא מסויים (למשל מחלה), ה"מקרים", לבין קבוצה שלא חוותה תוצא זה (קבוצת הבקרה). כאן בכל קבוצה נבדק לאחור מה הייתה מידת החשיפה לגורם מסוים.
---
מאמרים שהוזכרו בפרק
מחקר מקרה-בקרה מ annals of internal medicine מ 1983,שזיהה לראשונה את דרך ההעברה של המחלה הנקראת היום AIDS.
תגובת ה CDC למחלת האיידס- השנים הראשונות
פודקאסט מומלץ של JAMA על גילוי דרך העברת ה- AIDS.
מחקר קוהורט מ lancet משנת 1989, אצל גברים באפריקה שכבר נדבקו במחלות המועברות ביחסי מין, ובוצע אצלם מעקב להדבקות ב HIV. אחד מגורמי הסיכון המשמעותיים להדבקות בנגיף היה העדר מילה.
מחקר קוהורט נוסף שהראה ממצא דומה
מחקר מבוקר אקראי מ Lancet , 2007. מילת העורלה, בקבוצת המילה הייתה פחות הדבקות של גברים ב HIV
Male circumcision for HIV prevention in men in Rakai, Uganda: a randomised trial
אך לגבי הדבקת נשים- ייתכן שמילת הגברים לא רק שלא עוזרת אלא אף עלולה להגביר הדבקת השותפה-מחקר RCT נוסף
קווים מנחים של ארגון הבריאות העולמי לגבי מילה כהתערבות מניעתית באזורים מוכי איידס.
מחקר קוהורט בהקשר אחר שהראה קשר בין תדירות גבוהה יותר של יחסי מין בקשישים לבין חיים ארוכים יותר.
פרק זה הוא מבוא למחקרים תצפיתיים, בו נסביר את ההבדלים בין מחקר קוהורט, מחקר מקרה-בקרה, ומחקר קוהורט רטרוספקטיבי.
ב 1983 עדיין לא הבינו מהי דרך העברת מחלת האיידס. מחקר תצפיתי מסוג מקרה-בקרה היה חשוב ביותר להבנה זו. לאחר כמה שנים מחקר קוהורט פרוספקטיבי הדגים ממצא מפתיע – גברים נימולים נדבקו פחות באיידס. בהקשר אחר לגמרי, ושנים רבות אחר כך, תדירות יחסי מין גבוהה יותר הייתה קשורה לתוחלת חיים ארוכה יותר אצל קשישים בטאיוואן.
בכל המקרים האלו, מחקר התערבותי כמו RCT לא היה אפשרי, מסיבות פרקטיות או מוסריות, והיה צורך בביצוע מחקר תצפיתי. מחקרים תצפיתיים יכולים להתבצע בשיטות שונות. המאפיין אותם הוא שהחוקרים לא מבצעים את ההתערבות (לדוגמה מתן תרופה, החלטה על תדירות יחסי מין, החלטה על עישון, או חיתוך העורלה), אלא מתצפתים על אנשים שנחשפו להתערבות או לגורם סיכון מסוים. נדבר על שלושת המחקרים התצפיתיים השכיחים ביותר בספרות הרפואית, ונסביר את הדומה והשונה ביניהם.
מחקר קוהורט פרוספקטיבי, בו יש השוואה בין קבוצה שנחשפה לגורם מסויים לקבוצה שלא נחשפה לאותו גורם, ומעקב של החוקר לאורך זמן אחר שתי הקבוצות כדי לבחון האם היה שוני בהמשך בתוצא כמו למשל מחלה.
מחקר קוהורט רטרוספקטיבי, בו יש השוואה זהה, אך החוקר משתמש במידע שכבר נאסף קודם, כיום בדרך כלל מדובר על מידע מתוך תיקים רפואיים ממוחשבים- מידע שלא נאסף לצרכי מחקר אלא לצרכים מנהלתיים ורפואיים.
מחקר מקרה בקרה, בו ההשוואה שונה- בין קבוצה שחוותה תוצא מסויים (למשל מחלה), ה"מקרים", לבין קבוצה שלא חוותה תוצא זה (קבוצת הבקרה). כאן בכל קבוצה נבדק לאחור מה הייתה מידת החשיפה לגורם מסוים.
---
מאמרים שהוזכרו בפרק
מחקר מקרה-בקרה מ annals of internal medicine מ 1983,שזיהה לראשונה את דרך ההעברה של המחלה הנקראת היום AIDS.
תגובת ה CDC למחלת האיידס- השנים הראשונות
פודקאסט מומלץ של JAMA על גילוי דרך העברת ה- AIDS.
מחקר קוהורט מ lancet משנת 1989, אצל גברים באפריקה שכבר נדבקו במחלות המועברות ביחסי מין, ובוצע אצלם מעקב להדבקות ב HIV. אחד מגורמי הסיכון המשמעותיים להדבקות בנגיף היה העדר מילה.
מחקר קוהורט נוסף שהראה ממצא דומה
מחקר מבוקר אקראי מ Lancet , 2007. מילת העורלה, בקבוצת המילה הייתה פחות הדבקות של גברים ב HIV
Male circumcision for HIV prevention in men in Rakai, Uganda: a randomised trial
אך לגבי הדבקת נשים- ייתכן שמילת הגברים לא רק שלא עוזרת אלא אף עלולה להגביר הדבקת השותפה-מחקר RCT נוסף
קווים מנחים של ארגון הבריאות העולמי לגבי מילה כהתערבות מניעתית באזורים מוכי איידס.
מחקר קוהורט בהקשר אחר שהראה קשר בין תדירות גבוהה יותר של יחסי מין בקשישים לבין חיים ארוכים יותר.
סיכום מאמר מסוף יולי 2021, שעוסק בבדיקה אבחנתית: בדיקת אנטיגן מהירה לזיהוי קורונה. המחקר בוצע בשיטת מחקר חתך, בו על בני משפחה של חולי קורונה מאומתים בוצעה בדיקת האנטיגן וכן בדיקת PCR כבדיקה ההשוואה (gold standard).
המחקר בוצע למעשה פעמיים, עבור שני קיטים שונים לבדיקה- Veritor, ו- biosensor. ההתייחסות כאן היא רק לראשון שבהם, כיוון שהתוצאות דומות מאוד. המחקר עומד בצורה מרשימה ביותר בקריטריונים לתקפות מאמר על בדיקה אבחנתית.
תוצאות המחקר מראות שרגישות הבדיקה היא 64%, וספציפיות הבדיקה 99.6%. מתוך מספרים אלו ניתן לחשב-
Positive likelihood ratio=160
Negative likelihood ratio=0.36
במלים אחרות, הבדיקה טובה מאוד בהוכחת מחלה והרבה פחות טובה בשלילתה.
יוצא הדופן הוא בסבירויות נמוכות מאוד למחלה (למשל, בהעדר מגפה באזור וזמן מסוים, או באדם שאינו נפגש כמעט עם אנשים), שם בדיקה חיובית רחוקה מלהוכיח מחלה.
אני מקווה שבקרוב נוכל לראות בספרות הרפואית מחקרים דומים על בדיקת האנטיגן המיושמת בארץ.
---
מחשבון לחישוב likelihood ratio, ולמעבר מסבירות לפני בדיקה לסבירות אחרי הבדיקה
http://araw.mede.uic.edu/cgi-bin/testcalc.pl
(הנתונים הדרושים: שכיחות/ סבירות המחלה, רגישות וספציפיות הבדיקה)
---
המאמר שנותח בפרק:
הערה: המחקר בוצע על מטופלים ללא תסמינים. במקרה שישנם תסמינים, סביר שרגישות הבדיקה גבוהה יותר ואז יכולתה לשלול את קיום הנגיף גבוהה מעט יותר. למשל, בנוכחות תסמינים במטופל עם סבירות של 50% לזיהום קורונה, ובהנחת רגישות של 80%, בדיקה שלילית תפחית את הסבירות ל 17%.
סיכום מאמר מסוף יולי 2021, שעוסק בבדיקה אבחנתית: בדיקת אנטיגן מהירה לזיהוי קורונה. המחקר בוצע בשיטת מחקר חתך, בו על בני משפחה של חולי קורונה מאומתים בוצעה בדיקת האנטיגן וכן בדיקת PCR כבדיקה ההשוואה (gold standard).
המחקר בוצע למעשה פעמיים, עבור שני קיטים שונים לבדיקה- Veritor, ו- biosensor. ההתייחסות כאן היא רק לראשון שבהם, כיוון שהתוצאות דומות מאוד. המחקר עומד בצורה מרשימה ביותר בקריטריונים לתקפות מאמר על בדיקה אבחנתית.
תוצאות המחקר מראות שרגישות הבדיקה היא 64%, וספציפיות הבדיקה 99.6%. מתוך מספרים אלו ניתן לחשב-
Positive likelihood ratio=160
Negative likelihood ratio=0.36
במלים אחרות, הבדיקה טובה מאוד בהוכחת מחלה והרבה פחות טובה בשלילתה.
יוצא הדופן הוא בסבירויות נמוכות מאוד למחלה (למשל, בהעדר מגפה באזור וזמן מסוים, או באדם שאינו נפגש כמעט עם אנשים), שם בדיקה חיובית רחוקה מלהוכיח מחלה.
אני מקווה שבקרוב נוכל לראות בספרות הרפואית מחקרים דומים על בדיקת האנטיגן המיושמת בארץ.
---
מחשבון לחישוב likelihood ratio, ולמעבר מסבירות לפני בדיקה לסבירות אחרי הבדיקה
http://araw.mede.uic.edu/cgi-bin/testcalc.pl
(הנתונים הדרושים: שכיחות/ סבירות המחלה, רגישות וספציפיות הבדיקה)
---
המאמר שנותח בפרק:
הערה: המחקר בוצע על מטופלים ללא תסמינים. במקרה שישנם תסמינים, סביר שרגישות הבדיקה גבוהה יותר ואז יכולתה לשלול את קיום הנגיף גבוהה מעט יותר. למשל, בנוכחות תסמינים במטופל עם סבירות של 50% לזיהום קורונה, ובהנחת רגישות של 80%, בדיקה שלילית תפחית את הסבירות ל 17%.
רגע דיגיטלי מרגש: הפודקאסט חגג השבוע אלף הורדות של פרקים. לכבוד החגיגה, מחווה לשיר "אלף כבאים": מחקרים שעוסקים באלף כבאים, באלף ספרים (פ' דגושה), וברופא אחד שמתקרב אלי עם המזרק.
מדובר במטא אנליזה, במחקר אקראי מבוקר לפי צברים (cluster randomized trial)- שיטת מחקר שנסביר בפרק זה, ובמחקר מבוקר ללא אקראיות. בשלושתם נדבר על התקפות, על התוצאות ועל רלוונטיות
---
מאמרים שהוזכרו בפרק:
Cancer Incidence and Mortality in Firefighters: A State-of-the-Art Review and Meta-َAnalysis
מטא אנליזה של מחקרים תצפיתיים: היארעות סרטן ותמותה מסרטן בכבאים (לוחמי אש) יחסית לקבוצת בקרה.
A Cluster-Randomized Trial of Blood-Pressure Reduction in Black Barbershops
מחקר מבוקר אקראי בצברים (clusters). במספרות ההתערבות בוצע איזון לחץ דם על ידי רוקחים בהמלצת הספר. כבוד לספרים ולרוקחים!
מקצוע הספר-כירורג היה תקופה מסוימת אחד מהמקצועות המרכזיים ברפואה.
Effect of syringe size on severity of pain during local anesthesia administration
מזרק גדול יותר (3 מ"ל) כואב יותר מאשר מזרק קטן עם אותה מחט ואותו קצב הזרקת החומר.
---
הגרסה המקורית המעולה ל"אלף כבאים" היא של "דודה", כדאי לשמוע גם את
הביצוע של צחי הלוי, אבי סינגולדה, ודין בליזון.
רגע דיגיטלי מרגש: הפודקאסט חגג השבוע אלף הורדות של פרקים. לכבוד החגיגה, מחווה לשיר "אלף כבאים": מחקרים שעוסקים באלף כבאים, באלף ספרים (פ' דגושה), וברופא אחד שמתקרב אלי עם המזרק.
מדובר במטא אנליזה, במחקר אקראי מבוקר לפי צברים (cluster randomized trial)- שיטת מחקר שנסביר בפרק זה, ובמחקר מבוקר ללא אקראיות. בשלושתם נדבר על התקפות, על התוצאות ועל רלוונטיות
---
מאמרים שהוזכרו בפרק:
Cancer Incidence and Mortality in Firefighters: A State-of-the-Art Review and Meta-َAnalysis
מטא אנליזה של מחקרים תצפיתיים: היארעות סרטן ותמותה מסרטן בכבאים (לוחמי אש) יחסית לקבוצת בקרה.
A Cluster-Randomized Trial of Blood-Pressure Reduction in Black Barbershops
מחקר מבוקר אקראי בצברים (clusters). במספרות ההתערבות בוצע איזון לחץ דם על ידי רוקחים בהמלצת הספר. כבוד לספרים ולרוקחים!
מקצוע הספר-כירורג היה תקופה מסוימת אחד מהמקצועות המרכזיים ברפואה.
Effect of syringe size on severity of pain during local anesthesia administration
מזרק גדול יותר (3 מ"ל) כואב יותר מאשר מזרק קטן עם אותה מחט ואותו קצב הזרקת החומר.
---
הגרסה המקורית המעולה ל"אלף כבאים" היא של "דודה", כדאי לשמוע גם את
הביצוע של צחי הלוי, אבי סינגולדה, ודין בליזון.
"הספק הוא בית הספר של האמת"- פרנסיס בייקון
יש סיבות רבות להטיל ספק בממצאי מחקרים ברפואה ובעקר בממצאים חיוביים (שהתוצאה שלהם מובהקת).
נפרט חלק מסיבות אלה- החובה שלא להזיק, ההיסטוריה של טיפולים מזיקים ברפואה, ניגודי האינטרסים במחקר, ושכיחות שיטות לקויות במחקרים רפואיים.
ישנה גם סיבה מעניינת נוספת שנסביר יותר לעומק. זוהי סיבה מתמטית שהוצגה על ידי יואנידיס ב- 2005: כאשר מחקר קטן, וכאשר הוא בודק השערה שהסבירות שהיא נכונה נמוכה, תוצאה חיובית ומובהקת במחקר בדרך כלל תהיה מוטעית (!).
החישובים של יואנידיס מבוססים על הסתברות מותנית, וכוללים את הסבירות מראש שההשערה נכונה, את ערך הסף למובהקות ואת עצמת המחקר (power)- מושג שנסביר בפרק זה. המסקנה מחישובים אלו, היא שרוב המחקרים המתפרסמים ברפואה שבהם הממצאים מובהקים, למעשה מטעים אותנו. (למתעניינים- בסוף הטקסט יש פירוט החישוב)
למרות כל אלו, חשוב לראות גם את הצד השני של המטבע- צריך להיזהר מספקנות מוחלטת , מניהיליזם המטיל ספק מוחלט בכל המחקר הרפואי. גישה כזו עלולה להיות הרסנית ביותר לרפואה ולמטופלים.
כאשר המחקר גדול, כששאלת המחקר בדקה קשר שיש סבירות גבוהה שקיים, ואם המחקר בוצע בשיטות טובות- ממצאים מובהקים לרוב מעידים על האמת, מקדמים את הרפואה ועוזרים למטופלים לקבל טיפול נכון וטוב יותר.
"קיימים שני סוגי טיפשים: אלה שאינם מטילים ספק כלל, ואלה המטילים ספק בכל דבר"- שארל דה לין
---
המאמרים שהוזכרו בפרק
Ioannidis: Why Most Published Research Findings Are False
לחובבי מתמטיקה ברמה בסיסית (חילוק, חיסור)- החישובים במאמר בהחלט אפשריים להבנה, ויש דוגמה למטה. לנמנעי מתמטיקה- הגרפים מציגים את התופעה בצורה ברורה, ומראים מה הסבירות שתוצאת מחקר מובהקת אכן מייצגת את האמת לפי מאפיינים שונים המחקר.
מטא-אנליזות בכירורגיה הן לרוב עם הטיות (שיטות לקויות- מאמר מ 2005, אך מאמר דומה מ 2020 לגבי במטא-אנליזות העוסקות בנוגדי קרישה חדשים מראה שהבעיה עדיין קיימת.
מאמר דעה יפה על כך שספקות לגבי ממצאים הם חלק בלתי נפרד מהמדע
---
למתעניינים בחישובים של יואנידיס:
נאמר שבתחום רפואי מסוים יש סבירות של 5% שיש קשר בין שני משתנים, למשל 5% מהמזונות מגבירים סיכוי למחלה מסוימת. נאמר גם שבוצע מחקר שבדק האם יש קשר בין מזון מסוים לאותה מחלה. אם עצמת המחקר היא 0.2, ואם התוצאות היו מובהקות, עם ערך p של 0.05 הסבירות שמדובר בטעות ושלמעשה אין קשר בין המזון למחקר היא 70%, גם אם אין הטיות בשיטות המחקר*. במלים אחרות, למרות שהמחקר הראה שהמזון מגביר סיכוי למחלה, ולמרות שערך ה p – היה 0.05, סביר שאין קשר בין אותו מזון למחלה.
החישוב: במחקר בעצמה 0.2 , כאשר הסבירות מראש לקשר בין משתנים היא 5%,
מכפילים את הסבירות מראש לקשר בעצמה (power)
0.2X 5%=2%
מכפילים את הסבירות שאין קשר בערך ה- p
0.05X 95%=~5%
שני מצבים אלו יחד מייצגים את כלל האפשרויות לקבל תוצאה מובהקת במחקר,
ואז היחס בין תוצאות מובהקות מטעות לבין כלל התוצאות המובהקות הוא
5/7=~30%
*חישוב זה נוטה להגזים לטובה... יואנידיס משתמש גם במקדמים נוספים לתקנון עבור רמות שונות של הטיה במחקר, ועבור ביצוע מחקרים מרובים על אותה שאלה קלינית. כאשר משתמשים במקדמים אלו, שיעור התוצאות המובהקות המוטעות עולה עוד יותר.
לעומת זאת, החישוב נסמך על מחקרים בהם ערך ה p הוא 0.05, ואם ערך ה p קטן יותר, החישוב מגזים לרעה. באופן דומה, אם המחקר גדול (ולכן העצמה שלו גדולה יותר) החישוב מגזים לרעה, ואם הסבירות מראש לקשר בין שני משתנים גדולה יותר (למשל, תיאוריה בסיסית חזקה מאוד, מחקרים קודמים שהצביעו על קשר אפשרי, ועוד)- החישוב מגזים לרעה. זאת אומרת, במחקרים גדולים, עם שאלת מחקר שמאחוריה הגיון ומחקרים קודמים, עם ערך p קטן מאוד וכאשר ההטיות לא חמורות, אפשר בהחלט לסמוך על תוצאות חיוביות.
"הספק הוא בית הספר של האמת"- פרנסיס בייקון
יש סיבות רבות להטיל ספק בממצאי מחקרים ברפואה ובעקר בממצאים חיוביים (שהתוצאה שלהם מובהקת).
נפרט חלק מסיבות אלה- החובה שלא להזיק, ההיסטוריה של טיפולים מזיקים ברפואה, ניגודי האינטרסים במחקר, ושכיחות שיטות לקויות במחקרים רפואיים.
ישנה גם סיבה מעניינת נוספת שנסביר יותר לעומק. זוהי סיבה מתמטית שהוצגה על ידי יואנידיס ב- 2005: כאשר מחקר קטן, וכאשר הוא בודק השערה שהסבירות שהיא נכונה נמוכה, תוצאה חיובית ומובהקת במחקר בדרך כלל תהיה מוטעית (!).
החישובים של יואנידיס מבוססים על הסתברות מותנית, וכוללים את הסבירות מראש שההשערה נכונה, את ערך הסף למובהקות ואת עצמת המחקר (power)- מושג שנסביר בפרק זה. המסקנה מחישובים אלו, היא שרוב המחקרים המתפרסמים ברפואה שבהם הממצאים מובהקים, למעשה מטעים אותנו. (למתעניינים- בסוף הטקסט יש פירוט החישוב)
למרות כל אלו, חשוב לראות גם את הצד השני של המטבע- צריך להיזהר מספקנות מוחלטת , מניהיליזם המטיל ספק מוחלט בכל המחקר הרפואי. גישה כזו עלולה להיות הרסנית ביותר לרפואה ולמטופלים.
כאשר המחקר גדול, כששאלת המחקר בדקה קשר שיש סבירות גבוהה שקיים, ואם המחקר בוצע בשיטות טובות- ממצאים מובהקים לרוב מעידים על האמת, מקדמים את הרפואה ועוזרים למטופלים לקבל טיפול נכון וטוב יותר.
"קיימים שני סוגי טיפשים: אלה שאינם מטילים ספק כלל, ואלה המטילים ספק בכל דבר"- שארל דה לין
---
המאמרים שהוזכרו בפרק
Ioannidis: Why Most Published Research Findings Are False
לחובבי מתמטיקה ברמה בסיסית (חילוק, חיסור)- החישובים במאמר בהחלט אפשריים להבנה, ויש דוגמה למטה. לנמנעי מתמטיקה- הגרפים מציגים את התופעה בצורה ברורה, ומראים מה הסבירות שתוצאת מחקר מובהקת אכן מייצגת את האמת לפי מאפיינים שונים המחקר.
מטא-אנליזות בכירורגיה הן לרוב עם הטיות (שיטות לקויות- מאמר מ 2005, אך מאמר דומה מ 2020 לגבי במטא-אנליזות העוסקות בנוגדי קרישה חדשים מראה שהבעיה עדיין קיימת.
מאמר דעה יפה על כך שספקות לגבי ממצאים הם חלק בלתי נפרד מהמדע
---
למתעניינים בחישובים של יואנידיס:
נאמר שבתחום רפואי מסוים יש סבירות של 5% שיש קשר בין שני משתנים, למשל 5% מהמזונות מגבירים סיכוי למחלה מסוימת. נאמר גם שבוצע מחקר שבדק האם יש קשר בין מזון מסוים לאותה מחלה. אם עצמת המחקר היא 0.2, ואם התוצאות היו מובהקות, עם ערך p של 0.05 הסבירות שמדובר בטעות ושלמעשה אין קשר בין המזון למחקר היא 70%, גם אם אין הטיות בשיטות המחקר*. במלים אחרות, למרות שהמחקר הראה שהמזון מגביר סיכוי למחלה, ולמרות שערך ה p – היה 0.05, סביר שאין קשר בין אותו מזון למחלה.
החישוב: במחקר בעצמה 0.2 , כאשר הסבירות מראש לקשר בין משתנים היא 5%,
מכפילים את הסבירות מראש לקשר בעצמה (power)
0.2X 5%=2%
מכפילים את הסבירות שאין קשר בערך ה- p
0.05X 95%=~5%
שני מצבים אלו יחד מייצגים את כלל האפשרויות לקבל תוצאה מובהקת במחקר,
ואז היחס בין תוצאות מובהקות מטעות לבין כלל התוצאות המובהקות הוא
5/7=~30%
*חישוב זה נוטה להגזים לטובה... יואנידיס משתמש גם במקדמים נוספים לתקנון עבור רמות שונות של הטיה במחקר, ועבור ביצוע מחקרים מרובים על אותה שאלה קלינית. כאשר משתמשים במקדמים אלו, שיעור התוצאות המובהקות המוטעות עולה עוד יותר.
לעומת זאת, החישוב נסמך על מחקרים בהם ערך ה p הוא 0.05, ואם ערך ה p קטן יותר, החישוב מגזים לרעה. באופן דומה, אם המחקר גדול (ולכן העצמה שלו גדולה יותר) החישוב מגזים לרעה, ואם הסבירות מראש לקשר בין שני משתנים גדולה יותר (למשל, תיאוריה בסיסית חזקה מאוד, מחקרים קודמים שהצביעו על קשר אפשרי, ועוד)- החישוב מגזים לרעה. זאת אומרת, במחקרים גדולים, עם שאלת מחקר שמאחוריה הגיון ומחקרים קודמים, עם ערך p קטן מאוד וכאשר ההטיות לא חמורות, אפשר בהחלט לסמוך על תוצאות חיוביות.
הקצב בו מתפרסמים מאמרים הנוגעים לנגיף הקורונה מהיר ביותר, ומחייב סרט המשך מיד עם פרסום הפרק הקודם. אנחנו ממשיכים לעסוק בזן הדלתא של נגיף הקורונה וביעילות חיסון פייזר-ביונטק מולו.
מחקר דומה מאוד למחקר מהפרק הקודם, הפעם מאנגליה ולא מקנדה, בדק בשיטת negative test design (שהוסברה בפרק הקודם) את יעילות חיסון פייזר-ביונטק נגד זן הדלתא. הודגמה יעילות חיסון (vaccine effectiveness) של 88%, זאת לעומת 94% יעילות נגד זן האלפא.
בעזרת ספקולציות ננסה להבין מה מספרים אלו אומרים לגבי המטופל שמולנו או לגבי האוכלוסייה בעיר קטנה.
זהירות- שיטת המחקר במאמר, כפי שהוסבר בפרק הקודם (זן הדלתא וכינים עם פנסי ראש) חשופה להטיות מרובות ולכן מידת האמון שיש לתת בתוצאות היא בינונית. בנוסף- המודל שמוצג הוא מודל פשוט שנועד לעזור בהבנה ואינו כולל מרכיבים המשפיעים על שיעור ההדבקות בנגיף ועל יעילות החיסון.
---
המאמר שהוזכר בפרק
Effectiveness of Covid-19 Vaccines against the B.1.617.2 (Delta) Variant
https://www.nejm.org/doi/full/10.1056/NEJMoa2108891
---
חישובים:
(כאמור- כל החישובים האלו תקפים אם הנתונים מהמחקר אכן מייצגים את המציאות המדויקת, וכיוון שכמעט בטוח שלא כך, יש להתייחס לכל המספרים בערבון מוגבל.)
Vaccine effectiveness~relative risk reduction
Relative risk=vaccine failure rate=1-vaccine effectiveness
לכן, הסיכון היחסי (או שיעור כשלון החיסון) עבור זן דלתא הוא
100%-88%=12%
בספקולציה של 10% שיעור הדבקה לו לא היה חיסון, באוכלוסייה של 1000 איש, היו אמורים להדבק 100. מתוך אותם 100, החיסון היה נכשל ב 12 (לפי שיעור כשלון החיסון למעלה), לכן הסבירות להדבק למרות קבלת חיסון מלא הוא 12/1000 , או אחד מ 83 איש.
בספקולציה קטסטרופלית של 50% שיעור הדבקה ללא חיסון, באוכלוסיה של 1000 איש, ללא חיסון היו אמורים להדבק 500. אם כל ה 1000 חוסנו, ביעילות חיסון של 88%, ידבקו 60 איש. הסבירות להדבק למרות קבלת חיסון מלא היא 60/1000, או אחד מ 16 מחוסנים.
בעיר קטנה כמו סח'נין, אור יהודה, דימונה, או במועצה האזורית משגב, יש כ 30 אלף איש, מתוכם כ 20 אלף מחוסנים. ביעילות חיסון של 88%, בספקולציה המתונה יותר, שבה המגפה הייתה מדביקה כ 10% מהאוכלוסיה לו לא היה חיסון כלל, ידבקו במגפה הנגרמת מזן דלתא כ 240 מחוסנים , לעומת 120 מחוסנים שהיו נדבקים במגפה מזן אלפא. בתרחיש הקטסטרופלי, יש להכפיל את המספרים האלו פי 5.
מספר מאומתים מצטבר לפי יישובים, ושיעור חיסון בישובים שונים נלקח מערך ויקיפדיה,
https://tinyurl.com/554br4bd, המסתמך על נתוני משרד הבריאות מה 20/7/21
הקצב בו מתפרסמים מאמרים הנוגעים לנגיף הקורונה מהיר ביותר, ומחייב סרט המשך מיד עם פרסום הפרק הקודם. אנחנו ממשיכים לעסוק בזן הדלתא של נגיף הקורונה וביעילות חיסון פייזר-ביונטק מולו.
מחקר דומה מאוד למחקר מהפרק הקודם, הפעם מאנגליה ולא מקנדה, בדק בשיטת negative test design (שהוסברה בפרק הקודם) את יעילות חיסון פייזר-ביונטק נגד זן הדלתא. הודגמה יעילות חיסון (vaccine effectiveness) של 88%, זאת לעומת 94% יעילות נגד זן האלפא.
בעזרת ספקולציות ננסה להבין מה מספרים אלו אומרים לגבי המטופל שמולנו או לגבי האוכלוסייה בעיר קטנה.
זהירות- שיטת המחקר במאמר, כפי שהוסבר בפרק הקודם (זן הדלתא וכינים עם פנסי ראש) חשופה להטיות מרובות ולכן מידת האמון שיש לתת בתוצאות היא בינונית. בנוסף- המודל שמוצג הוא מודל פשוט שנועד לעזור בהבנה ואינו כולל מרכיבים המשפיעים על שיעור ההדבקות בנגיף ועל יעילות החיסון.
---
המאמר שהוזכר בפרק
Effectiveness of Covid-19 Vaccines against the B.1.617.2 (Delta) Variant
https://www.nejm.org/doi/full/10.1056/NEJMoa2108891
---
חישובים:
(כאמור- כל החישובים האלו תקפים אם הנתונים מהמחקר אכן מייצגים את המציאות המדויקת, וכיוון שכמעט בטוח שלא כך, יש להתייחס לכל המספרים בערבון מוגבל.)
Vaccine effectiveness~relative risk reduction
Relative risk=vaccine failure rate=1-vaccine effectiveness
לכן, הסיכון היחסי (או שיעור כשלון החיסון) עבור זן דלתא הוא
100%-88%=12%
בספקולציה של 10% שיעור הדבקה לו לא היה חיסון, באוכלוסייה של 1000 איש, היו אמורים להדבק 100. מתוך אותם 100, החיסון היה נכשל ב 12 (לפי שיעור כשלון החיסון למעלה), לכן הסבירות להדבק למרות קבלת חיסון מלא הוא 12/1000 , או אחד מ 83 איש.
בספקולציה קטסטרופלית של 50% שיעור הדבקה ללא חיסון, באוכלוסיה של 1000 איש, ללא חיסון היו אמורים להדבק 500. אם כל ה 1000 חוסנו, ביעילות חיסון של 88%, ידבקו 60 איש. הסבירות להדבק למרות קבלת חיסון מלא היא 60/1000, או אחד מ 16 מחוסנים.
בעיר קטנה כמו סח'נין, אור יהודה, דימונה, או במועצה האזורית משגב, יש כ 30 אלף איש, מתוכם כ 20 אלף מחוסנים. ביעילות חיסון של 88%, בספקולציה המתונה יותר, שבה המגפה הייתה מדביקה כ 10% מהאוכלוסיה לו לא היה חיסון כלל, ידבקו במגפה הנגרמת מזן דלתא כ 240 מחוסנים , לעומת 120 מחוסנים שהיו נדבקים במגפה מזן אלפא. בתרחיש הקטסטרופלי, יש להכפיל את המספרים האלו פי 5.
מספר מאומתים מצטבר לפי יישובים, ושיעור חיסון בישובים שונים נלקח מערך ויקיפדיה,
https://tinyurl.com/554br4bd, המסתמך על נתוני משרד הבריאות מה 20/7/21
שינויים מדאיגים של נגיף הקורונה הם כאלו שעלולים לגרום לו להיות עמיד יותר למערכת החיסון של מטופלים שחלו או חוסנו בעבר. למשל השינוי שקיים בנגיף מזן דלתא.
המחקר התקף ביותר בנושא יעילות חיסון נגד זן מסוים של נגיף הוא מחקר מבוקר אקראי. אך מחקר כזה לא תמיד מייצג את השפעת החיסון על אוכלוסייה שלמה, והוא לוקח זמן רב- עד שיתפרסם תופיע כבר גרסה חדשה של הנגיף...
לכן אנו נאלצים בינתיים להשתמש בסוגי מחקר מדרגת תקפות נמוכה: מחקרי מעבדה המשתמשים בתוצא סרוגייט, ומחקרי "real world".
מחקרי המעבדה משתמשים בשיטה בה תאים נגועים בנגיף מעורבבים עם נסיוב של מטופל, בכל פעם מחדש, כאשר ריכוז הנסיוב מופחת בכל פעם, ונמדד ריכוז הנסיוב המדולל ביותר שמצליח לחסל 50% מהנגיפים. שיטות מגוונות משמשות למדידת כמות הנגיפים, אפילו הכנסת גן לתוך הנגיף הגורם לו לזרוח (להאיר).
במחקרים שנדבר עליהם, אצל אנשים שקיבלו חיסון מלא, עצמת הנסיוב הממוצעת נגד זן הדלתא הייתה נמוכה פי 3 מעצמת אותו נסיוב נגד הזן המקורי או נגד זן אלפא ("הגרסה הבריטית").
מחקרי האוכלוסייה משתמשים בשיטת negative test design, מחקר מסוג מקרה- בקרה בו משתתפים רק אנשים עם תסמינים שנבדקו לקורונה, ומבוצעת השוואה בין הקבוצה עם תוצאה חיובית (במקרה הזה של נגיף דלתא) לבין אנשים עם תוצאה שלילית (ללא קורונה).
למרות שמעניין מאוד להבין כיצד מתבצעים מחקרים אלו, חשוב לזכור שרמת התקפות שלהם נמוכה, והם לא בהכרח מוכיחים או שוללים יעילות של חיסון נגד זן מסוים.
---
לחובבי חישובים:
עצמת הנסיוב נגד הנגיף היא המספר ההופכי של הריכוז הנמוך ביותר של הנסיוב שעדיין מחסל 50% מהנגיפים. למשל אם הריכוז הנמוך ביותר ש"עושה את העבודה" הוא 1:10, עצמת הנסיוב היא 10, ואם הריכוז הנמוך ביותר הוא 1:100 (הנסיוב דולל פי 100) עוצמת הנסיוב היא 100.
לגבי חישוב יעילות חיסון מתוך מחקר מקרה- בקרה (דורש ידע קודם): במחקר מקרה-בקרה אפשר לחשב רק odds ratio אך כאשר המחלה נדירה יחסית, זהו קירוב טוב ל relative risk. המספר המציין את יעילות החיסון הוא למעשה ה relative risk reduction.
Relative risk reduction=1-relative risk
ולכן יעילות החיסון המחושבת היא בקירוב
vaccine effectiveness=relative risk reduction=1- odds ratio
---
מאמרים שהוזכרו בפרק:
https://www.nature.com/articles/s41467-020-17892-0
מאמר מאוגוסט 2020 שמסביר את חיבור ה"פנסים" (גן הגורם לנגיף להאיר) ואיך בודקים נסיוב (סרום) מחולים ומבריאים כדי להעריך יכולת הנוגדנים לנטרל את הנגיף. זוהי רק שיטה אחת לספור את כמות הנגיף, ולא בהכרח השיטה המקובלת ביותר.
מחקרי מעבדה על נטרול זן הדלתא בעזרת נסיוב ממטופלים שחלו או חוסנו
https://www.nature.com/articles/s41586-021-03777-9
Reduced sensitivity of SARS-CoV-2 variant Delta to antibody neutralization | Nature
https://www.nejm.org/doi/full/10.1056/NEJMc2107799
Infection and Vaccine-Induced Neutralizing-Antibody Responses to the SARS-CoV-2 B.1.617 Variants | NEJM
מחקר שמראה שיש התאמה טובה אך לא מושלמת בין עצמת הנסיוב המופקת לאחר חיסונים מסוגים שונים לבין מידת ההגנה מזיהום שאותם חיסונים נותנים.
https://www.nature.com/articles/s41591-021-01377-8
מחקר "עולם אמיתי" מסוג negative test design (מקרה- בקרה) מקנדה- מאמר מצוין בסוגו (בעיני) אך עדיין לא פורסם בעיתון רפואי רשמי.
https://www.medrxiv.org/content/10.1101/2021.06.28.21259420v1
Effectiveness of COVID-19 vaccines against variants of concern, Canada
מחקר דומה מסקוטלנד הראה יכולת פחותה של חיסון פייזר כנגד זן הדלתא.
יעילות של 79% (רווח בר סמך 75%-82%) לעומת 92% יעילות נגד אלפא.
https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(21)01358-1/fulltext
SARS-CoV-2 Delta VOC in Scotland: demographics, risk of hospital admission, and vaccine effectiveness
.
לאחר סיום ההקלטה, פורסם המחקר הבריטי שדובר עליו בפרק- לאור כך הוקלט פרק המשך לפרק זה (מחץ הדלתא 2), שעוסק בתוצאות המחקר הבריטי, שהיו דומות מאוד לתוצאות של המחקר הקנדי.
שינויים מדאיגים של נגיף הקורונה הם כאלו שעלולים לגרום לו להיות עמיד יותר למערכת החיסון של מטופלים שחלו או חוסנו בעבר. למשל השינוי שקיים בנגיף מזן דלתא.
המחקר התקף ביותר בנושא יעילות חיסון נגד זן מסוים של נגיף הוא מחקר מבוקר אקראי. אך מחקר כזה לא תמיד מייצג את השפעת החיסון על אוכלוסייה שלמה, והוא לוקח זמן רב- עד שיתפרסם תופיע כבר גרסה חדשה של הנגיף...
לכן אנו נאלצים בינתיים להשתמש בסוגי מחקר מדרגת תקפות נמוכה: מחקרי מעבדה המשתמשים בתוצא סרוגייט, ומחקרי "real world".
מחקרי המעבדה משתמשים בשיטה בה תאים נגועים בנגיף מעורבבים עם נסיוב של מטופל, בכל פעם מחדש, כאשר ריכוז הנסיוב מופחת בכל פעם, ונמדד ריכוז הנסיוב המדולל ביותר שמצליח לחסל 50% מהנגיפים. שיטות מגוונות משמשות למדידת כמות הנגיפים, אפילו הכנסת גן לתוך הנגיף הגורם לו לזרוח (להאיר).
במחקרים שנדבר עליהם, אצל אנשים שקיבלו חיסון מלא, עצמת הנסיוב הממוצעת נגד זן הדלתא הייתה נמוכה פי 3 מעצמת אותו נסיוב נגד הזן המקורי או נגד זן אלפא ("הגרסה הבריטית").
מחקרי האוכלוסייה משתמשים בשיטת negative test design, מחקר מסוג מקרה- בקרה בו משתתפים רק אנשים עם תסמינים שנבדקו לקורונה, ומבוצעת השוואה בין הקבוצה עם תוצאה חיובית (במקרה הזה של נגיף דלתא) לבין אנשים עם תוצאה שלילית (ללא קורונה).
למרות שמעניין מאוד להבין כיצד מתבצעים מחקרים אלו, חשוב לזכור שרמת התקפות שלהם נמוכה, והם לא בהכרח מוכיחים או שוללים יעילות של חיסון נגד זן מסוים.
---
לחובבי חישובים:
עצמת הנסיוב נגד הנגיף היא המספר ההופכי של הריכוז הנמוך ביותר של הנסיוב שעדיין מחסל 50% מהנגיפים. למשל אם הריכוז הנמוך ביותר ש"עושה את העבודה" הוא 1:10, עצמת הנסיוב היא 10, ואם הריכוז הנמוך ביותר הוא 1:100 (הנסיוב דולל פי 100) עוצמת הנסיוב היא 100.
לגבי חישוב יעילות חיסון מתוך מחקר מקרה- בקרה (דורש ידע קודם): במחקר מקרה-בקרה אפשר לחשב רק odds ratio אך כאשר המחלה נדירה יחסית, זהו קירוב טוב ל relative risk. המספר המציין את יעילות החיסון הוא למעשה ה relative risk reduction.
Relative risk reduction=1-relative risk
ולכן יעילות החיסון המחושבת היא בקירוב
vaccine effectiveness=relative risk reduction=1- odds ratio
---
מאמרים שהוזכרו בפרק:
https://www.nature.com/articles/s41467-020-17892-0
מאמר מאוגוסט 2020 שמסביר את חיבור ה"פנסים" (גן הגורם לנגיף להאיר) ואיך בודקים נסיוב (סרום) מחולים ומבריאים כדי להעריך יכולת הנוגדנים לנטרל את הנגיף. זוהי רק שיטה אחת לספור את כמות הנגיף, ולא בהכרח השיטה המקובלת ביותר.
מחקרי מעבדה על נטרול זן הדלתא בעזרת נסיוב ממטופלים שחלו או חוסנו
https://www.nature.com/articles/s41586-021-03777-9
Reduced sensitivity of SARS-CoV-2 variant Delta to antibody neutralization | Nature
https://www.nejm.org/doi/full/10.1056/NEJMc2107799
Infection and Vaccine-Induced Neutralizing-Antibody Responses to the SARS-CoV-2 B.1.617 Variants | NEJM
מחקר שמראה שיש התאמה טובה אך לא מושלמת בין עצמת הנסיוב המופקת לאחר חיסונים מסוגים שונים לבין מידת ההגנה מזיהום שאותם חיסונים נותנים.
https://www.nature.com/articles/s41591-021-01377-8
מחקר "עולם אמיתי" מסוג negative test design (מקרה- בקרה) מקנדה- מאמר מצוין בסוגו (בעיני) אך עדיין לא פורסם בעיתון רפואי רשמי.
https://www.medrxiv.org/content/10.1101/2021.06.28.21259420v1
Effectiveness of COVID-19 vaccines against variants of concern, Canada
מחקר דומה מסקוטלנד הראה יכולת פחותה של חיסון פייזר כנגד זן הדלתא.
יעילות של 79% (רווח בר סמך 75%-82%) לעומת 92% יעילות נגד אלפא.
https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(21)01358-1/fulltext
SARS-CoV-2 Delta VOC in Scotland: demographics, risk of hospital admission, and vaccine effectiveness
.
לאחר סיום ההקלטה, פורסם המחקר הבריטי שדובר עליו בפרק- לאור כך הוקלט פרק המשך לפרק זה (מחץ הדלתא 2), שעוסק בתוצאות המחקר הבריטי, שהיו דומות מאוד לתוצאות של המחקר הקנדי.
למרות שמה שבאמת מעניין אותנו הוא העולם האמיתי, "מחקרי עולם אמיתי" (“real world data”) צפויים לתת לנו תמונה שאינה מדויקת ולעתים אינה נכונה, ולכן נחשבים פחות תקפים ממחקרים מבוקרים.
ברוב המוחלט של המקרים, מחקר real world data או מחקרי big data ברפואה מתבצעים על נתונים שכבר נאספו קודם למטרות אחרות- מטרות רפואיות ומנהלתיות. מחקרים כאלו הם גדולים מאוד ולעתים עוסקים בשאלות שלא ניתן לבדוק בשיטות מחקר אחרות, אך יש להם את החסרונות של כל מחקר תצפיתי ובנוסף חסרונות מיוחדים למידע שנאסף והוכנס למאגר הנתונים בצורה שאינה מתוכננת ואינה שיטתית.
נדבר בהקשר זה על מחקר real world data שהדגים קשר לכאורה בין שימוש ב PPI- proton pump inhibitors- תרופות להפחתת חומציות נוזל הקיבה- לבין דמנציה. נישאר עם ספק לגבי מסקנות המחקר.
---
מאמרים שהוזכרו בפרק ומאמרים נוספים העוסקים באותו נושא קליני
מחקר real world מספרד שהראה קשר בין PPI לדמנציה שאינה אלצהיימר
https://www.nature.com/articles/s41598-020-78199-0
ערפלן אפשרי: קשר (בנשים, במאמר זה) בין מחלה קרדיווסקולרית לירידה קוגניטיבית
https://www.ahajournals.org/doi/10.1161/JAHA.113.000369
יש מחקרים נוספים בנושא PPI ודמנציה שהראו תוצאות מעורבות וסותרות לעתים: למשל מחקר מתוכנן מראש עם איסוף נתונים שיטתי עבור אבחון דמנציה לאורך מעקב ומידע על תרופות מתוך מאגר נתונים- לא הראה קשר.
https://agsjournals.onlinelibrary.wiley.com/doi/epdf/10.1111/jgs.15073
או מחקר מתוכנן מראש שכן הדגים קשר
https://jamanetwork.com/journals/jamaneurology/fullarticle/2487379
מטא אנליזה של מחקרים תצפיתיים בנושא PPI ודמנציה שלא הדגימה קשר מובהק ביניהם
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6605652/
למרות שמה שבאמת מעניין אותנו הוא העולם האמיתי, "מחקרי עולם אמיתי" (“real world data”) צפויים לתת לנו תמונה שאינה מדויקת ולעתים אינה נכונה, ולכן נחשבים פחות תקפים ממחקרים מבוקרים.
ברוב המוחלט של המקרים, מחקר real world data או מחקרי big data ברפואה מתבצעים על נתונים שכבר נאספו קודם למטרות אחרות- מטרות רפואיות ומנהלתיות. מחקרים כאלו הם גדולים מאוד ולעתים עוסקים בשאלות שלא ניתן לבדוק בשיטות מחקר אחרות, אך יש להם את החסרונות של כל מחקר תצפיתי ובנוסף חסרונות מיוחדים למידע שנאסף והוכנס למאגר הנתונים בצורה שאינה מתוכננת ואינה שיטתית.
נדבר בהקשר זה על מחקר real world data שהדגים קשר לכאורה בין שימוש ב PPI- proton pump inhibitors- תרופות להפחתת חומציות נוזל הקיבה- לבין דמנציה. נישאר עם ספק לגבי מסקנות המחקר.
---
מאמרים שהוזכרו בפרק ומאמרים נוספים העוסקים באותו נושא קליני
מחקר real world מספרד שהראה קשר בין PPI לדמנציה שאינה אלצהיימר
https://www.nature.com/articles/s41598-020-78199-0
ערפלן אפשרי: קשר (בנשים, במאמר זה) בין מחלה קרדיווסקולרית לירידה קוגניטיבית
https://www.ahajournals.org/doi/10.1161/JAHA.113.000369
יש מחקרים נוספים בנושא PPI ודמנציה שהראו תוצאות מעורבות וסותרות לעתים: למשל מחקר מתוכנן מראש עם איסוף נתונים שיטתי עבור אבחון דמנציה לאורך מעקב ומידע על תרופות מתוך מאגר נתונים- לא הראה קשר.
https://agsjournals.onlinelibrary.wiley.com/doi/epdf/10.1111/jgs.15073
או מחקר מתוכנן מראש שכן הדגים קשר
https://jamanetwork.com/journals/jamaneurology/fullarticle/2487379
מטא אנליזה של מחקרים תצפיתיים בנושא PPI ודמנציה שלא הדגימה קשר מובהק ביניהם
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6605652/
טיפול מיני בעזרת שותף סרוגייט (SPT, surrogate partner therapy) בוצע כבר על ידי מאסטרס וג'ונסון, חלוצי חקר המיניות, אך רק בשנים אחרונות, ודווקא בישראל, החל מחדש מחקר בנושא. בטיפול כזה, שבוודאי מעלה שאלות אתיות וחוקיות רבות, המטופל מקבל טיפול בעזרת בן או בת זוג תחליפיים, המהווים חלק מהצוות הטיפולי ו"משודכים" למטופל על ידי מטפל מיני מוסמך.
גם במחקר רפואי מופיע המושג סרוגייט. התערבות ותוצא הם בני זוג במחקר. השדכן הוא החוקר. אספירין והפחתת התקפי לב, כמותרפיה והארכת חיים, תרופה לסוכרת ומניעת סיבוכי המחלה.
באופן אופטימלי, החוקר ירצה לשדך את ההתערבות שלו לתוצא שחשוב למטופל- למשל, בהקשר של סכרת השידוך האופטימלי הוא בין תרופה לבין מניעת סיבוכים כמו טיפול בדיאליזה, אך לעתים קרובות מחקר עם תוצא כזה הוא הרבה פחות פרקטי, והחוקר נאלץ להשתמש בתוצא תחליפי: surrogate outcome. זהו בדרך כלל ממצא מעבדתי, הדמייתי או רקמתי שקשור לתוצא החשוב, אך קל יותר למדידה. למשל, במקרה של סוכרת- רמת הסוכר בדם לאחר חודשיים היא תוצא תחליפי במקום מדידת שיעור האנשים שנזקקו לדיאליזה לאחר שנים רבות.
מחלת צליאק- תגובה אוטואימונית לגלוטן- מתבטאת בתסמינים שונים וכן בהשטחה של הvilli (סיסי המעי הדק). למרות שנוגדנים ל TTG משמשים לאבחנת צליאק, ל- TTG עצמו יש גם תפקיד ביצירת המחלה- הוא משנה כימית את תוצרי הגלוטן ומאפשר למערכת החיסון לזהות את הגלוטן כאויב.
תרופה מעכבת TTG נוסתה במחקר אקראי מבוקר במטופלים עם מחלת צליאק, עם תוצא תחליפי (סרוגייט): השטחה של הסיסים במעי הדק. האם הממצאים עבור תוצא סרוגייט זה מספיק מרשימים כדי להחליט שהטיפול יעיל?
---
המאמר שהוצג בפרק
https://www.nejm.org/doi/full/10.1056/NEJMoa2032441
A Randomized Trial of a Transglutaminase 2 Inhibitor for Celiac Disease
לקריאה על טיפול מיני בעזרת סרוגייט:
https://www.proquest.com/openview/1e38caa246da3eeb7bda01988f51f236/1?pq-origsite=gscholar&cbl=18750
פרק 2 החל מעמ' 44- סקירה (תיאורית, לא שיטתית) של הספרות הרפואית לגבי טיפול סרוגייט
https://pubmed.ncbi.nlm.nih.gov/17433089/
טיפול סרוגייט אל מול טיפול זוגי בוגיניזמוס (מחקר משווה רטרוספקטיבי, לא אקראי)
https://pubmed.ncbi.nlm.nih.gov/24261932/
מסגרת אתית לטיפול סרוגייט
טיפול מיני בעזרת שותף סרוגייט (SPT, surrogate partner therapy) בוצע כבר על ידי מאסטרס וג'ונסון, חלוצי חקר המיניות, אך רק בשנים אחרונות, ודווקא בישראל, החל מחדש מחקר בנושא. בטיפול כזה, שבוודאי מעלה שאלות אתיות וחוקיות רבות, המטופל מקבל טיפול בעזרת בן או בת זוג תחליפיים, המהווים חלק מהצוות הטיפולי ו"משודכים" למטופל על ידי מטפל מיני מוסמך.
גם במחקר רפואי מופיע המושג סרוגייט. התערבות ותוצא הם בני זוג במחקר. השדכן הוא החוקר. אספירין והפחתת התקפי לב, כמותרפיה והארכת חיים, תרופה לסוכרת ומניעת סיבוכי המחלה.
באופן אופטימלי, החוקר ירצה לשדך את ההתערבות שלו לתוצא שחשוב למטופל- למשל, בהקשר של סכרת השידוך האופטימלי הוא בין תרופה לבין מניעת סיבוכים כמו טיפול בדיאליזה, אך לעתים קרובות מחקר עם תוצא כזה הוא הרבה פחות פרקטי, והחוקר נאלץ להשתמש בתוצא תחליפי: surrogate outcome. זהו בדרך כלל ממצא מעבדתי, הדמייתי או רקמתי שקשור לתוצא החשוב, אך קל יותר למדידה. למשל, במקרה של סוכרת- רמת הסוכר בדם לאחר חודשיים היא תוצא תחליפי במקום מדידת שיעור האנשים שנזקקו לדיאליזה לאחר שנים רבות.
מחלת צליאק- תגובה אוטואימונית לגלוטן- מתבטאת בתסמינים שונים וכן בהשטחה של הvilli (סיסי המעי הדק). למרות שנוגדנים ל TTG משמשים לאבחנת צליאק, ל- TTG עצמו יש גם תפקיד ביצירת המחלה- הוא משנה כימית את תוצרי הגלוטן ומאפשר למערכת החיסון לזהות את הגלוטן כאויב.
תרופה מעכבת TTG נוסתה במחקר אקראי מבוקר במטופלים עם מחלת צליאק, עם תוצא תחליפי (סרוגייט): השטחה של הסיסים במעי הדק. האם הממצאים עבור תוצא סרוגייט זה מספיק מרשימים כדי להחליט שהטיפול יעיל?
---
המאמר שהוצג בפרק
https://www.nejm.org/doi/full/10.1056/NEJMoa2032441
A Randomized Trial of a Transglutaminase 2 Inhibitor for Celiac Disease
לקריאה על טיפול מיני בעזרת סרוגייט:
https://www.proquest.com/openview/1e38caa246da3eeb7bda01988f51f236/1?pq-origsite=gscholar&cbl=18750
פרק 2 החל מעמ' 44- סקירה (תיאורית, לא שיטתית) של הספרות הרפואית לגבי טיפול סרוגייט
https://pubmed.ncbi.nlm.nih.gov/17433089/
טיפול סרוגייט אל מול טיפול זוגי בוגיניזמוס (מחקר משווה רטרוספקטיבי, לא אקראי)
https://pubmed.ncbi.nlm.nih.gov/24261932/
מסגרת אתית לטיפול סרוגייט
מכתב בסוף מאי לעורכי ה NEJM התפרסם ונתן לי תשובות חשובות מאוד לגבי בטיחות חיסון הקורונה במתבגרים.
המאמר עסק בבטיחות ויעילות החיסון במתבגרים בני 12 עד גיל 15 לעומת צעירים מגיל 16 עד 25.
ההשוואה העיקרית בו הייתה בטיחות הטיפול במתבגרים שקיבלו את החיסון הפעיל, לעומת מבוגרים יותר שקיבלו חיסון פעיל. בפרק הזה נבין מהי מטרת טבלה מס' 1 במאמר שמשווה את נתוני הבסיס (לפני קבלת הטיפול) בין המתבגרים לבין המבוגרים יותר.
נגלה שלא נמצא בטבלה הזו את ערך p וגם לא רווח בר-סמך (CI) ונספר למה: כיוון שמטרת הטבלה אינה להבין משהו על העולם או על האמת מחוץ למחקר אלא דווקא על המדגם עצמו ועל אלו שהשתתפו במחקר.
נחפור קצת בטבלה הזו וננסה לחשוב מה אנחנו באמת רוצים לראות בה, והאם קיבלנו את מה שרצינו.
נחזור למאמר מי המלח לצפצופים בילדים, (מלפני שני פרקים) שם כן פורסם ערך ה -p בטבלה מס' 1, ונבין מדוע למרות שה- p לא מובהק, ההבדל בין הקבוצות חשוב ויכול לגרום להטיה קשה בתוצאות.
---
קישורים למאמרים המקוריים:
Safety, Immunogenicity, and Efficacy of the BNT162b2 Covid-19 Vaccine in Adolescents
https://www.nejm.org/doi/full/10.1056/NEJMoa2107456
Hypertonic Saline and Acute Wheezing in Preschool Children
https://pubmed.ncbi.nlm.nih.gov/22614767/
הנחיות לפרסום טבלה מס' 1- וספציפית הנחיה שלא להשתמש במבחני מובהקות בטבלה זו:
http://www.consort-statement.org/checklists/view/32--consort-2010/510-baseline-data
מכתב בסוף מאי לעורכי ה NEJM התפרסם ונתן לי תשובות חשובות מאוד לגבי בטיחות חיסון הקורונה במתבגרים.
המאמר עסק בבטיחות ויעילות החיסון במתבגרים בני 12 עד גיל 15 לעומת צעירים מגיל 16 עד 25.
ההשוואה העיקרית בו הייתה בטיחות הטיפול במתבגרים שקיבלו את החיסון הפעיל, לעומת מבוגרים יותר שקיבלו חיסון פעיל. בפרק הזה נבין מהי מטרת טבלה מס' 1 במאמר שמשווה את נתוני הבסיס (לפני קבלת הטיפול) בין המתבגרים לבין המבוגרים יותר.
נגלה שלא נמצא בטבלה הזו את ערך p וגם לא רווח בר-סמך (CI) ונספר למה: כיוון שמטרת הטבלה אינה להבין משהו על העולם או על האמת מחוץ למחקר אלא דווקא על המדגם עצמו ועל אלו שהשתתפו במחקר.
נחפור קצת בטבלה הזו וננסה לחשוב מה אנחנו באמת רוצים לראות בה, והאם קיבלנו את מה שרצינו.
נחזור למאמר מי המלח לצפצופים בילדים, (מלפני שני פרקים) שם כן פורסם ערך ה -p בטבלה מס' 1, ונבין מדוע למרות שה- p לא מובהק, ההבדל בין הקבוצות חשוב ויכול לגרום להטיה קשה בתוצאות.
---
קישורים למאמרים המקוריים:
Safety, Immunogenicity, and Efficacy of the BNT162b2 Covid-19 Vaccine in Adolescents
https://www.nejm.org/doi/full/10.1056/NEJMoa2107456
Hypertonic Saline and Acute Wheezing in Preschool Children
https://pubmed.ncbi.nlm.nih.gov/22614767/
הנחיות לפרסום טבלה מס' 1- וספציפית הנחיה שלא להשתמש במבחני מובהקות בטבלה זו:
http://www.consort-statement.org/checklists/view/32--consort-2010/510-baseline-data
שיטת ההסקה בסטטיסטיקה , זו שנותנת לנו את ערך ה-p, דומה לפעולה של בלש כאשר הוא מחפש חשודים בפשע.
הבלש מנסה לגלות משהו על הפשע בעזרת ממצאים. הסקה בסטטיסטיקה היא ניסיון לגלות משהו על העולם בעזרת מדגם. ובמקרה של מחקר קליני ברפואה- המדגם הוא המחקר עצמו.
כדי לחשוד באדם כלשהו, הבלש שואל את עצמו: אם האדם חף מפשע, עד כמה הזוי לגלות אצלו ממצא מסוים במהלך החקירה? אם זה הזוי, האדם כבר לא חף מפשע, והבלש מסיק שמדובר בחשוד העיקרי.
במקרה של מחקר קליני, כדי להוכיח יתרון של תרופה, המבחן הסטטיסטי, כמו מבחן student’s t למשל, שואל באופן דומה- אם במציאות התרופה לא מועילה, עד כמה הזוי לגלות יתרון של התרופה במחקר? אם זה הזוי, כנראה התרופה כן מועילה.
הביטוי "הזוי" במשפטים האלו מקבל בסטטיסטיקה ביטוי מספרי: ערך ה-p מייצג סבירות , ו-p נמוך מאוד מייצג ממצא מאוד לא סביר, זאת אומרת "הזוי".
למשל, במחקר על תרופה לירידה במשקל, שמצא הבדל של 3 ק"ג בממוצע במשקל בין אלו שקיבלו תרופה לבין אלו שקיבלו פלצבו, מבחן t בודק מה הסבירות (p) שאם במציאות התרופה כלל לא עוזרת, נקבל יתרון כזה של התרופה במחקר. כש-p נמוך מאוד - הזוי לקבל כזה יתרון כשהתרופה לא עוזרת – ונסיק שהתרופה כן עוזרת.
---
לקריאה נוספת על מבחן t
https://www.statisticshowto.com/probability-and-statistics/t-test/
שיטת ההסקה בסטטיסטיקה , זו שנותנת לנו את ערך ה-p, דומה לפעולה של בלש כאשר הוא מחפש חשודים בפשע.
הבלש מנסה לגלות משהו על הפשע בעזרת ממצאים. הסקה בסטטיסטיקה היא ניסיון לגלות משהו על העולם בעזרת מדגם. ובמקרה של מחקר קליני ברפואה- המדגם הוא המחקר עצמו.
כדי לחשוד באדם כלשהו, הבלש שואל את עצמו: אם האדם חף מפשע, עד כמה הזוי לגלות אצלו ממצא מסוים במהלך החקירה? אם זה הזוי, האדם כבר לא חף מפשע, והבלש מסיק שמדובר בחשוד העיקרי.
במקרה של מחקר קליני, כדי להוכיח יתרון של תרופה, המבחן הסטטיסטי, כמו מבחן student’s t למשל, שואל באופן דומה- אם במציאות התרופה לא מועילה, עד כמה הזוי לגלות יתרון של התרופה במחקר? אם זה הזוי, כנראה התרופה כן מועילה.
הביטוי "הזוי" במשפטים האלו מקבל בסטטיסטיקה ביטוי מספרי: ערך ה-p מייצג סבירות , ו-p נמוך מאוד מייצג ממצא מאוד לא סביר, זאת אומרת "הזוי".
למשל, במחקר על תרופה לירידה במשקל, שמצא הבדל של 3 ק"ג בממוצע במשקל בין אלו שקיבלו תרופה לבין אלו שקיבלו פלצבו, מבחן t בודק מה הסבירות (p) שאם במציאות התרופה כלל לא עוזרת, נקבל יתרון כזה של התרופה במחקר. כש-p נמוך מאוד - הזוי לקבל כזה יתרון כשהתרופה לא עוזרת – ונסיק שהתרופה כן עוזרת.
---
לקריאה נוספת על מבחן t
https://www.statisticshowto.com/probability-and-statistics/t-test/
במאמרים עם השוואה בין שתי קבוצות מטופלים, למשל במחקר מבוקר אקראי לגבי טיפול מסוים, תמיד נוכל למצוא את "טבלה מס' 1" . בטבלה זו שתי הקבוצות מושוות אחת מול השנייה בתחילת המחקר.
לפעמים, בעזרת עבודת בילוש והצבה של עצמנו בנעלי הרופאים והמטופלים במחקר, נוכל לגלות בתוך הטבלה הבדלים שיכולים לספק הסבר חלופי לתוצאות: לא הטיפול או החשיפה לגורם מסוים גרמו להבדל בתוצאות, אלא שוני מראש בין שתי הקבוצות.
נדגים את העיקרון הזה על מחקר שבו ילדים עם צפצופים בנשימה חולקו אקראית לקבוצה שקבלה מי מלח באינהלציה ולקבוצת ביקורת. האם אכן אלו מי המלח שעזרו לילדים ומנעו אשפוז ממושך, או שחוץ ממי המלח יש חשודים נוספים?
--------
סליין היפרטוני מפחית אשפוזים בילדים עם צפצופים.
https://pubmed.ncbi.nlm.nih.gov/22614767/
סקירה שיטתית של הספרות הגיעה למסקנה שלא מומלץ לתת סליין היפרטוני לילדים עם ברונכיוליטיס
https://www.ncbi.nlm.nih.gov/books/NBK328418/#ch4.s86
במאמרים עם השוואה בין שתי קבוצות מטופלים, למשל במחקר מבוקר אקראי לגבי טיפול מסוים, תמיד נוכל למצוא את "טבלה מס' 1" . בטבלה זו שתי הקבוצות מושוות אחת מול השנייה בתחילת המחקר.
לפעמים, בעזרת עבודת בילוש והצבה של עצמנו בנעלי הרופאים והמטופלים במחקר, נוכל לגלות בתוך הטבלה הבדלים שיכולים לספק הסבר חלופי לתוצאות: לא הטיפול או החשיפה לגורם מסוים גרמו להבדל בתוצאות, אלא שוני מראש בין שתי הקבוצות.
נדגים את העיקרון הזה על מחקר שבו ילדים עם צפצופים בנשימה חולקו אקראית לקבוצה שקבלה מי מלח באינהלציה ולקבוצת ביקורת. האם אכן אלו מי המלח שעזרו לילדים ומנעו אשפוז ממושך, או שחוץ ממי המלח יש חשודים נוספים?
--------
סליין היפרטוני מפחית אשפוזים בילדים עם צפצופים.
https://pubmed.ncbi.nlm.nih.gov/22614767/
סקירה שיטתית של הספרות הגיעה למסקנה שלא מומלץ לתת סליין היפרטוני לילדים עם ברונכיוליטיס
https://www.ncbi.nlm.nih.gov/books/NBK328418/#ch4.s86
בפרקים קודמים בצענו הערכת תקפות של מחקרים על ידי קריאת מאמר ובדיקה האם הוא עומד בקריטריונים מסוימים
הפעם נדבר על איך לבחור מבין המידע האינסופי שקיים, את המידע או המחקר המתקרב ביותר לאמת. יש סוגי מחקר תקפים יותר וסוגי מחקר תקפים פחות
בתחתית פירמידת המידע הקלאסית נמצאות סדרות מקרים, ורמת התקפות והאמון שלנו במידע עולה ככל שנתקדם למחקר מקרה-בקרה, מחקרי קוהורט השוואתיים, מחקר מבוקר אקראי ומטה אנליזה
פירמידה זו מתאימה למחקרים על טיפול או התערבות. עבור שאלות אחרות כמו למשל דיוק של בדיקה אבחנתית, קיימת היררכיה שונה מעט
נזכיר גם סוגי מידע נוספים כמו דעת מומחים, מחקרי מעבדה, קווים מנחים, ומאגרי מידע
כמו
UpToDate ו Dynamed.
סליחה מהמאזינים במצרים, אך לא תמיד צריך להתייחס לפירמידה כקדושה. למחקר מבוקר אקראי גרוע לא מגיע לקבל מקום גבוה בפירמידת המידע. גם למטה-אנליזה שמתבססת על מחקרים בינוניים או לא טובים, אין מקום של כבוד בשפיץ הפירמידה
מטה-אנליזה של ארגון קוקריין: מניפולציה לכאב גב תחתון חריף
https://www.cochrane.org/CD008880/BACK_spinal-manipulative-therapy-for-acute-low-back-pain
פירמידה קלאסית, אל מול פירמידה "מעורערת" שבה יש חפיפה בין השכבות
https://ebm.bmj.com/content/21/4/125
פירמידה הכוללת בתוכה גם סינתזה של מחקרים, כמו קווים מנחים
https://guides.lib.uci.edu/ebm/pyramid
למתקדמים- היררכיה מדויקת יותר של מחקרים לפי שאלת המחקר- טיפול, אבחנה, וכו', עם התייחסות לשיטות מחקר ספציפיות
בפרקים קודמים בצענו הערכת תקפות של מחקרים על ידי קריאת מאמר ובדיקה האם הוא עומד בקריטריונים מסוימים
הפעם נדבר על איך לבחור מבין המידע האינסופי שקיים, את המידע או המחקר המתקרב ביותר לאמת. יש סוגי מחקר תקפים יותר וסוגי מחקר תקפים פחות
בתחתית פירמידת המידע הקלאסית נמצאות סדרות מקרים, ורמת התקפות והאמון שלנו במידע עולה ככל שנתקדם למחקר מקרה-בקרה, מחקרי קוהורט השוואתיים, מחקר מבוקר אקראי ומטה אנליזה
פירמידה זו מתאימה למחקרים על טיפול או התערבות. עבור שאלות אחרות כמו למשל דיוק של בדיקה אבחנתית, קיימת היררכיה שונה מעט
נזכיר גם סוגי מידע נוספים כמו דעת מומחים, מחקרי מעבדה, קווים מנחים, ומאגרי מידע
כמו
UpToDate ו Dynamed.
סליחה מהמאזינים במצרים, אך לא תמיד צריך להתייחס לפירמידה כקדושה. למחקר מבוקר אקראי גרוע לא מגיע לקבל מקום גבוה בפירמידת המידע. גם למטה-אנליזה שמתבססת על מחקרים בינוניים או לא טובים, אין מקום של כבוד בשפיץ הפירמידה
מטה-אנליזה של ארגון קוקריין: מניפולציה לכאב גב תחתון חריף
https://www.cochrane.org/CD008880/BACK_spinal-manipulative-therapy-for-acute-low-back-pain
פירמידה קלאסית, אל מול פירמידה "מעורערת" שבה יש חפיפה בין השכבות
https://ebm.bmj.com/content/21/4/125
פירמידה הכוללת בתוכה גם סינתזה של מחקרים, כמו קווים מנחים
https://guides.lib.uci.edu/ebm/pyramid
למתקדמים- היררכיה מדויקת יותר של מחקרים לפי שאלת המחקר- טיפול, אבחנה, וכו', עם התייחסות לשיטות מחקר ספציפיות
ישנם מקרים נדירים בהם הטיפול תמיד מועיל, כמו למשל חגירת מצנח לפני קפיצה ממטוס. אך ברוב הטיפולים ברפואה, האפקט של טיפול אינו כה דרמטי, ואז יש צורך בהבנה של הסיכון לתוצא רע, כמו תמותה למשל, ללא טיפול, אל מול הסיכון עם טיפול.
נדבר על שני המונחים החשובים ביותר בהקשר זה. הפחתת הסיכון המוחלטת-
Absolute risk reduction, ARR
ומספר האנשים שיש לטפל בהם כדי למנוע אירוע אחד-
Number needed to treat, NNT
נדבר על דוגמה מתוך מחקר קלאסי שבדק מתן מטופרולול (חסם בטא) לאחר התקף לב.
https://www.ahajournals.org/doi/abs/10.1161/01.cir.73.3.503
ישנם מקרים נדירים בהם הטיפול תמיד מועיל, כמו למשל חגירת מצנח לפני קפיצה ממטוס. אך ברוב הטיפולים ברפואה, האפקט של טיפול אינו כה דרמטי, ואז יש צורך בהבנה של הסיכון לתוצא רע, כמו תמותה למשל, ללא טיפול, אל מול הסיכון עם טיפול.
נדבר על שני המונחים החשובים ביותר בהקשר זה. הפחתת הסיכון המוחלטת-
Absolute risk reduction, ARR
ומספר האנשים שיש לטפל בהם כדי למנוע אירוע אחד-
Number needed to treat, NNT
נדבר על דוגמה מתוך מחקר קלאסי שבדק מתן מטופרולול (חסם בטא) לאחר התקף לב.
https://www.ahajournals.org/doi/abs/10.1161/01.cir.73.3.503
מחקר תצפיתי מצא קשר בין שתיית קפה לבין הדרדרות קוגניטיבית איטית יותר. הממצא הזה יכול לייצג אמת, אך אולי זהו שלל של מסע דיג? מסעות דייג מתרחשים כאשר הדייג (החוקר) מציג שאלות שאלות מחקר מרובות, ובאחת מהן מתגלה קשר מובהק, למרות שבמציאות אין שום קשר כזה
נבין מה משמעות ערך הפי
p value
וכיצד כאשר קובעים עבור ערך הפי סף של 0.05 למובהקות אך שואלים שאלות מחקר מרובות, יש סיכוי גדול מאוד לדוג ממצא אקראי.
נדבר על שיטות להתמודד עם התופעה כמו שימוש בתוצא ראשוני
primary outcome,
או כמו החמרה בערך הסף שתחתיו ערך הפי נחשב מובהק
---
מחקר תצפיתי שמצא קשר הפוך בין שתיית קפה להתדרדרות קוגניטיבית
https://pubmed.ncbi.nlm.nih.gov/23422357/
מחקר תצפיתי מצא קשר בין שתיית קפה לבין הדרדרות קוגניטיבית איטית יותר. הממצא הזה יכול לייצג אמת, אך אולי זהו שלל של מסע דיג? מסעות דייג מתרחשים כאשר הדייג (החוקר) מציג שאלות שאלות מחקר מרובות, ובאחת מהן מתגלה קשר מובהק, למרות שבמציאות אין שום קשר כזה
נבין מה משמעות ערך הפי
p value
וכיצד כאשר קובעים עבור ערך הפי סף של 0.05 למובהקות אך שואלים שאלות מחקר מרובות, יש סיכוי גדול מאוד לדוג ממצא אקראי.
נדבר על שיטות להתמודד עם התופעה כמו שימוש בתוצא ראשוני
primary outcome,
או כמו החמרה בערך הסף שתחתיו ערך הפי נחשב מובהק
---
מחקר תצפיתי שמצא קשר הפוך בין שתיית קפה להתדרדרות קוגניטיבית
https://pubmed.ncbi.nlm.nih.gov/23422357/
רווח בר-סמך
(confidence interval)
הוא מושג חשוב ביותר בהבנת מחקרים רפואיים, מושג שלעתים מובן בצורה לא נכונה
המשמעות שלו בדרך כלל היא הטווח ("רווח") שבו בסבירות גבוהה (עליה אני "סומך") נמצאת אמת כלשהי באוכלוסיה שמעניינת אותי, למשל הטווח בו נמצאת האמת של הפחתת סיכון בעזרת טיפול מסויים. זאת בניגוד לתוצאת המחקר הנקודתית, שמייצגת תוצאה במדגם ולא את האמת באוכלוסיה
איך מתוך תוצאות של מחקר בודד, ניתן לדעת היכן נמצאת האמת באוכלוסייה? בפרק זה לא מפורטים שיטות או חישובים סטטיסטיים. במקום זה מוסבר המושג בצורת משל, ומובאת דוגמה מתוך מחקר שבדק יעילות צינטור כטיפול לאירוע מוחי של העורק הבזילרי
https://www.nejm.org/doi/full/10.1056/NEJMoa2030297?query=featured_home
רווח בר-סמך
(confidence interval)
הוא מושג חשוב ביותר בהבנת מחקרים רפואיים, מושג שלעתים מובן בצורה לא נכונה
המשמעות שלו בדרך כלל היא הטווח ("רווח") שבו בסבירות גבוהה (עליה אני "סומך") נמצאת אמת כלשהי באוכלוסיה שמעניינת אותי, למשל הטווח בו נמצאת האמת של הפחתת סיכון בעזרת טיפול מסויים. זאת בניגוד לתוצאת המחקר הנקודתית, שמייצגת תוצאה במדגם ולא את האמת באוכלוסיה
איך מתוך תוצאות של מחקר בודד, ניתן לדעת היכן נמצאת האמת באוכלוסייה? בפרק זה לא מפורטים שיטות או חישובים סטטיסטיים. במקום זה מוסבר המושג בצורת משל, ומובאת דוגמה מתוך מחקר שבדק יעילות צינטור כטיפול לאירוע מוחי של העורק הבזילרי
https://www.nejm.org/doi/full/10.1056/NEJMoa2030297?query=featured_home
אם כולם חושבים באופן זהה, מישהו לא חושב" (מצביא אמריקאי)"
השאלה השלישית שאנחנו שואלים את עצמנו בקריאת מאמר, ואולי החשובה ביותר, היא האם המאמר רלוונטי למטופל מסוים. נדבר על מאפיינים קליניים מיוחדים של המטופל, על הסבירות שהטיפול או הבדיקה האבחנתית באמת יועילו למטופל, ועל ערכים ומטרות של המטופל
אם כולם חושבים באופן זהה, מישהו לא חושב" (מצביא אמריקאי)"
השאלה השלישית שאנחנו שואלים את עצמנו בקריאת מאמר, ואולי החשובה ביותר, היא האם המאמר רלוונטי למטופל מסוים. נדבר על מאפיינים קליניים מיוחדים של המטופל, על הסבירות שהטיפול או הבדיקה האבחנתית באמת יועילו למטופל, ועל ערכים ומטרות של המטופל
זהירות! בניגוד לפרקים אחרים, הפרק כולל מתמטיקה ברמת חילוק וכפל, ואינו מומלץ לאנשים עם אלרגיה קשה לחישובים. בפרק נעסוק במקרה של מטופל עם חשד להתקף לב וממצאים בהאזנה ללב, ובתוצאות המאמר על מיפוי לאבחון מחלת פרקינסון, (מאמר אותו ניתחנו בפרקים קודמים)
בפרק "הדרך הקלה" השתמשנו בתוצאת המחקר על בדיקה אבחנתית ובעזרת ראשי התיבות
spin+snout
כדי להחליט האם בדיקה תעזור לנו להוכיח או לשלול מחלה, אך כזכור, ברפואה לרוב אין הוכחה או שלילה של מחלה, אלא הגעה מסבירות אחת לסבירות אחרת בעקבות תוצאות של בדיקה
בפרק הזה אנחנו עולים רמה, ומנסים לתת ביטוי כמותי לסבירויות . לצורך זה אנחנו משתמשים בערך שנקרא
likelihood ratio
למעשה עבור בדיקה מסוימת ישנם שני ערכים כאלו, אחד חיובי ואחד שלילי (עבור בדיקה עם תוצאה חיובית ושלילית, בהתאם). הערך הזה משמש למעבר מסבירות שלפני הבדיקה
pre test probability
לסבירות שלאחר בדיקה
post test probability
היום הדרך הפשוטה ביותר להגיע מהסבירות שלפני הבדיקה לסבירות לאחר בדיקה חיובית או שלילית, היא להשתמש במחשבונים ברשת, כמו המחשבון המצויין הזה
http://araw.mede.uic.edu/cgi-bin/testcalc.pl
אך הפרק שלנו מאפשר למי שמתעניין, להבין איך תהליך החישוב קורה, ומהו תפקיד ה בתוך התהליךlikelihood ratio
נוסחאות
positive likelihood ratio=sensitivity/(1-specificity)
negative likelihood ratio=(1-sensitivity)/specificity
odds=probability/(1-probability)
probability=odds/(1+odds)
דיוק הממצא של קול שלישי בהאזנה לאבחון התקף לב
https://jamanetwork.com/journals/jama/article-abstract/1107536
דיוק מיפוי לאבחון מחלת פרקינסון
https://pubmed.ncbi.nlm.nih.gov/19117369/
זהירות! בניגוד לפרקים אחרים, הפרק כולל מתמטיקה ברמת חילוק וכפל, ואינו מומלץ לאנשים עם אלרגיה קשה לחישובים. בפרק נעסוק במקרה של מטופל עם חשד להתקף לב וממצאים בהאזנה ללב, ובתוצאות המאמר על מיפוי לאבחון מחלת פרקינסון, (מאמר אותו ניתחנו בפרקים קודמים)
בפרק "הדרך הקלה" השתמשנו בתוצאת המחקר על בדיקה אבחנתית ובעזרת ראשי התיבות
spin+snout
כדי להחליט האם בדיקה תעזור לנו להוכיח או לשלול מחלה, אך כזכור, ברפואה לרוב אין הוכחה או שלילה של מחלה, אלא הגעה מסבירות אחת לסבירות אחרת בעקבות תוצאות של בדיקה
בפרק הזה אנחנו עולים רמה, ומנסים לתת ביטוי כמותי לסבירויות . לצורך זה אנחנו משתמשים בערך שנקרא
likelihood ratio
למעשה עבור בדיקה מסוימת ישנם שני ערכים כאלו, אחד חיובי ואחד שלילי (עבור בדיקה עם תוצאה חיובית ושלילית, בהתאם). הערך הזה משמש למעבר מסבירות שלפני הבדיקה
pre test probability
לסבירות שלאחר בדיקה
post test probability
היום הדרך הפשוטה ביותר להגיע מהסבירות שלפני הבדיקה לסבירות לאחר בדיקה חיובית או שלילית, היא להשתמש במחשבונים ברשת, כמו המחשבון המצויין הזה
http://araw.mede.uic.edu/cgi-bin/testcalc.pl
אך הפרק שלנו מאפשר למי שמתעניין, להבין איך תהליך החישוב קורה, ומהו תפקיד ה בתוך התהליךlikelihood ratio
נוסחאות
positive likelihood ratio=sensitivity/(1-specificity)
negative likelihood ratio=(1-sensitivity)/specificity
odds=probability/(1-probability)
probability=odds/(1+odds)
דיוק הממצא של קול שלישי בהאזנה לאבחון התקף לב
https://jamanetwork.com/journals/jama/article-abstract/1107536
דיוק מיפוי לאבחון מחלת פרקינסון
https://pubmed.ncbi.nlm.nih.gov/19117369/
לאחר שבפרק קודם הערכנו תקפות של מאמר על בדיקה אבחנתית (מיפוי לאבחון מחלת פרקינסון), נקרא את התוצאות. רגישות הבדיקה לפי המאמר היא 78%, והספציפיות שלה- 97%. מושגים אלו הוסברו בפרקים קודמים. האם הבדיקה הזו טובה בשלילת מחלה? בהוכחתה? נלמד להשתמש בראשי תיבות כדי לזכור מתי כדאי להשתמש בבדיקה זו.
אך כמובן, אף פעם לא ניתן לשלול או להוכיח בוודאות מחלה, אלא תמיד מדובר בסבירות למחלה, המשתנה בעקבות תוצאות של בדיקה מסוימת. בפרק הבא נשתמש בשיטה מדויקת יותר להגיע לסבירות למחלה לאחר תוצאת בדיקה, שעבורה נצטרך להבין ערך נוסף, הנקרא
likelihood ratio
לאחר שבפרק קודם הערכנו תקפות של מאמר על בדיקה אבחנתית (מיפוי לאבחון מחלת פרקינסון), נקרא את התוצאות. רגישות הבדיקה לפי המאמר היא 78%, והספציפיות שלה- 97%. מושגים אלו הוסברו בפרקים קודמים. האם הבדיקה הזו טובה בשלילת מחלה? בהוכחתה? נלמד להשתמש בראשי תיבות כדי לזכור מתי כדאי להשתמש בבדיקה זו.
אך כמובן, אף פעם לא ניתן לשלול או להוכיח בוודאות מחלה, אלא תמיד מדובר בסבירות למחלה, המשתנה בעקבות תוצאות של בדיקה מסוימת. בפרק הבא נשתמש בשיטה מדויקת יותר להגיע לסבירות למחלה לאחר תוצאת בדיקה, שעבורה נצטרך להבין ערך נוסף, הנקרא
likelihood ratio
כאשר מתגלה אצל הרופא חסר בידע לגבי בדיקה אבחנתית מסוימת, במקרה שלנו: האם מיפוי יעיל באבחון מחלת פרקינסון, יש צורך לקרוא את המאמר שבדק מה הדיוק של אותה בדיקה. לפני קריאת התוצאות נצטרך להחליט האם המאמר תקף. נעשה את זה לפי חמישה קריטריונים: מדגם מתאים של מטופלים אצלם קיימת שאלה אבחנתית, השוואה ל"בדיקת הזהב", ביצוע שתי הבדיקות באופן בלתי תלוי, סמיות של הבודקים, ומספיק פרטים טכניים כדי לבצע את הבדיקה בצורה דומה.
נדגים זאת על ידי קריאה של המאמר המקורי
כאשר מתגלה אצל הרופא חסר בידע לגבי בדיקה אבחנתית מסוימת, במקרה שלנו: האם מיפוי יעיל באבחון מחלת פרקינסון, יש צורך לקרוא את המאמר שבדק מה הדיוק של אותה בדיקה. לפני קריאת התוצאות נצטרך להחליט האם המאמר תקף. נעשה את זה לפי חמישה קריטריונים: מדגם מתאים של מטופלים אצלם קיימת שאלה אבחנתית, השוואה ל"בדיקת הזהב", ביצוע שתי הבדיקות באופן בלתי תלוי, סמיות של הבודקים, ומספיק פרטים טכניים כדי לבצע את הבדיקה בצורה דומה.
נדגים זאת על ידי קריאה של המאמר המקורי
הן בעבודה הקלינית והן בקריאת מאמר על בדיקה אבחנתית, חשוב להבין עד כמה הבדיקה מדוייקת, "טובה". למשל, א.ק.ג הוא בדיקה אבחנתית שיש לה שימוש באבחון התקף לב. כאשר משתמשים בבדיקה הזו מול מטופלים, וגם כאשר קוראים מאמר שעוסק בא.ק.ג. כבדיקה אבחנתית להתקף לב, אם נרצה לדעת כמה הבדיקה הזו מדוייקת, צריך להכיר היטב מספר מושגים. אלו הם רגישות, ספציפיות, ערך מנבא חיובי וערך מנבא שלילי. בפרק זה נדבר על הגדרות המושגים האלו.
הן בעבודה הקלינית והן בקריאת מאמר על בדיקה אבחנתית, חשוב להבין עד כמה הבדיקה מדוייקת, "טובה". למשל, א.ק.ג הוא בדיקה אבחנתית שיש לה שימוש באבחון התקף לב. כאשר משתמשים בבדיקה הזו מול מטופלים, וגם כאשר קוראים מאמר שעוסק בא.ק.ג. כבדיקה אבחנתית להתקף לב, אם נרצה לדעת כמה הבדיקה הזו מדוייקת, צריך להכיר היטב מספר מושגים. אלו הם רגישות, ספציפיות, ערך מנבא חיובי וערך מנבא שלילי. בפרק זה נדבר על הגדרות המושגים האלו.
אבחנה היא מושג מפתח ברפואה. היא מפתח להסבר על מקור הסבל של המטופל, לתחזית של העתיד הצפוי במחלה, ולטיפול המומלץ. לפני שננתח תקפות ותוצאות של מאמר על בדיקה אבחנתית, ננסה להבין את התהליך האבחנתי: מה מתרחש בו והיכן יש מקום למאמר על בדיקה אבחנתית בתוך תהליך זה.
אבחנה היא מושג מפתח ברפואה. היא מפתח להסבר על מקור הסבל של המטופל, לתחזית של העתיד הצפוי במחלה, ולטיפול המומלץ. לפני שננתח תקפות ותוצאות של מאמר על בדיקה אבחנתית, ננסה להבין את התהליך האבחנתי: מה מתרחש בו והיכן יש מקום למאמר על בדיקה אבחנתית בתוך תהליך זה.
לאחר שבפרק קודם הצגנו בקצרה ניתוח מאמר מבוקר אקראי , הסתבר שלפי השיטה שלנו, צריך לנסות לבדוק האם מאמר עומד בקריטריונים מסוימים. בשני פרקים הכרנו את הקריטריונים רנדומיזציה וסמיות, ובפרק הזה, השלישי בנושא תקפות מאמר טיפול, נדבר על קריטריונים נוספים שיעזרו לנו להבין האם להאמין למאמר מסוג זה: קבוצות דומות בבסיס, טיפול מקביל זהה, ניתוח לפי כוונת הטיפול ומעקב מלא.
לגבי קבוצות דומות בבסיס: נרצה שהדבר היחיד השונה בין הקבוצות יהיה ההתערבות הנבדקת, כדי לנטרל השפעות של גורמים אחרים. לכן כל שוני בבסיס בין הקבוצה שקיבלה את ההתערבות לקבוצת הבקרה, למשל בגיל, עלול ליצור הטיה. במחקרים גדולים מאוד, וכשהרנדומיזציה טובה, הקבוצות הופכות לדומות מאוד בזכות האקראיות.
לגבי טיפול מקביל זהה: גם במהלך המחקר, לא נרצה שיהיו הבדלים בהתערבויות בין הקבוצות מלבד ההתערבות הנבדקת, לכן צריך לחשוב מה עוד קיבלו האנשים בקבוצת ההתערבות. אם למשל הם קיבלו תרופה כהתערבות הנבדקת, כדאי לבדוק שהתרופה הזו לא לוותה במעקב נוסף שקבוצת הבקרה לא זכתה לו, או בהתערבות אחרת נוספת שלא ניתנה בקבוצת הבקרה.
הקריטריונים מעקב מלא וניתוח לפי כוונת טיפול נועדו לוודא שהייתה שמירה על הרנדומיזציה. אם אנשים שהוגרלו לקבוצה מסוימת לא נכללים בתוצאות באותה קבוצה, הקבוצות שהיו אמורות להיות דומות בכל, הופכות לעתים להיות שונות אחת מהשנייה, למשל בגיל האנשים, ותיווצר הטיה. לדוגמה, אם התרופה הנבדקת הייתה מורפין, וקבוצת הבקרה מקבלת טיפול בתרופה פשוטה נגד כאב, למשל אקמול, כדאי לבדוק האם מלבד התרופה הנבדקת היו עוד הבדלים בטיפול בין הקבוצות, למשל ביקורים רבים יותר במרפאה או מתן תרופות נוספות כדי לטפל בתופעות הלוואי של מורפין. אם היה הבדל כזה, ייתכן שהתוצאות של המחקר, למשל שוני באיכות חיים בין שתי הקבוצות, נובעות מהטיפול הנוסף ולא מהמורפין עצמו.
לאחר שבפרק קודם הצגנו בקצרה ניתוח מאמר מבוקר אקראי , הסתבר שלפי השיטה שלנו, צריך לנסות לבדוק האם מאמר עומד בקריטריונים מסוימים. בשני פרקים הכרנו את הקריטריונים רנדומיזציה וסמיות, ובפרק הזה, השלישי בנושא תקפות מאמר טיפול, נדבר על קריטריונים נוספים שיעזרו לנו להבין האם להאמין למאמר מסוג זה: קבוצות דומות בבסיס, טיפול מקביל זהה, ניתוח לפי כוונת הטיפול ומעקב מלא.
לגבי קבוצות דומות בבסיס: נרצה שהדבר היחיד השונה בין הקבוצות יהיה ההתערבות הנבדקת, כדי לנטרל השפעות של גורמים אחרים. לכן כל שוני בבסיס בין הקבוצה שקיבלה את ההתערבות לקבוצת הבקרה, למשל בגיל, עלול ליצור הטיה. במחקרים גדולים מאוד, וכשהרנדומיזציה טובה, הקבוצות הופכות לדומות מאוד בזכות האקראיות.
לגבי טיפול מקביל זהה: גם במהלך המחקר, לא נרצה שיהיו הבדלים בהתערבויות בין הקבוצות מלבד ההתערבות הנבדקת, לכן צריך לחשוב מה עוד קיבלו האנשים בקבוצת ההתערבות. אם למשל הם קיבלו תרופה כהתערבות הנבדקת, כדאי לבדוק שהתרופה הזו לא לוותה במעקב נוסף שקבוצת הבקרה לא זכתה לו, או בהתערבות אחרת נוספת שלא ניתנה בקבוצת הבקרה.
הקריטריונים מעקב מלא וניתוח לפי כוונת טיפול נועדו לוודא שהייתה שמירה על הרנדומיזציה. אם אנשים שהוגרלו לקבוצה מסוימת לא נכללים בתוצאות באותה קבוצה, הקבוצות שהיו אמורות להיות דומות בכל, הופכות לעתים להיות שונות אחת מהשנייה, למשל בגיל האנשים, ותיווצר הטיה. לדוגמה, אם התרופה הנבדקת הייתה מורפין, וקבוצת הבקרה מקבלת טיפול בתרופה פשוטה נגד כאב, למשל אקמול, כדאי לבדוק האם מלבד התרופה הנבדקת היו עוד הבדלים בטיפול בין הקבוצות, למשל ביקורים רבים יותר במרפאה או מתן תרופות נוספות כדי לטפל בתופעות הלוואי של מורפין. אם היה הבדל כזה, ייתכן שהתוצאות של המחקר, למשל שוני באיכות חיים בין שתי הקבוצות, נובעות מהטיפול הנוסף ולא מהמורפין עצמו.
רנדומיזציה אמיתית היא חלק קריטי מביצוע מחקר מבוקר אקראי, ומטרתה- קבלת שתי קבוצות דומות מאוד. אך התהליך הזה, שאמור להיות אקראי לחלוטין, יכול להיות חשוף להשפעה אנושית ובגללה להטיה של תוצאות המחקר.
רנדומיזציה אמיתית היא חלק קריטי מביצוע מחקר מבוקר אקראי, ומטרתה- קבלת שתי קבוצות דומות מאוד. אך התהליך הזה, שאמור להיות אקראי לחלוטין, יכול להיות חשוף להשפעה אנושית ובגללה להטיה של תוצאות המחקר.
סמיות היא אחד הקריטריונים לתקפות מאמר על התערבות טיפולית. צריך להבדיל אותה מהסתרת השיוך שמתייחסת למצב שלפני הכללת המטופל במחקר. המונחים המשמשים לתיאור סמיות במאמרים עלולים להטעות. הסמיות חשובה לא רק למניעת אפקט הפלצבו אלא גם לטיפול ולמדידה שיכולים לגרום להטיה בתוצאות המחקר, ולסיום- גם במחקר המצהיר על סמיות, כדאי לבדוק האם אכן לא היו למטופלים ולרופאים דרכים לגלות לאיזו קבוצה משתייך המטופל.
סמיות היא אחד הקריטריונים לתקפות מאמר על התערבות טיפולית. צריך להבדיל אותה מהסתרת השיוך שמתייחסת למצב שלפני הכללת המטופל במחקר. המונחים המשמשים לתיאור סמיות במאמרים עלולים להטעות. הסמיות חשובה לא רק למניעת אפקט הפלצבו אלא גם לטיפול ולמדידה שיכולים לגרום להטיה בתוצאות המחקר, ולסיום- גם במחקר המצהיר על סמיות, כדאי לבדוק האם אכן לא היו למטופלים ולרופאים דרכים לגלות לאיזו קבוצה משתייך המטופל.
מאמר מבוקר אקראי הוא אולי הדרך החשובה ביותר לקבל מידע אמין על טיפולים. בפרק הזה נדגים איך לקרוא במהירות מאמר כזה- ותוך כדי קריאת מאמר, נענה על שלושת השאלות הנוגעות לתקפות, תוצאות ורלוונטיות.
מאמר מבוקר אקראי הוא אולי הדרך החשובה ביותר לקבל מידע אמין על טיפולים. בפרק הזה נדגים איך לקרוא במהירות מאמר כזה- ותוך כדי קריאת מאמר, נענה על שלושת השאלות הנוגעות לתקפות, תוצאות ורלוונטיות.
רפואה נתמכת ראיות היא תורה עתיקה, שמקורותיה בסוף המאה העשרים, ויש שיגידו בתחילת המאה העשרים. לכאורה אפשר לחשוב שכבר אין בה צורך, אך כדאי לבדוק - אולי ישנן עדיין סיבות להעמיק ולשלוט בתורה זו.
רפואה נתמכת ראיות היא תורה עתיקה, שמקורותיה בסוף המאה העשרים, ויש שיגידו בתחילת המאה העשרים. לכאורה אפשר לחשוב שכבר אין בה צורך, אך כדאי לבדוק - אולי ישנן עדיין סיבות להעמיק ולשלוט בתורה זו.
במטא-אנליזה אוספים מידע ממחקרים קודמים ומאחדים אותו כדי לתת תשובה לשאלה קלינית מסוימת. בדרך כלל מאמר מסוג כזה נחשב חשוב ותקף, אך בתנאי שהוא עומד בקריטריונים מסוימים. בפרק הזה נדבר על מטא-אנליזה, ואיך להעריך האם היא אכן תקפה וטובה.
---
להעמקה- מאמר סקירה מקיף (בעברית) שמסביר כיצד מתבצעת מטא-אנליזה טובה
http://www.jipts.com/_Uploads/dbsAttachedFiles/4-21skira.pdf
במטא-אנליזה אוספים מידע ממחקרים קודמים ומאחדים אותו כדי לתת תשובה לשאלה קלינית מסוימת. בדרך כלל מאמר מסוג כזה נחשב חשוב ותקף, אך בתנאי שהוא עומד בקריטריונים מסוימים. בפרק הזה נדבר על מטא-אנליזה, ואיך להעריך האם היא אכן תקפה וטובה.
---
להעמקה- מאמר סקירה מקיף (בעברית) שמסביר כיצד מתבצעת מטא-אנליזה טובה
http://www.jipts.com/_Uploads/dbsAttachedFiles/4-21skira.pdf
בפרק הזה של רפואה נתמכת ראיות נלמד לשאול שלוש שאלות.
אלו שאלות שיעזרו לנו בקריאת כל מאמר רפואי קליני, וזהו גם מבוא ל"איך לקרוא מאמר".
בהמשך, כשנדבר על מחקרים מסוגים שונים, נשאל תמיד את אותן שלוש שאלות.
בפרק הזה של רפואה נתמכת ראיות נלמד לשאול שלוש שאלות.
אלו שאלות שיעזרו לנו בקריאת כל מאמר רפואי קליני, וזהו גם מבוא ל"איך לקרוא מאמר".
בהמשך, כשנדבר על מחקרים מסוגים שונים, נשאל תמיד את אותן שלוש שאלות.