Провеждането на първоначално търсене е важна стъпка, която потвърждава предложената концепция, предотвратява дублирането на вече обсъждани теми и потвърждава достатъчния брой статии за анализ. Този процес не е просто формалност, а значителен принос към областта (Tawfik et al., 2019).
След като сте установили протокола и обхвата, следващата стъпка е щателно пълно търсене. То ще доведе до многобройни проучвания, но много от тях ще бъдат отхвърлени като неуместни, като се използват критерии, основани на заглавието, резюмето или мястото на публикуване на проучването. Останалите "потенциално релевантни" проучвания трябва да бъдат прочетени по-внимателно и разделени на релевантни и нерелевантни. Този процес може да доведе до значително намаляване на броя на документите на всяка стъпка. Бъдете подготвени за това, че голям брой (често по-голямата част) от проучванията, които първоначално сте определили като подходящи, няма да бъдат подходящи за метаанализа. Последната стъпка е да се извлече необходимата информация (размери на ефекта и модератори) от съответните документи. От решаващо значение е финализираната таблица с данни, която гарантира, че цялата информация, която искате да извлечете, е включена.
От съществено значение е да се разбере компромисът между натрупването на купчина подходящи документи и връщането към тях за извличане на размера на ефекта, след като имате готова таблица с данни, и извличането на данни от даден документ, докато го четете. Предимството на първото е, че можете да сте по-сигурни, че електронната таблица съдържа цялата информация, която искате да извлечете. Предимството на второто е, че можете да прочетете статията в дълбочина веднъж.
Разбирането на това как точно е планирано дадено проучване и кои съответни данни са необходими за определяне на размера на ефекта може да бъде изненадващо сложно. Доброто водене на бележки е от съществено значение за този процес и често не е по-лесно при второ четене. Ако сте сигурни, че добре разбирате основните характеристики на съответните проучвания, можете да обмислите проектирането на база данни и извличането на данни веднага щом класифицирате даден документ като подходящ. Уточнението, разбира се, е, че може да се наложи да се върнете към тези документи, ако по-късно откриете, че трябва да кодирате допълнителен термин на модератора или да коригирате критериите за включване на проучването. Извличането на информация при първоначално четене е най-възможно, когато става въпрос за проучвания, които следват стриктно специфичен и общоприет експериментален дизайн.
Papakostidis и Giannoudis (2023 г.) обръщат внимание на факта, че въпреки последната тенденция за подобряване на качеството през последните години, в публикуваните понастоящем мета-анализи са открити методологични недостатъци. Системните прегледи и метаанализите трябва да отговарят на строги и прозрачни правила, като например насоките PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) (вж. фиг. 4), гарантиращи възпроизводимостта и надеждността на процеса на търсене, надеждността и валидността на техните резултати и яснотата на докладването. Тези насоки очертават основните стъпки, за да се гарантира спазването на всички горепосочени изисквания, включително прозрачното докладване на стратегията за търсене, процеса на подбор на проучвания, извличането на данни и синтеза на данни:
- Протоколът на проспективното изследване е в основата на систематичния преглед и мета-анализа. Ролята му за намаляване на отклоненията и осигуряване на прозрачност не може да бъде надценена. Този добре структуриран и кратък документ трябва да описва адекватно всички стъпки в процеса на изследване, включително потенциалните промени в методологията на систематичния преглед. По този начин той обосновава тези промени и предотвратява внасянето на пристрастия при подбора на данните за прегледа.
- Процесът на търсене не е просто стъпка, а гръбнакът на систематичния преглед и мета-анализа. Неговият стабилен и възпроизводим характер гарантира включването на всички релевантни данни от допустимите проучвания. Това включва търсене в множество електронни бази данни и референтни списъци, като от съществено значение са бази данни като PubMed, EMBASE или SCOPUS. Трябва да се разгледат и допълнителни бази данни като Cochrane, Web of Science и ProQuest. Струва си също така да се идентифицира потенциално значима сива литература чрез търсене на резюмета на материали от конференции. Въпреки това, неадекватните стратегии за търсене и езиковите ограничения могат да ограничат броя на допустимите проучвания, което води до значително отклонение от публикациите. Това отклонение е възможно дори при най-изчерпателната стратегия за търсене, тъй като се очаква да не бъдат публикувани цели проучвания или всички резултати от дадено проучване.
- Вътрешна валидност на първичните проучвания: Терминът "вътрешна валидност" се отнася до способността на дадено проучване да установи надеждна причинно-следствена връзка между лечението и резултата чрез ограничаване на различни смущаващи фактори. Това е изключително важен аспект, тясно свързан с риска от отклонение и методологичното качество на включените проучвания. Разработени са няколко инструмента за оценка на риска от отклонение в първичните проучвания, както за RCT (рандомизирани контролирани проучвания), така и за наблюдателни проучвания.
- Последното издание на инструмента за оценка на риска от пристрастие на Кохрейн колаборация (RoB-2)[1] предоставя рамка за оценка на риска от пристрастие в резултатите от РКИ. Той е структуриран в пет области на потенциално въвеждане на отклонения в резултатите от проучването: (1) процес на рандомизация; (2) отклонения на предвидените интервенции; (3) липсващи данни за резултатите; (4) измерване на резултатите; (5) подбор на докладваните резултати (Sterne et al., 2019). В рамките на всяка област на пристрастие специфични сигнални въпроси имат за цел да получат информация, свързана с оценката на риска от пристрастие[2] . Инструментът включва алгоритми, които съпоставят отговорите на тези сигнални въпроси с предложената оценка на риска от пристрастие за всяка област. Възможните оценки на риска от пристрастие са: (1) нисък риск от пристрастие, (2) известни опасения и (3) висок риск от пристрастие. Инструментът е представен като "светофарна уредба". Инструментът "Риск от пристрастия при нерандомизирани проучвания на интервенции" (ROBINS-I) очертава седем области на потенциална поява на пристрастия (вж. таблица 3): две във фазата "преди интервенцията", една във фазата "при интервенцията" и четири във фазата "след интервенцията".
- Анализ на данните и докладване: Въпреки че комбинирането на данни от отделни проучвания увеличава размера на извадката и статистическата мощ, от решаващо значение е да се изследва наличието на статистическа хетерогенност. Това несъответствие в ефекта от лечението в рамките на включените проучвания може да бъде подвеждащо и да намали доверието в заключенията. Количественото определяне на статистическата хетерогенност обикновено се основава на специфични статистически тестове (Higgins-I, Q-тест на Кокран). Авторите на метаанализи трябва да изследват наличието на статистическа хетерогенност чрез подходящо планиране и извършване на анализи на подгрупите и чувствителността въз основа на априорни хипотези в началото на протокола на изследването. Такива хипотези включват изследване на резултатите от обобщения анализ на потенциално по-хомогенни подгрупи от данни (подгрупи) въз основа например на клиничните характеристики на извадките, методологичните въпроси, дизайна на проучването и географския произход на проучванията. За получаване на оценки на комбинираните ефекти се използват два различни статистически модела. Изборът на подходящ статистически модел за обединяване на данните зависи от наличието на хетерогенност между проучванията. Не са определени обаче ясни гранични стойности на степента на хетерогенност, които да налагат избора на един модел пред другия. От друга страна, статистическите тестове за хетерогенност често са недостатъчно ефективни за откриване на значителна хетерогенност:
- Моделът с фиксирани ефекти предполага един-единствен действителен размер на ефекта за всички проучвания, представен от сборната оценка на ефекта. Този модел обикновено се използва, когато няма хетерогенност в метаанализа и когато има много проучвания с големи размери на извадките. В такива случаи има увереност, че тестът за хетерогенност е достатъчно мощен, за да открие значителни разлики. Резултатите, получени при използването на този модел, обикновено са с по-тесни доверителни интервали. Ако има опасения за хетерогенност, моделът със случайни ефекти (DerSimonian & Kacker, 2007) се счита за по-добър избор. При него се получават по-широки доверителни интервали около точковите оценки и е по-предпазлив вариант за анализ. В областта на медицината, където се очаква истинският ефект да варира в различните популации, по-честото използване на модела на случайните ефекти е по-подходящо. Използването на модела с фиксирани ефекти е разумно при метаанализи, които включват достатъчно голям брой проучвания с подходящи размери на извадките и при които все още не е открита статистическа хетерогенност. И накрая, качеството на обобщените доказателства, получени от метаанализа, трябва да се оценява, като се използва прозрачната рамка на инструментите GRADE, AMSTAR или PRISMA (вж. фиг. 4). Те оценяват доверието в оценката на ефекта за всеки резултат от интерес. Неизползването им в метаанализите може да доведе до липса на прозрачност и потенциално да доведе до подвеждащи заключения.
- Моделът на случайните ефекти предполага, че действителната оценка на ефекта се различава между оригиналните проучвания поради различията в клиничните им характеристики. Следователно комбинираната оценка на размера на ефекта, генерирана въз основа на този модел, представлява средна оценка на оценките на всички отделни проучвания.
- Анализ на резултатите от мета-анализ. От съществено значение е да се анализират резултатите от мета-анализа, като се отчита тяхната значимост. Статистически значимото отклонение не е значимо, ако му липсва значимост. Освен това всяка разлика може да постигне статистическа значимост при достатъчно голям размер на извадката. И обратно, когато се изчислява несигнификантна обща оценка на ефекта, от съществено значение е внимателно да се прецени дали това, което се счита за значимо, попада в доверителния интервал на тази оценка.
- Важна стъпка е потвърждаването на резултатите. Центрове за доказателства, като например CEBM в Оксфордския университет, който е известна институция в тази област, разработват важни инструменти за оценка. Те са от съществено значение за установяване на надеждността, научната значимост и приложимостта на събраните доказателства от метаанализа. Със своите пет ключови въпроса CEBM е надежден метод за определяне на валидността на резултатите от проучването.
[1] https://methods.cochrane.org/bias/resources/rob-2-revised-cochrane-risk-bias-tool-randomized-trials
[2] Вж. таблица 1 в https://www.bmj.com/content/366/bmj.l4898.long.
