在指南制訂臨床問題構建環節,需要引導臨床醫生提出具備PICO(人群、干預、對照、結局)格式的臨床問題或者對收集的臨床問題進行PICO結構化處理。但PICO結構內部每個要素的寬窄限定與評價方法此前并沒有被提出,導致具備了PICO結構的臨床問題由于范圍寬窄不合適而仍舊不適合作為指南問題。本文根據PIC三個要素中明顯需要拆分或擴充要素的數量將臨床問題分為8個等級(3,2,1,0,?1,?2,?3,混合)以區分和評價臨床問題的寬窄適用程度,并明確使用原則,為臨床醫生、指南制訂者等提供方法學參考。
引用本文: 王雅琪, 高一城, 蘇澄元, 劉美君, 李迅, 費宇彤. 臨床實踐指南中臨床問題結構化分級及評價. 中國循證醫學雜志, 2024, 24(7): 827-831. doi: 10.7507/1672-2531.202311037 復制
在循證臨床實踐指南的制訂過程中,確定臨床問題是重要環節[1],它關系著整部指南的實踐價值[2]。PICO(人群、干預、對照、結局)是指南制訂中最常用的臨床問題構建框架,為構建指南臨床問題提供了一種清晰、結構化的方法,在實際制訂循證臨床實踐指南的過程中,PICO各個要素的界定對產生有實用價值的指南至關重要[3-6]。
如何界定PICO問題的寬窄是一個難題[1,6,7],需要被專門考慮[8]。其困難之處一方面來源于問題的提出是基于臨床,所以問題的寬窄是否合適要根據臨床實踐動態變化[9,10];另一方面是難以整體性界定其寬窄,因為臨床問題按照PICO模式結構化后存在多個變動因素,P、I、C、O每一個要素都可以拆分或擴充。除此之外,在指南制訂過程中,方法學家和臨床醫生可能需要互相配合以提出同時具備科學結構和臨床價值的臨床問題。有時,臨床醫生很難將信息需求轉化為一個可回答的臨床問題[11],方法學家需要引導臨床醫生準確捕捉臨床實踐中關鍵的臨床問題并將其結構化,雙方需要合作溝通,此時對臨床問題的寬窄適當性的描述非常重要。
臨床問題的范圍將由PICO要素的寬窄決定[7]。當問題的寬窄界定不清,可能削弱對臨床醫生的指導意義。PICO結構的臨床問題在范圍上可以是寬泛的也可以是狹窄的。寬泛的臨床問題有更豐富的證據足以進行全面的總結[7],但它可能也需要更多的資源來回答,也可能產生非常不同的證據,使解釋變的困難;并且范圍過寬會使每個要素的界定不清,證據檢索難度加大、推薦意見數量較多,在臨床中的使用針對性較差。狹窄的問題可能產生更少的異質性證據,更好地解釋亞組之間的差異[7],然而范圍過窄容易使得臨床問題的針對性過強,外推性較差,對于臨床實踐的指導意義變小。
在缺乏高效的方法學指導下[12],合作雙方往往因難以清晰地描述及評價臨床問題,使臨床問題界定過程耗時耗力。為了在規定的時間內高效提出符合臨床指南定位的臨床問題,方便描述和評價產生的臨床問題的適當性,亟需探索一個方便實用的方法。
1 臨床問題的分級標準
本文提出了一個能夠整體性描述臨床問題寬窄的方法學建議——PICO化臨床問題的寬窄適當性評價標準。將臨床問題按照P、I、C中可拆分的要素的個數分為8個等級。
其中,0級問題代表一個寬窄適當的問題,這類問題中的P、I、C三個要素都是寬窄適當的(見表1的例1和例2);1級問題代表P、I、C中有一個要素的界定過于寬泛,明顯需要拆分(見表1的例3和例4);2級問題代表有兩個要素的界定過于寬泛,明顯需要拆分(見表1的例5);3級問題代表有三個要素的界定過于寬泛,明顯需要拆分(見表1的例6和例7);?1級問題代表有一個要素的界定過于狹窄,明顯需要擴充(見表1的例8);?2級問題代表有兩個要素的界定過于狹窄,明顯需要擴充(見表1的例9);?3級問題代表有三個要素的界定過于狹窄,明顯需要擴充(見表1的例10);混合型問題代表3個要素的界定中既有過于寬泛又有過于狹窄的情況(見表1的例11)。

一般情況下,PICO問題分級只考慮PIC的寬泛或狹窄程度而不考慮結局O。選取適當的結局指標能更明確地傳達干預措施效應大小并且更有利于臨床決策[22]。然而結局指標的種類很多,對不同的問題和在不同的背景下,重要的結局指標可能不同。通常情況下,應列出結局指標清單并且對每個問題進行結局指標的重要性排序[23]。而當結局O極其明確且罕見時,多數情況下無需再考慮PIC的寬窄,因為此時由于結局指標非常狹窄而導致PIC明確且有限,從而證據也十分有限。
2 臨床問題中PIC要素的寬窄評價
臨床問題分級標準建立后,該方法應用的重要環節在于PIC要素的寬窄評價,本節將對寬窄評價的原則進行介紹。
臨床問題的要素是否應該拆分或者合并是根據醫療實踐,也就是臨床醫生的專業知識和臨床經驗來評估的。因此在選擇共識專家時應該有一定的標準,確保共識專家具備把控臨床實踐的專業水平[24-26]。具體來說,臨床醫生根據臨床經驗考慮臨床問題中的要素應該盡可能準確描述,考慮人群時,使干預的絕對益處和危害的平衡在整個患者范圍內應該是相似的;一個確定的干預措施或對照措施,其對人群的影響也應該是相似的[9]。可以從這個原則出發,考慮是否有特殊情況導致當前要素的界定范圍過寬,需要分開考慮;以及是否有同類的要素可以合并。例如對于P是否過于寬泛的界定關鍵從其是否有明確的分期或分型來考慮,I或C重點考慮是否存在范圍內的下屬類別。當這些要素可能會明顯影響疾病的預后時,需要進行拆分后納入臨床問題。
中醫藥臨床問題在進行PICO結構化時需要進行更全面、更具有學科特性的考慮[27,28]。例如,對于人群P需要考慮臨床分期、辨證分型因素,對于干預措施需要考慮中藥藥味及藥量加減、針刺處方穴位及刺激量加減、種類繁多的外治法的選擇等,對于結局指標需要重視患者的生活質量等指標。
關于臨床問題PIC要素寬窄的判定在具體的場景下應該咨詢臨床醫生,劃分寬窄的理由根據醫療實踐言之有理即可,為使后人更好地理解,理由應當被如實記錄。本文例子中對臨床問題PIC要素寬窄的界定均是基于一般常識,不排除使用者使用時可能面臨特殊情況導致某些要素雖然表述上過于寬泛但是指代十分明確,這種情況應該明確說明。
3 已分級臨床問題的處理
對于已分級問題,從處理角度出發,可以將0級問題歸為可以直接納入指南臨床問題優先性評價的問題,±1級問題歸為需要微調和考慮后納入的問題,可以將±2級問題、±3級問題及混合性問題歸為調整后重新進行評級的問題。下面將對這幾類問題介紹處理原則。
總體上0級問題的寬窄是清晰的,因此在指南制訂中可以直接用于指南臨床問題優先性評價的備選問題。
±1級問題的寬窄方面比較清晰,可以稍作調整后用于指南中臨床問題優先性評價的備選問題或最終的臨床問題。在調整時首先明確PIC哪一個要素明顯需要拆分或合并,拆分或合并成0級臨床問題還是將1級問題分亞組分別推薦即可。其次考慮要素的拆分及合并對于其他兩個要素是否有影響以及有什么樣的影響和改變。
±2級問題、±3級問題都需要調整后再評級,最終改為0級或±1級問題考慮,再納入臨床問題優先性評價。如例6,對于帶狀皰疹患者,西醫常規治療與非藥物療法相比哪個能使患者獲益更多?這個問題中帶狀皰疹的治療有疹前期、出疹期和疹后期三個階段[16],不同年齡、不同身體狀況的患者治療方案不盡相同[17],本問題僅描述為帶狀皰疹患者則過于寬泛。西醫常規治療常用抗病毒藥治療,包括阿昔洛韋、泛昔洛韋和伐昔洛韋[18,19],三種藥物側重不同。非藥物療法的種類很多,包含針刺、拔罐、放血等。因此,P、I、C要素需要重新界定清晰后再進行評級。如果為1級問題則考慮分亞組或直接調整為0級問題,如果為?1級問題則考慮合并為0級問題,或者擴充為多個?1級問題。
混合型問題可能以二級問題的形式出現:P1I-1C0、P1I0C-1、P-1I1C0、P-1I0C1、P0I1C-1、P0I-1C1;也可能以三級問題的形式出現:P1I1C-1、P1I-1C-1、P1I-1C1、P-1I1C1、P-1I-1C1、P-1I1C-1。此時按照二級、三級問題的處理方式對各要素進行調整后重新評估分級即可。
上述臨床問題的分級是以干預性臨床問題為例,但其他類型的問題,如診斷、預防、預后等,可以參考這個思路進行分級。當前的分級系統,既可以幫助指南制訂者更加清晰地判斷自己指南的臨床問題處于什么樣的寬窄水平,需要在哪個維度進行優化調整,也可以用于評判已發表的指南中臨床問題的寬窄級別,以助于發現不足及分析推薦意見與指南臨床問題的對應性是否良好。
4 小結
在指南制訂構建臨床問題的過程中,最具挑戰性的是把握P、I、C三者界定的廣度[8],協調臨床問題臨床推廣性與針對性之間的關系,將臨床中的實踐困惑重新處理、結構化,并清晰地表達為一個可以回答的臨床問題。PICO結構的充分性和靈活性以及能否完整地捕捉到臨床問題的顯著特征對于指南證據檢索、綜合以及推薦意見形成的體量和質量至關重要[29]。
沒有明確PICO化臨床問題的寬窄適當性評價方法之前,大部分指南制訂手冊對臨床問題的要求是具備PICO結構。但實際應用中,研究者對于一個好的、可回答的、范圍寬窄適度的臨床問題往往概念不清,理解運用不到位。這種情況下,臨床問題(PICO)容易出現具備主體結構但是寬窄不當的情況導致指南臨床問題質量下降,推薦意見形成困難和實用性差。
本文通過對PICO結構中的“PIC”每個要素是否明顯需要拆分或合并進行分級并評價,明確其使用原則,并通過實例的形式輔助解讀理解,將PICO結構要素寬窄適當性評價的具體使用方法清晰落地。而對于PIC要素寬窄的界定標準是臨床醫生根據臨床實踐情況確定,本文并未對P、I、C各個要素的寬窄界定標準做出更具體的描述,更為具體的界定方法有待探索。
PICO結構最常用于干預性問題[30],本文主要針對干預性問題展開論述。但是PICO結構也易于根據不同問題的類型進行修改[23],對于PECOT(patients/consumers/participants、exposure、comparison、outcome、time)[11]、PICO(patients/population、interventions、comparisons、outcomes)[31]、PECO(population、exposure、comparator、outcomes)[32]結構的診斷問題、預后問題、因果關系問題等可以根據PICO結構的擴展參考使用。同時,對于其他結構的干預措施有效性、診斷、定性研究及混合研究問題,如SPICE(setting、perspective、intervention、comparison、evaluation)[30]、PIPOH(population、intervention、professional、outcomes of interest and healthcare setting)[10]、PInGO(patients or population、index tests、gold standard、outcome)[33]、PPIRT(population、prior tests、index test、reference standard、target condition)、SPIDER(sample size、phenomenon of interest、study design、evaluation、research type)[30]等其他類型的問題也可以適當地參考使用。
本文的分級和評價標準不僅可以供指南制訂者在臨床問題優先性排序之前評級及優化臨床問題的時候使用,也可供指南評價者對已發布的指南里的臨床問題進行評價時使用。指南制訂者在制訂臨床問題的時候參考本方法可以提出寬窄合適的臨床問題,不僅便于檢索和整合證據,也便于形成有針對性的推薦意見。指南評價者通過評價已有臨床問題的寬窄,不僅可以給后續指南更新時修訂或增減臨床問題提供參考建議,也可以用來探討指南臨床問題與推薦意見之間的對應關系是否良好。例如評價一個干預措施過于寬泛的1級問題其對應的推薦意見是否涵蓋了該干預措施概念內涵下各種類型干預措施的針對性建議,審查推薦意見是否有以偏概全之嫌。此外,本文僅針對PICO問題寬窄適當性評價就PIC要素的寬窄分級進行討論和界定,并未涉及PICO臨床問題結構完整性的評價。后者需要在方法學層面單獨進行規范。
在循證臨床實踐指南的制訂過程中,確定臨床問題是重要環節[1],它關系著整部指南的實踐價值[2]。PICO(人群、干預、對照、結局)是指南制訂中最常用的臨床問題構建框架,為構建指南臨床問題提供了一種清晰、結構化的方法,在實際制訂循證臨床實踐指南的過程中,PICO各個要素的界定對產生有實用價值的指南至關重要[3-6]。
如何界定PICO問題的寬窄是一個難題[1,6,7],需要被專門考慮[8]。其困難之處一方面來源于問題的提出是基于臨床,所以問題的寬窄是否合適要根據臨床實踐動態變化[9,10];另一方面是難以整體性界定其寬窄,因為臨床問題按照PICO模式結構化后存在多個變動因素,P、I、C、O每一個要素都可以拆分或擴充。除此之外,在指南制訂過程中,方法學家和臨床醫生可能需要互相配合以提出同時具備科學結構和臨床價值的臨床問題。有時,臨床醫生很難將信息需求轉化為一個可回答的臨床問題[11],方法學家需要引導臨床醫生準確捕捉臨床實踐中關鍵的臨床問題并將其結構化,雙方需要合作溝通,此時對臨床問題的寬窄適當性的描述非常重要。
臨床問題的范圍將由PICO要素的寬窄決定[7]。當問題的寬窄界定不清,可能削弱對臨床醫生的指導意義。PICO結構的臨床問題在范圍上可以是寬泛的也可以是狹窄的。寬泛的臨床問題有更豐富的證據足以進行全面的總結[7],但它可能也需要更多的資源來回答,也可能產生非常不同的證據,使解釋變的困難;并且范圍過寬會使每個要素的界定不清,證據檢索難度加大、推薦意見數量較多,在臨床中的使用針對性較差。狹窄的問題可能產生更少的異質性證據,更好地解釋亞組之間的差異[7],然而范圍過窄容易使得臨床問題的針對性過強,外推性較差,對于臨床實踐的指導意義變小。
在缺乏高效的方法學指導下[12],合作雙方往往因難以清晰地描述及評價臨床問題,使臨床問題界定過程耗時耗力。為了在規定的時間內高效提出符合臨床指南定位的臨床問題,方便描述和評價產生的臨床問題的適當性,亟需探索一個方便實用的方法。
1 臨床問題的分級標準
本文提出了一個能夠整體性描述臨床問題寬窄的方法學建議——PICO化臨床問題的寬窄適當性評價標準。將臨床問題按照P、I、C中可拆分的要素的個數分為8個等級。
其中,0級問題代表一個寬窄適當的問題,這類問題中的P、I、C三個要素都是寬窄適當的(見表1的例1和例2);1級問題代表P、I、C中有一個要素的界定過于寬泛,明顯需要拆分(見表1的例3和例4);2級問題代表有兩個要素的界定過于寬泛,明顯需要拆分(見表1的例5);3級問題代表有三個要素的界定過于寬泛,明顯需要拆分(見表1的例6和例7);?1級問題代表有一個要素的界定過于狹窄,明顯需要擴充(見表1的例8);?2級問題代表有兩個要素的界定過于狹窄,明顯需要擴充(見表1的例9);?3級問題代表有三個要素的界定過于狹窄,明顯需要擴充(見表1的例10);混合型問題代表3個要素的界定中既有過于寬泛又有過于狹窄的情況(見表1的例11)。

一般情況下,PICO問題分級只考慮PIC的寬泛或狹窄程度而不考慮結局O。選取適當的結局指標能更明確地傳達干預措施效應大小并且更有利于臨床決策[22]。然而結局指標的種類很多,對不同的問題和在不同的背景下,重要的結局指標可能不同。通常情況下,應列出結局指標清單并且對每個問題進行結局指標的重要性排序[23]。而當結局O極其明確且罕見時,多數情況下無需再考慮PIC的寬窄,因為此時由于結局指標非常狹窄而導致PIC明確且有限,從而證據也十分有限。
2 臨床問題中PIC要素的寬窄評價
臨床問題分級標準建立后,該方法應用的重要環節在于PIC要素的寬窄評價,本節將對寬窄評價的原則進行介紹。
臨床問題的要素是否應該拆分或者合并是根據醫療實踐,也就是臨床醫生的專業知識和臨床經驗來評估的。因此在選擇共識專家時應該有一定的標準,確保共識專家具備把控臨床實踐的專業水平[24-26]。具體來說,臨床醫生根據臨床經驗考慮臨床問題中的要素應該盡可能準確描述,考慮人群時,使干預的絕對益處和危害的平衡在整個患者范圍內應該是相似的;一個確定的干預措施或對照措施,其對人群的影響也應該是相似的[9]。可以從這個原則出發,考慮是否有特殊情況導致當前要素的界定范圍過寬,需要分開考慮;以及是否有同類的要素可以合并。例如對于P是否過于寬泛的界定關鍵從其是否有明確的分期或分型來考慮,I或C重點考慮是否存在范圍內的下屬類別。當這些要素可能會明顯影響疾病的預后時,需要進行拆分后納入臨床問題。
中醫藥臨床問題在進行PICO結構化時需要進行更全面、更具有學科特性的考慮[27,28]。例如,對于人群P需要考慮臨床分期、辨證分型因素,對于干預措施需要考慮中藥藥味及藥量加減、針刺處方穴位及刺激量加減、種類繁多的外治法的選擇等,對于結局指標需要重視患者的生活質量等指標。
關于臨床問題PIC要素寬窄的判定在具體的場景下應該咨詢臨床醫生,劃分寬窄的理由根據醫療實踐言之有理即可,為使后人更好地理解,理由應當被如實記錄。本文例子中對臨床問題PIC要素寬窄的界定均是基于一般常識,不排除使用者使用時可能面臨特殊情況導致某些要素雖然表述上過于寬泛但是指代十分明確,這種情況應該明確說明。
3 已分級臨床問題的處理
對于已分級問題,從處理角度出發,可以將0級問題歸為可以直接納入指南臨床問題優先性評價的問題,±1級問題歸為需要微調和考慮后納入的問題,可以將±2級問題、±3級問題及混合性問題歸為調整后重新進行評級的問題。下面將對這幾類問題介紹處理原則。
總體上0級問題的寬窄是清晰的,因此在指南制訂中可以直接用于指南臨床問題優先性評價的備選問題。
±1級問題的寬窄方面比較清晰,可以稍作調整后用于指南中臨床問題優先性評價的備選問題或最終的臨床問題。在調整時首先明確PIC哪一個要素明顯需要拆分或合并,拆分或合并成0級臨床問題還是將1級問題分亞組分別推薦即可。其次考慮要素的拆分及合并對于其他兩個要素是否有影響以及有什么樣的影響和改變。
±2級問題、±3級問題都需要調整后再評級,最終改為0級或±1級問題考慮,再納入臨床問題優先性評價。如例6,對于帶狀皰疹患者,西醫常規治療與非藥物療法相比哪個能使患者獲益更多?這個問題中帶狀皰疹的治療有疹前期、出疹期和疹后期三個階段[16],不同年齡、不同身體狀況的患者治療方案不盡相同[17],本問題僅描述為帶狀皰疹患者則過于寬泛。西醫常規治療常用抗病毒藥治療,包括阿昔洛韋、泛昔洛韋和伐昔洛韋[18,19],三種藥物側重不同。非藥物療法的種類很多,包含針刺、拔罐、放血等。因此,P、I、C要素需要重新界定清晰后再進行評級。如果為1級問題則考慮分亞組或直接調整為0級問題,如果為?1級問題則考慮合并為0級問題,或者擴充為多個?1級問題。
混合型問題可能以二級問題的形式出現:P1I-1C0、P1I0C-1、P-1I1C0、P-1I0C1、P0I1C-1、P0I-1C1;也可能以三級問題的形式出現:P1I1C-1、P1I-1C-1、P1I-1C1、P-1I1C1、P-1I-1C1、P-1I1C-1。此時按照二級、三級問題的處理方式對各要素進行調整后重新評估分級即可。
上述臨床問題的分級是以干預性臨床問題為例,但其他類型的問題,如診斷、預防、預后等,可以參考這個思路進行分級。當前的分級系統,既可以幫助指南制訂者更加清晰地判斷自己指南的臨床問題處于什么樣的寬窄水平,需要在哪個維度進行優化調整,也可以用于評判已發表的指南中臨床問題的寬窄級別,以助于發現不足及分析推薦意見與指南臨床問題的對應性是否良好。
4 小結
在指南制訂構建臨床問題的過程中,最具挑戰性的是把握P、I、C三者界定的廣度[8],協調臨床問題臨床推廣性與針對性之間的關系,將臨床中的實踐困惑重新處理、結構化,并清晰地表達為一個可以回答的臨床問題。PICO結構的充分性和靈活性以及能否完整地捕捉到臨床問題的顯著特征對于指南證據檢索、綜合以及推薦意見形成的體量和質量至關重要[29]。
沒有明確PICO化臨床問題的寬窄適當性評價方法之前,大部分指南制訂手冊對臨床問題的要求是具備PICO結構。但實際應用中,研究者對于一個好的、可回答的、范圍寬窄適度的臨床問題往往概念不清,理解運用不到位。這種情況下,臨床問題(PICO)容易出現具備主體結構但是寬窄不當的情況導致指南臨床問題質量下降,推薦意見形成困難和實用性差。
本文通過對PICO結構中的“PIC”每個要素是否明顯需要拆分或合并進行分級并評價,明確其使用原則,并通過實例的形式輔助解讀理解,將PICO結構要素寬窄適當性評價的具體使用方法清晰落地。而對于PIC要素寬窄的界定標準是臨床醫生根據臨床實踐情況確定,本文并未對P、I、C各個要素的寬窄界定標準做出更具體的描述,更為具體的界定方法有待探索。
PICO結構最常用于干預性問題[30],本文主要針對干預性問題展開論述。但是PICO結構也易于根據不同問題的類型進行修改[23],對于PECOT(patients/consumers/participants、exposure、comparison、outcome、time)[11]、PICO(patients/population、interventions、comparisons、outcomes)[31]、PECO(population、exposure、comparator、outcomes)[32]結構的診斷問題、預后問題、因果關系問題等可以根據PICO結構的擴展參考使用。同時,對于其他結構的干預措施有效性、診斷、定性研究及混合研究問題,如SPICE(setting、perspective、intervention、comparison、evaluation)[30]、PIPOH(population、intervention、professional、outcomes of interest and healthcare setting)[10]、PInGO(patients or population、index tests、gold standard、outcome)[33]、PPIRT(population、prior tests、index test、reference standard、target condition)、SPIDER(sample size、phenomenon of interest、study design、evaluation、research type)[30]等其他類型的問題也可以適當地參考使用。
本文的分級和評價標準不僅可以供指南制訂者在臨床問題優先性排序之前評級及優化臨床問題的時候使用,也可供指南評價者對已發布的指南里的臨床問題進行評價時使用。指南制訂者在制訂臨床問題的時候參考本方法可以提出寬窄合適的臨床問題,不僅便于檢索和整合證據,也便于形成有針對性的推薦意見。指南評價者通過評價已有臨床問題的寬窄,不僅可以給后續指南更新時修訂或增減臨床問題提供參考建議,也可以用來探討指南臨床問題與推薦意見之間的對應關系是否良好。例如評價一個干預措施過于寬泛的1級問題其對應的推薦意見是否涵蓋了該干預措施概念內涵下各種類型干預措施的針對性建議,審查推薦意見是否有以偏概全之嫌。此外,本文僅針對PICO問題寬窄適當性評價就PIC要素的寬窄分級進行討論和界定,并未涉及PICO臨床問題結構完整性的評價。后者需要在方法學層面單獨進行規范。