引用本文: 張孌, 王洋洋, 王旭, 謝潤生, 李肅, 陳耀龍, 李慧. 中國中醫藥指南與共識的科學性、透明性和適用性評價(2022年). 中國循證醫學雜志, 2024, 24(8): 959-966. doi: 10.7507/1672-2531.202311101 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
臨床實踐指南旨在幫助臨床醫生和患者在特定情況下做出恰當的醫療保健決策[1]。高質量指南與共識能有效規范診療行為、提高醫療質量以及降低醫療成本[2-5]。制訂高質量的中醫藥指南既是規范臨床中醫診療,提高疾病治療水平的需要,又是優化醫療服務質量,緩和醫患關系緊張的需要,更是中醫藥現代化、國際化的需要[6-8]。當前中醫藥指南與共識的制訂工作快速發展,截至2022年已累計制訂發布近千部指南[9,10]。在數量快速增長的同時,指南與共識的制訂情況、質量水平成為當前重點關注問題。
2021年,中華醫學會雜志社指南與標準研究中心聯合世界衛生組織指南實施與知識轉化合作中心,發布了《指南科學性、透明性和適用性評級工具》(scientific, transparent and applicable rankings tool,STAR),包括11個領域、39項條目[11-13]。STAR工作組自2021年起對醫學期刊每年發表的中國指南與共識進行STAR綜合評價并對其結果進行報道[14,15]。
為評價中醫藥領域指南與共識的質量及現狀,使評價工作更有針對性和專業性,2022年設立STAR中醫藥專業委員會[16],負責中醫藥指南與共識的評價工作。中醫藥專業委員會聯合STAR秘書組采用STAR對2022年度醫學期刊發表的中醫藥指南與共識進行評價,以期反映中醫藥指南與共識的質量及現狀,促進指南與共識的質量提升。本文作者皆為中醫藥專業委員會和STAR秘書組的工作成員,共同承擔完成了本次評價工作,現對評價結果進行分析和報告。
1 資料與方法
1.1 納入與排除標準
納入標準:① 標題包含“指南”“指引”“推薦意見”“guideline(s)”“recommendation(s)”“共識”“consensus”之一;② 關注臨床或公共衛生問題;③ 制訂機構為中國單位或牽頭人為中國學者;④ 發表在同行評審期刊;⑤ 發表語種為中文或英文;⑥ 公開發表時間為2022年;⑦ 中醫藥或中西醫結合領域的指南與共識。
排除標準:① 重復文獻;② 非期刊首發的指南與共識;③ 涉及針灸推拿領域的指南與共識;④ 多期刊或分章節發表(僅保留1篇);⑤ 指南與共識因材料不齊或其他原因退出評級。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、CBM、中華醫學期刊網等中文數據庫和MEDLINE(PubMed)數據庫,收集國內外中醫藥領域指南與共識,補充檢索香港期刊在線、港澳期刊網、澳門期刊論文索引和臺灣期刊論文索引網站。限定的檢索時間分2次,分別為2022年1月1日至7月31日和2022年1月1日至12月31日。檢索詞包括:指南、指引、推薦意見、專家意見、專家建議、guideline*、recommendation*、共識、consensus等。
1.3 指南與共識的篩選
由2名人員獨立篩選文獻并核對。如遇分歧,通過討論或咨詢指導委員會專家解決。篩選獲得指南與共識后,通過郵件聯系文獻通信作者、官方網站和微信平臺公示等方式收集STAR要求的補充材料。包括但不限于計劃書、利益沖突聲明表、檢索策略、共識記錄和推廣傳播文件等。
1.4 一致性測試
在正式評價前,中醫藥專業委員會的評價委員進行預試驗以測試委員間的評價一致性。秘書組對一致性測試結果進行ICC檢驗,ICC值介于0至1,檢驗水準α=0.05。當ICC<0.40,一致性差;0.40≤ICC<0.60,一致性中等;0.61≤ICC<0.75,一致性良好;0.75≤ICC≤1.00,一致性高[17]。
1.5 指南評價
使用STAR對納入的指南與共識進行評價。首先2名評價委員各自獨立評分,然后交叉核對評價結果,如有分歧通過參照評級規則或咨詢秘書組仲裁。依據指南與共識全文以及其補充材料獨立判斷其是否符合各條目要求,符合的條目賦1分,部分符合(僅部分條目適用)賦0.5分,不符合或條目不適用均賦0分。通過Excel 2019軟件計算得分率。條目得分率=條目實際總得分/條目理論最大總分×100%。領域得分率=領域實際總得分/領域理論最大總分×100%。
1.6 質量控制
① 復查:中醫藥專業委員會對評價結果進行復核。② 監察:STAR工作組抽檢25%評價結果,監察評價工作的準確性。③ 秘書組邀請未參與STAR評級工作的外部專家對評級結果進行評審。
1.7 統計分析
以得分率為評價指標,采用描述性分析方法報告指南與共識的總體情況。指南評價:① 各領域與條目得分率;② 中醫藥指南與全國指南得分率的對比分析;③ 分層分析。以不同發表期刊、制訂機構、學科專業、資助類別等為分層因素,進行得分率比較。
共識評價:① 各領域與條目得分率;② 中醫藥共識與全國共識得分率的對比分析;③ 分層分析。以不同發表期刊、制訂機構、學科專業、資助類別等為分層因素,進行得分率比較。
總體情況采用描述性統計分析,并繪制統計圖表。統計學分析使用SPSS 17.0軟件,顯著性檢驗采用單因素方差分析,兩兩比較采用LSD檢驗,檢驗水準為α=0.05。
2 結果
2.1 總體情況
2.1.1 評價對象
最終納入2022年度中醫藥指南與共識130篇,其中指南36篇,共識94篇(篩選過程見附件圖1)。
2.1.2 一致性評價結果
一致性ICC值為0.877[95%CI(0.810,0.927)],一致性程度高。
2.1.3 總得分率
評價領域:中醫藥指南與共識總得分率較高的3個評價領域依次是“推薦意見”“工作組”“資助”;得分率較低的評價領域依次為“計劃書”“注冊”“其他”;評價條目:指南與共識總得分率較高的3個條目依次為條目8、條目5和條目19,得分率較低的條目依次為條目36、條目6和條目4(表1)。

2.2 指南評價
2.2.1 領域與條目得分率
評價領域:指南得分率較高的3個領域依次是“推薦意見”“證據”“工作組”,得分率較低的評價領域依次為“計劃書”“注冊”“可及性”;評價條目:指南得分率較高的3個條目依次為條目19、條目5和條目8,得分率較低的條目依次為條目4、條目6和條目36(圖1)。
2.2.2 中醫藥指南與全國指南得分率對比
中醫藥指南和全國指南得分率最高的領域均為“推薦意見”,最低均為“計劃書”。在11個領域中,除“計劃書”“可及性”“其他”中醫藥指南得分率均高于全國指南(圖2)。
2.2.3 分層分析
① 發表期刊:以發表期刊為分層因素(發布指南數量≥3且排前4位的雜志),對比各期刊發布指南的得分率。結果顯示總得分率由高到低依次為中國中西醫結合雜志、中醫雜志、其他及世界中醫藥雜志,差異有統計學意義。各發表期刊在資助、工作組、利益沖突、臨床問題、證據、推薦意見、可及性、其他等評價領域的得分率差異有統計學意義(表2)。② 發布機構:以制訂機構為分層因素(發布指南數量前4位機構),對比各機構發布指南的得分率。結果顯示總得分率由高到低依次為中國中藥協會、中華中醫藥學會、其他、世界中醫藥學會聯合會及中國醫師協會,差異有統計學意義。各制訂機構在工作組、利益沖突、臨床問題、證據、推薦意見、可及性、其他等評價領域差異有統計學意義。③ 學科專業:以學科專業為分層因素(發布指南數量前4位學科專業),對比各學科發布指南的得分率。結果顯示總得分率差異無統計學意義。各學科專業在工作組評價領域差異有統計學意義。④ 資助類別:以資助類別為分層因素,對比各資助類別的指南得分率(資助作為分層因素,因此不做評價領域的統計分析)。結果顯示總得分率、各評價領域得分率差異均無統計學意義。

2.3 共識
2.3.1 共識領域與條目得分率
評價領域:共識得分率較高的3個領域依次是“推薦意見”“工作組”“資助”,得分率較低的評價領域依次為“計劃書”“注冊”“其他”;評價條目:共識得分率較高的3個條目依次為條目8、條目19和條目5,得分率較低的條目依次為條目36、條目6和條目14(圖1)。
2.3.2 中醫藥共識與全國共識領域得分率對比
中醫藥共識和全國共識得分率最高的領域均為“推薦意見”,最低均為“計劃書”。在11個領域中,除“資助”與“工作組”領域,中醫藥共識均低于全國共識(圖2)。
2.3.3 分層分析
① 發表期刊:以發表期刊為分層因素(同指南部分),對比各期刊發布共識的得分率。結果顯示總得分率由高到低依次為中國中西醫結合雜志、中醫雜志、其他、中國中西醫結合外科雜志及上海中醫藥雜志,差異有統計學意義。在領域得分率方面,各期刊在注冊、計劃、利益沖突、證據、共識方法、可及性領域差異有統計學意義(表3)。② 制訂機構:以制訂機構為分層因素(同指南部分),對比各機構發布共識的得分率。結果顯示總得分率由高到低依次為中華中醫藥學會、共識項目組、中國中西醫結合學會、其他及世界中醫藥學會聯合會,差異有統計學意義。在領域得分率方面,各制訂機構在注冊、計劃、共識方法領域差異有統計學意義。③ 學科專業:以學科類別為分層因素(同指南部分),對比各學科發布指南的得分率。結果顯示總得分率由高到低依次為婦科、外科、兒科、內科及其他,差異有統計學意義。在領域得分率方面,各學科專業在注冊、臨床問題、證據領域差異有統計學意義。④ 資助類別:以資助類別為分層因素(同指南部分),對比各資助類別的共識得分率。結果顯示總得分率由高到低依次為商業、學/協會、無資助、國家級及省部級,差異有統計學意義。在領域得分率方面,各資助類別在工作組、共識方法、推薦意見領域差異有統計學意義。

3 討論
3.1 中醫藥指南與共識的數量與質量持續提高
2022年度共有130篇中醫藥指南與共識納入本次評價,是STAR各專科委員會中評價指南與共識數量最多的專科(例:2022年度腫瘤學專科委員會121部,數量排名第2;兒科學76部,排名第3)[14]。提示中醫藥領域對規范化診療工作的重視提高,制訂指南與共識的數量呈增長趨勢。雖然中醫藥領域指南與共識發布數量最多,但中醫藥學科內還包括了各二級學科,還有較大提升空間。
中醫藥指南總體呈現較高質量水平,總得分率高于全國指南,今后在研制過程中應更加關注“注冊”“計劃書”“可及性”等領域。中醫藥共識總得分率低于全國共識,總體質量有較大提升空間,今后在研制過程中應更加關注“計劃書”“注冊”“其他”等領域。
3.2 中醫藥指南與共識的質量差異
中醫藥指南在“工作組”“臨床問題”“證據”“推薦意見”領域得分率較高,說明制訂過程中重點關注研究團隊組建、臨床問題的凝練、證據的系統評價和臨床決策方案的提出等指南制訂的核心內容[18],是指南科學性的重要保障。在“注冊”“計劃書”“可及性”領域得分率較低,說明尚未對指南的透明性及應用性方面的內容給予充分關注。而且與目前廣泛使用的AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)[19-21]和衛生保健實踐指南的報告條目(reporting items for practice guidelines in healthcare,RIGHT)[22-25]等評價工具相比,“注冊”“計劃書”“可及性”領域是STAR新增的領域,尚未引起指南制訂者的重視。
中醫藥共識在“資助”“工作組”“推薦意見”領域得分率較高,說明在循證證據不充分時制訂共識,重點關注研究團隊組建、臨床決策方案的提出等方面內容。在“注冊”“計劃書”等領域得分率較低,說明尚未對共識的透明性及應用性方面的內容給予充分關注。
中醫藥指南的得分率在總體和各評價領域均高于共識,說明指南的科學性、透明性、適用性等方面均顯著高于共識。制訂指南需要投入較高成本,共識的制訂相對簡便,筆者建議在資源條件允許的情況下,應將科學性作為研制工作的重要原則。
3.3 中醫藥指南與共識質量的影響因素
分層分析顯示,期刊雜志、制訂機構是中醫藥指南總得分率的影響因素,發表期刊、制訂機構、學科專業、資助類別是中醫藥共識總得分率的影響因素。提示:① 以上影響因素可能在指南與共識的制訂和報道過程中產生影響。② 共識制訂和報道過程中受外部影響較多,指南制訂較為嚴格,受外部因素影響相對較小。③ 制訂和推廣中醫藥指南研制程序與方法標準,可提高行業整體研制水平。
3.4 研究的局限性
本研究基于醫學期刊公開發表的指南與共識,因此未納入未在期刊公開發表的指南與共識,評價對象尚不夠充分全面。STAR首次應用于中醫藥指南與共識的評級,在中醫藥領域的適用性情況尚需進一步研究。
指南質量評價工具AGREE Ⅱ[19-21]和STAR[12,13]均重視指南制訂的科學性和適用性的評估,但側重點和表述各有不同。兩者均重視資助、利益沖突、團隊成員信息、證據系統檢索、評價、分級、推薦意見形成且推薦意見明確、易識別等方面的內容。AGREE Ⅱ的“范圍和目的”領域更加強調指南目的、適用人群的報告,而STAR相似領域(“臨床問題”)更強調臨床問題收集和遴選方法的設置。AGREE Ⅱ“利益相關者的參與”領域更加強調患者偏好與觀點和目標使用者的報告,而STAR相似領域(“工作組”)更強調多學科專家的納入。AGREE Ⅱ“指南制訂的嚴謹性”領域更加強調外部評審和指南更新的說明,而STAR相似領域(“證據”和“共識方法”)強調文獻可追溯性和研究空白領域的報告。AGREE Ⅱ更側重指南的“應用性”,而STAR更側重指南的“可及性”。
此外,STAR更加注重指南制訂的透明性。STAR增設了“注冊”“計劃書”領域,這兩個領域強調對指南注冊信息和計劃書的公開獲取,體現了STAR對指南制訂過程中透明性的重視。同時STAR的11個領域根據指南制訂順序設置,更便于指南制訂者在指南制訂流程中進行參考。
綜上所述,作為醫療指導文件,中醫藥指南總體質量較高,而中醫藥共識總體質量偏低。指南與共識制訂者需要重視指南與共識制訂過程中的薄弱環節,遵循中醫(中西醫結合)臨床實踐指南的制訂方法,充分論證指南選題、撰寫指南計劃書并注冊、進行利益沖突聲明以提高指南制訂的透明化[26];遴選重要的臨床問題并構建PICO、系統獲取臨床證據、進行證據質量與推薦分級以提高指南制訂的科學性[27];同時,制訂時充分考慮、綜合患者偏好與價值觀、實施應用等相關因素以提高指南的適用性[28]。參考STAR評級表的評級條目,制訂出高質量的指南與共識。
致謝 本研究得到STAR秘書處、STAR中醫藥專業委員會、STAR針灸推拿專業委員會參與此次評價工作的全體人員支持,一并致謝。
臨床實踐指南旨在幫助臨床醫生和患者在特定情況下做出恰當的醫療保健決策[1]。高質量指南與共識能有效規范診療行為、提高醫療質量以及降低醫療成本[2-5]。制訂高質量的中醫藥指南既是規范臨床中醫診療,提高疾病治療水平的需要,又是優化醫療服務質量,緩和醫患關系緊張的需要,更是中醫藥現代化、國際化的需要[6-8]。當前中醫藥指南與共識的制訂工作快速發展,截至2022年已累計制訂發布近千部指南[9,10]。在數量快速增長的同時,指南與共識的制訂情況、質量水平成為當前重點關注問題。
2021年,中華醫學會雜志社指南與標準研究中心聯合世界衛生組織指南實施與知識轉化合作中心,發布了《指南科學性、透明性和適用性評級工具》(scientific, transparent and applicable rankings tool,STAR),包括11個領域、39項條目[11-13]。STAR工作組自2021年起對醫學期刊每年發表的中國指南與共識進行STAR綜合評價并對其結果進行報道[14,15]。
為評價中醫藥領域指南與共識的質量及現狀,使評價工作更有針對性和專業性,2022年設立STAR中醫藥專業委員會[16],負責中醫藥指南與共識的評價工作。中醫藥專業委員會聯合STAR秘書組采用STAR對2022年度醫學期刊發表的中醫藥指南與共識進行評價,以期反映中醫藥指南與共識的質量及現狀,促進指南與共識的質量提升。本文作者皆為中醫藥專業委員會和STAR秘書組的工作成員,共同承擔完成了本次評價工作,現對評價結果進行分析和報告。
1 資料與方法
1.1 納入與排除標準
納入標準:① 標題包含“指南”“指引”“推薦意見”“guideline(s)”“recommendation(s)”“共識”“consensus”之一;② 關注臨床或公共衛生問題;③ 制訂機構為中國單位或牽頭人為中國學者;④ 發表在同行評審期刊;⑤ 發表語種為中文或英文;⑥ 公開發表時間為2022年;⑦ 中醫藥或中西醫結合領域的指南與共識。
排除標準:① 重復文獻;② 非期刊首發的指南與共識;③ 涉及針灸推拿領域的指南與共識;④ 多期刊或分章節發表(僅保留1篇);⑤ 指南與共識因材料不齊或其他原因退出評級。
1.2 文獻檢索策略
計算機檢索CNKI、WanFang Data、CBM、中華醫學期刊網等中文數據庫和MEDLINE(PubMed)數據庫,收集國內外中醫藥領域指南與共識,補充檢索香港期刊在線、港澳期刊網、澳門期刊論文索引和臺灣期刊論文索引網站。限定的檢索時間分2次,分別為2022年1月1日至7月31日和2022年1月1日至12月31日。檢索詞包括:指南、指引、推薦意見、專家意見、專家建議、guideline*、recommendation*、共識、consensus等。
1.3 指南與共識的篩選
由2名人員獨立篩選文獻并核對。如遇分歧,通過討論或咨詢指導委員會專家解決。篩選獲得指南與共識后,通過郵件聯系文獻通信作者、官方網站和微信平臺公示等方式收集STAR要求的補充材料。包括但不限于計劃書、利益沖突聲明表、檢索策略、共識記錄和推廣傳播文件等。
1.4 一致性測試
在正式評價前,中醫藥專業委員會的評價委員進行預試驗以測試委員間的評價一致性。秘書組對一致性測試結果進行ICC檢驗,ICC值介于0至1,檢驗水準α=0.05。當ICC<0.40,一致性差;0.40≤ICC<0.60,一致性中等;0.61≤ICC<0.75,一致性良好;0.75≤ICC≤1.00,一致性高[17]。
1.5 指南評價
使用STAR對納入的指南與共識進行評價。首先2名評價委員各自獨立評分,然后交叉核對評價結果,如有分歧通過參照評級規則或咨詢秘書組仲裁。依據指南與共識全文以及其補充材料獨立判斷其是否符合各條目要求,符合的條目賦1分,部分符合(僅部分條目適用)賦0.5分,不符合或條目不適用均賦0分。通過Excel 2019軟件計算得分率。條目得分率=條目實際總得分/條目理論最大總分×100%。領域得分率=領域實際總得分/領域理論最大總分×100%。
1.6 質量控制
① 復查:中醫藥專業委員會對評價結果進行復核。② 監察:STAR工作組抽檢25%評價結果,監察評價工作的準確性。③ 秘書組邀請未參與STAR評級工作的外部專家對評級結果進行評審。
1.7 統計分析
以得分率為評價指標,采用描述性分析方法報告指南與共識的總體情況。指南評價:① 各領域與條目得分率;② 中醫藥指南與全國指南得分率的對比分析;③ 分層分析。以不同發表期刊、制訂機構、學科專業、資助類別等為分層因素,進行得分率比較。
共識評價:① 各領域與條目得分率;② 中醫藥共識與全國共識得分率的對比分析;③ 分層分析。以不同發表期刊、制訂機構、學科專業、資助類別等為分層因素,進行得分率比較。
總體情況采用描述性統計分析,并繪制統計圖表。統計學分析使用SPSS 17.0軟件,顯著性檢驗采用單因素方差分析,兩兩比較采用LSD檢驗,檢驗水準為α=0.05。
2 結果
2.1 總體情況
2.1.1 評價對象
最終納入2022年度中醫藥指南與共識130篇,其中指南36篇,共識94篇(篩選過程見附件圖1)。
2.1.2 一致性評價結果
一致性ICC值為0.877[95%CI(0.810,0.927)],一致性程度高。
2.1.3 總得分率
評價領域:中醫藥指南與共識總得分率較高的3個評價領域依次是“推薦意見”“工作組”“資助”;得分率較低的評價領域依次為“計劃書”“注冊”“其他”;評價條目:指南與共識總得分率較高的3個條目依次為條目8、條目5和條目19,得分率較低的條目依次為條目36、條目6和條目4(表1)。

2.2 指南評價
2.2.1 領域與條目得分率
評價領域:指南得分率較高的3個領域依次是“推薦意見”“證據”“工作組”,得分率較低的評價領域依次為“計劃書”“注冊”“可及性”;評價條目:指南得分率較高的3個條目依次為條目19、條目5和條目8,得分率較低的條目依次為條目4、條目6和條目36(圖1)。
2.2.2 中醫藥指南與全國指南得分率對比
中醫藥指南和全國指南得分率最高的領域均為“推薦意見”,最低均為“計劃書”。在11個領域中,除“計劃書”“可及性”“其他”中醫藥指南得分率均高于全國指南(圖2)。
2.2.3 分層分析
① 發表期刊:以發表期刊為分層因素(發布指南數量≥3且排前4位的雜志),對比各期刊發布指南的得分率。結果顯示總得分率由高到低依次為中國中西醫結合雜志、中醫雜志、其他及世界中醫藥雜志,差異有統計學意義。各發表期刊在資助、工作組、利益沖突、臨床問題、證據、推薦意見、可及性、其他等評價領域的得分率差異有統計學意義(表2)。② 發布機構:以制訂機構為分層因素(發布指南數量前4位機構),對比各機構發布指南的得分率。結果顯示總得分率由高到低依次為中國中藥協會、中華中醫藥學會、其他、世界中醫藥學會聯合會及中國醫師協會,差異有統計學意義。各制訂機構在工作組、利益沖突、臨床問題、證據、推薦意見、可及性、其他等評價領域差異有統計學意義。③ 學科專業:以學科專業為分層因素(發布指南數量前4位學科專業),對比各學科發布指南的得分率。結果顯示總得分率差異無統計學意義。各學科專業在工作組評價領域差異有統計學意義。④ 資助類別:以資助類別為分層因素,對比各資助類別的指南得分率(資助作為分層因素,因此不做評價領域的統計分析)。結果顯示總得分率、各評價領域得分率差異均無統計學意義。

2.3 共識
2.3.1 共識領域與條目得分率
評價領域:共識得分率較高的3個領域依次是“推薦意見”“工作組”“資助”,得分率較低的評價領域依次為“計劃書”“注冊”“其他”;評價條目:共識得分率較高的3個條目依次為條目8、條目19和條目5,得分率較低的條目依次為條目36、條目6和條目14(圖1)。
2.3.2 中醫藥共識與全國共識領域得分率對比
中醫藥共識和全國共識得分率最高的領域均為“推薦意見”,最低均為“計劃書”。在11個領域中,除“資助”與“工作組”領域,中醫藥共識均低于全國共識(圖2)。
2.3.3 分層分析
① 發表期刊:以發表期刊為分層因素(同指南部分),對比各期刊發布共識的得分率。結果顯示總得分率由高到低依次為中國中西醫結合雜志、中醫雜志、其他、中國中西醫結合外科雜志及上海中醫藥雜志,差異有統計學意義。在領域得分率方面,各期刊在注冊、計劃、利益沖突、證據、共識方法、可及性領域差異有統計學意義(表3)。② 制訂機構:以制訂機構為分層因素(同指南部分),對比各機構發布共識的得分率。結果顯示總得分率由高到低依次為中華中醫藥學會、共識項目組、中國中西醫結合學會、其他及世界中醫藥學會聯合會,差異有統計學意義。在領域得分率方面,各制訂機構在注冊、計劃、共識方法領域差異有統計學意義。③ 學科專業:以學科類別為分層因素(同指南部分),對比各學科發布指南的得分率。結果顯示總得分率由高到低依次為婦科、外科、兒科、內科及其他,差異有統計學意義。在領域得分率方面,各學科專業在注冊、臨床問題、證據領域差異有統計學意義。④ 資助類別:以資助類別為分層因素(同指南部分),對比各資助類別的共識得分率。結果顯示總得分率由高到低依次為商業、學/協會、無資助、國家級及省部級,差異有統計學意義。在領域得分率方面,各資助類別在工作組、共識方法、推薦意見領域差異有統計學意義。

3 討論
3.1 中醫藥指南與共識的數量與質量持續提高
2022年度共有130篇中醫藥指南與共識納入本次評價,是STAR各專科委員會中評價指南與共識數量最多的專科(例:2022年度腫瘤學專科委員會121部,數量排名第2;兒科學76部,排名第3)[14]。提示中醫藥領域對規范化診療工作的重視提高,制訂指南與共識的數量呈增長趨勢。雖然中醫藥領域指南與共識發布數量最多,但中醫藥學科內還包括了各二級學科,還有較大提升空間。
中醫藥指南總體呈現較高質量水平,總得分率高于全國指南,今后在研制過程中應更加關注“注冊”“計劃書”“可及性”等領域。中醫藥共識總得分率低于全國共識,總體質量有較大提升空間,今后在研制過程中應更加關注“計劃書”“注冊”“其他”等領域。
3.2 中醫藥指南與共識的質量差異
中醫藥指南在“工作組”“臨床問題”“證據”“推薦意見”領域得分率較高,說明制訂過程中重點關注研究團隊組建、臨床問題的凝練、證據的系統評價和臨床決策方案的提出等指南制訂的核心內容[18],是指南科學性的重要保障。在“注冊”“計劃書”“可及性”領域得分率較低,說明尚未對指南的透明性及應用性方面的內容給予充分關注。而且與目前廣泛使用的AGREE Ⅱ(appraisal of guidelines for research and evaluation Ⅱ)[19-21]和衛生保健實踐指南的報告條目(reporting items for practice guidelines in healthcare,RIGHT)[22-25]等評價工具相比,“注冊”“計劃書”“可及性”領域是STAR新增的領域,尚未引起指南制訂者的重視。
中醫藥共識在“資助”“工作組”“推薦意見”領域得分率較高,說明在循證證據不充分時制訂共識,重點關注研究團隊組建、臨床決策方案的提出等方面內容。在“注冊”“計劃書”等領域得分率較低,說明尚未對共識的透明性及應用性方面的內容給予充分關注。
中醫藥指南的得分率在總體和各評價領域均高于共識,說明指南的科學性、透明性、適用性等方面均顯著高于共識。制訂指南需要投入較高成本,共識的制訂相對簡便,筆者建議在資源條件允許的情況下,應將科學性作為研制工作的重要原則。
3.3 中醫藥指南與共識質量的影響因素
分層分析顯示,期刊雜志、制訂機構是中醫藥指南總得分率的影響因素,發表期刊、制訂機構、學科專業、資助類別是中醫藥共識總得分率的影響因素。提示:① 以上影響因素可能在指南與共識的制訂和報道過程中產生影響。② 共識制訂和報道過程中受外部影響較多,指南制訂較為嚴格,受外部因素影響相對較小。③ 制訂和推廣中醫藥指南研制程序與方法標準,可提高行業整體研制水平。
3.4 研究的局限性
本研究基于醫學期刊公開發表的指南與共識,因此未納入未在期刊公開發表的指南與共識,評價對象尚不夠充分全面。STAR首次應用于中醫藥指南與共識的評級,在中醫藥領域的適用性情況尚需進一步研究。
指南質量評價工具AGREE Ⅱ[19-21]和STAR[12,13]均重視指南制訂的科學性和適用性的評估,但側重點和表述各有不同。兩者均重視資助、利益沖突、團隊成員信息、證據系統檢索、評價、分級、推薦意見形成且推薦意見明確、易識別等方面的內容。AGREE Ⅱ的“范圍和目的”領域更加強調指南目的、適用人群的報告,而STAR相似領域(“臨床問題”)更強調臨床問題收集和遴選方法的設置。AGREE Ⅱ“利益相關者的參與”領域更加強調患者偏好與觀點和目標使用者的報告,而STAR相似領域(“工作組”)更強調多學科專家的納入。AGREE Ⅱ“指南制訂的嚴謹性”領域更加強調外部評審和指南更新的說明,而STAR相似領域(“證據”和“共識方法”)強調文獻可追溯性和研究空白領域的報告。AGREE Ⅱ更側重指南的“應用性”,而STAR更側重指南的“可及性”。
此外,STAR更加注重指南制訂的透明性。STAR增設了“注冊”“計劃書”領域,這兩個領域強調對指南注冊信息和計劃書的公開獲取,體現了STAR對指南制訂過程中透明性的重視。同時STAR的11個領域根據指南制訂順序設置,更便于指南制訂者在指南制訂流程中進行參考。
綜上所述,作為醫療指導文件,中醫藥指南總體質量較高,而中醫藥共識總體質量偏低。指南與共識制訂者需要重視指南與共識制訂過程中的薄弱環節,遵循中醫(中西醫結合)臨床實踐指南的制訂方法,充分論證指南選題、撰寫指南計劃書并注冊、進行利益沖突聲明以提高指南制訂的透明化[26];遴選重要的臨床問題并構建PICO、系統獲取臨床證據、進行證據質量與推薦分級以提高指南制訂的科學性[27];同時,制訂時充分考慮、綜合患者偏好與價值觀、實施應用等相關因素以提高指南的適用性[28]。參考STAR評級表的評級條目,制訂出高質量的指南與共識。
致謝 本研究得到STAR秘書處、STAR中醫藥專業委員會、STAR針灸推拿專業委員會參與此次評價工作的全體人員支持,一并致謝。