引用本文: 樊子娟, 李帝均, 閆磊, 邢丹, 周奇, 王斌. 中國骨科臨床實踐指南及共識的質量評價. 中國循證醫學雜志, 2024, 24(7): 832-837. doi: 10.7507/1672-2531.202402052 復制
臨床實踐指南(以下簡稱“指南”)是根據系統生成的證據,對各種備選干預方式進行利弊評價和權衡之后提出的最佳推薦意見,能夠規范臨床醫生的診療行為,并為患者提供合適的建議與參考[1,2]。指南方法學與報告質量評價有助于指南制訂者規范化制訂指南,促進其傳播與應用。指南研究與評價工具(appraisal of guidelines for research and evaluation,AGREE)[3]和衛生保健實踐指南的報告條目(reporting items for practice guidelines in healthcare,RIGHT)[4]是目前國際通用的指南質量評級工具。然而AGREE和RIGHT在評價我國已發表的指南時,存在未納入影響指南質量的關鍵因素、不適用于共識評價及評價維度單一等問題[5,6]。為解決上述問題,我國于2022年發布了針對臨床實踐指南科學性、透明性和適用性評級工具(scientific, transparent and applicable rankings,STAR)[7]。
近年來,國內外骨科發展迅速,各種新技術、新材料、新器械和新理念不斷推出[8]。在中華醫學會和中國醫師協會等學術團體的指導下,我國骨科專業的臨床實踐指南與專家共識的數量也逐漸增多。隨著循證醫學理念不斷深入,越來越多指南和專家共識開始采用系統評價與證據共識方法形成推薦意見。此前,我們已對2016年之前發表的54篇臨床骨科指南進行方法學評價[5],發現AGREE工具僅評價了不同條目的報告情況,無法對指南內容進行有效評價,且此評價距今已有較長時間。因此,本研究擬采用滿足中國指南綜合評價需求的STAR工具評價近年來國內已發布的骨科臨床實踐指南與專家共識,為提高中國骨科臨床實踐指南質量提供參考和建議。
1 資料與方法
1.1 工作小組
評價工作組由骨科領域臨床醫師、循證醫學專家和指南方法學專家組成。參與評價工作的人員為STAR工作組委員,已多次參與骨科指南及共識的制訂工作,具有一定專業性和權威性。
1.2 納入與排除標準
1.2.1 納入標準
涉及創傷、脊柱、關節、骨腫瘤、骨病等骨科相關領域的指南和共識。語種限中文。
1.2.2 排除標準
重復發布的指南;指南解讀文章;指南和共識的方法學文章。
1.3 文獻檢索策略
計算機檢索CNKI、WanFang Data與SinoMed數據庫,搜集在中國期刊上發布的骨科指南與共識,檢索時限均從2016年1月至2023年10月23日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。中文檢索詞包括:指南、共識、骨、關節、脊柱等。檢索過程由兩名研究人員獨立進行并核對,如有爭議則通過協商解決。以SinoMed為例,具體檢索策略見附件框1。
1.4 文獻篩選及資料提取
使用Endnote X9對納入文獻進行去重、篩查。由2位研究者獨立進行文獻篩選、數據提取和質量評價,若有分歧則通過討論或交第三方裁定來解決。文獻篩選時,首先閱讀文題和摘要,在排除不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:指南的名稱、期刊、發表年份、主要制訂機構、指導類型、目標人群、目標用戶、是否注冊、有無基金支持、工作組有無方法學專家或循證醫學專家、是否存在利益沖突說明。
1.5 質量評價
采用STAR評級工具對納入的骨科指南和共識進行綜合評價[7]。該工具共包括39個評價條目,涵蓋11個領域,分別是注冊、計劃書、資助、工作組、利益沖突、臨床問題、證據、共識方法、推薦意見、可及性和其他。根據以前指南評價經驗,設定各領域的權重分別是0.050、0.050、0.031、0.073、0.092、0.170、0.170、0.107、0.170、0.073及0.012。
1.6 統計分析
STAR評價工具的領域得分比及條目得分比計算公式見公式(1)、公式(2)。總分為39個條目分值的總和,滿分為100分,分數越高則越說明該指南的科學性、透明性和適用性綜合評級較好。采用Excel軟件計算得分。在SPSS 25.0軟件中對兩名評價者評分的一致性采用Kappa值評估(0.0~0.20說明一致性極低,0.21~0.40說明一致性一般,0.41~0.60說明一致性中等,0.61~0.80說明一致性較高,0.81~1表明一致性幾乎完全一致)。
![]() |
![]() |
2 結果
2.1 文獻檢索結果
計算機初檢出相關文獻3 856篇,通過其他資源獲得文獻32篇。經過閱讀標題、摘要與原文后共獲得191篇骨科相關指南和共識,其中指南74篇,共識117篇。文獻篩選流程和結果見附件圖1。

2.2 納入指南和共識的基本特征
整體而言,骨科共識的發表數量遠高于骨科指南。自2019年之后,指南及共識的發表數量大幅度上升。發表骨科指南及共識最多的雜志為《中華骨科雜志》及《中華骨與關節外科雜志》。納入骨科指南的基本特征見附件表1。

2.3 STAR評分結果
2.3.1 年度變化趨勢
近年來,骨科指南和共識評分整體呈上升趨勢,且指南評分基本上高于共識評分,STAR評分年度變化趨勢見圖1。但由于檢索日期限制,2023年發表的指南和共識評分無法充分展示。
2.3.2 不同領域得分情況
納入評價的骨科指南平均得分為34.4分,中位得分為29.1分,共識平均得分為21.7分,中位得分為19.9分。74篇指南在11個領域,注冊、計劃書、資助、工作組、利益沖突、臨床問題、證據、共識方法、推薦意見、可及性和其他的平均得分分別為:22.4%、7.0%、17.7%、24.7%、20.0%、21.2%、45.7%、23.2%、77.5%、17.6%、32.4%;117篇共識平均得分分別為:4.2%、0.6%、23.5%、25.9%、24.4%、10.1%、32.3%、18.9%、62.5%、8.6%、21.4%。我國骨科指南和共識各領域得分比例見圖2。2位研究人員對指南評價的Kappa值為0.684(P<0.001)。

2.3.3 不同條目得分現狀
就具體條目得分而言,骨科指南在條目33[對每條推薦意見進行解釋說明(明確識別推薦意見,譬如以圖表,放大或加粗字體,下劃線等方式呈現)]、條目34(對推薦意見在實施過程中注意事項進行了闡述)及條目19(主要推薦意見有明確的參考文獻)的得分比例最高。得分比例最低的三個條目是條目6(說明了資助在指南制訂中的作用)、條目37(以圖片、視頻等其他形式發布指南或推薦意見)。骨科共識則在條目19(主要推薦意見有明確的參考文獻)、條目33(對每條推薦意見進行解釋說明)、條目34(對推薦意見在實施過程中注意事項進行了闡述)得分比例最高。在條目4(計劃書能夠在公開平臺獲取)、條目35(通過指南、會議、網絡等多平臺發布指南)、條目36(提供不同用戶版本的指南)、條目37(以圖片、視頻等其他形式發布指南或推薦意見)得分比例最低。骨科指南和共識各條目得分見表1。
3 討論
本研究首次使用STAR評價工具對我國骨科指南與共識進行方法學評價,評價結果與STAR官網目前所公布的指南及共識結果一致。評價結果顯示,近年來我國骨科指南和共識方法學評分整體呈上升趨勢,指南平均得分基本高于共識。就具體領域而言,骨科指南在注冊、計劃書、工作組、臨床問題、證據、共識方法、推薦意見、可及性及其他領域中的得分高于共識。就具體條目而言,指南和共識均在條目34(對推薦意見在實施過程中注意事項進行了闡述)得分最高。指南與共識均在條目37(以圖片、視頻等其他形式發布指南或推薦意見)得分最低。此外,指南在條目6(說明了資助在指南制訂中的作用),共識在條目4(計劃書能夠在公開平臺獲取)和條目36(提供不同用戶版本的指南)得分比例為0%。
目前,中國骨科指南和共識質量評分整體呈上升趨勢,這與近年來指南循證理念不斷傳播與應用有關。一方面,指南循證方法學團隊不斷通過會議、學術沙龍等方式推進指南循證方法的傳播[9,10]。另一方面,一些骨科學術組織,如中華醫學會骨科學分會等,也在有意識地將指南循證方法學理念深入到指南制訂過程中[8]。此外,指南解讀類文章在利用指南方法學評價工具的基礎上對指南進行解讀,同時也在一定程度上對指南制作質量與報告規范起到監督作用。
骨科指南總體評分高于共識,這一結論與陳耀龍等[11]的研究結果類似。骨科指南評分高于專家共識可能有以下原因:① 在專家共識制作過程中,參與共識意見形成的人員大多僅限于該領域的專家[11],骨科指南及共識在條目12(明確提出工作組包含方法學家或循證醫學專家)的平均得分僅為12.8%,提示循證醫學專家或者指南方法學家參與較少;② 大多數專家共識制訂的目的僅為臨床醫生提供參考和學術性建議,并非系統規范其臨床行為;③ 參與指南制訂的專家大多認為共識在科學性、透明性和可靠性方面低于指南,因此可能會忽視共識方法學[12]。
骨科指南和共識條目占比較高的領域集中在推薦意見。推薦領域強調清晰展示已形成的推薦意見。因為推薦意見領域是對指南或共識過程的展示,是臨床醫生和患者可以直接了解推薦意見內容和強度的領域,故條目整體得分比例較高。骨科指南和共識得分占比較低的領域集中在可及性領域。指南或共識的傳播與實施,是指南從理論轉化為實踐的重要步驟。而骨科指南和共識在這一領域得分較低,可能是因為這一領域還未得到指南或共識制訂組織或專家的重視。
骨科指南在條目6(說明了資助在指南制訂中的作用)的得分比例為0。指南或共識應明確說明制訂過程中是否存在資助情況,以避免專家的主要專業判斷或行動受到不恰當影響[13,14]。我國骨科指南忽視了報告資助在指南制訂中的作用,可能會導致指南透明度降低,影響指南權威性。但是納入的骨科指南大都由中華醫學會等專業骨科學會組織牽頭制訂,行業機構在制訂過程中有一定監督作用,且具有權威性。而共識則在計劃書領域得分比例最低。提前撰寫和公開報告計劃書不僅有利于讀者監督指南制訂過程,還有利于指南制訂者更高效地完成指南的制訂[15]。因此,未來在共識制訂過程中,制訂者應重視計劃書的撰寫與發布。
AGREE和RIGHT作為國際通用的指南制訂與評價工具有著不同的使用場景。AGREE工具的開發旨在評估指南的質量,提供指南開發的方法策略,并推薦指南中應報告哪些信息,而RIGHT主要用于規范指南報告[3,16]。STAR評級工具則以解決現有指南評級工具局限性、提升中國指南質量、研發更全面的指南評級工具為目的[7]。目前,STAR工具已被應用于我國指南及共識的綜合評價中[17,18]。相較于之前的指南評價工具,STAR工具具有以下優勢:① STAR指南評級工具細化了以往指南或共識評價內容的細節;例如,IOM[2]評級工具雖然也強調指南制訂過程中的透明性,但是在條目中只是籠統強調指南的制訂和資助過程應明確詳細且公開可獲得。而STAR評級工具則將指南或共識制訂透明度的評價細化到了每一個評級領域,指南或共識的注冊、計劃書、資助等均需要公開透明。因此STAR評級工具的條目設置在指南或共識制訂的計劃階段也具有重要的參考意義。② STAR評級工具對指南或共識制訂前、后的流程亦有所關注。相較于IOM[2]和RIGHT[4]評級工具,STAR關注了指南或共識制訂的整體流程。注冊、計劃書及可及性三個領域是對制訂前后評價的重要領域,這些領域對于評價指南或共識的規范性、有效性及可轉化性具有重要意義。③ STAR評級工具更加高效,節省了使用者的時間。STAR評級工具為多維度評價工具,使用者無需采用多個評級工具評價同一指南,從而提高了綜合評價的速度,也有助于提高指南制訂者的使用依從性,最終促進指南質量的提升。
本研究具有以下特點:① 是目前國內最大規模評價骨科指南與共識方法學質量的研究;② 采用最新發布的STAR評級工具從多維度對骨科指南或共識進行評價;③ 所納入指南及共識發表時間跨度較大,可縱向了解骨科指南及共識評分的年度變化趨勢。
由于時間限制,本研究未將2023年已發表的全部骨科指南與共識納入,可能會影響評級結果的穩定性。此外,由于STAR評級工具發布時間較短,尚無法了解其發表前后骨科指南及共識的得分變化。未來我們會定期使用STAR評級工具評估我國骨科指南及共識的質量,以追蹤我國骨科指南及共識的發展趨勢。
綜上所述,近年來,我國骨科指南及共識的科學性、透明性和適用性整體呈上升趨勢。但指南及共識尚需針對計劃書、資助和可及性領域提升質量,共識制訂小組需重視共識質量。此外,STAR作為針對我國中國指南綜合評價需求的指南評價工具,對規范我國指南制訂具有重要意義,我們期待越來越多高質量指南及共識發布。
聲明 所有評級人員均不存在任何利益沖突。
臨床實踐指南(以下簡稱“指南”)是根據系統生成的證據,對各種備選干預方式進行利弊評價和權衡之后提出的最佳推薦意見,能夠規范臨床醫生的診療行為,并為患者提供合適的建議與參考[1,2]。指南方法學與報告質量評價有助于指南制訂者規范化制訂指南,促進其傳播與應用。指南研究與評價工具(appraisal of guidelines for research and evaluation,AGREE)[3]和衛生保健實踐指南的報告條目(reporting items for practice guidelines in healthcare,RIGHT)[4]是目前國際通用的指南質量評級工具。然而AGREE和RIGHT在評價我國已發表的指南時,存在未納入影響指南質量的關鍵因素、不適用于共識評價及評價維度單一等問題[5,6]。為解決上述問題,我國于2022年發布了針對臨床實踐指南科學性、透明性和適用性評級工具(scientific, transparent and applicable rankings,STAR)[7]。
近年來,國內外骨科發展迅速,各種新技術、新材料、新器械和新理念不斷推出[8]。在中華醫學會和中國醫師協會等學術團體的指導下,我國骨科專業的臨床實踐指南與專家共識的數量也逐漸增多。隨著循證醫學理念不斷深入,越來越多指南和專家共識開始采用系統評價與證據共識方法形成推薦意見。此前,我們已對2016年之前發表的54篇臨床骨科指南進行方法學評價[5],發現AGREE工具僅評價了不同條目的報告情況,無法對指南內容進行有效評價,且此評價距今已有較長時間。因此,本研究擬采用滿足中國指南綜合評價需求的STAR工具評價近年來國內已發布的骨科臨床實踐指南與專家共識,為提高中國骨科臨床實踐指南質量提供參考和建議。
1 資料與方法
1.1 工作小組
評價工作組由骨科領域臨床醫師、循證醫學專家和指南方法學專家組成。參與評價工作的人員為STAR工作組委員,已多次參與骨科指南及共識的制訂工作,具有一定專業性和權威性。
1.2 納入與排除標準
1.2.1 納入標準
涉及創傷、脊柱、關節、骨腫瘤、骨病等骨科相關領域的指南和共識。語種限中文。
1.2.2 排除標準
重復發布的指南;指南解讀文章;指南和共識的方法學文章。
1.3 文獻檢索策略
計算機檢索CNKI、WanFang Data與SinoMed數據庫,搜集在中國期刊上發布的骨科指南與共識,檢索時限均從2016年1月至2023年10月23日。此外,追溯納入文獻的參考文獻,以補充獲取相關文獻。中文檢索詞包括:指南、共識、骨、關節、脊柱等。檢索過程由兩名研究人員獨立進行并核對,如有爭議則通過協商解決。以SinoMed為例,具體檢索策略見附件框1。
1.4 文獻篩選及資料提取
使用Endnote X9對納入文獻進行去重、篩查。由2位研究者獨立進行文獻篩選、數據提取和質量評價,若有分歧則通過討論或交第三方裁定來解決。文獻篩選時,首先閱讀文題和摘要,在排除不相關的文獻后,進一步閱讀全文,以確定最終是否納入。資料提取內容主要包括:指南的名稱、期刊、發表年份、主要制訂機構、指導類型、目標人群、目標用戶、是否注冊、有無基金支持、工作組有無方法學專家或循證醫學專家、是否存在利益沖突說明。
1.5 質量評價
采用STAR評級工具對納入的骨科指南和共識進行綜合評價[7]。該工具共包括39個評價條目,涵蓋11個領域,分別是注冊、計劃書、資助、工作組、利益沖突、臨床問題、證據、共識方法、推薦意見、可及性和其他。根據以前指南評價經驗,設定各領域的權重分別是0.050、0.050、0.031、0.073、0.092、0.170、0.170、0.107、0.170、0.073及0.012。
1.6 統計分析
STAR評價工具的領域得分比及條目得分比計算公式見公式(1)、公式(2)。總分為39個條目分值的總和,滿分為100分,分數越高則越說明該指南的科學性、透明性和適用性綜合評級較好。采用Excel軟件計算得分。在SPSS 25.0軟件中對兩名評價者評分的一致性采用Kappa值評估(0.0~0.20說明一致性極低,0.21~0.40說明一致性一般,0.41~0.60說明一致性中等,0.61~0.80說明一致性較高,0.81~1表明一致性幾乎完全一致)。
![]() |
![]() |
2 結果
2.1 文獻檢索結果
計算機初檢出相關文獻3 856篇,通過其他資源獲得文獻32篇。經過閱讀標題、摘要與原文后共獲得191篇骨科相關指南和共識,其中指南74篇,共識117篇。文獻篩選流程和結果見附件圖1。

2.2 納入指南和共識的基本特征
整體而言,骨科共識的發表數量遠高于骨科指南。自2019年之后,指南及共識的發表數量大幅度上升。發表骨科指南及共識最多的雜志為《中華骨科雜志》及《中華骨與關節外科雜志》。納入骨科指南的基本特征見附件表1。

2.3 STAR評分結果
2.3.1 年度變化趨勢
近年來,骨科指南和共識評分整體呈上升趨勢,且指南評分基本上高于共識評分,STAR評分年度變化趨勢見圖1。但由于檢索日期限制,2023年發表的指南和共識評分無法充分展示。
2.3.2 不同領域得分情況
納入評價的骨科指南平均得分為34.4分,中位得分為29.1分,共識平均得分為21.7分,中位得分為19.9分。74篇指南在11個領域,注冊、計劃書、資助、工作組、利益沖突、臨床問題、證據、共識方法、推薦意見、可及性和其他的平均得分分別為:22.4%、7.0%、17.7%、24.7%、20.0%、21.2%、45.7%、23.2%、77.5%、17.6%、32.4%;117篇共識平均得分分別為:4.2%、0.6%、23.5%、25.9%、24.4%、10.1%、32.3%、18.9%、62.5%、8.6%、21.4%。我國骨科指南和共識各領域得分比例見圖2。2位研究人員對指南評價的Kappa值為0.684(P<0.001)。

2.3.3 不同條目得分現狀
就具體條目得分而言,骨科指南在條目33[對每條推薦意見進行解釋說明(明確識別推薦意見,譬如以圖表,放大或加粗字體,下劃線等方式呈現)]、條目34(對推薦意見在實施過程中注意事項進行了闡述)及條目19(主要推薦意見有明確的參考文獻)的得分比例最高。得分比例最低的三個條目是條目6(說明了資助在指南制訂中的作用)、條目37(以圖片、視頻等其他形式發布指南或推薦意見)。骨科共識則在條目19(主要推薦意見有明確的參考文獻)、條目33(對每條推薦意見進行解釋說明)、條目34(對推薦意見在實施過程中注意事項進行了闡述)得分比例最高。在條目4(計劃書能夠在公開平臺獲取)、條目35(通過指南、會議、網絡等多平臺發布指南)、條目36(提供不同用戶版本的指南)、條目37(以圖片、視頻等其他形式發布指南或推薦意見)得分比例最低。骨科指南和共識各條目得分見表1。
3 討論
本研究首次使用STAR評價工具對我國骨科指南與共識進行方法學評價,評價結果與STAR官網目前所公布的指南及共識結果一致。評價結果顯示,近年來我國骨科指南和共識方法學評分整體呈上升趨勢,指南平均得分基本高于共識。就具體領域而言,骨科指南在注冊、計劃書、工作組、臨床問題、證據、共識方法、推薦意見、可及性及其他領域中的得分高于共識。就具體條目而言,指南和共識均在條目34(對推薦意見在實施過程中注意事項進行了闡述)得分最高。指南與共識均在條目37(以圖片、視頻等其他形式發布指南或推薦意見)得分最低。此外,指南在條目6(說明了資助在指南制訂中的作用),共識在條目4(計劃書能夠在公開平臺獲取)和條目36(提供不同用戶版本的指南)得分比例為0%。
目前,中國骨科指南和共識質量評分整體呈上升趨勢,這與近年來指南循證理念不斷傳播與應用有關。一方面,指南循證方法學團隊不斷通過會議、學術沙龍等方式推進指南循證方法的傳播[9,10]。另一方面,一些骨科學術組織,如中華醫學會骨科學分會等,也在有意識地將指南循證方法學理念深入到指南制訂過程中[8]。此外,指南解讀類文章在利用指南方法學評價工具的基礎上對指南進行解讀,同時也在一定程度上對指南制作質量與報告規范起到監督作用。
骨科指南總體評分高于共識,這一結論與陳耀龍等[11]的研究結果類似。骨科指南評分高于專家共識可能有以下原因:① 在專家共識制作過程中,參與共識意見形成的人員大多僅限于該領域的專家[11],骨科指南及共識在條目12(明確提出工作組包含方法學家或循證醫學專家)的平均得分僅為12.8%,提示循證醫學專家或者指南方法學家參與較少;② 大多數專家共識制訂的目的僅為臨床醫生提供參考和學術性建議,并非系統規范其臨床行為;③ 參與指南制訂的專家大多認為共識在科學性、透明性和可靠性方面低于指南,因此可能會忽視共識方法學[12]。
骨科指南和共識條目占比較高的領域集中在推薦意見。推薦領域強調清晰展示已形成的推薦意見。因為推薦意見領域是對指南或共識過程的展示,是臨床醫生和患者可以直接了解推薦意見內容和強度的領域,故條目整體得分比例較高。骨科指南和共識得分占比較低的領域集中在可及性領域。指南或共識的傳播與實施,是指南從理論轉化為實踐的重要步驟。而骨科指南和共識在這一領域得分較低,可能是因為這一領域還未得到指南或共識制訂組織或專家的重視。
骨科指南在條目6(說明了資助在指南制訂中的作用)的得分比例為0。指南或共識應明確說明制訂過程中是否存在資助情況,以避免專家的主要專業判斷或行動受到不恰當影響[13,14]。我國骨科指南忽視了報告資助在指南制訂中的作用,可能會導致指南透明度降低,影響指南權威性。但是納入的骨科指南大都由中華醫學會等專業骨科學會組織牽頭制訂,行業機構在制訂過程中有一定監督作用,且具有權威性。而共識則在計劃書領域得分比例最低。提前撰寫和公開報告計劃書不僅有利于讀者監督指南制訂過程,還有利于指南制訂者更高效地完成指南的制訂[15]。因此,未來在共識制訂過程中,制訂者應重視計劃書的撰寫與發布。
AGREE和RIGHT作為國際通用的指南制訂與評價工具有著不同的使用場景。AGREE工具的開發旨在評估指南的質量,提供指南開發的方法策略,并推薦指南中應報告哪些信息,而RIGHT主要用于規范指南報告[3,16]。STAR評級工具則以解決現有指南評級工具局限性、提升中國指南質量、研發更全面的指南評級工具為目的[7]。目前,STAR工具已被應用于我國指南及共識的綜合評價中[17,18]。相較于之前的指南評價工具,STAR工具具有以下優勢:① STAR指南評級工具細化了以往指南或共識評價內容的細節;例如,IOM[2]評級工具雖然也強調指南制訂過程中的透明性,但是在條目中只是籠統強調指南的制訂和資助過程應明確詳細且公開可獲得。而STAR評級工具則將指南或共識制訂透明度的評價細化到了每一個評級領域,指南或共識的注冊、計劃書、資助等均需要公開透明。因此STAR評級工具的條目設置在指南或共識制訂的計劃階段也具有重要的參考意義。② STAR評級工具對指南或共識制訂前、后的流程亦有所關注。相較于IOM[2]和RIGHT[4]評級工具,STAR關注了指南或共識制訂的整體流程。注冊、計劃書及可及性三個領域是對制訂前后評價的重要領域,這些領域對于評價指南或共識的規范性、有效性及可轉化性具有重要意義。③ STAR評級工具更加高效,節省了使用者的時間。STAR評級工具為多維度評價工具,使用者無需采用多個評級工具評價同一指南,從而提高了綜合評價的速度,也有助于提高指南制訂者的使用依從性,最終促進指南質量的提升。
本研究具有以下特點:① 是目前國內最大規模評價骨科指南與共識方法學質量的研究;② 采用最新發布的STAR評級工具從多維度對骨科指南或共識進行評價;③ 所納入指南及共識發表時間跨度較大,可縱向了解骨科指南及共識評分的年度變化趨勢。
由于時間限制,本研究未將2023年已發表的全部骨科指南與共識納入,可能會影響評級結果的穩定性。此外,由于STAR評級工具發布時間較短,尚無法了解其發表前后骨科指南及共識的得分變化。未來我們會定期使用STAR評級工具評估我國骨科指南及共識的質量,以追蹤我國骨科指南及共識的發展趨勢。
綜上所述,近年來,我國骨科指南及共識的科學性、透明性和適用性整體呈上升趨勢。但指南及共識尚需針對計劃書、資助和可及性領域提升質量,共識制訂小組需重視共識質量。此外,STAR作為針對我國中國指南綜合評價需求的指南評價工具,對規范我國指南制訂具有重要意義,我們期待越來越多高質量指南及共識發布。
聲明 所有評級人員均不存在任何利益沖突。