真實世界證據的結構化模板和報告工具(structured template and reporting tool for real world evidence,STaRT-RWE)是由哈佛醫學院布萊根婦女醫院Shirley V Wang教授帶領的團隊制訂的用于規劃和報告關于治療安全性和有效性的真實世界證據研究的實施情況,并于2021年1月發表在BMJ雜志,該模板已得到國際藥物流行病學學會以及國際藥物經濟學和結局研究學會的透明度倡議的認可。本文對其條目進行解讀,以促進國內從事真實世界研究的學者對STaRT-RWE的理解和應用,有助于提高RWE研究的透明度、可重復性和準確性。
引用本文: 曹雪, 孟祥然, 王馨, 秦宇寧, 王夢琪, 劉佳. 用于真實世界證據的結構化模板和報告工具(STaRT-RWE)的解讀. 中國循證醫學雜志, 2024, 24(8): 967-973. doi: 10.7507/1672-2531.202312132 復制
版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編
臨床試驗屬于前瞻性干預性研究,一般是指隨機對照試驗(randomized controlled trial,RCT),是醫療干預措施評價的金標準[1]。而真實世界研究(real world study,RWS)與傳統臨床試驗不同,它可以利用隨機化或非隨機研究為特定研究目的的前瞻性收集的數據,但大多數使用作為常規醫療保健過程的一部分(如醫院電子病歷數據、醫療索賠、醫保數據等)電子數據[2]。真實世界研究是基于現實臨床診療環境下收集的患者數據,因此外部真實性更高[3],產生的證據有助于彌補指南外部有效性不足,縮短指南與臨床決策之間的距離,可為臨床決策或醫療保健決策提供更符合臨床實際的依據[4]。真實世界證據(real world evidence,RWE)越來越多地用于生成關于醫療產品或干預措施的安全性和有效性的支持性證據,但由于RWS常缺乏嚴格的條件控制,與前瞻性收集數據的臨床試驗和非實驗研究相比,使用常規收集的電子醫療數據的研究在設計和數據分析方面具有更大的可變性,其結果更容易受到混雜因素和偏倚風險的影響,有可能導致產生高主觀偏倚的結果和質量偏低的RWE,因此,推動RWS透明化十分必要[5]。
規范報告研究結果是真實世界研究透明化的關鍵環節[5],規范的報告可提高RWE研究結果的透明度、可重復性和準確性。許多研究者意識到這個問題,并為研究報告制訂了指南和檢查清單,如RECORD(reporting of studies conducted using routinely collected data)清單和GRACEG(good research for comparative effectiveness)清單[6],現有的指南和清單已經對報告哪些主要要素及重要性達成了強有力的共識。然而,這些報告清單采用通用模板,但在計劃和實施RWE研究時,它們可能導致操作時的模棱兩可或錯誤解讀。近些年來,利用電子健康記錄(electronic health records,EHR)等常規收集的衛生數據開展真實世界有效性與安全性的研究越來越多地影響藥品上市后再評價、醫保報銷和醫療保健決策[7]。因此,為了有一個基礎模板來評估和區分有用的、嚴格設計的研究和涉及有效性問題的研究,國際人用藥品注冊技術協調會(the International Council for Harmonization,ICH)為RWE研究的安全性和有效性報告推出了RWE研究實施計劃和報告的結構化模板(structured template and reporting tool for real world evidence,STaRT-RWE)[8]。該模板是由美國哈佛大學醫學院附屬布萊根和婦女醫院Wang教授帶領的團隊與國際范圍內的利益相關方廣泛合作制訂,于2021年1月發表在BMJ雜志,該模板拓展了SPACE(structured pre-approval and post-approval comparative study design framework to generate valid and transparent real-world evidence)框架的功能,提供了詳細化的模板來規范展示最終的研究設計和實施細節,有助于設計和開展可靠的RWE研究,解決RWE研究方法的透明度差距,提高特異性,實現數據的可獲得性,并幫助閱讀者快速查找關鍵信息。它旨在用于醫療產品的有效性和安全性研究。該模板適用于多個研究設計、數據來源、報告指南和偏倚評估方法。本文將對STaRT-RWE 的所有要點進行解讀和介紹,并結合實例進行分析,旨在幫助研究人員更好地理解和應用該報告規范,促進RWE研究的可重現性及有效進行科學評估和證據的合成,以期提高RWE研究的報告質量。
1 制訂
關于RWE研究實施的結構化模板中要求的詳細研究參數來自于國際藥物流行病學會(International Society for Pharmacoepidemiology,ISPE)和國際藥物經濟學和結局研究協會(International Society for Pharmacoeconomics and Outcome Research,ISPOR)成立的聯合工作組所制訂的一份共識文件[9],這份文件中包括了具體參數的詳細目錄,詳細報告參數是RWE研究可重復的必要條件,可提高透明度并促進對有效性的評估。這些參數很多作為研究人員應該提供細節的部分,已被納入現有的報告清單中。Wang等引用了ISPE-ISPOR聯合工作組制訂的共識文件中目錄部分,總結分析既往發布的報告清單如RECORD-PE[10]和歐洲藥物流行病學和藥物警戒中心網絡(European Network of Centres for Pharmacoepidemiology and Pharmacovigilance,ENCePP)發布的指導文件[11],針對已發布的質量評估工具[12-14]提出了一個新的結構化模板,以確保涵蓋了評估有效性的所有關鍵要素,并與利益相關者和專家進行了焦點小組訪談,向ISPE和透明度倡議組織的成員們(由ISPE-ISPOR聯合工作組、馬戈利斯健康政策中心和美國國家醫藥委員會合作組成的多方利益相關者小組)尋求意見,得到了ISPE和透明度倡議組織的認可,最終確定了STaRT-RWE模板的內容。
2 STaRT-RWE模板的特點
該模板詳細描述了研究參數,以及縱向研究設計的圖形,即如何將研究設計過程中的細節被可視化地總結在一個圖形內。使用該模板有助于增加RWE研究的嚴謹性,并有利于決策者對RWE方法的理解和對結果的解釋。STaRT-RWE目的包括:① 用作設計和開展良好可重復RWE研究的指導工具;② 為RWE方法的溝通樹立明確的期望;③ 減少對缺乏特異性的錯誤解釋;④ 允許審閱者快速找到關鍵信息;⑤ 促進研究可重復性,有效性評估和證據合成。如果在注冊RWE研究方案時使用或公開發表了相應的STaRT-RWE模板,研究發表時可以在文章中引用,也可以作為補充材料發表。
STaRT-RWE模板的原作者也從價值、挑戰以及主要可用性的問題等方面對STaRT-RWE模板進行了解析,以幫助研究者了解該模板究竟能解決什么問題。例如,在研究者與監管者之間的溝通中,該模板被監管者視為一種教學工具,可以幫助研究者明確研究目的,并幫助雙方達成一致。
3 STaRT-RWE要點解讀與實例
為了與聯合ISPE-ISPOR特別工作組共識文件中確定的要素緊密一致,該模板包括了下面詳細介紹的幾個表格(見附件)及同時帶有示例條目的模板表,以顯示如何完成這些表,從而進行藥物流行病學中從時間到結局事件的比較隊列研究。在實踐過程中,模板表格條目將取決于研究設計類型和分析參數。在填寫完成模板表格之后,可以刪除模板表頭詳細的文本說明。模板表格內容主要包括管理信息、研究設計、研究人群參數(數據源和軟件的元數據、索引日期、納入和排除標準、預定義和經驗定義的協變量、結果、隨訪)、數據分析(主要分析、次要分析、亞組分析)、敏感性分析、損耗以及功率和樣本量計算。本研究以2021年BMJ發表的“early initiation of prophylactic anticoagulation for prevention of coronavirus disease 2019 mortality in patients admitted to hospital in the United States: cohort study”研究[15]為例(以下簡稱“案例”),針對每個條目進行案例解讀,便于讀者理解。
3.1 管理信息
包括研究方案標題、研究的主要目標和次要目標(研究對象、干預措施、對照措施、結果、時間范圍、研究設計)、研究方案注冊(注冊號、注冊日期、注冊網址)、研究方案(版本號、版本日期)、研究方案貢獻者(姓名、職稱、單位)、基金支持(編號、來源)、數據使用協議(數據使用協議標識符、數據提供者、數據提供者聯系方式)、人體受試者倫理批準(批件文號、批準日期、倫理審查委員會名稱)。如果對先前研究方案進行了修訂,需要記錄更改內容、更改原因以及更改時間(見附件表1)。
案例沒有報告研究方案相關描述。
3.2 研究設計
案例提供了隊列研究設計圖,明確報告了索引日期、隨訪時間、納入/排除標準評估窗口、協變量評估窗口、聯合用藥時間窗口以及暴露時間窗。
使用Schneeweiss等[16]提出的框架創建研究設計圖,研究設計圖以直觀的方式展示了從縱向醫療保健數據庫中創建分析性隊列研究的過程,見圖1。垂直箭頭表示第0天,即研究設計所需明確規定的起始點。并圍繞該主要時間錨點定位基線和后續時間窗口。水平條形圖的大小和位置直觀地顯示了洗脫窗口、納入/排除標準評估窗口、協變量評估窗口以及隨訪的評估時間窗口,第0天是否包含在某個評估窗口中,也可以通過它是否與代表隊列開始日期的垂直箭頭重疊來直觀地區分。每個條形圖內的數字使用標準的數學符號來明確表示時間范圍。該圖還可以有腳注,來方便提供關于在每個評估窗口中定義的內容細節。圖1可清晰地說明患者如何以及何時納入隊列研究、基線特征的定義以及隨訪時間何時開始和結束。
3.3 研究人群
選擇研究人群的數據源、研究周期、數據提取日期、數據鏈接、以及用于創建隊列研究的數據管理軟件或元數據的版本等內容。還包括統計軟件程序以及所應用的抽樣方法(例如,數據分割僅包括被診斷為糖尿病的患者)。如果涉及到數據鏈接,對鏈接方法以及數據鏈接的性能特征等信息需提供參考文獻或附錄加以描述(見附件表2)。
案例旨在納入所有在2020年3月1日至7月31日期間入院的新冠肺炎患者,數據為美國退伍軍人事務部的電子健康記錄數據,采用軟件SQL Server Management Studio(SSMS)v17.4進行數據管理,沒有提供數據提取日期和數據鏈接。
3.4 模板剩余部分內容
本模板的其余部分詳細說明了索引日期、暴露因素、納入或排除標準、協變量、研究結局以及隨訪時間。表格下面的題注總結了測量內容、測量時間、場所(如住院、門診、急診科)、用于識別變量的編碼類型(如藥物、診斷、程序或實驗室編碼),以及算法的來源(如參考文獻、臨床醫生調查)。對于基于診斷代碼的算法,該模板有專門的部分以供研究人員決定是否限制主要診斷編碼(表明該編碼是患者就診的主要原因)。
3.4.1 索引日期
索引日期定義為受試者被納入隊列研究人群的日期(見附件3B。一般是第0天為確定納入研究人群的日期。本部分還包括研究人群名稱、第0天描述、指定患者入組次數、參加人數、類型(說明納入研究人群的標準是否反映了新發病、現患病或其他情況)、事件(事件被定義為研究人群被納入研究)發生的洗脫窗口,以及定義事件發生(例如,使用藥物的研究對象或新診斷為特定疾病的研究對象)。
案例定義索引日期為住院日期。
3.4.2 納入和排除標準
描述納入和排除標準,明確納入和排除標準是在選擇研究人群入組的日期之前還是之后應用。某些情況下,研究對象可能存在多個時間點均能符合納入或排除標準。當使用醫療保健數據源時,常將患者觀察時間作為一個納入標準。當使用行政索賠數據時,可以考慮用保險覆蓋范圍內的登記日期。當使用電子健康記錄數據時,定義患者觀察時間可能需要做出一些強有力的假設。例如,假設患者的接觸總是可觀察的,患者在記錄中第一次和最后一次記錄之間可觀察到,患者在任何有記錄的接觸之前和之后都可觀察某段時間(見附件3C~3D)。
案例中描述了納入和排除標準,納入所有在2020年3月1日至7月31日期間入院,并在入院前14天內通過實驗室SARS-CoV-2檢測結果為陽性的患者。排除沒有護理史(定義為2020年3月1日前兩年至少有一次門診或住院患者),在入院前30天接受抗凝治療(以減輕抗凝藥物普遍使用的效果),在入院后24小時內接受紅細胞輸血(活動性出血或嚴重貧血可能是使用抗凝藥物的禁忌癥),或在入院后24小時內出現任何結果(在本研究中沒有機會被歸類為接受抗凝治療的患者)。
3.4.3 協變量
定義變量類型(例如連續變量、分類變量及二分類變量等),提供關于數據轉換的更多細節的選項。該模板包括預先定義的協變量(基于先前知識預先定義的,由研究者在方案中預先指定和定義的變量,如年齡、性別等)和依據經驗定義的協變量(沒有由研究者預先指定的,而是基于對數據應用算法的變量),其中提供了源代碼或通過數據驅動進行協變量篩選的算法(例如高維傾向評分算法)。在整個表中,字段表示研究參數是否預先指定,以及在敏感性分析中是否不同(見附件3E~3F)。
案例詳細列出了協變量,包括年齡、種族、民族、性別、城市或農村居住、美國人口普查地區、臨床共病、查爾森合并癥指數和藥物使用等。
3.4.4 結果
定義主要結果與結果測量特征(敏感性、特異性)。結果測量性能可通過已發表分析性隊列研究結果的文獻直接驗證,研究人員也可以明確地指出沒有關于結果確定的準確性的信息。本節還規定了結果類型、醫療場所和診斷人員。任何針對選擇研究人群編碼或算法進行的驗證研究均應標注引用的參考文獻。需提供已發表文獻中的結果算法特征(如PPV、敏感性、特異性)或研究人群中的結果驗證(病例回顧)。如果為本研究實施的驗證方法沒有在其他地方發表,則需要提供驗證方法的細節和結果(見附件3G)。
案例詳細說明主要結果為入院后30天內的死亡率,其中包括住院死亡(住院期間的死亡)和出院后發生的死亡,次要結果是住院患者死亡率和開始抗凝治療。
3.4.5 隨訪
在隨訪部分中,研究人員確定了相對于索引日期(第0天)的隨訪時間是何時開始以及如何結束的,這可以指導研究人員考慮每個選項,并讓審查人員清楚什么適合用作審查標準。如果隨訪停止,表單內容需要包括暴露持續時間、暴露結束時間、具體決定如何處理早期填補,或為暴露效應假設的生物窗口建立一個誘導窗口,或在暴露結束后對藥物效應的延續效應(見附件3H)。
案例將隨訪截止時間設為結果事件發生時間(最多30天或2020年8月30日)
3.4.6 數據分析
數據分析方法,包括假設檢驗、主要結果分析、亞組分析、分析軟件、模型擬合、調整混雜的方法、缺失數據處理方法(例如,排除性別缺失或未知的患者,以及對缺失的總膽固醇值的多重推斷)。并說明一些參數(如匹配比和卡尺、權重公式、修剪和截斷規則),見附件表4。
案例采用傾向性評分模型進行數據分析,數據分析工具為SAS和Stata統計軟件,同時報告了假設檢驗、主要結果分析、調整混雜的方法和缺失數據處理方法。
3.4.7 敏感性分析
提供了一個單獨的敏感性分析表格,研究人員可以指定哪些參數改變,為它們的變化提供了理論基礎,研究人員將敏感性分析結果與主要分析結果相比從而得到結論是否穩健(見附件表5)。
案例進行了敏感性分析。
3.4.8 其他表
損耗表展示了運用每項納入或排除標準后保留的患者數量(見附件表6),損耗表的確切內容可能根據計算的類型而不同。功效和樣本量估算表(見附件表7),選擇合適的樣本量和計算功效對于科學研究的可行性和準確性至關重要。術語表可以統一術語,有助于避免誤解和混淆,有利于調查人員和審查員使用的術語標準化(見附件表8)。還包括一個縮略表(見附件表9)。
案例中未提供損耗表、功效和樣本量估算表和術語表的相關內容。
模板表格應始終附帶附件,其中包含特定的臨床代碼列表(例如國際疾病分類第九次修訂版臨床修改版、當前程序術語、臨床術語)用于定義研究入選標準或暴露、納入或排除、混雜因素、結果,代碼是結構化的為機器可讀或可寫。如果相關,這些表還可以另外附帶附件,詳細說明從源數據到公共數據模型轉換過程中做出的決定,提供關于數據鏈接或其他數據處理步驟的更多信息,以及包含或提供用于創建和分析研究人群的代碼鏈接。
4 清單
模板主要側重于研究實施決策,可以根據不同的研究設計、數據來源靈活使用表中的一些內容。可以按照STaRT-RWE清單表(見表1)綜合系統評估一系列真實世界研究內容報告的完整性,可以分為全部報告、部分報告和沒有報告,也可以報告一項真實世界研究的具體內容。Khambholja等[17]已使用STaRT-RWE清單表對54項真實世界研究文獻報告質量進行評估,大多數研究中最常見的報告條目是倫理和基金,最常見的未報告條目包括研究設計圖、敏感性分析、損耗表和樣本量估算。

5 討論
RWE研究決策者考慮醫療產品的有效性和安全性的一個關鍵障礙是缺乏復雜設計、實施過程和數據分析的細節。STaRT-RWE為研究人員提供了研究設計、實施和審查的結構化流程模板,有助于研究人員就判斷RWD是否適合決策目的達成一致,從而為研究人員、贊助者、審查員和醫療保健決策者提供了有力工具。STaRT-RWE附有詳細的表格,通過提供一種結構化的方式來展示復雜的RWE研究設計和實施細節,從而與試驗設計相平行。該模板的目標不是將如何進行RWE研究的方式標準化,而是為研究人員提供一個框架,通過細化研究設計和數據分析內容,對決策達到一致認同。STaRT-RWE不僅是一個報告規范檢查表,還可以通過提供指導和共同結構來補充現有的檢查表,以幫助研究團隊在規劃和傳達預期科學決策的關鍵細節時保持清晰和全面。
除STaRT-RWE外,目前還有5個與提高RWE研究透明度和可重復性相關的實踐指南和檢查清單:① 2008年ISPE發布的良好的藥物流行病學實踐規范中的方案制定指南(ISPE-GPP)[18],規范藥物RWS的研究標準和流程;② 2012年歐洲藥品管理局發布的良好的藥物警戒規范指南模塊Ⅷ-上市后安全性研究模板(EMA-GVP Module Ⅷ-PASS)[19],用于指導非干預性PASS研究方案;③ 2019年美國輝瑞公司聯合哥倫比亞大學梅爾曼公共衛生學院流行病學系等發布的為產生有效和透明的RWE而制定的結構化的涵蓋審批前和審批后的比較研究設計框架[20],為審批前和審批后比較研究設計提供框架;④ 2020年美國國家衛生技術評估系統方案制定指南[21],可為采納RWE用于支持FDA監管產品上市許省時間和成本;⑤ 2021年美國 Aetion公司聯合美國杜蘭公共衛生和熱帶醫學學院等發布的識別適合研究目的的結構化流程[22],用于RWS可行性評估。STaRT-RWE補充了SPACE遺漏的方面,相比于其他標準化模板,其提供了更為詳細的模板用以獲取最終研究設計和實施細節(例如每個研究變量的特定算法)。
Wang等[23,24]帶領的研究團隊一直致力于提高RWE研究透明化的研究,在該領域具有豐富的研究經驗。現有報告規范未對電子健康醫療記錄、登記數據或其他醫療保健數據源中所包含的結構化和非結構化信息加以區分。Wang等[25]提出并制訂《使用非結構化電子健康數據開展真實世界比較效果和安全性研究的報告規范》,旨在鼓勵適當使用基于自然語言處理或機器學習算法從電子健康記錄數據提取的非結構化文本信息進行RWE研究,提高研究報告的透明度。2022年該團隊在總結既往發布的方案模板基礎上(包括ISPE-GPP、EMA-GVP Module Ⅷ-PASS、NEST和STaRT-RWE)又提出了一個新的綜合模板,即增強可重復性的草案模板(the harmonized protocol template to enhance reproducibility,HARPER)[26],以提高RWE研究的可重復性。
STaRT-RWE模板主要側重于研究實施決策。表單中羅列的結構可能不適用于全部案例,使用者可以根據研究目的和設計靈活選擇表單中的內容。值得一提的是,強調使用研究實施模板來指導研究計劃并提供明確的科學決策并不能保證這些決策將產生沒有偏倚的結果。但可提高醫療保健決策者有效評估RWE研究的能力。該模板研究設計和實施細節詳細,但不能替代藥物流行病學家和方法學家,研究者依舊需要培訓和學習專業知識。
臨床試驗屬于前瞻性干預性研究,一般是指隨機對照試驗(randomized controlled trial,RCT),是醫療干預措施評價的金標準[1]。而真實世界研究(real world study,RWS)與傳統臨床試驗不同,它可以利用隨機化或非隨機研究為特定研究目的的前瞻性收集的數據,但大多數使用作為常規醫療保健過程的一部分(如醫院電子病歷數據、醫療索賠、醫保數據等)電子數據[2]。真實世界研究是基于現實臨床診療環境下收集的患者數據,因此外部真實性更高[3],產生的證據有助于彌補指南外部有效性不足,縮短指南與臨床決策之間的距離,可為臨床決策或醫療保健決策提供更符合臨床實際的依據[4]。真實世界證據(real world evidence,RWE)越來越多地用于生成關于醫療產品或干預措施的安全性和有效性的支持性證據,但由于RWS常缺乏嚴格的條件控制,與前瞻性收集數據的臨床試驗和非實驗研究相比,使用常規收集的電子醫療數據的研究在設計和數據分析方面具有更大的可變性,其結果更容易受到混雜因素和偏倚風險的影響,有可能導致產生高主觀偏倚的結果和質量偏低的RWE,因此,推動RWS透明化十分必要[5]。
規范報告研究結果是真實世界研究透明化的關鍵環節[5],規范的報告可提高RWE研究結果的透明度、可重復性和準確性。許多研究者意識到這個問題,并為研究報告制訂了指南和檢查清單,如RECORD(reporting of studies conducted using routinely collected data)清單和GRACEG(good research for comparative effectiveness)清單[6],現有的指南和清單已經對報告哪些主要要素及重要性達成了強有力的共識。然而,這些報告清單采用通用模板,但在計劃和實施RWE研究時,它們可能導致操作時的模棱兩可或錯誤解讀。近些年來,利用電子健康記錄(electronic health records,EHR)等常規收集的衛生數據開展真實世界有效性與安全性的研究越來越多地影響藥品上市后再評價、醫保報銷和醫療保健決策[7]。因此,為了有一個基礎模板來評估和區分有用的、嚴格設計的研究和涉及有效性問題的研究,國際人用藥品注冊技術協調會(the International Council for Harmonization,ICH)為RWE研究的安全性和有效性報告推出了RWE研究實施計劃和報告的結構化模板(structured template and reporting tool for real world evidence,STaRT-RWE)[8]。該模板是由美國哈佛大學醫學院附屬布萊根和婦女醫院Wang教授帶領的團隊與國際范圍內的利益相關方廣泛合作制訂,于2021年1月發表在BMJ雜志,該模板拓展了SPACE(structured pre-approval and post-approval comparative study design framework to generate valid and transparent real-world evidence)框架的功能,提供了詳細化的模板來規范展示最終的研究設計和實施細節,有助于設計和開展可靠的RWE研究,解決RWE研究方法的透明度差距,提高特異性,實現數據的可獲得性,并幫助閱讀者快速查找關鍵信息。它旨在用于醫療產品的有效性和安全性研究。該模板適用于多個研究設計、數據來源、報告指南和偏倚評估方法。本文將對STaRT-RWE 的所有要點進行解讀和介紹,并結合實例進行分析,旨在幫助研究人員更好地理解和應用該報告規范,促進RWE研究的可重現性及有效進行科學評估和證據的合成,以期提高RWE研究的報告質量。
1 制訂
關于RWE研究實施的結構化模板中要求的詳細研究參數來自于國際藥物流行病學會(International Society for Pharmacoepidemiology,ISPE)和國際藥物經濟學和結局研究協會(International Society for Pharmacoeconomics and Outcome Research,ISPOR)成立的聯合工作組所制訂的一份共識文件[9],這份文件中包括了具體參數的詳細目錄,詳細報告參數是RWE研究可重復的必要條件,可提高透明度并促進對有效性的評估。這些參數很多作為研究人員應該提供細節的部分,已被納入現有的報告清單中。Wang等引用了ISPE-ISPOR聯合工作組制訂的共識文件中目錄部分,總結分析既往發布的報告清單如RECORD-PE[10]和歐洲藥物流行病學和藥物警戒中心網絡(European Network of Centres for Pharmacoepidemiology and Pharmacovigilance,ENCePP)發布的指導文件[11],針對已發布的質量評估工具[12-14]提出了一個新的結構化模板,以確保涵蓋了評估有效性的所有關鍵要素,并與利益相關者和專家進行了焦點小組訪談,向ISPE和透明度倡議組織的成員們(由ISPE-ISPOR聯合工作組、馬戈利斯健康政策中心和美國國家醫藥委員會合作組成的多方利益相關者小組)尋求意見,得到了ISPE和透明度倡議組織的認可,最終確定了STaRT-RWE模板的內容。
2 STaRT-RWE模板的特點
該模板詳細描述了研究參數,以及縱向研究設計的圖形,即如何將研究設計過程中的細節被可視化地總結在一個圖形內。使用該模板有助于增加RWE研究的嚴謹性,并有利于決策者對RWE方法的理解和對結果的解釋。STaRT-RWE目的包括:① 用作設計和開展良好可重復RWE研究的指導工具;② 為RWE方法的溝通樹立明確的期望;③ 減少對缺乏特異性的錯誤解釋;④ 允許審閱者快速找到關鍵信息;⑤ 促進研究可重復性,有效性評估和證據合成。如果在注冊RWE研究方案時使用或公開發表了相應的STaRT-RWE模板,研究發表時可以在文章中引用,也可以作為補充材料發表。
STaRT-RWE模板的原作者也從價值、挑戰以及主要可用性的問題等方面對STaRT-RWE模板進行了解析,以幫助研究者了解該模板究竟能解決什么問題。例如,在研究者與監管者之間的溝通中,該模板被監管者視為一種教學工具,可以幫助研究者明確研究目的,并幫助雙方達成一致。
3 STaRT-RWE要點解讀與實例
為了與聯合ISPE-ISPOR特別工作組共識文件中確定的要素緊密一致,該模板包括了下面詳細介紹的幾個表格(見附件)及同時帶有示例條目的模板表,以顯示如何完成這些表,從而進行藥物流行病學中從時間到結局事件的比較隊列研究。在實踐過程中,模板表格條目將取決于研究設計類型和分析參數。在填寫完成模板表格之后,可以刪除模板表頭詳細的文本說明。模板表格內容主要包括管理信息、研究設計、研究人群參數(數據源和軟件的元數據、索引日期、納入和排除標準、預定義和經驗定義的協變量、結果、隨訪)、數據分析(主要分析、次要分析、亞組分析)、敏感性分析、損耗以及功率和樣本量計算。本研究以2021年BMJ發表的“early initiation of prophylactic anticoagulation for prevention of coronavirus disease 2019 mortality in patients admitted to hospital in the United States: cohort study”研究[15]為例(以下簡稱“案例”),針對每個條目進行案例解讀,便于讀者理解。
3.1 管理信息
包括研究方案標題、研究的主要目標和次要目標(研究對象、干預措施、對照措施、結果、時間范圍、研究設計)、研究方案注冊(注冊號、注冊日期、注冊網址)、研究方案(版本號、版本日期)、研究方案貢獻者(姓名、職稱、單位)、基金支持(編號、來源)、數據使用協議(數據使用協議標識符、數據提供者、數據提供者聯系方式)、人體受試者倫理批準(批件文號、批準日期、倫理審查委員會名稱)。如果對先前研究方案進行了修訂,需要記錄更改內容、更改原因以及更改時間(見附件表1)。
案例沒有報告研究方案相關描述。
3.2 研究設計
案例提供了隊列研究設計圖,明確報告了索引日期、隨訪時間、納入/排除標準評估窗口、協變量評估窗口、聯合用藥時間窗口以及暴露時間窗。
使用Schneeweiss等[16]提出的框架創建研究設計圖,研究設計圖以直觀的方式展示了從縱向醫療保健數據庫中創建分析性隊列研究的過程,見圖1。垂直箭頭表示第0天,即研究設計所需明確規定的起始點。并圍繞該主要時間錨點定位基線和后續時間窗口。水平條形圖的大小和位置直觀地顯示了洗脫窗口、納入/排除標準評估窗口、協變量評估窗口以及隨訪的評估時間窗口,第0天是否包含在某個評估窗口中,也可以通過它是否與代表隊列開始日期的垂直箭頭重疊來直觀地區分。每個條形圖內的數字使用標準的數學符號來明確表示時間范圍。該圖還可以有腳注,來方便提供關于在每個評估窗口中定義的內容細節。圖1可清晰地說明患者如何以及何時納入隊列研究、基線特征的定義以及隨訪時間何時開始和結束。
3.3 研究人群
選擇研究人群的數據源、研究周期、數據提取日期、數據鏈接、以及用于創建隊列研究的數據管理軟件或元數據的版本等內容。還包括統計軟件程序以及所應用的抽樣方法(例如,數據分割僅包括被診斷為糖尿病的患者)。如果涉及到數據鏈接,對鏈接方法以及數據鏈接的性能特征等信息需提供參考文獻或附錄加以描述(見附件表2)。
案例旨在納入所有在2020年3月1日至7月31日期間入院的新冠肺炎患者,數據為美國退伍軍人事務部的電子健康記錄數據,采用軟件SQL Server Management Studio(SSMS)v17.4進行數據管理,沒有提供數據提取日期和數據鏈接。
3.4 模板剩余部分內容
本模板的其余部分詳細說明了索引日期、暴露因素、納入或排除標準、協變量、研究結局以及隨訪時間。表格下面的題注總結了測量內容、測量時間、場所(如住院、門診、急診科)、用于識別變量的編碼類型(如藥物、診斷、程序或實驗室編碼),以及算法的來源(如參考文獻、臨床醫生調查)。對于基于診斷代碼的算法,該模板有專門的部分以供研究人員決定是否限制主要診斷編碼(表明該編碼是患者就診的主要原因)。
3.4.1 索引日期
索引日期定義為受試者被納入隊列研究人群的日期(見附件3B。一般是第0天為確定納入研究人群的日期。本部分還包括研究人群名稱、第0天描述、指定患者入組次數、參加人數、類型(說明納入研究人群的標準是否反映了新發病、現患病或其他情況)、事件(事件被定義為研究人群被納入研究)發生的洗脫窗口,以及定義事件發生(例如,使用藥物的研究對象或新診斷為特定疾病的研究對象)。
案例定義索引日期為住院日期。
3.4.2 納入和排除標準
描述納入和排除標準,明確納入和排除標準是在選擇研究人群入組的日期之前還是之后應用。某些情況下,研究對象可能存在多個時間點均能符合納入或排除標準。當使用醫療保健數據源時,常將患者觀察時間作為一個納入標準。當使用行政索賠數據時,可以考慮用保險覆蓋范圍內的登記日期。當使用電子健康記錄數據時,定義患者觀察時間可能需要做出一些強有力的假設。例如,假設患者的接觸總是可觀察的,患者在記錄中第一次和最后一次記錄之間可觀察到,患者在任何有記錄的接觸之前和之后都可觀察某段時間(見附件3C~3D)。
案例中描述了納入和排除標準,納入所有在2020年3月1日至7月31日期間入院,并在入院前14天內通過實驗室SARS-CoV-2檢測結果為陽性的患者。排除沒有護理史(定義為2020年3月1日前兩年至少有一次門診或住院患者),在入院前30天接受抗凝治療(以減輕抗凝藥物普遍使用的效果),在入院后24小時內接受紅細胞輸血(活動性出血或嚴重貧血可能是使用抗凝藥物的禁忌癥),或在入院后24小時內出現任何結果(在本研究中沒有機會被歸類為接受抗凝治療的患者)。
3.4.3 協變量
定義變量類型(例如連續變量、分類變量及二分類變量等),提供關于數據轉換的更多細節的選項。該模板包括預先定義的協變量(基于先前知識預先定義的,由研究者在方案中預先指定和定義的變量,如年齡、性別等)和依據經驗定義的協變量(沒有由研究者預先指定的,而是基于對數據應用算法的變量),其中提供了源代碼或通過數據驅動進行協變量篩選的算法(例如高維傾向評分算法)。在整個表中,字段表示研究參數是否預先指定,以及在敏感性分析中是否不同(見附件3E~3F)。
案例詳細列出了協變量,包括年齡、種族、民族、性別、城市或農村居住、美國人口普查地區、臨床共病、查爾森合并癥指數和藥物使用等。
3.4.4 結果
定義主要結果與結果測量特征(敏感性、特異性)。結果測量性能可通過已發表分析性隊列研究結果的文獻直接驗證,研究人員也可以明確地指出沒有關于結果確定的準確性的信息。本節還規定了結果類型、醫療場所和診斷人員。任何針對選擇研究人群編碼或算法進行的驗證研究均應標注引用的參考文獻。需提供已發表文獻中的結果算法特征(如PPV、敏感性、特異性)或研究人群中的結果驗證(病例回顧)。如果為本研究實施的驗證方法沒有在其他地方發表,則需要提供驗證方法的細節和結果(見附件3G)。
案例詳細說明主要結果為入院后30天內的死亡率,其中包括住院死亡(住院期間的死亡)和出院后發生的死亡,次要結果是住院患者死亡率和開始抗凝治療。
3.4.5 隨訪
在隨訪部分中,研究人員確定了相對于索引日期(第0天)的隨訪時間是何時開始以及如何結束的,這可以指導研究人員考慮每個選項,并讓審查人員清楚什么適合用作審查標準。如果隨訪停止,表單內容需要包括暴露持續時間、暴露結束時間、具體決定如何處理早期填補,或為暴露效應假設的生物窗口建立一個誘導窗口,或在暴露結束后對藥物效應的延續效應(見附件3H)。
案例將隨訪截止時間設為結果事件發生時間(最多30天或2020年8月30日)
3.4.6 數據分析
數據分析方法,包括假設檢驗、主要結果分析、亞組分析、分析軟件、模型擬合、調整混雜的方法、缺失數據處理方法(例如,排除性別缺失或未知的患者,以及對缺失的總膽固醇值的多重推斷)。并說明一些參數(如匹配比和卡尺、權重公式、修剪和截斷規則),見附件表4。
案例采用傾向性評分模型進行數據分析,數據分析工具為SAS和Stata統計軟件,同時報告了假設檢驗、主要結果分析、調整混雜的方法和缺失數據處理方法。
3.4.7 敏感性分析
提供了一個單獨的敏感性分析表格,研究人員可以指定哪些參數改變,為它們的變化提供了理論基礎,研究人員將敏感性分析結果與主要分析結果相比從而得到結論是否穩健(見附件表5)。
案例進行了敏感性分析。
3.4.8 其他表
損耗表展示了運用每項納入或排除標準后保留的患者數量(見附件表6),損耗表的確切內容可能根據計算的類型而不同。功效和樣本量估算表(見附件表7),選擇合適的樣本量和計算功效對于科學研究的可行性和準確性至關重要。術語表可以統一術語,有助于避免誤解和混淆,有利于調查人員和審查員使用的術語標準化(見附件表8)。還包括一個縮略表(見附件表9)。
案例中未提供損耗表、功效和樣本量估算表和術語表的相關內容。
模板表格應始終附帶附件,其中包含特定的臨床代碼列表(例如國際疾病分類第九次修訂版臨床修改版、當前程序術語、臨床術語)用于定義研究入選標準或暴露、納入或排除、混雜因素、結果,代碼是結構化的為機器可讀或可寫。如果相關,這些表還可以另外附帶附件,詳細說明從源數據到公共數據模型轉換過程中做出的決定,提供關于數據鏈接或其他數據處理步驟的更多信息,以及包含或提供用于創建和分析研究人群的代碼鏈接。
4 清單
模板主要側重于研究實施決策,可以根據不同的研究設計、數據來源靈活使用表中的一些內容。可以按照STaRT-RWE清單表(見表1)綜合系統評估一系列真實世界研究內容報告的完整性,可以分為全部報告、部分報告和沒有報告,也可以報告一項真實世界研究的具體內容。Khambholja等[17]已使用STaRT-RWE清單表對54項真實世界研究文獻報告質量進行評估,大多數研究中最常見的報告條目是倫理和基金,最常見的未報告條目包括研究設計圖、敏感性分析、損耗表和樣本量估算。

5 討論
RWE研究決策者考慮醫療產品的有效性和安全性的一個關鍵障礙是缺乏復雜設計、實施過程和數據分析的細節。STaRT-RWE為研究人員提供了研究設計、實施和審查的結構化流程模板,有助于研究人員就判斷RWD是否適合決策目的達成一致,從而為研究人員、贊助者、審查員和醫療保健決策者提供了有力工具。STaRT-RWE附有詳細的表格,通過提供一種結構化的方式來展示復雜的RWE研究設計和實施細節,從而與試驗設計相平行。該模板的目標不是將如何進行RWE研究的方式標準化,而是為研究人員提供一個框架,通過細化研究設計和數據分析內容,對決策達到一致認同。STaRT-RWE不僅是一個報告規范檢查表,還可以通過提供指導和共同結構來補充現有的檢查表,以幫助研究團隊在規劃和傳達預期科學決策的關鍵細節時保持清晰和全面。
除STaRT-RWE外,目前還有5個與提高RWE研究透明度和可重復性相關的實踐指南和檢查清單:① 2008年ISPE發布的良好的藥物流行病學實踐規范中的方案制定指南(ISPE-GPP)[18],規范藥物RWS的研究標準和流程;② 2012年歐洲藥品管理局發布的良好的藥物警戒規范指南模塊Ⅷ-上市后安全性研究模板(EMA-GVP Module Ⅷ-PASS)[19],用于指導非干預性PASS研究方案;③ 2019年美國輝瑞公司聯合哥倫比亞大學梅爾曼公共衛生學院流行病學系等發布的為產生有效和透明的RWE而制定的結構化的涵蓋審批前和審批后的比較研究設計框架[20],為審批前和審批后比較研究設計提供框架;④ 2020年美國國家衛生技術評估系統方案制定指南[21],可為采納RWE用于支持FDA監管產品上市許省時間和成本;⑤ 2021年美國 Aetion公司聯合美國杜蘭公共衛生和熱帶醫學學院等發布的識別適合研究目的的結構化流程[22],用于RWS可行性評估。STaRT-RWE補充了SPACE遺漏的方面,相比于其他標準化模板,其提供了更為詳細的模板用以獲取最終研究設計和實施細節(例如每個研究變量的特定算法)。
Wang等[23,24]帶領的研究團隊一直致力于提高RWE研究透明化的研究,在該領域具有豐富的研究經驗。現有報告規范未對電子健康醫療記錄、登記數據或其他醫療保健數據源中所包含的結構化和非結構化信息加以區分。Wang等[25]提出并制訂《使用非結構化電子健康數據開展真實世界比較效果和安全性研究的報告規范》,旨在鼓勵適當使用基于自然語言處理或機器學習算法從電子健康記錄數據提取的非結構化文本信息進行RWE研究,提高研究報告的透明度。2022年該團隊在總結既往發布的方案模板基礎上(包括ISPE-GPP、EMA-GVP Module Ⅷ-PASS、NEST和STaRT-RWE)又提出了一個新的綜合模板,即增強可重復性的草案模板(the harmonized protocol template to enhance reproducibility,HARPER)[26],以提高RWE研究的可重復性。
STaRT-RWE模板主要側重于研究實施決策。表單中羅列的結構可能不適用于全部案例,使用者可以根據研究目的和設計靈活選擇表單中的內容。值得一提的是,強調使用研究實施模板來指導研究計劃并提供明確的科學決策并不能保證這些決策將產生沒有偏倚的結果。但可提高醫療保健決策者有效評估RWE研究的能力。該模板研究設計和實施細節詳細,但不能替代藥物流行病學家和方法學家,研究者依舊需要培訓和學習專業知識。