廣告贊助

由二期試驗來模擬與預測三期試驗,是藥廠公司與學界的熱門且利基的研究方向,因此有學者提出臨床試驗模擬(Clinical trial simulation)的統計模擬研究,後續進而對臨床試驗模式與設計進行修改,以利試驗成功。

實際研究例如 Kimko, H. C., Reele, S. S., Holford, N. H., & Peck, C. C. (2000). Prediction of the outcome of a phase 3 clinical trial of an antischizophrenic agent (quetiapine fumarate) by simulation with a population pharmacokinetic and pharmacodynamic model. Clinical Pharmacology & Therapeutics, 68(5), 568-577.

用PK/PD藥理模式,模擬三期試驗結果,並比較三期試驗實際結果,結論當然是此法有遠景,卻也只能堪稱可用。其論點強調,選擇適當而充分資料的模擬模型,應該會逼近實際情況,但實際模擬上,常常遭遇其他各種假設基礎因資料不充分而只能以機率模型來摸擬的問題。另外該模擬試驗報告提到安慰劑效應影響模擬效果很大,不可不慎。畢竟PK/PD藥理模擬模式,是沒有模擬安慰劑心理效應。

我們已知RCT試驗,要盡量統計考驗,以達顯著有效,就是要實驗組與控制組兩組在各項可能的干擾變項上盡量最佳控制(Con)到同質,若無法同質或條件配對,就寄望隨機分派成兩組,讓不同質的因素自然混合,然後在實驗控制上,造成最大(Max)組間變異量(其中最被關注的就是藥效變異量,還有部分來自區域、試驗中心、種族變異量),並且盡量最小化(Min)組內變異量(如儘量剔除或平衡機構安慰劑效應變異量)與受試者內的變異量(如個人安慰劑效應變異量、病程變異量)。

 

以SND-13為例(試驗設計參見https://clinicaltrials.gov/ct2/show/NCT02261519),筆者當然不可能有PK/PD藥理資料來建立模擬模式,雖想由有限的2a期試驗報告資料如平均數、標準差、人數,來進行模擬,但牽涉以下需要先對假設基礎的研判問題,進行預判,而以下也是我們已知公司盡力改善2b+3期試驗的修正作法。這讓我們對2b+3期的模擬與預測,格外困難。

一、提升內在效度

1.將試驗參與者的篩選,經過試驗中心篩選,再由三位精神科醫師獨立篩選,最後由教授篩選,可以減少精神分裂病人或有藥癮,其他精神疾病的變項干擾。--->這將減少多少比例的受試者內變異量?

 

2.由精神科醫師面談並評量病人反應,輸入資料庫並且有演算法,偵測反應不一致、說謊的病人,加以排除,以減少個體內差異與組間差異。--->這將減少多少比例的受試者內變異量?與組間變異量?

 

3.排除高安慰劑效應的試驗中心,例如盡量選用美國25個低安慰劑效應的試驗中心,減少組間變異量與受試者內變異量。--->這將減少多少比例的組間變異量與受試者內變異量?

 

4.採取SPCD設計,只取用第一階段安慰劑組無反應群的受試者,進行第二階段RCT 試驗,可以篩除安慰劑反應的比例約7-8成,減少組內變異量與受試者內變異量。--->這將減少多少比例的組內與受試者內變異量?

 

5.回診時,面談評量前,均有工作人員進行衛教,中性說明藥物試驗可能情形,降低醫療人員的暗示效應與受試者的預期效應,減少安慰劑效果。--->這將減少多少比例的受試者內變異量?

 

6.從原本2a試驗的6周拉長為2b+3期試驗的8周,使藥物效果持續發揮,增加藥物造成的藥效變異量(詳細內容可見http://liawbf.pixnet.net/blog/post/47579859),

2a試驗之SND-13藥效反應曲線如下圖,可以假設藥效趨勢不變,時間拉長,累積藥效會更好。(筆者簡單估算,依該趨勢,8周後實驗組PANSS可能降低到66.3分,而安慰劑組可能只降低到79.7分,換言之,兩組6周差值9.7,擴大到8周差值13.4(分子變大),如果再因安慰劑效應等變異量減少,將使標準差縮小(分母變小),進行F考驗時,差值13.4除以2+3期試驗標準差,將遠大過於9.7除以2a期試驗標準差的比值,因此F考驗將更容易顯著,效果量將更顯著)

SND-13 PANSS.jpg

而同時安慰劑效果維持不變的話,藥效變異量對比安慰劑變異量,就會變更大,統計考驗更顯著,效果量更大。但是由於精神分裂症是否會隨時間試驗增長而使病程惡化,這部分增加2周的病程變異量,是否需要考量進去?

 

7.擴大全球樣本,RCT設計,執行雙盲,醫師、藥師、當事人、施測者、資料處理者之盲性試驗作業,隨機分派,讓實驗控制組間變異,促使儘量兩組相等。在統計控制上,確認兩組相等,並將背景或基準線變項放入變異數分析的共變數,對於重複測量造成的變異,利用自我迴歸矩陣,進行統計控制。

 

8.2b+3期有採Adpative design以增加樣本數,最少收348人,最多可收1374人 ​​​​​,故有效SPCD樣本數至少是2a期樣本數52人的3.3倍起跳,最多是13.2倍,此種Adpative design絕對應可以增加統計顯著性與統計考驗力。

 

二、提升外在效度

1.將試驗參與者的篩選,經過試驗中心篩選,再由三位精神科醫師獨立篩選,最後由教授篩選,更可以普遍確診為精神分裂症病人。--->這將減少受試樣本推論目標族群的誤差

2.擴大全球試驗中心的抽樣範圍,美加,日本、台灣,歐洲等,擴大試驗結果可以推論之目標族群、區域與種族,但是多區域,多中心、多種族的變項,有可能如何干擾組間變異量?--->這將增加多少比例的組間變異量?

3.增加樣本倍數,也增加樣本代表性,增加將試驗結果類化推論到全球人類的可信度。

 

再者如這方面學者Nick Holford所倡議的模擬程序(http://holford.fmhs.auckland.ac.nz/docs/clinical-trial-simulation-analysis.pdf),上述模型建立後,再依不同參數數值範圍(如上述所需推估的各項參數比例數值),進行統計分析至少100次以上,再依據上述百次以上結果進行後設分析,顯然,這些分析程序,已經超過一般投資人的能力(筆者確實也有困難去模擬,仍需突破),恐怕也是需要試驗專家與統計學者,費很大一番心力的努力去模擬。

但對新藥公司而言,與其費力模擬,何不費力做好做滿試驗效果?

所以簡單結論就是,SND-13的2b+3期試驗,應該已經盡量做到MaxMinCon最大努力,來涵容全球試驗引入的多區域,多中心,多種族變異量。(如讀友有想到其他試驗仍可盡力之處,敬請告知)

或許正如教授在二月被法國雜誌訪問時,所表達的類似意思~新藥研發到此時,已不再是科學試驗的議題,而是商業化的問題。如果讀友相信教授與公司團隊的努力,也持續閱讀本BLOG的論述,相信應該有此同感。

文章標籤
創作者介紹
創作者 liaw6575 的頭像
liaw6575

NMDA、Synapse與心悅、SyneuRx的世界

liaw6575 發表在 痞客邦 留言(0) 人氣()