CDISC遞交數(shù)據(jù)--Origin實例續(xù)講
上篇文章末尾的圖片,此篇文章會一一介紹。
CRF
All the variables mapped from CRF fields should have origin of CRF. This includes variables with Multiple rule and text greater than 200 characters split into multiple variables.
唯一模糊的是”Multiple rule”,我個人理解為,比如SEX實際CRF填寫的內容是Female or Male,但是我們需要以標準的F or M來呈現(xiàn)去遞交,這樣被某些標準規(guī)則去改變呈現(xiàn)方式的變量如果是在CRF上收集,則Origin=CRF。
跟--STRESC, --STRESN不同,這些改變的不僅是呈現(xiàn)方式,絕大部分都會改變原有值。
上圖SUEVLINC和DFTPTREF是屬于pre-printed在CRF上,故Origin=CRF。
Pre-printed:顧名思義“預印”,就是已經(jīng)打印在CRF上的,我們把其中的一些文字提取出來作為某個變量,甚至是把這些文字進行變形。比如SUEVLINC已經(jīng)retired,目前在用SUEVLINT,把“within 30 days prior to elevated labs”變形為”-P30D”。
Assigned
從CDSIC編碼表或申辦方編碼表中映射的--TEST值
從LB查詢表(look-up)中映射的類似LBCAT、LBSCAT、LBSPEC的值
從CDSIC編碼表或申辦方編碼表中映射的--STRESU的值
--DECOD的值,比如DSDECOD, AEDECOD等等
除了以上從LOOK UP映射過來的還有為了使一個record完整的rule。
比如--PRESP, --REDOFL, --PHEPFL, --VENTYP, ?-- ECMOOD等等可以完善record。
--SPID,--GRPID
這些變量是申辦方定義的標識符,便于溯源到原始數(shù)據(jù)集,也便于RELREC中的數(shù)據(jù)集關聯(lián)。
eDT??????
字面意思,不做過多解釋。
Protocol
不在CRF中收集且only available in Protocol
比如STUDYID;
僅在Trial design中的變量 ARM,ELEMET,EPOCH...;
EXDOSFRM...
Derived
Derive的數(shù)據(jù)不是直接從CRF上收集的,而是通過某種算法或可重復性規(guī)則計算得來的。
比如USUBJID,--STRESC,--STRESN,--BLFL,Population flag。
在RAVE系統(tǒng)中,有部分變量是系統(tǒng)自己derive,一般在CRF上都會有Derived的標記,這些也要算作Derived。?
變量在不同的domain也呈現(xiàn)不同的Origin。
比如EPOCH,TA中是Protocol。
在SE以及以及其他數(shù)據(jù)集中,EPOCH是基于各element的開始和結束時間生成的。
比如VISIT,TV中是Protocol。
在SV中非計劃外訪視是根據(jù)規(guī)則衍生出來,是Derived。
其他數(shù)據(jù)集以SV作為參照即look-up,衍生出的visit,是Assigned。
延伸:
????????其實Assigned和Derived是存在“灰色地帶”,可能存在某些變量無法辨別,無法了解變量更多的細節(jié)。那么建議最好寫為Derived,然后寫明具體的computation method。
???????????還有就是adam如果是來源于相同的sdtm變量,在最后的define,我們需要填寫Origin=Predecessor并填寫具體來源sdtm數(shù)據(jù)集和變量。
有部分圖片沒展示出來,有興趣可移步wx“gong zhong hao”: CDISC_SAS