CDISC遞交數(shù)據(jù)--SDTM Dataset Metadata之Origin
4.1.1.8?? Origin Metadata
4.1.1.8.1 Origin Metadata for Variables
還是以SDTMIG V3.2為例,穿插3.4的不同。
Define.xml?中的“Origin”列用于說明數(shù)據(jù)的來源。是為了清楚地向reviewer說明數(shù)據(jù):是否來自CRF(并且是可以從注釋的CRF?中溯源)、是否是衍生的(Derived)(并且可以根據(jù)一些衍生規(guī)則溯源)、是否是根據(jù)一些主觀規(guī)則賦值(Assigned)
(可以根據(jù)外部評(píng)估者溯源)等。SDTMIG?中定義了以下幾種受控術(shù)語用于說明“來源(Origin)”?(請(qǐng)注意:也可以根據(jù)其他規(guī)則定義一些其它值)。
3.4:數(shù)據(jù)可以是被colletcd(CRF上,來自供應(yīng)商(vendor),來自設(shè)備(device)),derived,或者assigned;?CRF數(shù)據(jù)可以從注釋的CRF?中溯源,衍生數(shù)據(jù)可以根據(jù)一些衍生規(guī)則溯源。Define.xml specification是Origin值的最權(quán)威的來源解釋??梢允褂?/span>SDTMIG的元數(shù)據(jù)提交指南 (Metadata Submission Guidelines, MSG) 引用其他指導(dǎo)和支持示例。
CRF:在define.xml?中指定?“CRF”?(及其對(duì)應(yīng)頁碼參考)作為Origin?意味著數(shù)據(jù)是作為CRF?的一部分收集的,并且會(huì)有一個(gè)相對(duì)應(yīng)的關(guān)于變量說明的注釋的CRF(aCRF)。Sponsor可能也會(huì)在define.xml?的注釋部分(Comments)提供額外的說明,以有助于reviewer審閱數(shù)據(jù),來源(Origin)為“CRF”,包含預(yù)先設(shè)定在CRF?上的信息。(例如:MHCAT:“呼吸系統(tǒng)疾病”)。
eDT:?在define.xml?中指定?“eDT”?作為Origin,意味著數(shù)據(jù)是通過電子數(shù)據(jù)傳輸(electronic Data Transfer) (eDT) 獲得的,并且通常沒有相應(yīng)的注釋。來源為“eDT”?的數(shù)據(jù)通常是通過數(shù)據(jù)流收集的(例如:lab實(shí)驗(yàn)室、ECG?或IVRS)。Sponsor可能會(huì)在define.xml?的注釋(Comments)部分提供一些有助于reviewer審閱數(shù)據(jù)的額外補(bǔ)充信息。
Derived(衍生):衍生的數(shù)據(jù)不是直接從CRF?上收集的,而是通過某種算法或可重復(fù)性規(guī)則計(jì)算得來的(這些數(shù)據(jù)是基于其他的數(shù)據(jù)計(jì)算產(chǎn)生的)。這種算法適用于該數(shù)據(jù)集中所有的記錄,也可以引用其他SDTM?數(shù)據(jù)集中的記錄。這些數(shù)據(jù)衍生規(guī)則是由Sponsor規(guī)定的。但是這些不適用于直接從實(shí)驗(yàn)室(或檢查設(shè)備)得到的實(shí)驗(yàn)室檢測結(jié)果。以下示例說明收集的數(shù)據(jù)和衍生數(shù)據(jù)之間的區(qū)別:
??通過eCRF?系統(tǒng),從其他錄入?yún)^(qū)域衍生的值的來源為?”Derived”?,因?yàn)镾ponsor決定衍生規(guī)則。
??根據(jù)Sponsor收集的數(shù)據(jù)衍生的值,或CRO?代表Sponsor衍生的值,來源為?”Derived”。
??由研究者衍生的值,書寫或錄入在CRF?上的值,來源為“CRF”(附帶參考),而不是”Derived”。
??由供應(yīng)商(例如:中心實(shí)驗(yàn)室)根據(jù)他們工作流程衍生的值認(rèn)為是收集而來的,而不是衍生的,來源為“eDT”。
Assigned(指定):由獨(dú)立判斷(通過評(píng)估者,而不是受試者或研究者)決定的值,而不是作為CRF?的一部分收集的,或根據(jù)某種算法計(jì)算得來的值。這個(gè)過程可能包括第三方機(jī)構(gòu)的裁定。編碼過程中提供的編碼術(shù)語(像--DECOD?的值)的來源通常為“Assigned”。為了滿足SDTM?規(guī)則而單獨(dú)設(shè)定的受試者相關(guān)數(shù)據(jù)的值(例如:DOMAIN、--TESTCD)的來源通常為“Assigned”。
Protocol(方案):作為試驗(yàn)設(shè)計(jì)準(zhǔn)備[see Section 7 – Trial Design Datasets]值得一部分,通常將Origin?定義為“Protocol”。例如:變量VSPOS(生命體征體位)可能只在方案中說明而不會(huì)出現(xiàn)在CRF?上。
在以前SDTMIG?版本中,使用術(shù)語“Sponsor Defined”,用來說明元數(shù)據(jù)中的某些數(shù)據(jù)是Sponsor提供的Origin值。字段“Sponsor Defined”?不會(huì)再用于define.xml?中,并且SDTMIG v3.1.2?及以后版本都不會(huì)再使用。
4.1.1.8.2 Origin Metadata for Records
Sponsor需要注意:Origin=”Derived”,意味著這個(gè)變量所有的值都是衍生的,Origin=”CRF”(包含注釋)意味著這個(gè)變量所有的值都是收集來的。在一些情況下,收集和衍生可能同時(shí)映射到同一個(gè)變量。例如:Finding類數(shù)據(jù)集(如QS?數(shù)據(jù)集)包含從CRF?中收集的結(jié)果,然而像“總分”這樣的記錄是衍生的值。出現(xiàn)上述情況時(shí),記錄值級(jí)別(value-level)的元數(shù)據(jù)Origin將顯示為“Derived”或“CRF”,而變量級(jí)(variable-level)元數(shù)據(jù)Origin將列出所有種類的變量,并以逗號(hào)分開(如“Derived, CRF”)。
3.4:當(dāng)derived和collected的值同時(shí)映射到同一變量時(shí),Origin就需要用value-level的元數(shù)據(jù)在define.xml中描述。
標(biāo)黃部分與實(shí)際情況不符,目前define2.0或更新版本已經(jīng)不支持如"Derived, CRF”兩種及以上的Origin,可能老版本支持。
總結(jié):
1.Origin是什么?
Origin是一個(gè)定義Define.xml中數(shù)據(jù)集變量的元數(shù)據(jù)屬性,用來描述變量的來源。
2.如果某變量有value-level元數(shù)據(jù)定義,那么Origin either value-level or variable-level。
比如VS的CRF收集了HEIGHT和WEIGHT,并延伸了BMI,則variable-level的Origin為空,不可以在variable-level?Origin寫“Derived, CRF”。而value-level需要填寫清楚。

如果value-level都是相同的話,則variable-level需要填充成value-level。


拓展:

如有問題(如上圖),歡迎私信,一起討論交流!微信號(hào):Terhing
訂閱號(hào):CDISC_SAS