3.2 CDISC遞交數(shù)據(jù)--SDTM Dataset Metadata之Primary key
SDTMIG V3.2和V3.4比較:
SDTMIG V3.2:
3.2 Using the CDISC Domain Models in Regulatory Submissions —Dataset Metadata
與數(shù)據(jù)集一并遞交的define.xml,描述了每一個數(shù)據(jù)集的基本屬性及其natural key結(jié)構(gòu)。盡管大多數(shù)的研究通常會包括DM?和基于3種general observation classes(Interventions, Events, or Findings)的安全性domains(通常包括?EX,?CM,?AE,?DS,?MH,?IE,?LB?和?VS),但實際遞交哪些數(shù)據(jù)將取決于試驗方案及藥物監(jiān)管評審委員的要求。如下面表格?3.2.1?中所描述,數(shù)據(jù)集定義元數(shù)據(jù)(Dataset definition metadata)應包括數(shù)據(jù)集文件名稱、描述、位置、結(jié)構(gòu)、類別、目的、關鍵變量(keys)及注釋等內(nèi)容。
如果有一個數(shù)據(jù)集中沒有記錄,為空(例如,小型?PK?研究中,沒有受試者服用伴隨藥物),則該空數(shù)據(jù)集不需要進行遞交,也不要在?define.xml?中進行描述。在注釋的CRF?中表明只有采集到的數(shù)據(jù)才會進行遞交,因而不需要在CRF上對沒有記錄做再次注釋。
3.2.1 Table 3.2.1 SDTM Submission Dataset-Definition Metadata Example
*注意:此表所示key變量只是示例。Sponsor的實際key結(jié)構(gòu)可能會有所不同。
**推薦使用獨立的補充修飾語數(shù)據(jù)集supp--.xpt。參見章節(jié)?8.4。
3.2.1.1 Primary Keys
上表列舉了Sponsor遞交的SDTM數(shù)據(jù)集中構(gòu)成primary key的一些變量示例。由于該列的目的是幫助評審委員會(reviewers)理解數(shù)據(jù)集結(jié)構(gòu),因而Sponsor應當列出該數(shù)據(jù)集對應的所有natural keys(參見下面的定義)。這些keys用來確定記錄在數(shù)據(jù)集內(nèi)的唯一性,并可能定義每條記錄的順序。這些keys的名字應該與structure列中對結(jié)構(gòu)的描述一致。對于所有general-observation-class domains(以及一些special-purpose domains),可以通過創(chuàng)建--SEQ變量及結(jié)合使用?STUDYID、?USUBJID、?DOMAIN,來確保數(shù)據(jù)記錄的唯一性。在大部分domains中,?--SEQ?是包含natural key的一組變量的替代key(參見下面的定義)。在某些情況下,一個補充修飾(SUPP--)變量也可能構(gòu)成某些domain里記錄的natural key。關于如何呈現(xiàn)及其它附加信息,請參見?4.1.1.9。
natural keys是(數(shù)據(jù)集中單個變量或多個變量)用來標識該數(shù)據(jù)集唯一性的一條(段?)數(shù)據(jù)(a piece of data),并將數(shù)據(jù)集內(nèi)其他數(shù)據(jù)區(qū)分開。natural keys的優(yōu)點是它們已經(jīng)存在,并且不需要在數(shù)據(jù)集中衍生新的變量。選擇natural keys的困難之一在于,任何能想到的natural keys都可能改變。因為natural keys具有特定的使用目的,只有與其相關內(nèi)容一起使用時才有效,當使用需求發(fā)生變化時,natural keys也得隨之變化。臨床試驗數(shù)據(jù)發(fā)生這種變化的一個例子是:在新研究中新收集的部位和地點數(shù)據(jù)成為key,但在以前的研究中并沒有收集。
surrogate keys是單方面、人為衍生的記錄標識符。surrogate keys賦值是衍生數(shù)據(jù)中的一種特殊情況,是primary key中衍生而來的那部分。surrogate key不會受到需求變化的影響。另外,由于該key只依賴于一個字段,因而比較緊湊。surrogate keys的常用方法是按某種順序衍生整數(shù)型變量。在?SDTM?數(shù)據(jù)集中,變量--SEQ是絕大部分數(shù)據(jù)集中的surrogate key;然而,在某些情況下,--SEQ可能是natural key的一部分,它替代已存在于Sponsor數(shù)據(jù)庫中的一個key(例如,一個重復的序列號變量)。此處可理解為數(shù)據(jù)集里已存在類似--SEQ的變量,故直接改名為--SEQ即可。
SDTMIG V3.4:
3.2.1 Dataset-level Metadata
注意:此表所示key變量只是示例。Sponsor的實際key結(jié)構(gòu)可能會有所不同。此表中的class和展示的數(shù)據(jù)集順序不是作為遞交數(shù)據(jù)集的規(guī)范的順序。
必須使用獨立的補充修飾語數(shù)據(jù)集supp--.xpt。參見章節(jié)?8.4
詳細擴展內(nèi)容請移步微信訂閱號:CDISC_SAS。