wanghaisheng / healthcaredatastandard

healthcare data standard in China
449 stars 280 forks source link

ws363数据类型分析 #1

Open wanghaisheng opened 9 years ago

wanghaisheng commented 9 years ago

由于我们国家的卫生信息数据标准并非像老外一样,是在卫生信息概念模型的基础上抽象而成,而是在整理了据说1000多份医院信息系统、医院业务、公共卫生服务中用到的表单归纳而成,因此其中没有类的概念、也没有类与类之间的关联,只是简单的数据项的水平排列,这就造成了一点,信息的粒度过于离散,有点编程语言的数据类型的味道,确又不足以支撑医疗的业务。 WS363中对数据元的取值的约束是通过数据类型和允许值的表示格式组合来共同完成的, 数据类型先确定大方向,到底是字符串还是数字,是布尔值还是日期时间。由表示格式来表示简单的业务层面的约束,比如身份证号码可以是数字字符串,且长不超过18位 表示成 S1 AN..18 这个对于我们而言 可以抽象成一种数据类型S1字符串或数字

wanghaisheng commented 9 years ago

简单数据类型总结如下

数据类型名称 说明 范例 FHIR中对应的数据类型
N 任意长度 数字 整数和小数 123456 integer和decimal
S1 任意长度 包含字母和或数字 123456 1024x john string
S2 可枚举的 字母或数字表示的编码 同时亦可是一个编码所表示的概念含义的字符串 1.高级职称 2.中级职称 3.初级职称 code
S3 不可枚举的 字母或数字表示的编码 同时亦可包括一个编码所表示的概念含义的字符串 同时要包含编码系统的标识以及名称 具体请看后面 Coding
D8 定义YYYYMMDD格式的日期 20000101 date
DT15 定义格式YYYYMMDDThhmmss的日期时间 20111028T162330 dateTime
L 布尔值 0 1 true false booelan
BY 二进制文件 base64Binary
---- ---- ---- ----
---- ---- ---- ----
---- ---- ---- ----

S3数据类型取值的范例

            <婚姻状况类别代码>
                <值域代码标识>GB/T 2261.2-2003</值域代码标识>
                <值域代码名称>个人基本信息与分类代码 婚姻状况代码</值域代码名称>
                <版本>2003</版本>
                <代码含义>未婚</代码含义>
                <代码值>10</代码值>
            </婚姻状况类别代码>

二进制文件

<二维码图片 value="/9j/4...KAP//Z" /> 
wanghaisheng commented 9 years ago

从上看出 S1其实就是string字符串类型,S2、S3其实都是可以由字符串衍生得到,加一些额外的属性就好了。 S2可以与FHIR的code完美对应,而S3可以对应到Coding。 D8可以与FHIR 的date对应,DT15可以与dateTime对应 L对应booelan BY对应base64Binary N对应到integer和decimal

wanghaisheng commented 9 years ago

其他复杂的概念如

概念名称 说明 数据类型 FHIR中的数据类型
名称 表示一个对象称谓的一个词或短语 S1 ----
代码 替代某一特定信息的一个有内在规则的字符串(字母、数字、符号) S2 S3 ----
说明 表示描述对象信息的一段文字 S1 ----
金额 以货币为表示单位的数量,通常与货币类型有关 ---- ----
数量 非货币单位数量,通常与计量单位有关。计量单位参见附录表A.1,法定构成十进倍数和分数单位的词头见附录表A.2 ---- ----
日期 以公元纪年方式表达的年、月、日的组合 D8 ----
时间 以24小时制计时方式表达的一天中的小时、分、秒的组合 DT15 ----
日期时间 完整时间表达格式,即DT15,YYYYMMDDThhmmss的格式 ---- ----
百分比 具有相同计量单位的两个值之间的百分数形式的比率 ---- ----
比率 一个计量的量或金额与另一个计量的量或金额的比 ---- ----
标志 又称指示符,两个且只有两个表明条件的值,如:是/否、有/无等 L ----
时长 两个时点间的时间长度 ---- ----
wanghaisheng commented 9 years ago

复杂数据类型

概念名称 说明 数据类型 FHIR中的数据类型
金额 以货币为表示单位的数量,通常与货币类型有关 ---- Money
数量 非货币单位数量,通常与计量单位有关。计量单位参见附录表A.1,法定构成十进倍数和分数单位的词头见附录表A.2 ---- Quantity
百分比 具有相同计量单位的两个值之间的百分数形式的比率 ---- ----
比率 一个计量的量或金额与另一个计量的量或金额的比 ---- Ratio
时长 两个时点间的时间长度 ---- Duration 和Period 到底用哪个