数据留痕|数据留痕的两种使用场景:电子文档修改和流程留痕
编辑导语:数据在变动之后有可能留下痕迹,此时这类痕迹就称为“数据留痕”。而数据留痕在一定程度上可以帮助业务人员寻找易混淆的信息,寻找数据可能出错的起点。本篇文章里,作者就对数据留痕的定义和场景做了解读,一起来看一下。

文章插图
一、背景医学科研中,原始数据经过解析,完成数据的首次填充。然后经过多轮校验和修改,最终形成高准确度的数据。但是数据演进的过程越长,出现错误的概率也就越大。使用错误数据进行科研,科研结果的准确性就会受到影响。
当数据出现问题时,由于没有记录数据演进过程,所以无法了解数据是“何人何时修改了何种信息”,缺少了寻找错误的起点。
例如,数据库中记录患者李明的“就诊年龄=61岁”,但是医生通过其他资料查询,认为就诊年龄应该是59岁。由于没有记录中间演进过程,所以不知道是什么原因产生了这种差异。也不知道是谁因为什么修改的这个数据。
其实,数据的演进过程是这样的。其中“61岁”是通过身份证号和当时的就诊日期自动计算出来的。后面经过数据核查,“李明的身份证年龄比实际年龄小2岁”,于是修改李明的“就诊年龄=59岁”。
上述案例中,“就诊年龄=61岁”,“就诊年龄=59岁”是数据的痕迹。“由身份证号和就诊日期计算所得”“身份证年龄比实际年龄小2岁”是数据修改的原因。
由于缺乏数据修改记录和数据修改原因,这种情况下可能会产生两个后果。
- 医生手动将61岁修改为59岁。原本正确的数据,被修改错误。如果筛选年龄介于18-60的患者。该患者就会被误选进入研究样本中,对研究结果产生干扰。
- 医生无法确定哪个数据准确,为了保证数据的准确性,则不适用该数据。那么研究的样本中就会少一例。当可供研究的样本数量较少时,减少一个研究样本就少了一份可用数据。
这就是我们今天讨论的话题,数据留痕。
二、数据留痕指的是记录数据的每一次变动,让每一次数据变化都留下痕迹。一条留痕记录包括两部分内容,变动信息和变动原因。
变动信息,指的是用户在提交数据时,提交后的数据相较于提交前上一次数据,发生变动的地方。主要数据有变动变量、变动前的结果(原值)、变动后结果(现值)、变动时间、修改人。变动信息具备事实性,能够准确的反应数据发生变动时的场景。
变动原因,指的是产生本次数据修改的原因。该部分信息是由用户手动填写完成,在数据提交时由系统记录的。数据的信息量大,价值高。主观性较强,准确性无法保证。
举例:

文章插图
在表单“基本信息”中,点击提交按钮,“首次就诊年龄“从原值“61岁”变更为现值“59岁”。同时,系统产生一条留痕记录。

文章插图
留痕记录中,变动信息:
① 变动时间:2021-2-2 19:04,记录执行提交任务的时刻。
② 修改人:张三医生,记录执行数据提交任务的人。
③ 变动变量:就诊年龄,记录修改的变量。
④ 原值:61岁,记录变量修改前的结果。
⑤现值:59岁,记录变量修改后的结果。
变动原因:
⑥变动原因:李明的身份证年龄比实际年龄大2岁,61岁是根据身份证号计算出来。
- 京东|裁员不忘膈应人,这家互联网大厂送的离职礼物恶心到我了!
- iPhone14|准大学生的数码装备推荐
- 有人觉得中暑就是热出来的,吃一些退烧药就好了,这种做法 蚂蚁庄园今日答案6月28日
- 浮甘瓜于清泉,沉朱李于寒水”描述的是什么场面 蚂蚁庄园今日答案6月28日
- 个头大的车厘子比小樱桃营养价值更高,对吗 蚂蚁新村6月28日答案最新
- 位于广东省阳江市的海陵岛自然资源丰富,景色优美,该岛没有 神奇海洋6月28日答案
- 哪种水果横着切开像星星的形状 蚂蚁庄园今日答案6月29日
- 为验证人类和黑猩猩,是否会产生新的后代,科学家找来5位姑娘!
- 喜马拉雅山出现的“雪人”是何生物?目击者:智商高、攻击性强
- 为什么科学家表示人类“灭绝”的可能性极低?这些理由你赞同吗?
