什么是健康医疗大数据
健康数据“多跑路” 人民群众“少跑腿”
华讯网7月4日电 国务院办公厅日前印发《关于促进和规范健康医疗大数据应用发展的指导意见》。什么是健康医疗大数据?健康大数据对医疗服务和百姓生活将产生哪些影响?就以上话题采访了相关部门负责同志和有关专家。
国家卫计委副主任金小桃介绍,健康医疗大数据涵盖人的全生命周期,既包括个人健康,又涉及医药服务、疾病防控、健康保障和食品安全、养生保健等多方面数据的汇聚和聚合。“让健康数据‘多跑路’,让人民群众‘少跑腿’。大数据有助于提供更加优质的健康医疗卫生服务。互联网健康咨询、预约就诊、诊间结算、医保联网异地结算、移动支付等,都给老百姓带来了更加便捷的应用服务。”
指导意见提出,要夯实健康医疗大数据应用基础。实施全民健康保障信息化工程,全面建成统一权威、互联互通的人口健康信息平台,消除数据壁垒,畅通共享通道。中国工程院院士、浙江大学附属第一医院李兰娟认为,未来以大数据为基础的全新医疗云计算模式和以家庭为云终端的健康服务将贯穿家庭、社区和医院,推动医学取得突破,帮助百姓获得实惠。目前,部分医改试点省份开展了医学检验检查结果互认共享的探索,这意味着在确保医疗质量的前提下避免不必要的重复检查,缓解“看病难、看病贵”问题。“《意见》的出台对国家医疗卫生的改革与发展,尤其是对每个人的健康管理将起到巨大的推动作用”。
国家卫生计生委医药卫生科技发展研究中心副主任代涛表示,国家要大力加强基础设施、资源目录、标准规范的建设,才能实现共建共享、互联互通。“光靠政府推动是不够的,必须要通过重要领域推广应用,形成示范带动,要让大家看到大数据是如何提高医疗服务效率和降低成本,是如何为临床决策提供支持系统的,是如何为政府决策提供事实产生的支持数据,然后才是组织实施”。
从尚未出生的胎儿到新生儿检查、定期体检,直至临终关怀,人生中所有的医疗健康数据都被存储记录下来,为医生的诊断提供参考——大数据让覆盖全生命周期的健康服务成为可能。
“如果能够把群众就医的数字医学足迹完整准确地记录下来,有利于构建一个预防、治疗、康复和自我保健管理一体化的电子云服务。小病在社区就能解决问题,一些疑难重症可以通过远程医疗方式分级诊疗。”国家卫生计生委规划信息司副司长张锋描述了大数据在健康领域的应用模式。
“利用大数据,将各种健康数据、各种生命体征的指标,集合在每个人的数据库和电子健康档案中,然后再通过可穿戴设备,及时监控血压、心率等方面的生命体征指标,及时作出健康提醒。通过大数据分析应用,推动覆盖全生命周期的预防、治疗、康复和健康管理的一体化健康服务,这是未来健康服务管理的新趋势。”金小桃介绍。
如何加强医疗大数据背景下的隐私保护,也是公众关注的话题。此次《意见》提出,促进和规范大数据应用,一方面要推进网络可信体系建设,包括强化健康医疗数字身份管理,建设全国统一标识的医疗卫生人员和医疗卫生机构可信医学数字身份、电子实名认证等。另一方面是加强健康医疗数据安全保障,开展大数据平台及服务商的可靠性、可控性和安全性评测以及应用的安全性评测和风险评估。
国家信息中心专家委员会副主任宁家骏认为,大数据安全是国家《促进大数据行动发展纲要》的安全保障重要组成环节,今后除了做好相应保障之外,大数据的开发应用要实现个体数据的“脱敏”,在应用和研究时只能看到群体差异化特征,阻止对个体化信息的开发使用。
医疗健康大数据如何发展、应用?专家详解
点击上方“健康中国”可以订阅哦
如何理解《促进和规范健康医疗大数据应用发展的指导意见》(以下简称“指导意见”),以及该政策对健康医疗领域所将产生的重要影响,《医学界》就热点话题采访了国家信息中心专家委员会副主任宁家骏教授。
请您介绍文件出台的背景及其意义?
宁家骏教授:这一文件是贯彻落实《国务院关于积极推进“互联网+”行动的指导意见》(国发40号)和《国务院关于印发“大数据发展行动纲要”的通知》(国发50号文件)的一个重要步骤,或者说是其重要组成部分。不久前,大数据部际联席会议还通过了《促进大数据行动纲要》的三年计划,并将医疗健康大数据应用作为今后三年的重要工作和突破点。大家都知道,医疗健康领域所包含的数据是非常巨大的,其应用也具有重要意义。在此背景下,国家卫计委推出该文件,应该说符合贯彻国家“十三五”期间推进大数据发展的要求,是一个重大战略和突破点,既关系民生、满足群众健康切身需求,又促进相关产业发展。
据悉文件包括夯实应用基础、全面深化应用、规范和推动“互联网+健康医疗”服务以及加强保障体系建设四大方面。请问国家将如何推动医学大数据的应用?在法律法规上如何保障体系建设呢?
宁家骏教授:可以说,人体是最复杂的系统,对健康的管理也是最复杂的工程,这项工作需要有海量、精准合不断变化的大数据的支持。近年来,伴随着国家经济实力的提高,我国医院的硬件设施有了很大的改善。很多医院都建立了现代化的临床信息管理系统,而且投入很大。但是,现在最主要的问题是每个医院都是自己在推动,导致信息孤岛的形成,造成重复诊断、重复检查等医疗资源的浪费,检查结果和信息利用率较低。所以发展大数据是利国利民的一件大事。具体而言,我们希望从公共卫生到医疗服务,包括医疗保障、药品供应和计划生育等全环节的数据很好地整合起来。这是该文件对医疗健康大数据应用指出了非常重要明确的方向。
谈到法律法规的问题,《行动纲要》已把大数据的相关立法和制度建设工作作为非常重要的环节。就医疗健康大数据来说,对涉及个人诸如基因库、疾病谱等高度敏感的信息是国家的重要资源,有必要通过立法来加强保护。考虑到立法周期比较长,所以目前国家还是首先利用好现有法律,如民法对隐私的保护要求等。同时,国家也鼓励地方政府部门的试点和创新。我认为,我们能够通过这些工作来做好数据保护。
从文件中我们看出政府大力推进医疗健康大数据的应用和资源整合,那么未来政府将有哪些资金上的支持?
宁家骏教授:在“十二五”期间,国家已重视医疗数据的整合,从中央层面开始做顶层设计推进信息共享。国家卫计委也从“十二五”就开始启动了“全民健康信息化工程”建设,计划在前期先行投入4亿多元人民币,进行建设。今后在“十三五”期间,还将动员更多的投资来做这方面的工作。当然除了政府投入,还要引入更多的社会资金投入这项重要领域的建设。
尽管目前推动不同的医疗机构间的信息贯通、共享存在一定难度,但是从技术层面来说,这实际上不成为障碍。近几年国家卫计委一直在做标准化建设,包括电子健康档案和电子病例,实下发了部标和国标。
我个人的观点是,推动信息共享是各利益群体的认识问题,关键在人。
互联网+健康服务将有哪些具体项目呢?
宁家骏教授:目前从各省已经或正在申报一些项目来看,“互联网+健康医疗”的项目不少,因为这些应用是互联网+健康服务的重要组成部分。按照审批程序,已有一些项目获得国家专项基金。
我认为,互联网+健康医疗的项目要分为两个层次。一个层面属于公益性/基础性的服务,要以政府为主导;另一个层面是增值务,须以市场为主导,政府做好监管和适当引导,以满足不同层次人民群众的需求。但总的来说,推动互联网+健康医疗,更重要的是利用互联网平台途径和思维,把过去传统的服务做好转型升级,真正地实现资源共享,更好推动信息共享、信息的汇聚。
作者:张凌
从健康码出发,聊聊大数据的利与弊
疫情期间,健康码的采用让使疫情防控更加高效、精准。这背后,是大数据技术在发挥作用。但是,大数据在为生活带来便利的同时,我们的隐私可能也会受到威胁。文章从大数据的概念出发,对其利弊进行了分析,并总结了它带来的机遇。

2020年,疫情的爆发使健康码在各大城市相继使用,健康码是以真实数据为基准,识别人员是不是直接或间接接触过一些感染者,从而判断人员是否需要隔离排查。
杭州市委副书记在接受新闻采访时表示,健康码的评判来源于三个维度:空间维度、时间维度和人际关系维度。这说明了健康码的生成充分利用了用户的数据,虽官方暂未公开数据使用的详情,但猜测健康码会结合用户的人际关系数据、GPS定位数据、电信运营商数据、消费记录数据、线下扫码位置数据等相关信息,进而判断人员是否出入高危场地。
健康码的应用,属于大数据技术的典型案例,网络服务提供者利用收集到的用户数据,预测用户的健康情况,使疫情防控更加高效、精准。
人们在享受大数据带来便利的同时,若网络服务提供者不按照规定使用用户数据,也将对用户造成骚扰,威胁到用户的隐私信息。
“任何理论首先必须澄清杂乱的,或者说是混淆不清的概念和观念。只有对名称和概念有了共同的理解,才能清楚而顺利地研究问题”。——克劳塞维茨《战争论》
李笑来曾经提及过,在写《韭菜的自我修养》这本书之前从来不会使用“韭菜”一词,因为没有弄清“韭菜”一词的定义,在没有弄清一个词的定义之前,不应该随便使用。
自从大数据概念被提出,我们已经广泛使用了这么多年的“大数据”,那么“大数据”的具体概念应该是什么?
现实世界中,有很多词汇是没有官方定义的,比如“人工智能”,没有哪个机构说他们定义的就是正确的“人工智能”概念。在不同的时代里人们对人工智能的定义也是不同的,上个世纪60年代,人们认为可以下跳棋的计算机就是人工智能,但现在看来这个说法显然是无法被人们接受的。
相同的,大数据的定义,也没有一个官方机构明确地说明什么就是“大数据”。早些年对于政府机构来说,数据汇集也叫做大数据,而后出现了一些数字办、大数据局等新成立的单位,把各地方、各单位的数据汇聚起来,以发挥后续政府数据的价值。对于金融机构来说,可以通过用户的行为进行用户画像就是大数据,通过用户的行为数据,判断用户的偿还能力及偿还意愿,识别用户贷款的风险。
麦肯锡对大数据给出的定义是:“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。”在《大数据时代》中,大数据指“不用随机分析法,而是采用所有数据进行分析处理。”IBM提出,“大数据是具备5V的特性数据,5V包括:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。”在上述基础上,业内人士已将大数据拓展成了“十字特性”,即:一“大”,二“杂”,三“全”,四“多”,五“快”,六“久”,七“活”,八“简”,九“稀”,十“联”。
大数据的定义如此之多,致使每个人心中都有对大数据的不同理解。如今多数情况下,人们提到大数据,都是在特指通过数据分析,可以得到数据中的价值,具体价值可以是协助人们进行决策判断,预测未来事情的变化,发现事务中的关联性等价值体现。本文所说的大数据,就是在遵循这样的描述。
预测是自古人们都在向往的活动,生活中的预测无处不在,比如通过概率分析法预测的中奖号码,通过价值分析法预测股价的走势。
古代人们利用占卜进行预测,就是通过多年观察到的事务变化,结合历史数据总结出来规律,应用在后续的占卜活动中。占卜并没有科学依据,但实际上占卜就体验了人们的大数据思维,利用对过往数据的总结,不必非得知道现象背后的因果,只要知道相关性就可以预测未来。
古代的中医从业者,并没有能力提炼出草药中的成分,哪种草药可以抑制哪种疾病,完全是在结合大量的实际案例,根据经验从数百种种草药中挑选出不同的组合,从而医治不同的疾病。
预测从古代发展到近代,出现了利用数学模型预测的方法,比如利用过往数据和数学模型的结合,预测未来几年的人口增长情况。
数学模型是用数学符号、公式、方程等对现实世界规律的抽象描述。如今的气象预报,还在应用数学模型的方法来预测未来的天气,气象局会根据气象图的变化趋势,结合温度,压力,湿度,风向,风速,阳光照射情况等,应用数学模型预测天气的变化趋势。
当今的大数据分析,就是在结合了占卜和天气预报的方法,利用历史数据,结合数学模型,预测未来、预测结果。健康码应用,通过我们的电信运营商数据、交通出行数据、交易记录数据等信息,预测我们是否为高危感染人群,判断是否需要进行隔离观察,这就是在预测结果。搜索引擎,通过用户的搜索喜好,预测美国总统的未来人选,这就是在预测未来。
预测是大数据最典型直观的价值体现,有时预测也被看作人工智能的范畴。在未来,利用大数据预测,将给人们带来更多的便利。利用数据预测可能的疾病,以便提早做出预防;利用数据预测学习的缺陷,以便精准教育及练习;利用数据预测用户的真实需求,从而不需要产品经理来瞎猜(估计到时候我也就下岗了)……
2004年,沃尔玛从以往数据中发现,在季节性飓风来临之前,不仅仅飓风用品的销量会增加,而且蛋挞的销量也会大幅增加。因此每当季节性飓风来临之前,沃尔玛就会把蛋挞商品摆放到飓风用品旁边,以便让快速购买飓风用品的顾客留意到蛋挞,增加蛋挞商品的销售量。沃尔玛的人也并不知道为什么蛋挞就成了飓风来临时的畅销产品,但是他们只需要知道飓风来临时沃尔玛的蛋挞会畅销就可以了,找到了这个相关性之后即使不用找到背后的原因,也可以提升销量。
大数据时代,我们不必非得知道现象背后的因果,只需要发现相关性,应用到后续的活动中,就可以创造巨大的经济或社会价值。利用大数据发现相关性,可以加快社会的进步,加快人们的决策,避免了找到“因”,在想清“果”的繁琐过程。
在大数据时代,人们偶然间发现自己的隐私受到了威胁,我们的隐私被互联网服务提供商监视着,购物应用监视着我们购物习惯,搜索引擎监视着我们网页浏览习惯,社交软件监视着我们的社会关系,理财产品监视着我们的财富……
互联网服务提供商监控着我们的数据,利用我们的数据搞“大数据杀熟”,形成“千人千价”,从而提高自身的利润,受害的却是我们消费者。美国国家2007年发起的棱镜计划,通过互联网服务器中的数据监听着我们每一个人的一举一动,在其面前我们没有隐私可言,拥有大量数据的机构,知道我们的每一个真实行为,有时甚至比我们自己都了解我们。
互联网服务提供商不合规利用数据对我们造成的影响尚可原谅,一旦数据被泄露或非法交易,将造成不可预知的后果。当今泄露事件层出不穷,脸书把用户的点赞数据非法供给了剑桥分析公司,间接性对美国大选结果造成一定影响;雅虎2016年泄露15亿人次的用户信息,使广大互联网用户的生日,电话号码,账户密码在暗网流传,随时有可能流入不法分子之手。
未来将是人工智能的时代,从人工智能的历史发展中观察,人工智能算法的优化,用程序员主动去写算法,算法的精准度不如利用大量数据去训练算法的效果好。因而数据在人工智能的发展中,将会起到至关重要的作用。
企业拥有的数据量越大,其算法的训练越充分;算法训练越充分,产品将越趋于完善;产品越完善,用户越多;用户越多,企业的数据量越大。这样就走到了一种无限的循环之中,形成强者愈强的马太效应,使小企业更难赶超大企业。
未来可能会存在部分企业,不在以向用户收费或广告商收费的方式盈利,而是以产生数据,售卖数据服务的方式来达到盈利的目的。
例如智能冰箱制造企业,免费提供智能冰箱给用户使用,但冰箱中的货物情况制造企业需要进行监控。企业将监控到的数据售卖给商超形式的货物提供企业,货物提供企业自动对冰箱中的缺货情况进行补货,从而承包用户的全家食材。
同时智能冰箱制造企业还可以将用电数据卖给电力供应商,告知电力供应商每户家庭的冰箱使用及耗电情况。电力供应商通过购买全部智能家电的用电情况,从而实现精准生产电能,避免造成电能的浪费。
当前企业间、政府间的数据,无法做到互联互通,形成了一个又一个的数据孤岛,但是一些企业可能又需要其他机构的数据,来实现自身业务的优化。例如银行就需要用户的房产数据、车辆数据来判断用户的财富;保险机构需要用户的医疗数据来判断用户的以往病史。
在数据互联需求的驱动下,未来将会催化数据连接平台产品的诞生。平台连接数据的供需双方,成为“数据淘宝”,为供需双方提供数据的信息流和资金流。
由于受到法律的制约,直接进行数据售卖显然将存在法律风险。因而数据连接平台的发展可能会朝着授权流通、画像流通、去标识化流通的方向发展。
授权流通就是在用户的合法授权之下,把数据从供应方转移到需求方;画像流通就是将需求方的用户画像模型运行于供应方的系统之中,从而在供应方的系统中只输出画像结果,不输出原始数据;去标识化流通就是将用户的隐私信息去标识化,只流通无隐私的数据,例如流通某地区的用户购买数据,分析购买喜好,但不能对应到具体个人。
未来将会有越来越多的企业需要进行数据的价值挖掘,但由于每个企业都有自身的业务,企业内部的员工重点关注自身业务的发展,对数据价值挖掘的具体方法不会特别了解,因此将会有公司专门提供数据价值挖掘思维的业务。如麦肯锡,波士顿,贝恩,四大等,都具备天然的优势开展此类业务。
本文由 @产品工具箱 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议