我国人口与健康领域的大数据资源4日首次向社会公布。本次发布的数据量高达49.1TB、2.8亿条,包括生物医学、基础医学、临床、公共卫生、中医药学、药学、人口与生殖健康七大类。
记者从4日在京召开的国家人口与健康科技资源发布会上获悉,大数据资源由国家人口与健康科学数据共享平台公布。中国工程院院士、共享平台管理中心主任刘德培院士说,此次发布的数据较为详尽地反映了我国居民健康状况。以我国国民体质与健康数据库的建设为例,抽样调查了16个省份的48个县市居民,其中4省还进行了二次跟踪调查,指标涉及12大类、240余项,还包括生理信号和图像类数据。
据刘德培介绍,为保护数据提供者权益和个人隐私,共享平台在建设过程中,自动为每个数据集提供唯一标识,并为数据提供者创立电子注册证书。在数据导出时,去掉个人姓名等关键信息,实现个人隐私安全。