自大数据于2012年开始成为行业信息化热点话题后,它在国内的“落地”、就引起了业界普遍关注。医疗行业,因其必须面对的海量医疗健康数据处理需求,也成为了国内率先启动大数据应用的先锋行业之一。
医疗大数据应用面临挑战
就数据集的规模、多样化程度和增长速度而言,中国医疗行业确实面临着艰巨的大数据应用挑战。比如说,寻常一张CT扫描图像,就含有约150MB的数据;一个基因组序列文件大小约为750MB;标准病理图的数据量接近5GB。如果将这些数据量乘以人口数量和平均寿命的话,仅一个社区医院累积的数据量,就可达PB级,而且其中还富含图像、视频等非结构化数据,更不要说规模更大的三甲医院,甚至是地区医疗主管部门汇集的数据集了。
医疗行业的大数据集量大且繁杂,其中蕴含的信息价值也多样且丰富,如果能够对其进行有效的存储、处理、查询和分析,那么就可对于小到辅助某个临床医生做出更为科学和准确的诊断和用药决策,或帮助某个医院根据患者潜在需求开发全新个性化服务及自动服务,大到帮助相关研究机构突破医疗方法和药物革新,或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置。
然而,如何将海量、复杂的数据存储、处理和保护成本降至最低,同时还能对此进行实时或准实时的处理、秒级的查询需求响应以及智能、深入的分析,却面临着重重挑战,其中“入门”第一关,就是大数据集的存储、处理和查询难题。
这一挑战,目前也摆在政府、金融、电信、互联网等大数据应用的行业先锋面前,因为这些行业以往用于承载、处理和分析数据的基石,多为针对结构化数据设计的传统关系型数据库,以及基于这种数据库的商业智能应用。
随着这些行业的数据迅速发展成为大数据,特别是大量非结构化数据产生后,关系型数据库在存储大数据集时已失去性能、功能和成本优势,而且在处理和查询大数据集时更是力不从心。IT产业界及行业用户都亟需针对大数据设计和优化的数据存储、管理和查询平台,来替代传统关系型数据库平台,帮助他们迈过大数据应用的这道门槛。
英特尔助力大数据应用落地
面对行业大数据应用的重重挑战,英特尔的开放架构大数据平台逐渐浮出水面。据悉,该平台具备高性能和高能效,并对存储子系统进行了优化,可用于打造存储服务器、支持横向可扩展存储方案开发的双路至强处理器,以及英特尔专门为大数据存储、管理、处理和查询需求开发,且针对英特尔至强平台进行了充分优化的英特尔Apache Hadoop发行版软件所组成。
正是这一硬一软的搭配,为行业用户解决大数据应用的入门难题带来了突破—它可以凭借成本优势支持TB-PB级大数据集的分布式存储、实时处理和查询应用,并支持在其上开发部署丰富的大数据分析应用。值得一提的是,该解决方案已经获得了包括政府、电信和金融在内的众多行业用户的成功应用。因此对于医疗行业用户及其面临的大数据应用挑战来说,英特尔这一开放架构大数据平台,就是一个理想的、也较为成熟可靠的选择。
“由于英特尔公司的Hadoop数据库已经完成了从芯片硬件到数据库管理的全面优化,降低了我们在应用软件产品化方案化过程中的工作量和总体成本。我们在嘉和CDR方案中采用了基于大数据技术的数据库。”北京嘉和美康信息技术有限公司副总经理范可方表示,“这次和英特尔公司共同发布CDR方案,也表明了双方对电子病历数据应用市场的信心和决心。”
北京嘉和美康信息技术有限公司副总经理范可方
据悉,英特尔日前与国内知名的医疗行业应用软件开发商—嘉和美康信息技术有限公司达成合作,标志着英特尔大数据技术在医疗行业的落地,它与嘉和美康既有的医疗信息化应用及方案的结合,则将为医疗行业用户大数据的多维度、多层次应用提供强有力的技术平台支撑——这将使针对中国本地医疗行业用户定制的“医疗大数据解决方案”尽快问世并得以普及。
“我们很高兴能与嘉和美康在推进中国医疗大数据应用方面携手并进,”英特尔(中国)有限公司行业合作与解决方案部数字医疗行业中国区经理黄庆春表示:“这次合作使得我们的大数据平台得以进一步为中国广大医疗行业用户提供支持,让他们能够更好地服务于中国亿万民众的健康大计。”