基于大数据的中医文献数据挖掘
扫描二维码
随时随地手机看文章
引 言
根据第六次全国人口普查数据可知,我国农村居民为 6.74 亿人,看病贵问题依然突出,其症结在于医疗保障体系不够健全,大部分群众就医依然靠自费;公立医疗机构倾向于市场化, 淡化了公益性质。很多人普遍存在着 小病不用去医院 的观念,最终却因为这些观念被 小病 要了性命。
我国的中药文化博大精深,源远流长。几千年来,中国人形成了自己的用药理念和方法。与西药相比,中药的优势在于它取自动植物和矿物质,大部分属于天然产物。因此,中药的不良反应轻于西药,毒副作用较小。而且中药与自然有着密切联系,容易获取。
本文的灵感来源于屠呦呦荣获诺贝尔奖事件。通过创建基于R 语言平台的数据挖掘技术,建立中药数据库,利用计算机代替人工进行精确查找,大大提高了采集数据结果的准确性、全面性、权威性,明显缩短了数据挖掘所需时间,极大限度地减少了人力资源消耗。
1 研究方法
1.1 数据挖掘
基于历朝历代中医古籍和国内外权威中医论文,挖掘出农产品在所有中医古籍中的相关记载以及某一类疾病在所有中医古籍中的相关记载。
1.2 数据库构建
利用已拥有的中医古籍和国内外权威中医论文及其他合作院校所提供的数据资料、网上发表的论文等有效研究资料可建立数据库,通过搜索查找到中医古籍对农产品的描述。同理,如果想知道不同体质的人群是否适合吃某一类农产品,也可通过搜索获得。根据这些参数,利用统计软件R,根据已建好的可靠的数据模型对数据进行分析、计算,得到最佳健康结果,实现健康生活。数据库的建立工作是长期的,因为随着时间推移,农产品性质会发生潜在变化,所以要时刻将最新数据导入数据库,及时更新。因此,应详细搜集全国各地区的农产品资料并及时更新数据,将其存入数据库中,不断完善数据库,完善的数据库会使分析结果更加准确。山东农业大学农业大数据中心已经搜集并存储了多年的数据。
1.3 大数据平台的构建
本研究将在广东超算中心(天河二号)的基础上构建大数据分析与挖掘平台。充分利用大数据平台的资源构建算法结构, 实现在中医和农产品大数据方面的采集、存储、处理与分析挖掘等功能,以获得更精准的数据信息。研究 Linux平台下数据库的构建及应用,用以存储农作物相关参数,实现在数据量大的情况下的快速检索。
1.4 搭建应用平台
运用数据库等知识搭建好网站后台, 运用Wordpress、PHP、JSP 等技术搭建网站前台页面,免费提供给人们一个便捷、交互性强的平台。所谓个性苹果网站即为个例与健康的结合。建立了异于他人的双向搜索界面,实现个性农产品和个性用户的双向个性搜索;针对个性用户、个性农产品、个性群体、个性交流(社交),平台开展了从每个个体的健康指导到相似群体的健康交流;个性苹果项目为非营利项目。其显著特点是为社会提供的服务和可供使用的功能不收取任何费用,目的在于服务社会、服务人民,为人民提供便利与健康。
2 研究过程
个性苹果网站搭建如图 1 所示。
结 语
(1)个性用户。客户可以通过输入自己独特的健康状态, 查询最符合自身状况的可食用农产品排名顺序,得知自己最适 合吃的食物品种,哪些农产品对自己的身体最有利,最能改善 自己的身体状况,同时平台也会为用户筛选出忌食农产品,食 用哪类农产品不利于自身健康,甚至会加重病情。通过食物疗 法为每一位用户提供个性化的健康保障方案!对于符合自己健 康状态的农产品,平台将提供最权威、最安全的电商平台的 相关链接。
(2)个性农产品。客户可通过输入某一种农产品查询到 忌吃某类农产品的群体,通过比对得知自身状况是否适合吃 此种农产品,同时本研究利用中 / 西医的研究成果,为每一位 用户阐明原因。
(3)个性群体。研究团队为每一类群体提供健康计划, 比如小孩、老人、孕妇、生病群体等。就小孩而言,可为每一 个年龄段、不同体质的孩子提供健康成长计划,从饮食、生活 起居等各方面为孩子提供一个有助于其成长的方案,同时用户 再根据自身状况,将自己的各项相关指标反馈给平台,研究团 队可及时调整相关解决方案。
(4)个性交流(社交)平台。相同群体交流 :根据用户的 个性注册信息,向用户精准推荐好友,为每一位用户找到与自 己“志趣”相同的小伙伴,彼此交流各自的心得,为自己的健康、 成长、生活方式等找到更多的可参考方案 ;不同群体交流 :每 一位用户都可以选择自己感兴趣的群体,平台将根据用户的选 择,推荐每一位用户想要交流的群体,使每一位用户的生活 更加丰富多彩!(注:为保护用户隐私,社交平台不采用实名制)
(5)非营利性 :个性苹果是为社会公众提供健康指导的 非营利项目,其目的在于服务社会、服务人民,为大家提供便利。