作为江苏北部的重要门户,沛县正在借助大数据的力量,提升政务数据治理能力和政府服务水平。
沛县是首批全国文明县城、全国科技进步先进县,荣获全国百强县、全国工业百强县、国家知识产权强县工程试点县等诸多荣誉称号。
为深入贯彻落实国家大数据战略,进一步规范和深化沛县政务信息资源的有效整合和开放共享,推动沛县政务信息资源的优化配置和增值利用,促进政府部门间业务协同,沛县人民政府携手百度智能云,借助百度智能云数据湖管理与分析平台EasyDAP平台开展沛县政务大数据治理及数据资产编目工作。
摸清数据底数,探索数据治理
沛县信息化办公室科长杨雅透露,选择百度智能云是因为EasyDAP平台功能齐全,操作简单、数据处理能力等重要指标上表现不俗,能够满足沛县的要求。同时EasyDAP在兼容性和开放性上具有独有特色。
在实际落地过程中,沛县梳理了全县所掌握信息资源,摸清数据底数,明确可共享的信息资源,并完成沛县政务信息资源目录编制,逐步构建起全县政务信息资源目录体系,包括基础信息资源如人口、法人、地理信息、信用等。主题信息资源如生态环境、健康保障、社会保障、药品安全、市场监管等。部门信息资源即各部门信息资源,涉及公安、司法、教育、政务等27个部门。
与此同时,沛县还建立了政务信息资源调查的元数据标准,基于对各部门的业务理解,完成对数据元的结构、分布、标准等内容的梳理。
EasyDAP赋能,七个步骤实现数据治理
沛县数据资产编目项目基于百度智能云数据湖管理与分析平台EasyDAP如下能力开展数据治理工作:
数据资源的调研梳理与管理
EasyDAP支持接入MySQL、Oracle、SQL Server、GreenPlum、Palo、HIVE、SAP HANA、对象存储等各类数据源系统,进行统一的管理。数据资产编目第一步先将现有各类数据源接入EasyDAP数据源管理模块,以初步实现全域数据源资产的统一视图和理解。
数据资源的探查和分析、理解
基于EasyDAP探查自动获取各类数据源的数据Schame,并在EasyDAP上建设统一元数据, 基于元数据通过SQL方式即可探查、分析理解数据源数据内容。
数据资产的规划、标准制定
基于EasyDAP数据标准建设、内置行业数据标准模板、码表管理等功能,建设统一数据模型标准。
数据资产的编目和建设
基于EasyDAP灵活自定义数据主题、自定义库、自定义表,根据组织结构、根据数据资产规划进行数据编目、资产建设。
数据集成、清洗
基于EasyDAP提供可视化ETL数据集成、清洗能力,采用30余种可视化数据处理插件,和内置集成百度NLP自然语言处理能力进行数据清洗处理。在实践过程可根据数据处理场景沉淀自动化、智能化数据处理插件。
数据资产的安全管理
EasyDAP从数据源资产维度支持各类数据源的访问权限管理,将接入的各类数据源系统设置权限,确保访问安全。从数据资产统一元数据管理维度,支持主题、库、表、行、列级别的数据权限管理。支持数据密级定义、数据动态脱敏等能力,确保数据安全。
数据资产的服务化
EasyDAP开放数据API服务,使得建设好的数据资产高效对外服务。
此外,EasyDAP还可以对数据资产进行全面的统计分析,包括数据源维度、主题维度、库表维度等,帮助用户高效查看数据资产情况。
大数据价值初现,持续探索
截至目前,沛县数据资产编目项目一期已经基本完成,打通27个部门的数据信息,改变了以往各部门数据孤岛情况,实现了数据开放、共享,互联互通。有利于政府各部门根据数据,统观全局,合理规划,科学决策。例如,数据打通后更便于经济发展局调取数据,并进行数据规划。在数据安全方面,原本分散、不规范的数据集中后更利于留存、取用,方便及时发现问题并采取相应举措。
杨雅认为,EasyDAP强大快速、稳定安全、操作简单、节省成本,完全满足了沛县的数据治理需求。
城市级大数据治理覆盖医疗、教育、环保、交通等多个领域,最终惠及的是每个人的工作、生活。沛县的大数据实践证明,百度智能云数据湖管理与分析平台EasyDAP通过统一的数据治理逻辑,为城市数据治理提供一套高效率、低技术成本的工具支撑。
EasyDAP不仅能够帮助客户通过数据治理建设完成数据资产,还可以支持用户在平台上进一步完成批和流数据开发、多源数据的融合分析,基于实际应用场景发挥数据价值。
未来,沛县将在目前数据梳理的基础上,进一步挖掘数据价值,持续提升政务数据治理能力和政府服务水平。