大数据名词解释_大数据的三种定义

2024-12-1806:12:48创业资讯1

数据治理,即是在特定框架内,借助制度规章、标准规范、技术应用及实践经验,对数据进行全生命周期的管理,包括确权、质量管理、安全控制、隐私保护、开放共享、交易流通及分析处理等环节。其目标在于提升数据可用性、安全性及流通性,从而激活数据资源的潜在价值,并发挥其经济和社会效益。

“数据治理”核心概念详解

一、数据元

数据元是构成实体数据的最小单元。它由对象、特性和表现形式三部分组成,是一组属性描述其定义、标识、表示及允许值的数据单元。作为数据标准化定义的基础,数据元为构建统一、集成且稳定的行业数据模型提供了基石。

二、元数据

元数据是描述数据的数据,是结构化数据的一种。它主要分为业务元数据、技术元数据和管理元数据三类,用于描述数据的属性,如存储位置、历史数据、资源查找及文件记录等功能。在数据治理中,元数据起到描述和存储数据信息的作用,有助于数据的理解、查找、管理及使用。

三、主数据

主数据,也称为基准数据,指的是系统间共享的核心数据。这些数据反映核心业务的高价值信息,具有变化缓慢且在企业内部保持一致的特点。主数据的正确维护能确保企业内部系统数据的完整性。主数据具备高价值性、高共享性及相对稳定性等特性,并超越业务、部门、系统及技术层面。

四、业务数据

业务数据是在业务活动过程或系统自动产生的既定事实的数据,如交易过程中生成的数据或系统产生的数据。这类数据主要服务于各类业务应用,如生产、销售、采购等。

五、主题数据

主题数据是按数据分析需求对数据进行和管理的一种方式。它是分析型数据,按业务主题域,服务于决策时关注的重点方面。主题数据通常由主数据和交易数据组成,是汇总的、不可更新的只读型数据。

六、数据处理与存储基础设施

(1) 数据仓库

数据仓库是一个面向主题的、集成的、相对稳定的集合,用于支持管理决策。它汇集来自不同业务系统的数据,并按主题进行分类和分组,为数据分析提供支撑。它是数据分析与可视化的基础。

(2) 数据湖

数据湖是一个以原始格式存储数据的仓库或系统。它不要求事先对数据进行结构化处理,能存储结构化与非结构化等多种类型的数据。它是解决不同数据结构统一存储问题的低成本解决方案,并为机器学习提供全局数据。

更多关于“数据治理”的专业术语名词解释及相关概念可参考相关文献资料。

  • 版权说明:
  • 本文内容由互联网用户自发贡献,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 295052769@qq.com 举报,一经查实,本站将立刻删除。