麦粉社区
>
建议征集
>
帖子详情

简单介绍数据仓库架构和数据模型

建议征集 发表于 2022-1-26 17:57
发表于 2022-1-26 17:57:31

一、数据仓库架构


      数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持企业的管理决策。它的基础架构主要分为三个方面:数据源、数据仓库、数据应用。即首先采集数据源,经过抽取、转换、装载之后,得到统一的、规范的数据,然后再进行数据应用的过程。


 


 


二、数据模型


      数据模型用于描述、组织和操作数据,描述现实世界的数据特征。我们通常将将数据模型分为三类:概念数据模型、逻辑数据模型和物理数据模型。


 


1、概念模型


 


      概念数据模型是从普通用户的视角对数据进行描述的,通常运用简单的符号来表示数据信息。只要能够清晰地反映出信息,没有特别严格的规定。常用的就是E-R图。


 


      E-R图的构图要素有实体、属性和联系。


 


      实体代表客观上可区分的事物,可以是人、物、或抽象的概念,在E-R图中用矩形表示,矩形框内写明实体名。


 


      属性指的是实体所具有的某种特征,一个实体可以由若干个属性来刻画。在E-R图中用椭圆形表示,并用直线将它与相对应的实体连接起来。


 


      联系也称关系,是用来反映实体内部或实体与实体之间的关联。在E-R图中通常用菱形表示,框内写明联系名,并用直线分别与有关实体连接起来,同时标上联系的类型(1 : 1,1 : n或m : n)。


 


2、逻辑数据模型


 


      逻辑数据模型是严格定义的一组概念的集合,通常由数据结构,数据操作和数据完整性约束条件这三要素组成。


 


      数据结构是指所描述的对象的属性(类型、性质、内容等)的集合,是对数据库的静态描述。


 


      数据操作是指允许数据库中的对象实例或值执行的集合,包括操作方法和相关规则,是对数据库系统动态特性的描述。


 


      数据完整性约束条件是指对数据和数据库状态进行限制,使其保持数据正确,符合实际情况。


 


      常见的逻辑数据模型有层次模型、网状模型和关系模型。


 


      层次模型:用树形“二叉树”结构来反映一对多关系的模型。它的特点是有且只能有一个根结点,结点的双亲是唯一的,没有一个子女记录值可以脱离双亲记录值而独立存在。如下图:


 


 


      网状模型:用网络结构表示实体类型及其实体之间联系的模型。它的特点是可以允许存在两个或者多个节点没有父节点,允许单个节点存在两个或以上父节点。如下图:


 


 


 


      关系模型:是用表格表示实体之间的关系的模型。无论是实体还是实体之间的联系都被映射在一张二维表中。


 


 


 

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 0关注人数 1270浏览人数
最后回复于:2022-1-26 17:57
快速回复 返回顶部 返回列表