数据模型定义:DAMA数据治理体系中将数据模型定义为一种文档形式,数据模型是用来将数据需求从业务传递到IT,以及在IT内部从分析师、建模师和架构师到数据库设计人员和开发人员的主要媒介;
作用:记录数据需求和建模过程中产生的数据定义;
数据建模方法:
常见的数据建模方法是关系建模、维度建模、面向对象建模、基于事实建模、基于时间建模和非关系型建模;
本章重点梳理关系建模方法:
关系建模定义:是一种通用的数据建模方法,关系建模的基本思想是通过将数据表示为关系模型,提高数据的结构化和可理解性;
关系建模按照陈氏符号表示法主要涉及以下几个步骤:
- 识别实体:实体的识别逻辑参考5W1H逻辑;
- 识别实体的主键:根据实体的定义和标准,确定存储颗粒度,识别实体的主键;
- 定义属性:为每个实体定义属性,也就是实体所对应的描述性标签;
- 确定关系:关系类型可以分为以下几类
a.多对多的关系类型:不同的原材料加工成多种产成品;
b.1对多的关系类型:多个原材料只能用于一个产品的生产;
c.1对1的关系类型:一个原材料加工成一个产成品;
基于识别出来的实体、关系、属性设计相关的数据模型;
实例:
以下是在线书店的ER图示例:
1.识别出的实体包含:客户、订单、书
2.识别实体的主键:客户的主键是客户id,订单的主键时订单id,书的主键是书的id;
3.定义属性:
a.客户的属性包含名称、email、密码、地址;
b.订单的属性包含订单日期、订单金额、订单的采购数、订单总价格;
c.书的属性包含标题、作者、ISBN、书的单价、书类型;
4.确定关系:
客户和订单的关系:1对多;
订单和书的关系:多对多;
陈氏符号(Chen's Notation)是由美国计算机科学家彼得·陈(Peter Chen)在1976年提出的,用于描述实体-关系(ER)模型的一种图形表示方法。这种表示方法在数据库设计和信息系统分析中被广泛使用。以下是陈氏符号的一些基本元素和规则:
- 实体(Entity):
- 实体用矩形表示,矩形内写上实体的名称。
- 实体可以是现实世界中的对象,如人、地点、物品等。
- 属性(Attribute):
- 属性用椭圆表示,并通过线连接到它们所属的实体。
- 属性是描述实体特征的数据项,如人的名字、年龄等。
- 关系(Relationship):
- 关系用菱形表示,并通过线连接到它们涉及的实体。
- 关系描述实体之间的联系,如“学生”和“课程”之间的“选课”关系。
- 键(Key):
- 键是用于唯一标识实体实例的属性或属性集。
- 在陈氏符号中,主键通常用下划线标记。
- 基数(Cardinality):
- 基数描述实体间关系的数量约束,如“一个学生可以选多门课程,但一门课程可以被多个学生选”。
- 基数可以用“1”、“0..1”、“*”等符号表示。
- 参与度(Participation):
- 参与度描述实体在关系中的角色,可以是“部分参与”(Partial Participation)或“全参与”(Total Participation)。
- 参与度可以用“O”(全参与)和“o”(部分参与)表示。
- 弱实体集(Weak Entity Set):
- 弱实体集是指没有足够属性来形成主键的实体集。
- 弱实体集用双线矩形表示,并且它们的关系称为识别关系。
- 外键(Foreign Key):
- 外键是用于在两个实体集之间建立联系的属性或属性集。
- 在陈氏符号中,外键通常用箭头指向它们所指向的实体。