【系统架构设计】数据库系统(一)

数据库系统(一)

  • 数据库模式与范式
    • 数据库的结构与模式
    • 数据模型
    • 关系代数
    • 数据的规范化
    • 反规范化
  • 数据库设计
  • 事务管理
  • 备份与恢复
  • 分布式数据库系统
  • 数据仓库
  • 数据挖掘
  • NoSQL
  • 大数据

数据库模式与范式

数据库的结构与模式

数据库技术中采用分级的方法将数据库的结构划分多个层次。最著名的是美国ANSI/SPARC数据库系统研究组1975年提出的三级划分法,如图3-1所示。

在这里插入图片描述

  1. 三级抽象

数据库系统划分为三个抽象级:用户级、概念级、物理级

  • 用户级数据库:对应于外模式,是最接近用户的一级数据库,是用户可以看到和使用的数据库,又称为用户视图。用户级数据库主要由外部记录组成,不同的用户视图可以互相重叠,用户的所有操作都是针对用户视图进行的。
  • 概念级数据库:对应于概念模式,是所有用户视图的最小并集,是数据库管理员可看到和使用的数据库,又称为DBA(DataBase Administrator ,数据库管理员)视图。概念级数据库由概念记录组成,一个数据库可有多个不同的用户视图,每个用户视图由数据库某一部分的抽象表示所组成。一个数据库应用系统只存在一个DBA视图,它把数据库作为一个整体的抽象表示。概念级模式把用户视图有机地结合成一个整体,综合平衡考虑所有用户要求,实现数据的一致性、最大限度降低数据冗余、准确地反映数据间的联系。
  • 物理级数据库:对应于内模式,是数据库的底层表示,描述数据的实际存储组织,是最接近于物理存储的级,又称为内部视图。物理级数据库由内部记录组成,物理级数据库并不是真正的物理存储,而是最接近于物理存储的级
  1. 三级模式
  • 外模式:用以描述用户看到或使用的那部分数据的逻辑结构,用户根据外模式用数据操作语句或应用程序去操作数据库中的数据。一个数据库可以有多个外模式,一个应用程序只能使用一个外模式
  • 概念模式:用以描述整个数据库中数据库的逻辑结构,描述现实世界中的实体及其性质与联系,定义记录、数据项、数据的完整性约束条件及记录之间的联系,是数据项值的框架,是所有用户的公共数据视图。一个数据库只有一个概念模式
  • 内模式:是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式

三者之间的关系:

  • 概念模式是数据库的中心与关键
  • 内模式依赖于概念模式,独立于外模式和存储设备;
  • 外模式面向具体的应用,独立于内模式和存储设备;
  • 应用程序依赖于外模式,独立于内模式和概念模式。
  1. 两级独立性

是指物理独立性和逻辑独立性。三个抽象级间通过两级映射(外模式-概念模式映射、概念模式-内模式映射)进行相互转换,使得数据库的三级形成一个统一的整体。

  • 物理独立性:指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。当数据的物理存储改变时,应用程序不需要改变。存在于概念模式-内模式之间的映射转换,说明物理组织发生变化时应用程序的独立程度。
  • 逻辑独立性:指用户的应用程序与数据库中的逻辑结构是相互独立的。当数据的逻辑结构改变时,应用程序不需要改变。存在于外模式-概念模式之间的映射转换,说明概念模式发生变化时应用程序的独立程度。

ps:逻辑独立性比物理独立性更难实现。

数据模型

数据模型主要有2大类,分别是概念数据模型(实体-联系模型) 和 基本数据模型(结构数据模型)

  • 概念数据模型:按照用户的观点来对数据和信息建模,主要用于数据库设计。概念数据模型主要用实体-联系方法(Entity-Relationship Approach)表示,所以也称为E-R模型
  • 基本数据模型:按照计算机系统的观点来对数据和信息建模,主要用于数据库管理系统(Database Management System,DBMS)实现。基本数据模型是数据库系统的核心和基础,通常由数据结构、数据操作和完整性约束三部分组成。其中 数据结构是对系统静态特性的描述,数据操作是对系统动态特性的描述,完整性约束是一组完整性规则的集合。常用的有:层次模型、网状模型、关系模型、面向对象模型。

ps:关系模型常用,用表格结构表达实体集,用外键表示实体间的联系。优点有:

  1. 建立在严格的数据概念基础上;
  2. 概念(关系)单一,结构简单、清晰,用户易懂易用;
  3. 存取路径对用户透明,从而数据独立性、安全性好,简化数据库开发工作。

关系代数

在这里插入图片描述

  • 笛卡尔积: 对R和S 做笛卡尔积运算,结果如下:
    在这里插入图片描述

  • 投影:从一个关系中抽取指明的属性(列)。对表3-1 关系R做投影操作,p1,2( R) 的结果如下:
    注意:p1,2( R) 操作表示对第1列和第2列做投影。
    在这里插入图片描述

  • 选择在这里插入图片描述
    注意:选择运算是从元组(行)的角度进行的运算。

  • 等值连接/自然连接
    在这里插入图片描述


  • 在这里插入图片描述

ps :
笛卡尔积:就是把表的记录都一一组合
投影:以列为单位,选择不重复的行
选择:以行为单位,选择行
等值连接:以相同列等值,选择行
自然连接:在等值连接基础上,并在结果中将重复的属性去掉
除:如果表A 和表B 做除法,先确定XYZ,Y和Z 一样,选择A和B 公共部分为YZ,然后A除去公共部分的就是X,然后对X进行投影操作,获取的结果X’与Z进行笛卡尔积操作,如果结果包含在A 中,则X’为最终结果

数据的规范化

关系模型满足的确定约束条件称为范式把一个低一级的关系模型分解为高一级关系模型的过程,称为关系模型的规范化规范化的思想是:逐步消除不合适的函数依赖,使数据库中的各个关系模型达到某种程度的分离关系模型分解必须遵守2个准则

  • 无损连接性: 信息不失真(不增减信息);
  • 函数依赖保持性:不破坏属性间存在的依赖关系。

范式从低到高分为1NF(第一范式)、2NF(第二范式)、3NF(第三范式)、BCNF(BC范式)、4NF(第四范式)等。

  • 第一范式:元素不可再分,如以下例子。但是满足了1NF会有很多重复值,并且增加了修改其数据时引起疏漏的可能性。为了消除这种数据冗余和避免更新数据的遗漏,需要更规范的2NF。
    在这里插入图片描述

  • 第二范式:如果一个关系R属于1NF,且所以的非主属性都完全依赖于主属性,则称为第二范式。

  • 第三范式:如果一个关系R属于2NF,且每个非主属性不传递依赖于主属性,则称为第三范式。

  • BC范式:一般满足3NF的关系模型已能消除冗余和各种异常现象,但无论2NF和3NF 都没有涉及主属性间的函数依赖,所以有时仍会引起一些问题,由此引入BC范式,通常也认为是3NF的改进。其定义是:每个函数依赖关系中的决定因素都包含码,即主属性都有外键和主键。

反规范化

优点是减少数据冗余,节约存储空间,相应逻辑和物理的I/O次数减少,同时加快了增、删、改的速度,但对完全规范的数据库查询,通常需要更多的连接操作,从而影响查询速度。因此,有时为了提高某些查询或应用的性能而破坏规范规则,即反规范化(非规范化处理)。

数据库设计

事务管理

备份与恢复

分布式数据库系统

数据仓库

数据挖掘

NoSQL

大数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3246764.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

萝卜快跑无人出租车是有人远程代驾? 客服:没有人操控

ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 近期“萝卜快跑”无人驾驶网约车相关话题引发网友热议。 有网传图片显示,萝卜快跑机器人智控中心,有真人坐在带有方向盘的屏幕前; 有网友认为所谓的无人网约车&am…

【设计模式】【创建型模式】【02工厂模式】

系列文章 可跳转到下面链接查看下表所有内容https://blog.csdn.net/handsomethefirst/article/details/138226266?spm1001.2014.3001.5501文章浏览阅读2次。系列文章大全https://blog.csdn.net/handsomethefirst/article/details/138226266?spm1001.2014.3001.5501 目录 系…

C++链接FTP服务器并下载数据(在qt中编写)

.pro文件 #------------------------------------------------- # # Project created by QtCreator 2024-07-16T13:19:03 # #-------------------------------------------------QT core gui networkgreaterThan(QT_MAJOR_VERSION, 4): QT widgetsTARGET untitled TE…

通过SchedulingConfigurer 接口完成动态定时任务

通过SchedulingConfigurer 接口完成动态定时任务 一.背景 在Spring中,除了使用Scheduled注解外,还可以通过实现SchedulingConfigurer接口来创建定时任务。它们之间的主要区别在于灵活性和动态性。Scheduled注解适用于固定周期的任务,一旦任…

【C++数据结构】二叉搜索树(超详细图解操作过程,超详细讲解代码实现)

目录 01.二叉搜索树的概念 02.二叉搜索树的操作过程 03.二叉搜索树的代码实现 (1)基本框架 (2)树的创建与销毁 (3)元素的查找 (4)元素的插入 (5)元素的…

Day71 代码随想录打卡|回溯算法篇---全排列

题目(leecode T46): 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 方法:全排列是数学中的基础问题,也是回溯算法能解决的经典问题。全排列因为每个元素都会…

卷积神经网络学习问题总结

问题一: 深度学习中的损失函数和应用场景 回归任务: 均方误差函数(MSE)适用于回归任务,如预测房价、预测股票价格等。 import torch.nn as nn loss_fn nn.MSELoss() 分类任务: 交叉熵损失函数&…

AI算法19-偏最小二乘法回归算法Partial Least Squares Regression | PLS

偏最小二乘法回归算法简介 算法概述 偏最小二乘法模型可分为偏最小二乘回归模型和偏最小二乘路径模型。其中偏最小二乘回归模型是一种新型的多元统计方法,它集中了主成分分析、典型相关分析和线性回归的特点,特别在解决回归中的共线性问题具有无可比拟…

PX4 运行 make px4_sitl_default gazebo 报错

报错原因:最开始我把依赖一直都是在base环境下安装的,没有conda deactivate,而pip install的东西应该装在系统环境,不能装在base环境下,sudo apt 是装在系统环境的 1.检查ros 用鱼香ros安装 wget http://fishros.…

日活2.5亿的Twitter 使用了哪些数据库?

Twitter 使用什么数据库存储用户每天发送的数亿条推文?是 SQL、NoSQL 还是其它持久化存储系统? Twitter 使用什么数据库? 任何一个稍微有点规模的系统其存储层绝不会只使用一种数据库,服务于数以亿计用户的Twitter更是如此。Twit…

《YOLOv10改进实战专栏》专栏介绍 专栏目录

《YOLOv10改进实战专栏》介绍及目录 YOLOv10官方仓库地址 专栏地址:点击跳转 专栏导航如下: 🎀基础入门篇🎀 万字长文,小白新手怎么开始做YOLO实验,从零开始教!整体思路在这里,科研指…

Vue学习---vue cli 项目创建

使用的编辑工具webStorm 创建例子: hello vue create hello 选择 vue3 进行创建 运行 npm run serve 测试访问:http://localhost:8080 改动内容重新编译: npm run build dist 目录就是编译后的可运行内容

浅谈C嘎嘎类与对象

本篇文章与大家浅谈一下C嘎嘎的类与对象知识点 类的定义 关键字:class 语法格式: class 类名 { };//这里的分号不能少 此外,class有三个属性分别是private、public、protected,这三个属性是干啥的,相…

MSPM0G3507——时钟主频拉到80MHZ

先点开使用时钟树 在配置时钟界面这样配置

Ghost Browser指纹浏览器年+IPXProxy代理IP组合:SheIn卖家必看

SheIn是一家时尚电商公司,其用户数量近年来增长迅速,在全球的知名度越来越高。SheIn跨境电商卖家想要提升店铺曝光和排名,从而增加销量和信誉的话,就需要满足独立IP、模拟设备参数、独立环境等条件。同时满足这些条件的话就需要用…

生成式人工智能(AI)的未来

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

windows qt编译报错 无法打开包括文件: “EGL/egl.h”: No such file or directory

windows mingw32 qt creator QtAV 推荐ffmpeg依赖包 QT5.14.2 如果出现:无法打开包括文件: “EGL/egl.h”: No such file or directory 可能是Qt6的问题.在QT5上安装。 编译步骤: git clone https://github.com/wang-bin/QtAV.git cd QtAV &&…

【深度学习教程】

文章目录 pytorch官方教程知识蒸馏:https://pytorch.org/tutorials/beginner/knowledge_distillation_tutorial.html 李宏毅-机器学习/深度学习https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.phphttps://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.phphttp…

最新Qt6的下载与成功安装详细介绍

引言 Qt6 是一款强大的跨平台应用程序开发框架,支持多种编程语言,最常用的是C。Qt6带来了许多改进和新功能,包括对C17的支持、增强的QML和UI技术、新的图形架构,以及构建系统方面的革新。本文将指导你如何在Windows平台上下载和安…

第五章:卷-将磁盘挂载到容器

本章内容包括: 创建多容器pod创建一个可在容器间共享磁盘存储的卷在pod中使用git仓库将持久性存储挂载到pod使用预先配置的持久性存储动态调配持久存储 在前面说过,pod类似逻辑主机,在逻辑主机中运行的进程共享如CPU、RAM、网络接口等资源&am…