数据库课程学习总结
目录第1章 绪论一、数据库的4个基本概念二、数据库系统的特点三、概念模型在信息世界中重要的基本概念四、关系模型五、数据库系统的结构
第2章 关系数据库一、关系数据结构及形式化定义二、数据库系统的特点三、关系的完整性四、关系代数第3章 关系数据库标准语言SQL一、数据的定义二、查询Query第4章 数据库安全性一、安全标准</a二、数据库安全性控制三、试图机制四、数据加密第5章 数据库完整性一、三大完整性二、触发器(trigger) + 存储过程
数据是数据库中存储的基本对象。描述事物的符号记录称为数据。数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
数据库时长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库管理系统是位于用户与操作系统之间的一层数据管理软件。数据库管理系统提供的语言功能:数据定义语言DDL、数据操纵语言DML。
数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。一般简称数据库系统为数据库。
❖数据结构化结构化是指数据以结构方式存储(字段名,记录组成的二维表);而不是以文本(无结构)、HTML(半结构化)等方式存储
❖数据的共享性高,冗余度低且易扩充
❖数据独立性高❖物理独立性◼ 指用户的应用程序与数据库中数据的物理存储是相互独立的。即:当数据的物理存储改变了,应用程序不用改变。❖逻辑独立性◼ 指用户的应用程序与数据库的逻辑结构是相互独立的。即:数据的逻辑结构改变了,应用程序不用改变。
❖数据由DBMS统一管理和控制
(1)实体:客观存在并可相互区别的事物称为实体( 可以是具体的人、事、物或抽象的概念)(2)属性:实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。(3)码:唯一标识实体的属性集称为码。如学号是学生实体的码。(4)实体型:用实体名及其属性名集合来抽象和刻画同类实体称为实体型。如学生(学号,姓名,性别,院系,出生年月)。(5)实体集:同一类型实体的集合称为实体集。如全体学生。(6)联系:实体之间的联系通常是指不同实体集之间的联系。有一对一,一对多,多对多等类型。
关系模型由一组关系构成,每个关系的数据结构是一张规范化的二维表。下面是相关术语。
- 关系:一个关系对应通常说的是一张表。
- 元组:表中的一行即为一个元组,也就是一个实体。
- 属性:表中的一列即为一个属性,给每一个属性起一个名称即为属性名。
- 码:也称为码键。表中的某个属性组,可以唯一确定一个元组。
- 域:是一组具有相同数据类型的值的集合。属性的取值范围来自某个域
- 分量: 元组中的一个属性值
- 关系模式: 对关系的描述,一般表示为 关系名(属性1,属性2,···,属性n)
型(Type): 对某一类数据的结构和属性的说明值(Value): 是型的一个具体赋值❖模式(Schema)◼ 数据库逻辑结构和特征的抽象描述◼ 是型的描述,不涉及具体值◼ 反映的是数据的结构及其联系◼ 模式是相对稳定的❖实例(Instance)◼ 模式的一个具体值◼ 反映数据库某一时刻的状态◼ 同一个模式可以有很多实例◼ 实例随数据库中的数据的更新而变动
数据库系统的三级模式结构是指数据库系统是由外模式 、模式和 内模式三级构成,如图所示
(1)模式(也称逻辑模式)是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库只有一个模式。是数据库系统模式结构的中间层(2)外模式(也称子模式或用户模式)是用户使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。介于模式与应用之间。
(3)内模式(也称存储模式)是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式
关系:单一的数据结构现实世界的实体及实体间的各种联系均用关系来表示二维表: 逻辑结构
给定一组域D1,D2,…,Dn,允许其中某些域是相同的。 D1,D2,…,Dn的笛卡尔积为:D1×D2×…×Dn = {(d1,d2,…,dn)|diDi,i=1,2,…,n}
例如:假设集合A={a, b},集合B={0, 1, 2},则两个集合的笛卡尔积:A×B={(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}
笛卡尔积中每一个元素(d1,d2,…,dn)叫作一个n元组(n-tuple)或简称元组。例如:在A×B={(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}中,(a, 0), (a, 1) 等 都是2元组
笛卡尔积元素(d1,d2,…,dn)中的每一个值di 叫作一个分量例如:a,b,0,1等都是分量
基数:若Di(i=1,2,…,n)为有限集,其基数为mi(i=1, 2,…,n),则D1×D2×…×Dn的基数M为:例如:集合A={a, b}基数为2,集合B={0, 1, 2}基数为3, A×B={(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}的基数为2×3=6
关系是一个二维表。表的每行对应一个元组,表的每列对应一个属性。
❖ 候选码:若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。简单的情况:候选码只包含一个属性。最极端的情况:所有属性组是候选码,称为全码(第六章详解 P186)❖ 主码:若一个关系有多个候选码,则选定其中一个为主码❖ 主属性:候选码的诸属性称为主属性。不包含在任何侯选码中的属性称为非主属性或非码属性。
关系的三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表。
关系的描述称为关系模式。表示为R(U, D, DOM, F)。
R 关系名U 组成该关系的属性名集合D U中属性所来自的域DOM 属性向域的映象的集合F 属性间数据的依赖关系的集合(数据依赖将在第六章详细叙述)
例:导师(SUPERVISOR)和研究生(POSTGRADUATE)出自同一个域——人(PERSON),在模式中定义属性向域的映象,说明它们分别出自哪个域:
❖ 常用的关系操作◼ 查询:选择、投影、连接、除、并、差、交、笛卡尔积(选择、投影、并、差、笛卡尔基是5种基本操作) 【 2.4节关系代数详细讲解这部分内容】◼ 更新:插入、删除、修改
三大完整性原则分别是:实体完整性、参照完整性、用户自定义完整性。
若属性A是基本关系R的主属性,则属性A不能取空值。可以简单记忆为:主属性不能为空
关系间的引用比如:学生实体、专业实体(主码用下划线表示)。学生(学号,姓名,性别,专业号,年龄),专业(专业号,专业名)。这个例子中: 学生关系引用了专业关系的主码 “专业号”,学生关系中的 “专业号”值必须是 确实存在的专业的专业号。
外码(Foreign Key)设F是基本关系R的一个或一组属性,但不是关系R的码(ps:码可唯一确定一个元组)。如果F与基本关系S的主码Ks相对应,则称F是R的外码,基本关系R称为参照关系(Referencing Relation),基本关系S称为被参照关系(Referenced Relation)。
参照完整性原则:若属性(或属性组)F是基本关系R的外码它与基本关系S的主码Ks 相对应,则对于R中每个元组在F上的值必须为:要么取空值(F的每个属性值均为空值),要么等于S中某个元组的主码值简单记忆:外码要么为空,要么源自于被参照关系的主码。
针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求。如年龄必须是10~25岁。
一种抽象的查询语言,用对关系的运算来表达查询。
再谈笛卡尔积❖ 严格地讲应该是广义的笛卡尔积◼ R: n目关系,k1个元组◼ S: m目关系,k2个元组❖ R×S◼ 列:(n+m)列元组的集合⚫元组的前n列是关系R的一个元组⚫后m列是关系S的一个元组◼ 行: k1×k2个元组(基数)⚫R×S = {tr ts |tr R ∧ tsS }
σF® = {t|tR∧F(t)= ‘真’}F:选择条件,是一个逻辑表达式,取值为“真”或“假”查询信息系(IS系)全体学生。σSdept = ‘IS’ (Student)
πA® = { t[A] | t R } A:R中的属性列查询学生关系Student中都有哪些系。去掉了重复的πSdept(Student)
R连接符号+条件 S = { | tr R ∧ ts S ∧ tr[A]θts[B] }
❖两类常用连接运算◼ 等值连接(equijoin)⚫ θ为“=”的连接运算称为等值连接⚫从关系R与S的广义笛卡尔积中选取A、B属性值相等的那些元组,即等值连接为:◼自然连接(Natural join)⚫自然连接是一种特殊的等值连接➢两个关系中进行比较的分量必须是相同的属性组➢在结果中把重复的属性列去掉⚫自然连接的含义❖悬浮元组(Dangling tuple)◼ 两个关系R和S在做自然连接时,关系R中某些元组有可能在S中不存在公共属性上值相等的元组,从而造成R中这些元组在操作时被舍 弃了,这些被舍弃的元组称为悬浮元组。❖外连接(Outer Join):如果把悬浮元组也保存在结果关系中,而在其他属性上,填空值(Null),就叫做外连接◼ 左外连接(LEFT OUTER JOIN或LEFT JOIN)⚫ 只保留左边关系R中的悬浮元组◼ 右外连接(RIGHT OUTER JOIN或RIGHT JOIN)⚫ 只保留右边关系S中的悬浮元组
象集:给定一个关系R(X,Z),X和Z为属性组。 当t[X]=x时,x在R中的象集(Images Set)为:Zx={t[Z]|t R,t[X]=x},它表示R中属性组X上值为x的诸元组在Z上分量的集合(t[X]表示元组t中相应于属性X的一个分量)给定关系R (X,Y) 和S (Y,Z),其中X,Y,Z为属性组。元组在X上分量值x的象集Yx包含S在Y上投影的集合,记作:R÷S={tr[X]|trR∧πY(S)Yx} Yx:x在R中的象集,x = tr[X]
SQL Server数据定义——模式与基本表操作
查询涉及的知识点很多,关键是嵌套查询和子查询部分,是难点也是重点。囿于篇幅,不方便把知识点一一罗列,这里放上之前的链接,结合起来复习。就不多写了,自己慢慢消化!!
SQL Server——索引+基于单表的数据插入与简单查询【1】2021-4-3课程——SQL Server查询【2】2021-4-5课程——SQL Server查询【3】2021-4-6课程——SQL Server查询【4】2021-4-12课程——SQL Server查询【5】+数据更新+空值处理+视图
记住CC标准,是评估信息产品安全性的主要标准。
存取控制机制主要包括定义用户权限和合法权限检查两部分。定义用户权限和合法权限检查机制一起组成了数据库管理系统的存取控制子系统。C2级的数据库管理系统支持自主存取控制,B1级的支持强制存取控制。
- 用户对不同的数据对象有不同的存取权限
- 不同的用户对同一对象也有不同的权限
- 用户还可将其拥有的存取权限转授给其他用户
(1)用户权限有两个要素组成:数据库对象和操作类型。在数据库系统中,定义存取权限称为授权(authorization)。
(2)授权:授予与收回
GRANT语句向用户授予权限REVOKE语句收回已经授予用户的权限
GRANT在授予(grant)时,如果指定了with grant option子句,说明被授予权限的用户还可以把这种权限再授予其他的用户。
PS:①对属性列的授权时必须明确指出相应属性列名②若授予所有用户使用public③标准SQL在指定基本表时要写table,而T-SQL不写!!
REVOKE格式和注意点基本与GRANT操作相同,只是把grant换成revoke
数据库角色:被命名的一组与数据库操作相关的权限。角色是权限的集合
- 每一个数据对象被标以一定的密级
- 每一个用户也被授予某一个级别的许可证
- 对于任意一个对象,具有合法许可证的用户才可以存取
在强制存取控制中,数据库管理系统所管理的全部实体被分为主体和客体两大类。主体是系统中的活动实体◼数据库管理系统所管理的实际用户客体是系统中的被动实体◼文件、基本表、索引、视图❖两类常用连接运算◼ 等值连接(equijoin)⚫❖敏感度标记(Label)◼ 对于主体和客体,DBMS为它们每个实例(值)指派一个敏感度标记(Label)敏感度标记分成若干级别:⚫绝密(Top Secret,TS)⚫机密(Secret,S)⚫可信(Confidential,C)⚫公开(Public,P)◼TS>=S>=C>=P◼主体的敏感度标记称为许可证级别(Clearance Level)◼客体的敏感度标记称为密级(Classification Level)
❖强制存取控制规则◼仅当主体的许可证级别大于或等于客体的密级时,该主体才能读相应的客体◼仅当主体的许可证级别小于或等于客体的密级时,该主体才能写相应的客体
为不同的用户定义不同的机制,把数据对象限制在一定范围内。视图机制间接地实现支持存取谓词的用户权限定义
数据加密主要包括存储加密和传输加密
以主码作为唯一性标识,竹马中的属性即主属性不能取空值。用PRIMARY KEY定义插入或更新操作时,DBMS按照实体完整性规则自动进行检查。(1)检查主码值是否唯一,如果不唯一则拒绝插入或修改(2)检查主码的各个属性是否为空,只要有一个为空就拒绝插入或修改
参照和被参照关系。主码和外码。用FOREIGN KEY短语定义哪些列为外码。用REFERENCES短语指明这些外码参照哪些表的主码
❖CREATE TABLE时定义属性上的约束条件◼列值非空(NOT NULL)◼列值唯一(UNIQUE)◼检查列值是否满足一个条件表达式(CHECK)
❖在CREATE TABLE时可以用CHECK短语定义元组上的约束条件,即元组级的限制
❖触发器类型◼行级触发器(FOR EACH ROW)◼语句级触发器(FOR EACH STATEMENT)❖AFTER/BEFORE是触发的时机◼AFTER表示在触发事件的操作执行之后激活触发器◼BEFORE表示在触发事件的操作执行之前激活触发器❖触发器的执行是由触发事件激活的,并由数据库服务器自动执行!❖删除触发器
❖存储过程由过程化SQL语句,经编译和优化后存储在数据库服务器中,可以被反复调用,运行速度较快。
◼标准SQL创建存储过程
CREATE OR REPLACE PROCEDURE 过程名([参数1,参数2,…])AS <过程化SQL块>;
◼T-SQL典型例子,用以说明建立过程
◼执行存储过程:T-SQL是用exec,标准SQL是call或者perform
◼修改存储过程:只需将创建时的create改成alter
◼删除存储过程:
drop procedure 过程名;
❖函数
同:都是持久性存储模块异:函数必须指定返回的类型
下面是标准SQL函数的相关内容
CREATE OR REPLACE FUNCTION 函数名 ([参数1,参数2,…]) RETURNS <类型> AS <过程化SQL块>;
CALL/SELECT 函数名 ([参数1,参数2,…]);
重命名
ALTER FUNCTION 过程名1 RENAME TO 过程名2;
重新编译
ALTER FUNCTION 过程名 COMPILE;
下面是T-SQL函数的相关内容,拿个练习的例子说
数据库复习资料
数据库概论
1.1 基本内容分析
1.1.1 本章的重要概念
(1)DB、DBMS和DBS的定义
(2)数据管理技术的发展阶段 人工管理阶段、文件系统阶段、数据库系统阶段和高级数据库技术阶段等各阶段的特点。
(3)数据描述 概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二元联系的描述(1:1,1:N,M:N)。
(4)数据模型 数据模型的定义,两类数据模型,逻辑模型的形式定义,ER模型,层次模型、网状模型、关系模型和面向对象模型的数据结构以及联系的实现方式。
(5)DB的体系结构 三级结构,两级映像,两级数据独立性,体系结构各个层次中记录的联系。
(6)DBMS
DBMS的工作模式、主要功能和模块组成。 (7)DBS DBS的组成,DBA,DBS的全局结构,DBS结构的分类。
1.2 教材中习题1的解答
1.1 名词解释
·逻辑数据:指程序员或用户用以操作的数据形式。
·物理数据:指存储设备上存储的数据。
·联系的元数:与一个联系有关的实体集个数,称为联系的元数。
·1:1联系:如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么E1和E2的联系称为“1:1联系”。
·1:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中一个实体有联系,那么E1和E2的联系是“1:N联系”。
·M:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1和E2的联系称为“M:N联系”。
·数据模型:能表示实体类型及实体间联系的模型称为“数据模型”。
·概念数据模型:独立于计算机系统、完全不涉及信息在计算机中的表示、反映企业组织所关心的信息结构的数据模型。
·结构数据模型(或逻辑数据模型):与DBMS有关的,直接面向DB的逻辑结构、从计算机观点对数据建模的数据模型。
·层次模型:用树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。 ·网状模型:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。 ·关系模型:用二维表格表达实体集的数据模型。
·外模式:是用户用到的那部分数据的描述。
·概念模式:数据库中全部数据的整体逻辑结构的描述。
·内模式:DB在物理存储方面的描述。
·外模式/模式映象:用于定义外模式和概念模式之间数据结构的对应性。
·模式/内模式映象:用于定义概念模式和内模式之间数据结构的对应性。
·数据独立性:应用程序和DB的数据结构之间相互独立,不受影响。
·物理数据独立性:在DB的物理结构改变时,尽量不影响应用程序。
·逻辑数据独立性:在DB的逻辑结构改变时,尽量不影响应用程序。
·主语言:编写应用程序的语言(如C一类高级程序设计语言),称为主语言。
·DDL:定义DB三级结构的语言,称为DDL。
·DML:对DB进行查询和更新操作的语言,称为DML。
·过程性语言:用户编程时,不仅需要指出“做什么”,还需要指出“怎么做”的语言。
·非过程性语言:用户编程时,只需指出“做什么”,不需要指出“怎么做”的语言。
·DD(数据字典):存放三级结构定义的DB,称为DD。
·DD系统:管理DD的软件系统,称为DD系统。
1.2 试解释DB、DBMS和DBS三个概念。
答:DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。 DBMS是位于用户与OS之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法。
DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即采用数据库技术的计算机系统。
1.3 人工管理阶段和文件系统阶段的数据管理各有哪些特点?
答:人工管理阶段主要有四个特点:数据不保存在计算机内;没有专用的软件对数据进行管理;只有程序的概念,没有文件的概念;数据面向程序。 文件系统阶段主要有五个特点: 数据以“文件”形式长期保存;数据的逻辑结构与物理结构有了区别;文件组织已多样化;数据面向应用;对数据的操作以记录为单位。
1.4 文件系统阶段的数据管理有些什么缺陷?试举例说明。 答:主要有三个缺陷:数据冗余;数据不一致性;数据联系弱。
例如学校里教务处、财务处、保健处建立的文件中都有学生详细资料,譬如联系电话,家庭住址等。这就是“数据”冗余;如果某个学生搬家,就要修改三个部门文件中的数据,否则会引起同一数据在三个部门中不一致;产生上述问题的原因是这三个部门的文件中数据没有联系。
1.5 数据管理的数据库阶段产生的标志是哪三件事情?
答:进入数据库阶段的标志是20世纪60年代末发生的三件事件: ·1968年IBM公司研制的IMS系统是一个典型的层次DBS; ·1969年美国CODASYL组织DBTG报告,提出网状DBS的概念; ·1970年美国IBM公司的E.F.Codd发表论文,提出关系模型的思想。
1.6 数据库阶段的数据管理有哪些特点?
答:主要有五个特点: 采用数据模型表示复杂的数据结构;有较高的数据独立性;为用户提供了方便的用户接口;提供了四个方面的数据控制功能;对数据的操作以数据项为单位,增加了系统的灵活性。
1.7 与“文件”结构相比,“数据库”结构有些什么不同?
答:与文件结构相比,数据库结构主要有下面三点不同:
·数据的结构化。文件由记录组成,但各文件之间缺乏联系。数据库中数据在磁盘中仍以文件形式组织,但这些文件之间有着广泛的联系。数据库的逻辑结构用数据模型来描述,整体结构化。数据模型不仅描述数据本身的特点,还要描述数据之间的联系。
·数据独立性。文件只有设备独立性,而数据库还具有逻辑独立性和物理独立性。
·访问数据的单位。访问文件中的数据,以记录为单位。访问数据库中的数据,以数据项(字段)为单位,增加了系统的灵活性。
1.8 什么是数据独立性?在数据库中有哪两级独立性?
答:数据独立性是指应用程序与DB的数据结构之间相互独立。在物理结构改变时,尽量不影响应用程序,称为物理数据独立性;在逻辑结构改变时,尽量不影响应用程序,称为逻辑数据独立性。
1.9 分布式数据库系统和面向对象数据库系统各有哪些特点?
答:DDBS主要有三个特点:
·数据物理上分布在各地,但逻辑上是一个整体;
·每个场地既可以执行局部应用,也可以执行全局应用;
·各地的计算机由数据通信网络相连接。 面向对象数据系统主要有两个特点:
·面向对象数据模型能完整地描述现实世界的数据结构,能表达数据间嵌套、递归的联系。 ·具有面向对象技术的封装性和继承性的特点,提高了软件的可重用性。
1.10 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别?
答:逻辑数据是用户用以操作的数据形式,是抽象的概念化数据。物理数据是实际存放在存储设备上的数据。 逻辑数据与物理数据在结构上可以差别很大,需通过两级映象来进行数据传输和格式转换。 从以上的解释可以看出,逻辑记录和逻辑文件是用户在程序中使用的记录和文件,而物理记录和物理文件是指磁盘上的记录和文件。逻辑记录、文件与物理记录、文件在结构、组成上有很大的差异,而数据管理软件就是通过三级结构两级映象来实现逻辑数据与物理数据之间的转换。
1.11 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。
答:ER模型直接表示实体类型及实体间联系,与计算机系统无关,充分反映用户的需求,用户容易理解。 层次模型的数据结构为树结构,记录之间联系通过指针实现,查询较快,但DML属于过程化的,操作复杂。 网状模型的数据结构为有向图,记录之间联系通过指针实现,查询较快,并且容易实现M:N联系,但DML属于过程化的语言,编程较复杂。 关系模型的数据结构为二维表格,容易为初学者理解。记录之间联系通过关键码实现。DML属于非过程化语言,编程较简单。 面向对象模型能完整描述现实世界的数据结构,具有丰富的表达能力,能表达嵌套、递归的数据结构。但涉及的知识面较广,用户较难理解,这种模型尚未普及。
1.12 数据之间联系在各种结构数据模型中是怎么实现的?
答:在层次、网状模型中,数据之间的联系通过指针实现的; 在关系模型中,数据之间联系通过外键和主键间联系实现的; 在面向对象模型中,数据之间嵌套、递归联系通过对象标识符(OID)实现的(见第8章)。
1.13 DB的三级模式结构描述了什么问题?试详细解释。
答:DB的三级模式结构是对数据的三个抽象级别,分别从外部(用户)级、概念级和内部级去观察数据库。 外部级是用户使用的局部数据库的逻辑结构,其描述称为外模式。 概念级是DB的整体逻辑结构,其描述称为概念模式。 内部级是DB的物理结构,其描述称为内模式。
1.14 试述概念模式在数据库结构中的重要地位。
答:数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。
1.15 试叙述用户、DB的三级模式结构、磁盘上的物理文件之间有些什么联系和不同?
答:用户、外模式、概念模式、内模式和物理文件中的记录分别称为用户记录、外部记录、概念记录、内部记录和物理记录。 用户记录与外部记录的结构是一致的,它们之间只是数据传输问题。 而外部记录、概念记录和内部记录之间的结构可能是不一致的,除了数据传输问题,还 有格式转换问题。 内部记录与物理记录的结构是一致的,它们之间只是数据传输问题。
1.16 数据独立性与数据联系这两个概念有什么区别?
答:数据独立性是指应用程序和DB的数据之间相互独立,不受影响,对系统的要求是“数据独立性要高”,而数据联系是指记录之间的联系,对系统的要求是“数据联系密切”。
1.17 试述DBMS的工作模式和主要功能。
答:DBMS的工作模式有六点: ·接受应用程序的数据请求和处理请求; ·将用户的数据请求转换成低层指令; ·实现对DB的操作; ·从对DB的操作中接受查询结果; ·对查询结构进行处理; ·将处理结果返回给用户。
DBMS的主要功能有DB的定义、操纵、保护、维护和数据字典等五个功能。 1.18 试叙述DBMS对数据库的维护功能。
答:包括DB的数据载入、转换、转储、DB的改组以及性能监控等功能。这些功能分别由各个实用程序完成。
1.19 从模块结构观察,DBMS由哪些部分组成?
答:DBMS由两大部分组成:查询处理器和存储管理器。(解释略) 1.20 DBS有哪几部分组成?其中DD有什么作用?
答:DBS由DB、硬件、软件和DBA等四个部分组成。(解释略)
在DBS中,DD是存储三级结构描述(即元数据)的DB。DBMS的所有工作都要以DD中的元数据为依据,也就是所有工作都要通过DD访问DB。
1.21“元数据”与“数据”之间有些什么联系与区别? 答:元数据(metadata)是指“数据的数据”,即数据的描述。DB中的元数据是指三级模式结构的详细描述。
数据(data),一般是指用户使用的具体值。
1.22 什么是DBA?DBA应具有什么素质?DBA的职责是什么?
答:DBA是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护DB结构的责任。 DBA必须具备下列4条素质:熟悉企业全部数据的性质和用途;对所有用户的需求有充分的了解;对系统的性能非常熟悉;兼有系统分析员和运筹学专家的品质和知识。 DBA的主要职责有6点:定义模式;定义内模式;与用户的联络;定义安全性规则;定义完整性规则;DB的转储与恢复。
1.23 试对DBS的全局结构作详细解释。 答:从四个方面解释: ·数据库用户有四类:DBA,专业用户,应用程序员,终端用户。 ·DBMS的查询处理器有四个模块:DML编译器,嵌入型DML预编译器,DDL编译器,查询运行核心程序。 ·DBMS的存储管理器有四个模块:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器。 ·磁盘存储器中有五种数据结构:数据文件,数据字典,索引文件,统计数据组织和日志。
1.24 使用DBS的用户有哪几类? 答:(略,见习题1.23)
1.25 DBMS的查询处理器和存储管理器各有哪些功能? 答:(略,见习题1.23)
1.26 磁盘存储器中有哪五类主要的数据结构? 答:(略,见习题1.23)
1.27 根据计算机的系统结构,DBS可分成哪四种?各有什么特点?
答:根据计算机的系统结构,DBS可分成集中式、C/S式、并行式和分布式等四种 集中式DBS的特点是单点数据(DB集中在一个场地)单地处理(单个CPU)。 C/S式DBS的特点是计算机的功能分放在客户机和服务器上(即功能的分布)。客户机上专门实现前端处理和用户界面。服务器上完成事务处理和数据访问控制。
并行式DBS的特点是使用多个CPU和多个磁盘进行并行操作。
分布式DBS的特点是多点数据(DB分布在多个场地)多点处理(多个CPU)。数据具有物理分布性和逻辑整体性特点。系统中事务有本地事务(访问本地DB)和全局事务(访问至少两个场地的DB)之分。
1.28 DBS能产生哪些效益?
答:DBS的应用,使计算机应用深入到社会的每个角落。其效益有以下7个方面:灵活性,简易性,面向用户,有效的数据控制,加快应用开发速度,维护方便,标准化。
第2章 关系模型和关系运算理论
2.1 基本内容分析
2.1.1 本章重要概念
(1)基本概念 关系模型,关键码(主键和外键),关系的定义和性质,三类完整性规则,ER模型到关系模型的转换规则,过程性语言与非过程性语言。
(2)关系代数 五个基本操作,四个组合操作,七个扩充操作。
(3)关系演算 元组关系演算和域关系演算的原子公式、公式的定义。关系演算的安全性和等价性。
(4)关系代数表达式的优化 关系代数表达式的等价及等价转换规则,启化式优化算法。 (5)关系逻辑 谓词、原子、规则和查询,规则的安全性,用规则模拟关系代数表达式。
2.1.2 本章的重点篇幅
(1)教材中P56的例2.7(关系代数表达式的应用实例)。
(2)教材中P63的例2.19(元组表达式的应用实例)。
(3)教材中P81的例2.36(关系逻辑的规则表示)。
2.1.3 重要内容分析
1.关系代数表达式的运用技巧
(1)一般规则 ·对于只涉及到选择、投影、联接的查询可用下列表达式表示:
π„(σ„(R×S)) 或者π„(σ„(R⋈S))
·对于否定的操作,一般要用差操作表示,例如“检索不学C2课的学生姓名”。
·对于检索具有“全部”特征的操作,一般要用除法操作表示,例如“检索学习全部课程的学生姓名”。
2)“检索不学C2课的学生姓名”,决不能用下式表示:
π SNAME,AGE(σC#≠\’C2\’(S⋈SC))
一定要用“差”的形式: π SNAME,AGE(S)-πSNAME,AGE(σC#=\’C2\’(S⋈SC))
(3)“检索学习全部课程的学生学号”,要用πS#,C#(SC)÷πC#(C)表示, 而不能写成 πS# (SC÷πC#(C))形式。这是因为一个学生学的课程的成绩可能是不一样的。
(4)(4)对于教材P56的例2.7的8个查询语句的关系代数表达式,考生一定要掌握,这是基础。
2.非过程性语言与过程性语言的区别 编程时必须指出“干什么”及“怎么干”的语言,称为过程性语言;编程时只须指出“干什么”,不必指出“怎么干”的语言,称为非过程性语言。 两种语言的主要区别见图2.1
2.2 教材中习题2的解答
2.1名词解释
·关系模型:用二维表格表示实体集,外键和主键表示实体间联系的数据模型,称为关系模型。
·关系模式:是对关系的描述,包括模式名、诸属性名、值域名和模式的主键。
·关系实例:关系模式具体的值,称为关系实例。
·属性:即字段或数据项,与二维表中的列对应。属性个数,称为元数(arity)。
·域:属性的取值范围,称为域。
·元组:即记录,与二维表中的行对应。元组个数,称为基数(cardinality)。
·超键:能惟一标识元组的属性或属性集,称为关系的超键。
·候选键:不含有多余属性的超键,称为候选键。
·主键:正在使用的、用于标识元组的候选键,称为主键。
·外键:属性集F是模式S的主键,在模式R中也出现,那么称F是模式R的外键。
·实体完整性规则:实体的主键值不允许是空值。
·参照完整性规则:依赖关系中的外键值或者为空值,或者是相应参照关系中某个主键码。
·过程性语言:编程时必须给出获得结果的操作步骤,即指出“干什么”及“怎么干”的语言。
·非过程性语言:编程时,只需指出需要什么信息,不必给出具体的操作步骤,即只要指出“干什么”,不必指出“怎么干”的语言。
·无限关系:指元组个数为无穷多个的关系。
·无穷验证:验证公式真假时需要进行无限次验证。 l 2.2 在关系模型中,对关系作了哪些规范性限制? 答:对关系作了一下四个限制: 属性值不可分解;没有重复元组;没有行序;使用时有列序。
2.3 为什么关系中的元组没有先后顺序,且不允许有重复元组?
答:由于关系定义为元组的集合,而集合中的元素是没有顺序的,因此关系中的元组也就没有先后的顺序(对用户而言)。这样既能减少逻辑排序,又便于在关系数据库中引进集合论的理论。
每个关系模式都有一个主键,在关系中主键值是不允许重复的。如果关系中有重复元组,那么其主键值肯定相等,起不了惟一标识作用,因此关系中不允许有重复元组。
2.4 外键值何时允许空?何时不允许空?
答:在依赖表中,当外键是主键的组成部分时,外键值不允许空;否则外键值允许空。
2.5 笛卡儿积、等值联接、自然联接三者之间有什么区别?
答:笛卡尔积是一个基本操作,而等值联接和自然联接是组合操作。
设关系R的元数为r,元组个数为m;关系S的元数为s,元组个数为n。 那么,R×S的元数为r+s,元组个数为m×n;R⋈S的元数也是r+s,但元组个数小于等于m×n;R⋈S的元数小于等于r+s,元组个数也小于等于m×n;
第3章关系数据库语言SQL
3.1 基本内容分析
3.1.1 本章重要概念
(1)SQL数据库的体系结构,SQL的组成。
(2)SQL的数据定义:SQL模式、基本表和索引的创建和撤销。
(3)SQL的数据查询;SELECT语句的句法,SELECT语句的三种形式及各种限定,基本表的联接操作,SQL3中的递归查询。
(4)SQL的数据更新:插入、删除和修改语句。
(5)视图的创建和撤消,对视图更新操作的限制。
(6)嵌入式SQL:预处理方式,使用规定,使用技术,卷游标,动态SQL语句。
3.1.2 本章的重点篇幅
(1)教材中P97的例3.8(SELECT语句)。
(2)教材中P123的例3.31和P123的例3.32(嵌入式SQL)。
3.1.3 重要内容分析
SELECT语句是SQL的核心内容,对于该语句考生应掌握下列内容。
1.SELECT语句的来历在关系代数中最常用的式子是下列表达式: πA1,„,An(σF(R1ׄ×Rm)) 这里R1、„、Rm为关系,F是公式,A1、„、An为属性针对上述表达式,SQL为此设计了SELECT—FROM—WHERE句型:
SELECT A1,„,An
FROM R1,„,Rm
WHERE F
这个句型是从关系代数表达式演变来的,但WHERE子句中的条件表达式F要比关系代数中公式更灵活。
2.SELECT语句中出现的基本表名,应理解为基本表中的元组变量,而列名应理解为元组分量。
3.SELECT语句的语义有三种情况,下面以学生表S(S#,SNAME,AGE,SEX)为例说明。
第一种情况:SELECT语句中未使用分组子句,也未使用聚合操作,那么SELECT子句的语义是对查询的结果执行投影操作。譬如:
SELECT S#,SNAME
FROM S
WHERE SEX=\’M\’;
第二种情况:SELECT语句中未使用分组子句,但在SELECT子句中使用了聚合操作,此时SELECT子句的语义是对查询结果执行聚合操作。譬如:
SELECT COUNT(*),AVG(AGE)
FROM S
WHERE SEX=\’M\’;
该语句是求男同学的人数和平均年龄。
第三种情况:SELECT语句使用了分组子句和聚合操作(有分组子句时必有聚合操作),此时SELECT子句的语义是对查询结果的每一分组去做聚合操作。譬如:
SELECT AGE,COUNT(*)
FROM S
WHERE SEX=\’M\’
GROUP BY AGE;
该语句是求男同学每一年龄的人数。
4.SELECT语句中使用分组子句的先决条件是要有聚合操作。但执行聚合操作不一定要用分组子句。譬如求男同学的人数,此时聚合值只有一个,因此不必分组。但同一个聚合操作的值有多个时,必须使用分组子句。譬如求每一年龄的学生人数。此时聚合值有多个,与年龄有关,因此必须分组。
3.2 教材中习题3的解答
3.1 名词解释
·基本表:实际存储在数据库中的表,称为基本表。
·视图:是从基本表或其他视图中导出的表,它本身不独立存储在数据库中,也就是数据库中只存放视图的定义而不存放视图的数据。
·实表:是对基本表的别称。
·虚表:是对视图的别称。
·相关子查询:SELECT语句嵌套时,子查询中查询条件依赖于外层查询中的值,因此子查询要反复求值供外层查询使用。这种子查询称为相关子查询。
·联接查询:查询时要从多个基本表中提取数据,此时把多个基本表写在同一层的FROM子句中,这种查询形式称为联接查询。
·嵌套查询:查询时要从多个基本表中提取数据,此时把多个基本表分别放在不同层次上的FROM子句中,这种查询形式称为嵌套查询。
·交互式SQL:在终端交互方式使用的SQL语言。
·嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言。
·共享变量:嵌入的SQL语句和主语言语句间传递信息的变量,称为共享变量。共享变量先由主语言程序定义,再用SQL的说明语句说明,然后SQL语句就可使用这些变量。
·游标:游标是与某一查询相联系的符号名。游标有游标关系和游标指针两层含义。在游标打开时,游标(指针)指向查询结果的第一个记录之前。
·卷游标:在游标推进时,可以进退自如的游标。
第4章 模式设计理论
4.1 基本知识点
4.1.1 本章重要概念
(1)关系模式的冗余和异常问题。
(2)FD的定义、逻辑蕴涵、闭包、推理规则、与关键码的联系;平凡的FD;属性集 的闭包;推理规则的正确性和完备性;FD集的等价;最小依赖集。
(3)无损分解的定义、性质、测试;保持依赖集的分解。
(4)关系模式的范式:1NF,2NF,3NF,BCNF。分解成2NF、3NF模式集的算法。
(5)MVD、4NF、JD和5NF的定义。
4.1.2 本章的重点篇幅 (1)教材中P148的例4.13。(无损联接和保持FD的例子) (2)教材中P149的例4.14和P150的例4.15。(分解成2NF和3NF的例子) 4.2 教材中习题4的解答
4.1 名词解释
·数据冗余:指同一个数据在系统中多次重复出现。
·函数依赖(FD):在关系模式R(U)中,FD是形为X→Y的一个命题,只要r是R的当前关系,对r中任意两个元组t和s,都有t[X]=s[X]蕴涵t[Y]=s[Y],那么称FD X→Y在关系模式R(U)中成立。
·平凡的FD:如果X→Y,且Y⊆X,则称X→Y是一个“平凡的FD”。
·FD集F的闭包F+:被F逻辑蕴涵的函数依赖全体构成的集合,称为F的闭包,记为F+,即F+={ X→Y | F⊨X→Y}。
·属性集X的闭包X+:从已知的FD集F使用FD推理规则推出的所有满足X→A的属性A的集合,称为X的闭包,记为X+,即X+={ 属性A | X→A在F+中 }。
·FD的逻辑蕴涵:如果从已知的FD集F能推导出X→Y成立,那么称F逻辑蕴涵 X→Y,记为F ⊨X→Y。
·FD集的等价:对于两个FD集F和G,有F+=G+,则称F和G是等价的依赖集。
·最小依赖集:设F是属性集U上的FD集,Fmin是F的最小依赖集,那么Fmin应满足下列四个条件:Fmin+=F+;每个FD的右边都是单属性;Fmin中没有冗余的FD;每个FD的左边没有冗余的属性。
·无损分解:设关系模式R,F是R上的FD集,ρ={ R1,„,Rk }是R的一个分解。 如果对R中满足F的每一关系r,都有r= ⋈πRi(r),那么称分解ρ相对F是“无损分解”。 ·泛关系假设:指数据库中每一个关系都是全部属性构成的关系的投影,此时,由全部属性构成的关系称为泛关系。
·chase过程:根据已知FD集,对R分解成ρ构造的初始表格的值进行修改,使之符合FD集,这个过程称为chase过程。
·保持FD:设关系模式R,F是R上的FD分解,ρ={ R1,„,Rk }是R的一个分 解,如果有∪ πRi(F)⊨F,那么称分解ρ保持FD集F。
·1NF:如果关系模式R的每个关系r的属性值都是不可分的原子值,那么称R是1NF 的模式。
·2NF:如果R是1NF的模式,且每个非主属性完全函数依赖于R的候选键,那么称
R k i=1 k i=1 是2NF的模式。
·3NF:如果R是1NF的模式,且每个非主属性都不传递依赖于R的候选键,那么称R是3NF的模式。 ·BCNF:如果R是1NF的模式,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。
·4NF:设D是关系模式R上成立的FD和MVD集合。如果D中每个非平凡的MVD X→→Y的左部X都是R的超键,那么称R是4NF模式。
·5NF:如果关系模式R的每个JD均由R的候选键蕴涵,那么称R是5NF的模式。
·多值依赖(MVD):设关系模式R(U),X和Y是U的子集,Z=U-X-Y。对于R的关系r,若在r中存在元组(x,y1,z1)和(x,y2,z2),就也应存在元组(x,y2,z1)和(x,y1,z2),那么称MVD X→→Y在模式R上成立。
·联接依赖(JD):设关系模式R(U),R1、„、Rn是U的子集,并满足U=R1∪„∪Rn, ρ={ R1,„,Rn }是R的一个分解。如果对于R的每个关系r都有mρ(r)=r,那么称
JD *(R1,„,Rn)在模式R上成立。
第7章 系统实现技术
7.1 基本知识点
7.1.1 本章重要概念
(1)系统目录及其和DBMS各子系统的联系。
(2)事务的定义,COMMIT和ROLLBACK的语义,事务的ACID性质,事务的状态变迁图。
(3)存储器类型,稳定存储器的实现,数据传送过程。
(4)恢复的定义、基本原则和实现方法,故障的类型,检查点技术,REDO和UNDO操作,运行记录优先原则。
(5)并发操作带来的三个问题,X锁、PX协议、PXC协议,S锁、PS协议、PSC协议,活锁、饿死和死锁,并发调度,串行调度,并发调度的可串行化,两段封锁法,SQL中事务的存取模式和隔离级别。
(6)完整性的定义,完整性子系统的功能,完整性规则的组成。SQL中的三大类完整性约束,SQL3中的触发器技术。
(7)安全性的定义、级别,权限,SQL中的安全性机制,几种常用的安全性措施,自然环境的安全性。
7.1.2 本章的重点篇幅 (1)教材中P261 的图7.7。(检查点技术) (2)并发操作带来的四个问题,封锁带来的三个问题,并发调度的可串行化。(教材P265-276) (3)SQL中完整性约束的实现:断言(教材P290)。 (4)安全性中的授权语句(教材P298)。 7.2 教材中习题7的解答
7.1 名词解释
·系统目录:系统目录(system catalog)是任何通用DBMS的核心。系统目录本身就是一个“微型数据库”,其主要功能是存储DBMS管理的数据库的定义或描述。这类信息被称为元数据(metadata),主要包括数据库三级结构、两级映像的定义。
·事务:事务是构成单一逻辑工作单元的操作集合。
·DB的可恢复性:系统能把DB从被破坏、不正确的状态,恢复到最近一个正确的状态,DBMS的这种功能称为DB的可恢复性。
·并发操作:在多用户共享系统中,许多事务可能同时对同一数据进行操作,这种操作称为并发操作。 ·封锁:封锁是系统保证对数据项的访问以互斥方式进行的一种手段。
·X锁:事务T对某数据加了X锁后,其他事务要等T解除X锁后,才能对这个数据进行封锁。
·PX协议:只有获准X锁的事务,才能修改数据,否则这个事务进入等待状态。
·PXC协议:PX协议再加上一条规则:“X锁必须保留到事务终点才能解除”。
·S锁:事务T对某数据加了S锁后,仍允许其他事务再对该数据加S锁,但在对该数据的所有S锁都解除之前决不允许任何事务对该数据加X锁。
·PS协议:获准S锁的事务,只能读数据,不能修改数据。
·PSC协议:PS协议再加上一条规则:“S锁必须保留到事务终点才能解除”。
·活锁:系统可能使某个事务永远处于等待状态,得不到封锁的机会,这种现象称为“活锁”。
·饿死:若干事务连续不断地对某数据实现加S锁和释放S锁的操作,那么若有一个事务欲对该数据加X锁,将永远轮不上封锁的机会。这种现象称为“饿死”。
·死锁:若干事务都处于等待状态,相互等待对方解除封锁,结果造成这些事务都无法继续执行,这种现象称为系统进入了“死锁”状态。
·调度:事务的执行次序称为“调度”。
·串行调度:多个事务依次执行,称为事务的串行调度。 ·并发调度:利用分时的方法,同时处理多个事务,则称为事务的并发调度。
·可串行化调度/不可串行化调度:如果一个并发调度的执行结果与某一串行调度的执行结果等价,那么这个并发调度称为“可串行化的调度”,否则称为“不可串行化调度”。
·两段封锁协议:事务分成两个阶段,前一阶段只能申请封锁,后一阶段只能释放封锁,这一规则称为事务的两段封锁协议。
【数据管理】数据库通用概念和常用SQL讲解
数据库是计算机领域的专业词汇,大部分人也许觉得和数据库没有交集。但其实每天,甚至连你自己都没有意识到,我们一直在使用数据库。淘宝购物挑选的商品信息,手机通讯录里面的联系人,微信发送的聊天记录等,数据都是存储在数据库进行管理,人们一直在间接地使用数据库。
数据库在工作生活中使用如此广泛,即使不是计算机领域的人员,也应该了解其通用的概念,扩展知识的广度。如果感兴趣可以再掌握常用的数据库查询SQL语句,亲自搭建属于自己的数据库。
本文后面和大家分享如下三个方面:
- 数据库的定义
- 数据库的通用概念
- SQL的定义及其常见语句
数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。
以上是取自百度百科的定义。
通俗的理解,数据库,就像是一个电子化的文件柜。文件柜只是一个用于存放数据的物理位置,它不管数据是什么,也不管数据是如何组织的。在《SQL必知必会》中,数据库定义如下,全面而凝练地总结了数据库的含义。
数据库
保存有组织的数据的容器。
数据库软件(DBMS):
人们通常把数据库这个术语代表他们使用的数据库软件,这是边界不清晰造成的混淆。数据库软件,确切的说,应称为数据库管理系统(DBMS)。数据库是通过DMBS创建和管理的容器。MySQL就是常见的数据库管理系统,即它是一种数据库软件。
表(table):
表是某种特定类型的数据的结构化清单。
关键的一点是,存储在表的是同一种类型的数据或一个清单。不允许将商品清单和顾客信息清单放在同一个数据库表,这样对后续的检索访问将造成困难,应该创建两个表,遵循功能单一的设计原则。数据库中的每个表都有一个唯一的名字,不允许有同名的表。
列(column):
列是表中的一个字段。所有表都是由一个或多个列组成的。可以想象表是一个Excel表格,表格的每一列,存储着对应某个字段类型的数据。举例如,你有一个顾客信息表,每一列分别对应为姓名,地址,联系电话等,它们一起组成了一个表。
数据类型(datatype):
列中所允许的数据类型,如数值,字符串等。每个列都有对应的数据类型,用于限制该列存储的数据。这样有利于避免其他类型的数据误录入,也有利于数据库管理系统知道数据类型后,优化数据的存储和排序。
行(row):
表中的数据是按行存储的。将表想象成Excel表格,垂直的是列,水平的就是行。行也被称为记录(record)。如果表是顾客信息表,那么一行数据,即是一个顾客的完整信息记录。
主键(primary key):
一列(或一组列),其值能唯一区分表中的每一行。主键用于表示一个特定的行。没有主键,更新和删除表中特定的行很困难。表中的任何列都可以作为主键,只要满足两个条件:任意两行不存在相同的主键值,每个行必须有一个主键值(不允许为NULL)。主键通常定义在某一列,也可以多列组成主键,多列主键值组合在一起需要唯一。
SQL是结构化查询语言(Structured Query Language)的缩写。
SQL是一种专门用于数据库通信的语言。与其他语言(Java,Python等)不同,SQL由很少的词构成,这是有意为之,因为设计SQL的目的,就是提供一种从数据库读写数据的简单有效的方法。
SQL不是某一个数据库软件的专用语言,几乎所有主流的数据库软件都支持SQL。所以学习了SQL,你也就掌握了与主流数据库软件打交道的方法。
下面是汇总的常见SQL语句,如果感兴趣可以进一步去查阅学习专业的SQL学习资料。
语句有2个注意点和大家提一下。
a. SQL语句不区分大小写。可以对关键字使用大写,对表和列名使用小写,可读性更好。
b. 多条SQL语句必须以分号(;)分割,单条语句可以不用分号结尾。
创建库
CREATE DATABASE db1;
建库是否存在,不存在则创建
CREATE DATABASE IF NOT EXISTS db1;
查看所有数据库
SHOW DATABASES;
查看某个数据库的定义
SHOW CREATE DATABASE db1;
修改数据库字符信息
ALTER DATABASE db1 CHARACTER SET utf8;
删除数据库
DROP DATABASE bd1;
查看表结构
DESC 表名;
查看创建表的 SQL 语句
SHOW CREATE TABLE 表名;
修改表名
ALTER TABLE 表名 RENAME TO 新的表名;
添加一列
ALTER TABLE 表名 ADD 列名 数据类型;
删除列
ALTER TABLE 表名 DROP 列名;
删除表
ALTER TABLE 表名;
DROP TABLE IF EXISTS 表名;
增加
写全所有列名
INSERT INTO 表名(列名1,...列名 n ) VALUES(值1,..值 n )
不写列名(所有列全部添加)
INSERT INTO 表名 VALUES(值1,值2,...值 n )
插入数据 (不写有默认值的列,使用默认值)
INSERT INTO 表名(列名1,列名2) values (值1,值2)
删除
删除表中数据
DELETE FROM 表名 WHERE 列名=值;
删除表中所有数据
DELETE FROM 表名;
删除表中所有数据(高效先删除表,然后再创建一样的表)
TRUNCATE TABLE 表名;
修改
不带条件的修改(会修改所有行)
UPDATE 表名 SET 列名=值;
带条件的修改
UPDATE 表名 SET 列名=值 WHERE 列名=值;
UPDATE [ IGNORE ] table_name
SET
column _ namel =value1,
column _name2=value2,
[ WHERE clause ];
排序查询 order by
语法: order by 子句
例子
SELECT * FROM person ORDER BY math;
SELECT * FROM person ORDER BY math DESC;
聚合函数:将一列数据作为一个整体,进行纵向计算
1.COUNT:计算个数
2.MAX:计算最大值
3.MIN:计算最小值
4.SUN:计算和
5.AVG:计算平均数
分组查询
语法: GROUP BY 分组字段;
注意:分组之后查询的字段;分组字段、聚合函数
按照性别分组。分别查询男、女同学平均分
SELECT gender , AVG ( math ) FROM student GROUP BY gende;
按照性别分组。分别查询男、女同学平均分,人数
SELECT gender , AVG ( math ), COUNT ( id ) FROM student GROUP BY gender;
分页查询
语法: LIMIT 开始的索引,每页查询的条数;
公式:开始的索引 =(当前的页码-1)*每页显示的条数
LIMIT是一个 MySQL \”方言\”
每页显示3条记录
SELECT * FROM student LIMIT 0,3
SELECT * FROM student LIMIT 3,3
SELECT * FROM student LIMIT 6,3
子查询:查询中嵌套查询
查询年龄最高的人员信息
查询最高的年龄
SELECT MAX ( age ) FROM 表名;
查询人员信息,并且年龄等于30的
SELECT * FROM 表名 WHERE age =30;
一条 sql 就完成这个操作。这就是子查询
SELECT * FROM 表名 WHERE age =
( SELECT MAX ( age ) FROM 表名);
连接查询
左外连接–查询的是左表所有数据及其交集部分
SELECT 字段列表 FROM 表1 LEFT [ outer ] JOIN 表2 ON 条件;
右外连接﹣﹣查询的是右表所有数据及其交集部分
SELECT 字段列表 FROM 表1 RIGHT [ outer ] JOIN 表2 ON 条件
希望以上内容能对你有所启发,互相学习,共同成长!
本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com
文章为作者独立观点不代本网立场,未经允许不得转载。