永洪社区

标题: 从零开始学SQL数据分析(4)-SQL数据提取与筛选 [打印本页]

作者: 喝酸奶不舔盖    时间: 2024-6-13 16:02
标题: 从零开始学SQL数据分析(4)-SQL数据提取与筛选

一张表中通常会包含很多字段,造成数据冗余,在做数据分析时,我们仅需要提取数据分析所需要的字段,这里就需要用到数据选取的知识点,同时还可以依据特定条件筛选。
本文介绍数据提取、数据筛选、条件聚合运算等内容,数据筛选后又类比EXCEL做条件计数和条件求和等操作,下面一起来学习。
数据提取
按列提取数据,使用SELECT函数,提取对应的字段名即可。
#按列提取 SELECT cname  FROM course;

按行提取需要特定加一个按行筛选的条件。
#按行提取 SELECT * FROM course  WHERE cname='数学';
按位置提取数据,这里使用LIMIT限制数据的大小,"LIMIT 3,4"的含义表示从第3行开始筛选4行数据。
#按位置提取 SELECT * FROM student  LIMIT 3,4;

按条件提取数据,普通提取数据后,需要按照一定的条件筛选数据,这里使用WHERE函数,在后面设定条件即可完成筛选。
#按条件提取并计算 SELECT * FROM score WHERE cid=02 AND score>80;

逻辑条件筛选
常用的逻辑条件有与(AND)、或(OR)、非(NOT),这里使用AND函数,筛选条件为课程号为03,且分数大于80分。
#数据筛选AND SELECT * FROM score WHERE cid=03 AND score>80;

此处使用OR函数,筛选学号为01,或者分数大于98分的数据。
#数据筛选OR SELECT * FROM score WHERE sid=01 OR score>98;

添加一个不等于条件,筛选性别中不为"女"的数据,其中,不等于号用"!="来表示。
#数据筛选(不等于) SELECT * FROM student WHERE ssex != '女';

使用IN函数,可以将条件值限定为具体的值,从而达到筛选确定值的目的。
#数据筛选IN SELECT * FROM score WHERE score IN (90,99);

使用LIKE模糊筛选,%是通配符,替代一个或多个字符,这里的条件可以筛选姓李的同学。
#数据筛选like(模糊筛选) SELECT * FROM student WHERE sname LIKE '李%';

条件聚合运算
条件筛选后计数,类似于EXCEL中的countif函数,这里筛选课程号为03,且成绩大于60分的课程,然后计数。
#筛选后计数 SELECT COUNT(cid) AS cid_count  FROM score WHERE cid=03 AND score>60;
筛选后求和,类似于EXCEL中的sumtif函数。
#筛选后求和  SELECT SUM(score) AS sum_score  FROM score WHERE sid=01 AND cid=01 AND score>60;
同理可以设置条件,求条件平均。
#筛选后求均值 averageif SELECT AVG(score) AS avg_score  FROM score WHERE cid != 01;
文章源自:大话数据分析







欢迎光临 永洪社区 (https://club.yonghongtech.com/) Powered by Discuz! X3.4