从oracle去重复记录实例中学习使用group by， having -LYWILL设计运营 - 网站运营与推广、开发技术、成功项目展示。

2012年03月01日 00:35:57

从oracle去重复记录实例中学习使用group by， having

oracle中去重复记录不用distinct ，用distinct关键字只能过滤查询字段中所有记录相同的（记录集相同），而如果要指定一个字段却没有效果，另外distinct关键字会排序，效率很低。

select distinct name from t1 能消除重复记录，但只能取一个字段，现在要同时取id,name这2个字段的值。

select distinct id,name from t1 可以取多个字段，但只能消除这2个字段值全部相同的记录。

所以用distinct达不到想要的效果，用group by ，可以解决这个问题。

例如要显示的字段为A、B、C三个，而A字段的内容不能重复可以用下面的语句：

select A, min(B),min(C),count(*) from [table] where [条件] group by A having [条件] order by A desc

为了显示标题头好看点可以把select A, min(B),min(C),count(*) 换称select A as A, min(B) as B,min(C) as C,count(*) as 重复次数

显示出来的字段和排序字段都要包括在group by 中，但显示出来的字段包有min,max,count,avg,sum等聚合函数时可以不在group by 中。

如上句的min(B),min(C),count(*)

一般条件写在where 后面，有聚合函数的条件写在having 后面

如果在上句中having加 count(*)>1 就可以查出记录A的重复次数大于1的记录

如果在上句中having加 count(*)>2 就可以查出记录A的重复次数大于2的记录

如果在上句中having加 count(*)>=1 就可以查出所有的记录，但重复的只显示一条，并且后面有显示重复的次数----这就是所需要的结果，而且语句可以通过hibernate

下面语句可以查询出那些数据是重复的：

select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1

将上面的>号改为=号就可以查询出没有重复的数据了。

例如 select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having

count(*)>=1 order by GKRQ)

select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by

gcmc ) order by gkrq desc ---还是这个可行。

聚合函数对一组行中的某个列执行计算执行计算并返回单一的值。聚合函数忽略空值。聚合函数经常与 SELECT 语句的 GROUP BY 子句一同使用,所以有的时候也把其称之为分组函数。

SQL代码

常见的分组函数有：
函数名称函数描述
Count 返回找到的记录数
Min 返回一个数字列或计算列的最小值
Max 返回一个数字列或计算列的最大值
Sum 返回一个数字列或计算列总和
avg 返回一个数字列或计算列的平均值
分组函数的语法：
SELECT [column,] group_function(column), ...
FROM table
[WHERE condition]
[GROUP BY column]
[ORDER BY column];
//返回总记录数 //* 代表的是：一条记录
SQL> select count(*) from emp;
//返回comm不为空的总记录数
SQL> select count(comm) from emp;
//COUNT(DISTINCT expr) 返回 expr非空且不重复的记录总数
SQL> select count(distinct(sal)) from emp;
注意：组函数忽略空值。
//返回所有员工的平均工资
SQL> select avg(nvl(sal,0)) from emp;
注意：NVL函数使分组函数无法忽略空值
//返回员工编号最小值
SQL> select min(empno) from emp;
//返回员工工资最大值
SQL> select max(sal) from emp;
//求该月本公司发出的工资总额
SQL> select sum(comm)+sum(sal) from emp;
SQL> select sum(nvl(sal,0)+nvl(comm,0)) from emp;
Group by子句
Group By语句从英文的字面意义上理解就是“根据(by)一定的规则进行分组(Group)”。它的作用是通过一定的规则将一个数据集划分成若干个小的区域，然后针对若干个小区域进行数据处理。如果在查询的过程中需要按某一列的值进行分组,以统计该组内数据的信息时,就要使用group by子句。不管select是否使用了where子句都可以使用group by子句。
注意：group by子句一定要与分组函数结合使用,否则没有意义。
//求出每个部门的员工人数
SQL> select deptno,count(*) as "人数" from emp group by deptno;
//求出每个部门的员工的平均工资
SQL> select deptno,avg(nvl(sal,0)) from emp group by deptno;
//注意：group by 子句中的列不必包含在SELECT 列表中
SQL> select avg(nvl(sal,0)) from emp group by deptno;
//求出某个部门中相同职位的员工人数 group by 后可以跟多个分组的字段
SQL> select deptno,job,count(*) from emp group by deptno,job order by deptno;
非法使用组函数
1、所用包含于SELECT 列表中，而未包含于组函数中的列都必须包含于 GROUP BY 子句中。
举例：
SQL> select empno,count(job) from emp;
正确写法如下：
SQL> select empno,count(job) from emp group by empno;
2、不能在 WHERE 子句中使用组函数（注意）。
SQL> select deptno from emp where count(job)>0 group by deptno;
备注：ORA-00934: 此处不允许使用分组函数
Having 子句
HAVING 子句对 GROUP BY 子句设置条件的方式与 WHERE 子句和 SELECT 语句交互的方式类似。WHERE 子句搜索条件在进行分组操作之前应用；而 HAVING 搜索条件在进行分组操作之后应用。HAVING 语法与 WHERE 语法类似，但 HAVING 可以包含聚合函数。HAVING 子句可以引用选择列表中出现的任意项。
备注：having子句通常与group by子句结合使用
语法：
SELECT column, group_function
FROM table
[WHERE condition]
[GROUP BY group_by_expression]
[HAVING group_condition]
[ORDER BY column];
//查询部门的员工人数大于五部门编号
SQL> select deptno,count(*) from emp group by deptno having count(*)>5;
备注：分组函数可以嵌套
嵌套函数
　　函数可以嵌套。一个函数的输出可以是另一个函数的输入。操作数有一个可继承的执行过程。但函数的优先权只是基于位置，函数遵循由内到外，由左到右的原则.
　嵌套函数可以包括在组函数中嵌套单行函数，或者组函数嵌套入单行函数或组函数中
总结：整个查询语句的语法格式如下：
SELECT column, group_function(column)
FROM table
[WHERE condition]
[GROUP BY group_by_expression]
[HAVING group_condition]
[ORDER BY column];