【原】这一年又是稀里糊涂地度过了

爱开发 2022-08-02 发布于广东

展开全文

快过年了，这一年又是稀里糊涂地度过了，没什么成就，个人视野依然存在局限性。

一年又一年，感觉增长却只有年龄。

小时候盼望过年，盼望着快快长大。

现在却对过年有点恐惧，有点害怕过年了。

也不知从何时开始，对于过年，不再是那种期盼了，而是成为了一种负担和责任了。年年年过，却找不到儿时那么期盼的感觉了，不变的是周而复始的一年四季，变的是容颜。

兜兜转转，归来时已不再是曾经那位对什么都朦朦胧胧的少年了。

怕归怕，时间它才不会理会你，该来的总是它还是会来。

闲话说完，回归正题。

今天我们来看看大数据开发中row_number函数。

作为一名程序员，求职面试时时常会遇到需要编写一些基础的sql，编写sql这样做的目的主要是考验求职者的逻辑思维及编写sql基础能力。而row_number() 函数在面试中得到了不少面试官的青睐，有的面试官喜欢用这个知识点来考察应聘者。

我们来看看下面这道题目。

有张员工表tb_employee 表包含员工基本信息，每个员工有其对应的 user_id、user_name、salary和department_name

面试官：编写一个 SQL 查询，找出每个部门工资第二高的员工。

这种情况我们可以尝试用row_number() 函数实现。

语法

row_number() over(partition by [要分组的列]  order by [排序列])

row_number() 函数将select语句返回的每一行，从1开始编号，赋予其连续的序号。在查询时应用了一个排序标准后，只有通过序号才能够保证其顺序是一致的，当使用row_number() 函数时，也需要专门一列用于预先排序以便于进行编号。

partition by关键字是分析性函数的一部分，它和聚合函数不同的地方在于它能返回一个分组中的多条记录，而聚合函数一般只有一条反映统计值的记录，partition by用于给结果集分组，如果没有指定那么它把整个结果集作为一个分组，分区函数一般与排名函数一起使用。

create  table if not exists test.tb_employee(  `user_id` int ,  `user_name` string ,  `salary` double ,  `department_name` string)row format delimited fields terminated by ',' stored as textfile;

新增数据

insert into test.tb_employee(user_id,user_name,salary,department_name) values(1,'李四',4000,'运营部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(2,'王五',5000,'运营部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(3,'张工',6000,'运营部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(4,'小爱',7000,'运营部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(5,'小张',3000,'行政部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(6,'小李',4000,'行政部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(7,'小王',5000,'行政部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(8,'小洪',6000,'行政部');insert into test.tb_employee(user_id,user_name,salary,department_name) values(9,'小刘',7000,'行政部');

能看出每个部门工资第二高的员工分别为

--运营部编号为3的张工薪资6000

--行政部编号为8的小洪薪资6000

那么Sql如何编写，我们可以用row_number() 这样写。

select*from(select   *, row_number() over(partition by department_name order by salary desc) as rn fromtest.tb_employee )as awherern = 2;

关于row_number()函数，在大数据开发中，更多的是用来去重。可以根据分组，取rn=1最新的一条记录。

由于笔者知识及水平有限,文中错漏之处在所难免,如有不足之处，欢迎交流。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：爱开发 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

爱开发

关注对话

TA的最新馆藏

刚刚，峰哥又官宣新恋情了，记不清这是峰哥第几次官宣了
一个人结婚生娃后，就成熟了
久违的期待：五一假期，重拾自我与激情
清华团队国产“Sora”火了！国产AI视频生成技术再突破
“一条小团团”单月礼物收入曾高达500万，贫穷限制了我的想象
忙碌又充实的一天终于落下帷幕，今天主要完成了三件“大事”

喜欢该文的人也喜欢更多

热门阅读换一换