SQL 小技巧

ajoo

浏览: 455342 次

最近访客更多访客>>

san_yun

w931

97wgl

csm_qz

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

SQL Sybase Oracle performance Google

很久不搞sql了。整天就是java, java，也挺无聊的。

其实想想，sql还是挺好玩的，尤其是把别人吭哧吭哧几百行的stored procedure改写成一个简洁的query，或者一个本来要跑十分钟的stored proc改成几秒钟，感觉还是满爽的。

闲来无事，把一些小技巧回忆下来，省得以后考人的时候想不起来了。

1。一个基金performance表，记录着每个基金的每个月相比于前一个月的增长百分率，比如：
一月： 2.1（%）
二月： -0.5 (%)
三月：
...
十二月：15 (%)

基金用基金ticker来标识。

请列出每个基金从去年五月到今年五月的总共增长。

2。每个基金每个月都有打分，从一分到五分。请列出最近一年内每个基金被打五分的次数，四分的次数，三分的次数。如果一个基金被打至少三分的次数少于两次，就不要列出来了。

3。请针对上一年列出每个基金增长最好的那个月，包括基金ticker，当月的增长百分比，当月打分。如果两个月增长幅度相同，选择打分高的那个月；如果打分也相同，选择最近发生的那个月。

4。假设基金表不小心出现了重复数据，也就是ticker, 月份都相同，但是id是主键，唯一的。请删除重复记录。对重复记录，保留打分高的那条，如果打分也一样，保留其中任意一条。（其实，这个和三是一样的，不过算一个比较常见的dba要面临的问题）

（答案回头有时间写出来。提示：珍爱生命，远离存储过程！）

(I have discovered a truly marvelous proof of this, which this margin is too narrow to contain)

分享到：

瓜娃之走马观花 (1) - List和Map | getThis().getEvilAdvocate().setDead(getT ...

2008-08-20 11:13
浏览 5711
评论(39)
论坛回复 / 浏览 (37 / 36008)
分类:数据库
查看更多

39 楼 xushengcheng1985 2008-10-04

我想请教一下打分的标准是什么？

38 楼 gwinthis 2008-09-26

楼主举得例子有些极端，简单的SQL可以实现当然不用存储过程了。SQL语句和存储过程应该是没有矛盾的，我想大家遇到问题都是首先考虑使用SQL语句，如果SQL实现太复杂，会再考虑存储过程。特别是一些报表，字段来自很多表，并且需要复杂的计算。比如SQL语句包含6、7个表，左套一层右套一层，这样的语句让数据库来解析和执行很难想象会是什么样的结果，性能可想而知，编写难度也比较大，可读性当然也不会太好。在这种情况我觉得可以使用存储过程来代替一个复杂的SQL语句，把问题分散解决，对数据库，开发人员，维护人员都是个不错的选择。

37 楼 xiogxiog 2008-09-25

脱离SQL就是脱离本质，搞那么多虚的东西是没用的
碰上专业的数据仓库比如TERRADATA，你就是得老老实实用他的专用查询语句
搞技术的也不要太执着，见人说人话，见鬼说鬼话即可！

36 楼 willmore 2008-09-23

不存在符合条件的记录,也就是唯一边界的记录,对于ON 只能用等值连接,所以WHERE里补空件.

35 楼 armorking 2008-09-19

lintomny 写道

armorking 写道

对于oracle
第二个问题，

select 
      基金表.PK
    , count(decode(基金表.分数, 5, 1, 0)) as count_5
    , count(decode(基金表.分数, 4, 1, 0)) as count_4
    , count(decode(基金表.分数, 3, 1, 0)) as count_3
    , count(decode(基金表.分数, 5, 1, 4, 1, 3, 1, 0)) as count_543
from 基金表
group by 基金表.PK
having count_543 > 2

这里的having count_543 > 2可以这么写吗？
没听说查询出来的别名可以作having过滤项。至少Oracle9i下这是不行的。

的确，这是个笔误

34 楼 singhua 2008-09-18

太强悍了，对我触动很大，讨厌存储过程，可是我离不开存储过程！

33 楼 caoyangx 2008-09-16

你不会是做财帮子、晨星、数米等相关网站的吧？
如果是，我们是同行。呵呵。

32 楼 ccxw1983 2008-09-13

出现一些很笨的sql写法往往是因为写sql的人对sql所知甚少，或者是在别人的基础上修改，图快修改而来。
多知道些sql知识，在条件允许的条件下多点责任心应该可以避免这类事情。
当然如果有dba，有些事情在自己只知道一些笨的解决方法的时候应该先咨询下。

31 楼 lintomny 2008-09-09

第三个问题，可以使用数据库提供的分析函数呀
<pre name='code' class='sql'>select ticker, percent, star, ymonth
from (
select ticker, percent, star, ymonth,
row_number () over (partition by ticker order by percent desc, star desc, ymonth desc) as rrow
from performance
)
where rrow=1; </pre>
 
我想ajoo说的是不使用分析函数的情况下解决问题的办法吧。

30 楼 lintomny 2008-09-09

armorking 写道

对于oracle
第二个问题，

select 
      基金表.PK
    , count(decode(基金表.分数, 5, 1, 0)) as count_5
    , count(decode(基金表.分数, 4, 1, 0)) as count_4
    , count(decode(基金表.分数, 3, 1, 0)) as count_3
    , count(decode(基金表.分数, 5, 1, 4, 1, 3, 1, 0)) as count_543
from 基金表
group by 基金表.PK
having count_543 > 2

这里的having count_543 > 2可以这么写吗？
没听说查询出来的别名可以作having过滤项。至少Oracle9i下这是不行的。

29 楼 icefishc 2008-09-08

shoulders 写道

icefishc 写道

lz是强人。向lz学习。
手头只有sybase. 而Sybase不支持在outter join的时候再做其他连接, 头痛. 在这种情况下lz有什么好建议么？

我也用sybase,这种写法是SQL的标准,不会有问题的。

http://manuals.sybase.com/onlinebooks/group-as/asg1250e/sqlug/@Generic__BookTextView/12062;hf=0

真的不行的

28 楼 InnocentBoy 2008-09-05

很支持，我喜欢，我也喜欢搞这种事情。

27 楼 programmedbloke 2008-09-04

恩，不错!

26 楼 Tony_zc 2008-09-02

值得学习~

25 楼 eclipse2008 2008-08-26

sql调优还是蛮好玩的

24 楼 armorking 2008-08-22

对于oracle

第一个问题
可以用自定义集约函数搞定

可以参看
http://www.iteye.com/post/519866
那里有一个关于字符串连接(concat)用的自定义集约函数

第二个问题，

select 
      基金表.PK
    , count(decode(基金表.分数, 5, 1, 0)) as count_5
    , count(decode(基金表.分数, 4, 1, 0)) as count_4
    , count(decode(基金表.分数, 3, 1, 0)) as count_3
    , count(decode(基金表.分数, 5, 1, 4, 1, 3, 1, 0)) as count_543
from 基金表
group by 基金表.PK
having count_543 > 2

23 楼 ajoo 2008-08-22

shoulders 写道

ajoo 写道

第三个问题，先写出代码来吧。等有点时间再解释一下。第四个问题其实可以照猫画虎的：

select x.ticker, x.star, x.percent from perf x
left join perf nothing
on x.ticker = nothing.ticker and
(x.percent < nothing.percent or
  (x.percent=nothing.percent and x.star < nothing.star or
      x.star=nothing.star and x.date < nothing.date)
)
where nothing.ticker is null

在使用外链接的时候，where clause 跟left join on clause，数据库优化器会先使用哪个clause过滤数据啊？

这是根据索引来的，不是简单的谁先谁后。

咱们先假设ticker上有索引。

那么比如你的where clause如果有"and ticker in ('a','b','c')"，这个肯定就先index seek了。在seek出来的基础上，在怎么搞都无所谓了。

但是where nothing.ticker is null肯定不会是先被过滤的，因为做不到，只有join之后你才知道哪个ticker是null。

所以据我的经验，如果没有上面那种额外的过滤条件的话，根据数据量的大小，这里可能是一个merge join或者hash join配上table scan/index scan。

22 楼 shoulders 2008-08-22

icefishc 写道

lz是强人。向lz学习。
手头只有sybase. 而Sybase不支持在outter join的时候再做其他连接, 头痛. 在这种情况下lz有什么好建议么？

我也用sybase,这种写法是SQL的标准,不会有问题的。

21 楼 shoulders 2008-08-22

ajoo 写道

第三个问题，先写出代码来吧。等有点时间再解释一下。第四个问题其实可以照猫画虎的：

select x.ticker, x.star, x.percent from perf x
left join perf nothing
on x.ticker = nothing.ticker and
(x.percent < nothing.percent or
  (x.percent=nothing.percent and x.star < nothing.star or
      x.star=nothing.star and x.date < nothing.date)
)
where nothing.ticker is null

在使用外链接的时候，where clause 跟left join on clause，数据库优化器会先使用哪个clause过滤数据啊？

20 楼 licogi 2008-08-22

ajoo 写道

第一个问题
...
我的解决方法嘛，只读提过了。为了完整，我再贴一遍我的用自然对数的方法：

select ticker, (exp(sum(log(1 + percent/100))) - 1) / 100 as accumulated_percent
from perf where date between startdate and enddate group by ticker

...

很不错的SQL 收藏了

不过第一题有个小问题计算增长率的部分应该是：
(exp(sum(log(1 + percent/100))) - 1) * 100

select ticker, (exp(sum(log(1 + percent/100))) - 1) * 100 as accumulated_percent
from perf where date between startdate and enddate group by ticker

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SQL 小技巧

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SQL 小技巧

评论

发表评论

相关推荐

最近访客更多访客>>