haskell中的Data.Map的效率

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 3861 次

锁定老帖子主题：haskell中的Data.Map的效率精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
yjfuk 等级: 初级会员性别: 文章: 3 积分: 70	发表时间：2009-07-20 相关推荐: luautils:Haskell与Lua集成的助手 Haskell语言学习笔记（28）Data.Map Haskell语言学习笔记（54）Data.Set Haskell语言学习笔记（15）Data.List Haskell语言学习笔记（12）Data.Function 更多相关推荐 Haskell haskell中的Data.Map是用平衡二叉树实现的，相对用hash实现来说，效率应该差了不少可是Data.hashtable功能好像很弱有没有比较好的实现方法声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

night_stalker 等级: 性别: 文章: 1366 积分: 780 来自: 杭州	发表时间：2009-07-20 最后修改：2009-07-20 hashtable 不一定比 map 快 …… 要看具体情况，而且 ghc 的 hashtable 有时会很慢。这是比较平均的情况 bench_hashtable.hs import Control.Monad import qualified Data.HashTable as H main = do m <- H.new (==) H.hashInt forM_ [1..10000000] $ \n -> H.insert m n n v <- H.lookup m 100 print v bench_hashmap.hs import Data.IntMap import Data.List main = print $ m ! 100 where m = fromDistinctAscList [(i,i) \| i <- [1..10000000]] 在我的机器上（ghc 6.10.2，编译参数 -O2） bench_hashtable.hs 18.656250s bench_map.hs 6.328125s 不过这个慢估计是 GC 的原因，bench_hashmap +RTS -H500M 就变成 7.296875s 了。但是仍旧显示 ghc 的 hashtable 实现有问题 …… 比较一下对应的 Ruby 代码（1.9.1 p129） bench_hash.rb h = {} (1..10000000).each do \|i\| h[i] = i end puts h[100] bench_hash.rb 7.125000 s ，号称最慢的 ruby 竟然还快一点点，是不是很囧？同样的事情如果用 F# 或者 C++，简直是闪电速度 …… hash 遇到某个 key 有个超长链的情况，性能会更坏。不过很多情况换个思路也能达到很高的效率，不是非 hashtable 不可 …… 再不满意就用 C++ 的 unordered_map 补救 ……
返回顶楼	回帖地址 1 0 请登录后投票

icefishc 等级: 初级会员性别: 文章: 874 积分: 30 来自: 北京	发表时间：2009-07-20 最后修改：2009-07-20 引用 haskell中的Data.Map是用平衡二叉树实现的，相对用hash实现来说，效率应该差了不少 hash表常常有更好的效率但平衡二叉树的效率要比hash稳定我们说hash的查找效率是1那只是在不考虑冲突的情况下。况且求hash值也是要时间的时间复杂度更优不带表效率更好这还和数据规模有关。引用可是Data.hashtable功能好像很弱 hashtable比Map少了很多方法那是正常的因为hashtable不适合做那些事作为标准库把那些方法加进去才不正常呢没有万能的数据结构根据自己的需求选一种就是了
返回顶楼	回帖地址 1 0 请登录后投票

yjfuk 等级: 初级会员性别: 文章: 3 积分: 70	发表时间：2009-07-20 谢谢，楼上两位的回复因为想实现类似python中dict的，可以insert, update等等用Data.Map实际运行起来比用python还要慢
返回顶楼	回帖地址 0 0 请登录后投票

night_stalker 等级: 性别: 文章: 1366 积分: 780 来自: 杭州	发表时间：2009-07-20 Data.HashTable 不是引用透明的（这个东西竟然有内部状态 ……），可能他们因此而不太喜欢它 …… 不过我想 CRUD 4 个函数应该够用了，如果要更多的功能，用 combinator 的方式能组合出不少。toList 以后也可以用 list 相关的很多方法。不用太担心 toList 的效率问题，lazy 求值会舍弃很多不必要的计算。
返回顶楼	回帖地址 0 0 请登录后投票

yjfuk 等级: 初级会员性别: 文章: 3 积分: 70	发表时间：2009-08-02 night_stalker 写道不过很多情况换个思路也能达到很高的效率，不是非 hashtable 不可 …… 再不满意就用 C++ 的 unordered_map 补救 …… 能具体举个例子么？
返回顶楼	回帖地址 0 0 请登录后投票

Magicloud 等级: 初级会员性别: 文章: 222 积分: 70 来自: 成都	发表时间：2009-08-03 還有，因為哈希需要提供哈希函數，對于某些沒有或難以提供哈希函數的key，map是唯一的選擇（不能實現Eq的很少）……
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 综合技术版

跳转论坛: