`
lvzun
  • 浏览: 56636 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

(转)如何用数据库保存多级结构的数据

阅读更多

产品分类,多级的树状结构的论坛,邮件列表等许多地方我们都会遇到这样的问题:如何存储多级结构的数据?在PHP的应用中,提供后台数据存储的通常是关系型数据库,它能够保存大量的数据,提供高效的数据检索和更新服务。然而关系型数据的基本形式是纵横交错的表,是一个平面的结构,如果要将多级树状结构存储在关系型数据库里就需要进行合理的翻译工作。接下来我会将自己的所见所闻和一些实用的经验和大家探讨一下: 

层级结构的数据保存在平面的数据库中基本上有两种常用设计方法: 

1、毗邻目录模式(adjacency list model) 

2、预排序遍历树算法(modified preorder tree traversal algorithm) 

我不是计算机专业的,也没有学过什么数据结构的东西,所以这两个名字都是我自己按照字面的意思翻的,如果说错了还请多多指教。 
这两个东西听着好像很吓人,其实非常容易理解。这里我用一个简单食品目录作为我们的示例数据。 

我们的数据结构是这样的 

以下是代码: 

Food
|
|---Fruit
|    |
|    |---Red
|    |    |
|    |    |--Cherry
|    |
|    |---Yellow
|          |
|          |--Banana
|
|---Meat
     |
     |--Beef
     |
     |--Pork



为了照顾那些英文一塌糊涂的PHP爱好者 
Food:食物 
Fruit:水果 
Red:红色 
Cherry:樱桃 
Yellow:黄色 
Banana:香蕉 
Meat:肉类 
Beef:牛肉 
Pork:猪肉 


毗邻目录模式(adjacency list model) 
这种模式我们经常用到,很多的教程和书中也介绍过。我们通过给每个节点增加一个属性 parent 来表示这个节点的父节点从而将整个树状结构通过平面的表描述出来。根据这个原则,例子中的数据可以转化成如下的表: 

以下是代码: 

+-----------------------+
|   parent |    name    |
+-----------------------+
|          |    Food    |
|   Food   |   Fruit    |
|   Fruit  |    Green   |
|   Green  |    Pear    |
|   Fruit  |    Red     |
|   Red    |    Cherry  |
|   Fruit  |    Yellow  |
|   Yellow |    Banana  |
|   Food   |    Meat    |
|   Meat   |    Beef    |
|   Meat   |    Pork    |
+-----------------------+




我们看到 Pear 是Green的一个子节点,Green是Fruit的一个子节点。而根节点'Food'没有父节点。 为了简单地描述这个问题, 这个例子中只用了name来表示一个记录。 在实际的数据库中,你需要用数字的id来标示每个节点,数据库的表结构大概应该像这样:id, parent_id, name, description。 
有了这样的表我们就可以通过数据库保存整个多级树状结构了。 

显示多级树 
如果我们需要显示这样的一个多级结构需要一个递归函数。 

以下是代码: 

<?php

// $parent is the parent of the children we want to see

// $level is increased when we go deeper into the tree,

//        used to display a nice indented tree

function display_children($parent, $level) 
{

   // 获得一个 父节点 $parent 的所有子节点

   $result = mysql_query('SELECT name FROM tree '.

                          'WHERE parent="'.$parent.'";');

   // 显示每个子节点
   while ($row = mysql_fetch_array($result)) 
   {
       // 缩进显示节点名称
       echo str_repeat('  ',$level).$row['name']."n";
       //再次调用这个函数显示子节点的子节点
       display_children($row['name'], $level+1);
   }
}

?>;



对整个结构的根节点(Food)使用这个函数就可以打印出整个多级树结构,由于Food是根节点它的父节点是空的,所以这样调用: display_children('',0)。将显示整个树的内容: 

Food 
Fruit 
 Red
  Cherry 
 Yellow 
  Banana 
Meat 
 Beef 
 Pork 


如果你只想显示整个结构中的一部分,比如说水果部分,就可以这样调用:display_children('Fruit',0); 

几乎使用同样的方法我们可以知道从根节点到任意节点的路径。比如 Cherry 的路径是 "Food >; Fruit >; Red"。 为了得到这样的一个路径我们需要从最深的一级"Cherry"开始, 查询得到它的父节点"Red"把它添加到路径中, 然后我们再查询Red的父节点并把它也添加到路径中,以此类推直到最高层的"Food" 

以下是代码: 

<?php

// $node 是那个最深的节点
function get_path($node) 
{
   // 查询这个节点的父节点
   $result = mysql_query('SELECT parent FROM tree '.
                          'WHERE name="'.$node.'";');
   $row = mysql_fetch_array($result);
   // 用一个数组保存路径
   $path = array();
   // 如果不是根节点则继续向上查询
   // (根节点没有父节点)
   if ($row['parent']!='') 
   {
       // the last part of the path to $node, is the name
       // of the parent of $node
       $path[] = $row['parent'];
       // we should add the path to the parent of this node
       // to the path
       $path = array_merge(get_path($row['parent']), $path);
   }
   // return the path
   return $path;
}

?>;



如果对"Cherry"使用这个函数:print_r(get_path('Cherry')),就会得到这样的一个数组了: 

Array 
( 
  [0] =>; Food 

  [1] =>; Fruit 

  [2] =>; Red 
) 


接下来如何把它打印成你希望的格式,就是你的事情了。 

缺点: 
这种方法很简单,容易理解,好上手。但是也有一些缺点。主要是因为运行速度很慢,由于得到每个节点都需要进行数据库查询,数据量大的时候要进行很多查询才能完成一个树。另外由于要进行递归运算,递归的每一级都需要占用一些内存所以在空间利用上效率也比较低。 

现在让我们看一看另外一种不使用递归计算,更加快速的方法,这就是预排序遍历树算法(modified preorder tree traversal algorithm) 
这种方法大家可能接触的比较少,初次使用也不像上面的方法容易理解,但是由于这种方法不使用递归查询算法,有更高的查询效率。 

我们首先将多级数据按照下面的方式画在纸上,在根节点Food的左侧写上 1 然后沿着这个树继续向下 在 Fruit 的左侧写上 2 然后继续前进,沿着整个树的边缘给每一个节点都标上左侧和右侧的数字。最后一个数字是标在Food 右侧的 18。 在下面的这张图中你可以看到整个标好了数字的多级结构。(没有看懂?用你的手指指着数字从1数到18就明白怎么回事了。还不明白,再数一遍,注意移动你的手指)。 
这些数字标明了各个节点之间的关系,"Red"的号是3和6,它是 "Food" 1-18 的子孙节点。 同样,我们可以看到 所有左值大于2和右值小于11的节点 都是"Fruit" 2-11 的子孙节点 

以下是代码: 

                                1 Food 18
                                    |
                +-------------------------------------------+
                |                                                       |
            2 Fruit 11                                    12 Meat 17
                |                                                       |
    +------------------------+                   +-----------------------+
    |                                |                   |                              |
 3 Red 6               7 Yellow 10         13 Beef 14            15 Pork 16
    |                                |
4 Cherry 5               8 Banana 9



这样整个树状结构可以通过左右值来存储到数据库中。继续之前,我们看一看下面整理过的数据表。 

以下是代码: 

+-----------------------+-----+-----+
|   parent |    name  | lft   | rgt |
+-----------------------+-----+-----+
|              |    Food    | 1   | 18  |
|   Food   |   Fruit      | 2   | 11  |
|   Fruit    |    Red      | 3   |  6  |
|   Red     |    Cherry  | 4   |  5  |
|   Fruit    |    Yellow  | 7   | 10  |
|   Yellow |    Banana | 8   |  9  |
|   Food   |    Meat     | 12  | 17  |
|   Meat   |    Beef     | 13  | 14  |
|   Meat   |    Pork     | 15  | 16  |
+-----------------------+-----+-----+



注意:由于"left"和"right"在 SQL中有特殊的意义,所以我们需要用"lft"和"rgt"来表示左右字段。 另外这种结构中不再需要"parent"字段来表示树状结构。也就是 说下面这样的表结构就足够了。 

以下是代码: 

+------------+-----+-----+
|    name    | lft | rgt |
+------------+-----+-----+
|    Food    | 1   | 18  |
|   Fruit      | 2   | 11  |
|    Red      | 3   |  6  |
|    Cherry  | 4   |  5  |
|    Yellow  | 7   | 10  |
|    Banana | 8   |  9  |
|    Meat     | 12  | 17  |
|    Beef     | 13  | 14  |
|    Pork     | 15  | 16  |
+------------+-----+-----+



好了我们现在可以从数据库中获取数据了,例如我们需要得到"Fruit"项下的所有所有节点就可以这样写查询语句: 
SELECT * FROM tree WHERE lft BETWEEN 2 AND 11; 
这个查询得到了以下的结果。 

以下是代码: 

+------------+-----+-----+
|    name    | lft | rgt |
+------------+-----+-----+
|   Fruit    | 2   | 11  |
|    Red     | 3   |  6  |
|    Cherry  | 4   |  5  |
|    Yellow  | 7   | 10  |
|    Banana  | 8   |  9  |
+------------+-----+-----+




看到了吧,只要一个查询就可以得到所有这些节点。为了能够像上面的递归函数那样显示整个树状结构,我们还需要对这样的查询进行排序。用节点的左值进行排序: 

SELECT * FROM tree WHERE lft BETWEEN 2 AND 11 ORDER BY lft ASC; 


剩下的问题如何显示层级的缩进了。 

以下是代码: 

<?php
function display_tree($root) 
{
   // 得到根节点的左右值
   $result = mysql_query('SELECT lft, rgt FROM tree '.'WHERE name="'.$root.'";');
   $row = mysql_fetch_array($result);
   // 准备一个空的右值堆栈
   $right = array();
   // 获得根基点的所有子孙节点
   $result = mysql_query('SELECT name, lft, rgt FROM tree '.
                          'WHERE lft BETWEEN '.$row['lft'].' AND '.
                          $row['rgt'].' ORDER BY lft ASC;');
   // 显示每一行
   while ($row = mysql_fetch_array($result)) 
   {
       // only check stack if there is one
       if (count($right)>;0) 
   {
           // 检查我们是否应该将节点移出堆栈
           while ($right[count($right)-1]<$row['rgt']) 
   {
               array_pop($right);
           }

       }

       // 缩进显示节点的名称
       echo str_repeat('  ',count($right)).$row['name']."n";
       // 将这个节点加入到堆栈中
       $right[] = $row['rgt'];
   }

}

?>;



如果你运行一下以上的函数就会得到和递归函数一样的结果。只是我们的这个新的函数可能会更快一些,因为只有2次数据库查询。 

要获知一个节点的路径就更简单了,如果我们想知道Cherry 的路径就利用它的左右值4和5来做一个查询。 

SELECT name FROM tree WHERE lft < 4 AND rgt >; 5 ORDER BY lft ASC; 

这样就会得到以下的结果: 

以下是代码: 

+------------+
|    name    |
+------------+
|   Food     |
|   Fruit    |
|    Red     |
+------------+



那么某个节点到底有多少子孙节点呢?很简单,子孙总数=(右值-左值-1)/2 
descendants = (right – left - 1) / 2 
不相信?自己算一算啦。 
用这个简单的公式,我们可以很快的算出"Fruit 2-11"节点有4个子孙节点,而"Banana 8-9"节点没有子孙节点,也就是说它不是一个父节点了。 

很神奇吧?虽然我已经多次用过这个方法,但是每次这样做的时候还是感到很神奇。 

这的确是个很好的办法,但是有什么办法能够帮我们建立这样有左右值的数据表呢?这里再介绍一个函数给大家,这个函数可以将name和parent结构的表自动转换成带有左右值的数据表。 

以下是代码: 

<?php
function rebuild_tree($parent, $left) {
   // the right value of this node is the left value + 1
   $right = $left+1;

   // get all children of this node
   $result = mysql_query('SELECT name FROM tree '.
                          'WHERE parent="'.$parent.'";');

   while ($row = mysql_fetch_array($result)) {

       // recursive execution of this function for each

       // child of this node

       // $right is the current right value, which is

       // incremented by the rebuild_tree function

       $right = rebuild_tree($row['name'], $right);

   }



   // we've got the left value, and now that we've processed

   // the children of this node we also know the right value

   mysql_query('UPDATE tree SET lft='.$left.', rgt='.

                $right.' WHERE name="'.$parent.'";');



   // return the right value of this node + 1

   return $right+1;

}

?>;



当然这个函数是一个递归函数,我们需要从根节点开始运行这个函数来重建一个带有左右值的树 

rebuild_tree('Food',1); 

这个函数看上去有些复杂,但是它的作用和手工对表进行编号一样,就是将立体多层结构的转换成一个带有左右值的数据表。 

那么对于这样的结构我们该如何增加,更新和删除一个节点呢? 

增加一个节点一般有两种方法: 

第一种,保留原有的name 和parent结构,用老方法向数据中添加数据,每增加一条数据以后使用rebuild_tree函数对整个结构重新进行一次编号。 

第二种,效率更高的办法是改变所有位于新节点右侧的数值。举例来说:我们想增加一种新的水果"Strawberry"(草莓)它将成为"Red"节点的最后一个子节点。首先我们需要为它腾出一些空间。"Red"的右值应当从6改成8,"Yellow 7-10 "的左右值则应当改成 9-12。 依次类推我们可以得知,如果要给新的值腾出空间需要给所有左右值大于5的节点 (5 是"Red"最后一个子节点的右值) 加上2。 所以我们这样进行数据库操作: 

UPDATE tree SET rgt=rgt+2 WHERE rgt>;5; 
UPDATE tree SET lft=lft+2 WHERE lft>;5; 

这样就为新插入的值腾出了空间,现在可以在腾出的空间里建立一个新的数据节点了, 它的左右值分别是6和7 

INSERT INTO tree SET lft=6, rgt=7, name='Strawberry'; 

再做一次查询看看吧!怎么样?很快吧。 

好了,现在你可以用两种不同的方法设计你的多级数据库结构了,采用何种方式完全取决于你个人的判断,但是对于层次多数量大的结构我更喜欢第二种方法。如果查询量较小但是需要频繁添加和更新的数据,则第一种方法更为简便。 

另外,如果数据库支持的话 你还可以将rebuild_tree()和 腾出空间的操作写成数据库端的触发器函数, 在插入和更新的时候自动执行, 这样可以得到更好的运行效率, 而且你添加新节点的SQL语句会变得更加简单。

 

 

 

方法二:

 

关于标记任意的级别数据,我还是赞同采取编码标记法
比如,每级数据为四位数,饱合值9999,在编号存取方面,采用VChar值
“Num.”四位作为前缀,之后是一级编码,二级编码,三级编码。。。比如一条信息在第四级13号,那其编号就是“Num.0001000100010013”
递归列树则基础于检索时的条件限制,例如用“Num.xxxx%”作为关键字检索第一级的所有数据量,如果要把某一类置于另一个父类,只需要检索“Num.xxxxxxxx...”将前面的“Num.xxxx...”替换为父类的ID就OK了
另,有两点需要注意:
第一,这张数据表要有一个Max值表辅助,也就是要通过一个Max值,来记录每一个类已经存储的最大值;
第二,删除数据时不能真的删除,而是打上删除标记,在插入新纪录时update,有效的节约资源

本标记看似采用大数标记,其实属字串操作,不会耗太多的CPU资源,而设定索引后,配合左端定制右边通配符的条件检索,可以获得很高的效率

 

方法二:

无限级分类排序算法

正在写一带分类的程序,基本构思如下:
每级分类递增两位数字,这样,每级分类的数目限定在100个之间,分类方法主要为编码法;
示例:
一级分类:01,02,03
二级分类:0101,0102,0103,0201,0202........
三级分类:010101,010102,010103,010104..........

数据库查询时使用 like '01%'就可得到一级分类01下的所有子分类,非常方便!
如果要列出所有分类的树型结构,只需用一条语句select * from pro_class order by code,再稍微处理一下就可。(其中,pro_class为产品分类表,code为类别编码)。


设计的数据库结构如下:

id:                    类别id,主键
classname:         类名
classcode:          类别编码
parent:             父id
left_child:          最左孩子id(或第一个孩子)
right_sibling:      右兄弟id
layer:                层级(第一级类别为1,第2级类别2,以此类推)


顺便说明一点,我们公司采用的就是这样的编码

所以在输入的时候不会被轻易注入,只要检测好长度就可以了

比如一级就是两个长度,就是两个多一个就提示出错就可以了

 

方法三:

递归调用,恩路如下:

表为两张,一张分类表,一张信息表。
信息表如下:

  `ID` int(10) unsigned NOT NULL auto_increment,
  `cID` tinyint(3) unsigned NOT NULL default '0',
  `title` varchar(255) NOT NULL default 'No Title',
  `content` mediumtext NOT NULL,

最简单的无限级分类数据表,只是设置一个parentID来判断父ID
数据表如下:

  `cID` tinyint(3) unsigned NOT NULL auto_increment,
  `parentID` tinyint(3) unsigned NOT NULL default '0',
  `order` tinyint(3) NOT NULL default '0',
  `name` varchar(255) NOT NULL default '',

这样可以根据cID = parentID来判断上一级内容,运用递归至最顶层。

将数据库里的数据存成一个二维数组,然后放到一个文件中去,用的时候直接将这个php文件引入,使用其中缓存下来的数组,用数组来进行如上的一系统运算。我作了一个600个分类,4层节点的表,进行了一下对比,直接操作用了近3秒才算出树形列表,而用数组,只花了0.06秒左右。

 

以上是我在网上找的几种用数据库保存多级结构的数据的方法。

 

分享到:
评论

相关推荐

    c++模板存储类数据结构

    使用c++模板保存类结构文件,支持多级存储,多级嵌套,存取极为方便

    解析左右值无限分类的实现算法

    一、引言产品分类,多级的树状结构的论坛,邮件列表等许多地方我们都会遇到这样的问题:如何存储多级结构的数据?在PHP的应用中,提供后台数据存储的通常是关系型数据库,它能够保存大量的数据,提供高效的数据检索...

    Visual C++程序开发范例宝典(光盘) 第四部分

    实例065 多级数据库树状结构数据显示 实例066 可动态修改节点的树状结构 实例067 带复选功能的树状结构 实例068 显示磁盘目录 实例069 树型提示框 2.7 RichEdit控件典型实例 实例070 利用RichEdit显示Word...

    Visual C++程序开发范例宝典(光盘) 第八部分

    实例065 多级数据库树状结构数据显示 实例066 可动态修改节点的树状结构 实例067 带复选功能的树状结构 实例068 显示磁盘目录 实例069 树型提示框 2.7 RichEdit控件典型实例 实例070 利用RichEdit显示Word...

    实用小巧的注册表学习工具

    的信息就是按多级的层次结构组织起来的。 注册表中的每个分支中保存有该计算机中软 硬件设置中某一方面的特定信息与数据。 在注册表编辑器窗口底部是状态栏,当 选定一个主键或次级主键时,状态栏中显示 出所选主键...

    Visual C++程序开发范例宝典(PDF扫描版).part3

     cc实例065 多级数据库树状结构数据显示   cc实例066 可动态修改节点的树状结构   cc实例067 带复选功能的树状结构   cc实例068 显示磁盘目录   cc实例069 树型提示框   2.7 RichEdit控件典型实例...

    Visual C++程序开发范例宝典(PDF扫描版).part2

     cc实例065 多级数据库树状结构数据显示   cc实例066 可动态修改节点的树状结构   cc实例067 带复选功能的树状结构   cc实例068 显示磁盘目录   cc实例069 树型提示框   2.7 RichEdit控件典型实例...

    Visual C++ 程序开发范例宝典 源码 光盘 part2

    cc实例065 多级数据库树状结构数据显示 cc实例066 可动态修改节点的树状结构 cc实例067 带复选功能的树状结构 cc实例068 显示磁盘目录 cc实例069 树型提示框 2.7 RichEdit控件典型实例 cc实例070 利用...

    注册表学习

    主键中可包括多级次级主键,注册表中 的信息就是按多级的层次结构组织起来的。 注册表中的每个分支中保存有该计算机中软 硬件设置中某一方面的特定信息与数据。 在注册表编辑器窗口底部是状态栏,...

    易语言540个易模块

    edb数据库转Excel模块 1.3 ETimeFly API模块 Excel功能模块 F 发送消息_全选插入 防破解 仿XP窗口2.0 仿XP界面3.0特别版模块 3.0 分辨率 分割无逢文本模块 复制目录模块 G 改变系统菜单1.0改进版 改变系统...

    massCode-1.1.0-mac.zip 针对开发人员的代码段管理器

    它可以帮助您创建和组织自己的个人摘要集,并可以快速访问它。 功能组织MassCode允许您使用多级...数据库massCode使用简单但功能强大的NeDB来存储数据,每个条目都是一个简单的JSON结构。数据库文件位于本地计算机上。

    因特达crm2009客户关系管理系统 v2009.11.17

    采用B/S结构,数据库为Access与sql任意切换,可灵活用于单机、局域网、互联网,使用和维护都简单。 软件特点: 1、基于B/S架构,应用灵活 基于B/S架构,互联网、局域网、本地电脑皆可使用,不需安装客户端,可无限...

Global site tag (gtag.js) - Google Analytics