`

对象转换的问题

阅读更多

 

有句话叫做“计算机科学领域任何问题,都可以间接的通过添加一个中间层来解决”,但是唯一解决不了的问题,是层次本身过多的问题。每一层内都会维护自己在乎的数据对象模型。层与层之间数据的传递,就不可避免地遇到对象类型转换的问题。

这个话题也和最近的项目有关。我们在重构一个老旧的系统,所做的第一件事情,就是要把数据访问层从原有系统中剥离出来,我们精心设计了这一层的模型和结构,但是要让原有系统平缓地从原有数据访问方式上移植到新的数据访问层上,就涉及到上层(Service)的原有数据对象和数据访问层(DAS)之间的数据传递,而二者模型并不相同,而且原有Service的模型并不纯粹,既不是充血模型,model层也掺杂了很多逻辑,因此也不是纯粹的贫血模型,因此这两层之间对象转换的工作就显得尤为重要。

且看这样的对象转换:

public UserNew transform(UserOld old){
    UserNew userNew = new UserNew();
    userNew.setName(old.getName());
    userNew.setAge(old.getAge());
    userNew.setSex(old.getSex());
    userNew.setDesc(old.getDesc());
    ... ...
}
public UserOld transform(UserNew newUser){
    ... ...
}

但是在使用过程中,发现存在着这样一些问题:

  1. 一个UserNew/UserOld对象有40个属性,这样的一次transform就要写40+行这样毫无营养的get/set代码,而再提供一个反向转换的方法这样的代码需要×2;整个系统存在二三十种model,这样啰嗦的转换令人恶心;再者,我们发现,层次可能很多——比如我们在使用一些序列化框架时,需要借由类似的方法将当前对象转换成框架需要的POJO对象,因此一个User就让我们做了很多次这样丑陋的转换。
  2. 转换并不是那么顺利的,经常遇到类型不同的情况,需要经过类型转换或者简单的逻辑处理。比如对于空值的特殊处理,对于0值的特殊处理等。
  3. 转换甚至都不一定是一对一的,特殊情形的处理被迫使用到的逻辑,让整个转换层和业务模块中的很多发生耦合……这不是我希望看到的。

如何思考和解决这样的问题?其实这个问题有很多种表现形式,比如PO-VO对象的互转换等等。这里的争论很多,我整理如下:

1、如果能够尽量保证模型的字段名和和类型一致,可以利用Spring的copyProperties方法来完成POJO对象的拷贝:

BeanUtils.copyProperties(srcObj, desObj);

不过这个方法也有一些缺陷,一个是反射导致的性能损失,一次反射并不明显,对象拷贝可以说是非常频繁的;还有一个是对于一些类型不同的情况,我们需要自定义一些转换逻辑来处理这样的特殊情形。

2、借由一个中间层来承载数据,这样的中间层往往是可序列化的,比如JSON格式,每一种String、int等基础的类型都有转换成JSON的统一处理办法,所有数据的转换都通过通用方法转成JSON格式,然后再根据目标对象对各字段格式的要求,把JSON表示的对象复原。这种办法需要的框架性代码比较多,而且通过序列化对象作为中间介质,不免存在性能损耗的问题,但是对于存在大量数据转换的情况,也不失为一种好办法:

image

3、如果是使用Ruby之类的动态语言,或者变量定义本身就是弱类型的,那么就会省去很多这样转换的工作,当然,由于编译期间对于对象属性的不确定性,也可能引入更多不可预期的运行时异常,或者是一些丢失精度、显示错乱等等这方面的问题。

4、还有一个走极端的方式,对象变成Map<String, String>来存储,这样就免去了对象转换的成本,而且扩展性极强。但是缺点也是极其明显的,这就根本不是面向对象了,这是“面向无差异数据容器”编程……而且缺少约束,对于嵌套场景可读性极差。

5、在某些情况下还有一个变通的方式,我们不减少任何这样对象转换的重复代码,但是,我们可以通过注解、工具等等让这些可预期的代码自动生成,这同样减少了程序员的工作量。

最后,我要说的是,保持模型对象的纯粹和单一性,是减小工程重量的一个原则,让不同层次的逻辑使用同一组对象,虽然可能带来一些契合性问题、兼容性问题,但是带来的好处就是大大减小冗余对象类型的数量,减少这种没有营养的转换。这里又是trade off了。

除了这些,你还有什么体会和好办法?

文章系本人原创,转载请注明作者和出处(http://www.raychase.net

注:本博客已经迁移到个人站点 http://www.raychase.net/ ,欢迎大家访问收藏,本ITEye博客在数日后将不再更新。

 

2
0
分享到:
评论
10 楼 mack 2017-06-14  
一般采用json
9 楼 liaomengge 2015-12-21  
那对比与Apache提供的BeanUils(当然,这仅是对简单地对象,map转化),两者之间的效率差别又有哪些???
8 楼 RayChase 2012-11-12  
一江春水邀明月 写道
RayChase 写道
一江春水邀明月 写道
楼主试过Dozer 或者Orika 这样的工具么?
1. BeanUtils 是不建议用的, 浅拷贝会带来很多对象使用上的陷阱;
2. 中间层Json的转换, 实在不敢恭维, CPU 和内存开销, 性能是硬伤。

没有。谢谢。顺便去学习了一下Dozer和Orika。


可以参考我的博客, http://wangbt5191-hotmail-com.iteye.com/blog/1632444
强烈推荐Orika。 就我的感觉是1.2.0 比较稳定, 但是还是有点小trick 需要绕过去的。 好在它的代码逻辑非常清晰, 很容易看明白

Good!
7 楼 一江春水邀明月 2012-11-12  
RayChase 写道
一江春水邀明月 写道
楼主试过Dozer 或者Orika 这样的工具么?
1. BeanUtils 是不建议用的, 浅拷贝会带来很多对象使用上的陷阱;
2. 中间层Json的转换, 实在不敢恭维, CPU 和内存开销, 性能是硬伤。

没有。谢谢。顺便去学习了一下Dozer和Orika。


可以参考我的博客, http://wangbt5191-hotmail-com.iteye.com/blog/1632444
强烈推荐Orika。 就我的感觉是1.2.0 比较稳定, 但是还是有点小trick 需要绕过去的。 好在它的代码逻辑非常清晰, 很容易看明白
6 楼 RayChase 2012-11-11  
一江春水邀明月 写道
楼主试过Dozer 或者Orika 这样的工具么?
1. BeanUtils 是不建议用的, 浅拷贝会带来很多对象使用上的陷阱;
2. 中间层Json的转换, 实在不敢恭维, CPU 和内存开销, 性能是硬伤。

没有。谢谢。顺便去学习了一下Dozer和Orika。
5 楼 一江春水邀明月 2012-11-11  
楼主试过Dozer 或者Orika 这样的工具么?
1. BeanUtils 是不建议用的, 浅拷贝会带来很多对象使用上的陷阱;
2. 中间层Json的转换, 实在不敢恭维, CPU 和内存开销, 性能是硬伤。
4 楼 RayChase 2012-09-30  
hxze220 写道
我想请问一下,如果用JSON作序列化,由于Java的类型擦除,如何反序列化呢?
比如List<StudentPO>转成JSON是OK的,但是对端由JSON反序列化貌似是会出问题的。
更复杂的还有类属性自引用、类属性是接口或抽象对象、多层集合类嵌套的问题。
另外还想请问下您推荐用哪个JSON包呢?

JSON格式在还原对象的时候是不知道原始类型的。所以这个原始类型信息必须你指定。换言之,模型定义少不了,可以少的是转换的代码。
3 楼 1127 2012-09-30  
有些失望啊,还是没有解决方案。转换这个重复劳动,还是没法避免啊。。。
2 楼 hxze220 2012-09-30  
我想请问一下,如果用JSON作序列化,由于Java的类型擦除,如何反序列化呢?
比如List<StudentPO>转成JSON是OK的,但是对端由JSON反序列化貌似是会出问题的。
更复杂的还有类属性自引用、类属性是接口或抽象对象、多层集合类嵌套的问题。
另外还想请问下您推荐用哪个JSON包呢?
1 楼 jinnianshilongnian 2012-09-29  
引用
保持模型对象的纯粹和单一性,是减小工程重量的一个原则,让不同层次的逻辑使用同一组对象,虽然可能带来一些契合性问题、兼容性问题,但是带来的好处就是大大减小冗余对象类型的数量,减少这种没有营养的转换。这里又是trade off了。



在交换数据及存储数据时 最好采用平台/语言无关形式 如JSON、XML,尽量不要使用平台相关的存储机制,如Java序列化机制。

相关推荐

Global site tag (gtag.js) - Google Analytics