序列化: 一个老家伙的咸鱼翻身
1寒冬的蛰伏
这里的工作很繁忙,一年365天, 一天24小时几乎不停工。
但是我却是一个闲人, 因为我做的工作最近用的人太少了, 经常被冷落在一边。
大多数时候,我只能羡慕的看着线程、反射、注解、集合、泛型这些明星员工在那里忙忙碌碌, 听着他们充满激情的的大声说笑。
他们都叫我序列化,想想也是, 我的工作就是把一个Java 对象变成二进制的字节流, 或者反过来把字节流变成Java 对象, 这有什么意思?
当大家需要一个Java 对象的时候, 直接new 出来不就得了, 对象不用了自然有令人胆战心惊的垃圾回收去处理。
但是存在即合理, 在JDk1.1的时代, 我就已经存在了。 当时人们的思想很超前: 网络就是计算机。 一个个Java 对象应该可以在网络中到处旅行 : 从一个机器出发时,就变成二进制字节流,顺着网络跨过千山万水, 到达另外一台机器,在那里摇身一变,恢复成Java 对象, 在那里继续运算。
既然可以以二进制方式在网络中漫游, 那自然也可以把这些字节流存到硬盘中, 当JVM停机,整个世界坍塌以后, 线程,反射,注解都不复存在了, 而我的字节流还会在硬盘上默默等待, 等待下一次JVM的重生, 把对象恢复。
所以我觉得我的工作也很有价值, 从某种意义上来讲, 我可以让Java 对象跨越时间和空间而永生 !
这种永生是有代价的, 首先你必须得用Java, 这是废话, 因为我只是java对象序列化。
虽然那二进制字节流的格式是公开的, 你可以用任何语言(C,C++,Python...)去解析读取, 但是解析以后又有什么用处呢? 那些字节流中会告知你这是哪个类的数据,字段的类型和值, 但是如果你没有相对应的Java 类,还是无法构建出Java 对象出来。
其次, 做序列化双方的类必须得一致, 要不然肯定出乱子。
大部分人都不知道在上个世纪末和本世纪初, 我还是随着J2EE火了一阵, 当时J2EE中有个叫RMI东西, 其实就是Java RPC。 由于我卓越的工作, 开发人员用可以轻松的调用远程服务器上的Java 方法, 就相当于调用本地方法一样, 很方便。
可惜的是这个RMI只能用在Java环境中,对于服务器来说这根本不是问题, 但是当时Web应用正在兴起, 一个浏览器中是很难有Java环境的, 所以RMI很快就没落了, 我也随之被打入冷宫, 我也只好蛰伏下来,等待机会。
2XML和JSON的挑战
后来我们这里来了一个叫XML的小伙子,很受大家的欢迎, 都喜欢把Java 对象序列化的工作交给他去做。
我不能坐以待毙, 我仔细的观察了几天以后, 终于发现这个家伙有个大缺点: 太复杂了!
对于我的Java 序列化,大部分情况下你只需要让你的类实现Serializable接口, 我就可以接管后续的所有工作。不用你操心了。
可是用XML, 你还得写一堆代码把一个类中的各个字段和他们的值变成XML标签/属性/值 才行。 当用来表示对象的XML字符串漫游到另外一个机器上, 还得有一堆代码把XML变成对象。
我嘲笑XML说: “小伙子, 你这也太麻烦了吧, 人类的时间多宝贵, 为了用XML做序列化,代价好高嗷!”
“老家伙,没你想的那么复杂, 你可能不知道, 我们有些类库能自动帮助把对象变成XML” 他毫不示弱。
“ 不要忘了 ” 小伙子补充道 “ 我们XML可是语言中立的, 在这里是Java对象, 到了客户端 什么语言都行 , Java/C/Python/Ruby.... 都没问题, 甚至浏览器里的Javascript都能处理, 这一点你不行了吧?”
这家伙戳到了我的痛处, 在浏览器中我的确需要一个Java 环境才行运行 , 唉,真是成也Java ,败也Java。
我说: “我知道你是语言无关的, 但是你注意到没有, 你的XML标签冗余太多, 真正的数据很少。 比如有个Person类, 有两个字段name和address, 用你的XML做序列化就变成了这个样子<person><name>abc</name><address>xyz</address></person>, 这在网络上传输起来绝对是一种浪费! 我的java 字节流就不一样了, 二进制的,非常紧凑,一点都不浪费!“
XML小伙子沉默了, 小样, 我也抓住了你的痛点。
过了两天,这个小伙子又带来了一个叫JSON的小弟, 他得意洋洋的向我炫耀: 用了JSON以后,数据精简多了, 不信你看:{"name”:“abc", "address":"xyz"} , 现在我们不但语言中立,还很精简, 老家伙,这下你无话可说了吧。
我认栽, 但是让XML也没高兴多久, 让他没有想到的是, Web时代JSON和Javascript是一对绝配, 联手统治了浏览器。 连XML自己都快没饭吃了。
(码农翻身注: 参见《Javascript: 一个屌丝的逆袭》)
3新协议的崛起
其实我一直觉得我的二进制序列化方式能减少存储空间, 方便网络传输,只是我的硬伤是无法跨越语言。
不行, 我不能一直守着Java这一亩三分地了, 必须扩展支持多语言, 这样才能脱离Java环境。
有人说: 计算机的所有问题都可以通过增加一个中间层来解决。 我是不是也可以搞个中间层出来?
让这个中间层来定义/描述消息的格式,然后再弄一个小翻译器( 不,叫编译器显的更加高大上), 把这个程序员自定义的消息格式转换成各种语言的实现,例如java, python, c++等等。
在转换好的语言实现里边,自动包含了要被序列化的类的定义, 以及实现序列化和反序列化的代码, 当然序列化以后的数据是二进制的。
等到二进制的字节流通过网络传输到另外一台机器, 就可以反序列化为各种语言(例如Python)的对象了, 当然必须是同一个消息格式产生的Python类。
不仅仅是Python, C++, Go, C# , 甚至Javascript 都可以用 !
是不是很爽 ? 既语言中立, 又采用二进制传输, 体积小,解析快, 完美的综合了各种优点!
唯一的额外工作是需要把消息格式的定义编译成各种语言的实现, 为了能支持多语言,这也是没办法的事情 。
我得意的把新方案给XML和JSON这两个家伙看了, 从表情来看,就知道他俩如临大敌了。
我也把方案提交给了我们服务器世界的老大 , 他大为赞赏, 决定先在部分场景下用起来, 例如对象存入缓存的时候需要序列化, 以前用json, 占用空间很大, 改用了我的新方案以后, 不但减少了空间使用, 还提升了读写的效率, 效果不错。
我成功地扳回了一局,现在找我用新方案来做序列化的人越来越多了, 但是最终鹿死谁手还很难说,最有可能的情况是,各种方案混合使用, 即使是这样,我也很满足了。
你看到的只是冰山一角, 更多精彩文章,请移步《码农翻身文章精华》
有心得想和大家分享? 欢迎投稿 ! 我的联系方式:微信:liuxinlehan QQ: 3340792577
·END·
用故事给技术加点料
编辑推荐
掘金是一个高质量的技术社区,从移动开发到架构设计,编程语言到开源类库,让你不错过互联网开发的每一个技术干货。长按图片二维码识别或者各大应用市场搜索「掘金」,技术干货尽在掌握中。