如何实现一个优雅的Python的Json序列化库

在Python的世界里,将一个对象以json格式进行序列化或反序列化一直是一个问题 。Python标准库里面提供了json序列化的工具,我们可以简单的用json.dumps来将一个对象序列化 。但是这种序列化仅支持python内置的基本类型 。

如何实现一个优雅的Python的Json序列化库

文章插图
Python
在Python的世界里,将一个对象以json格式进行序列化或反序列化一直是一个问题 。Python标准库里面提供了json序列化的工具,我们可以简单的用json.dumps来将一个对象序列化 。但是这种序列化仅支持python内置的基本类型,对于自定义的类,我们将得到Object of type A is not JSON serializable的错误 。
有很多种方法可以用来支持这种序列化,这里有一个很长的关于这个问题的讨论 。总结起来,基本上有两种还不错的思路:
  1. 利用标准库的接口:从python标准json库中的JSONDecoder继承,然后自定义实现一个default方法用来自定义序列化过程
  2. 利用第三方库实现:如jsonpickle jsonweb json-tricks等
利用标准库的接口的问题在于,我们需要对每一个自定义类都实现一个JSONDecoder.default接口,难以实现代码复用 。
利用第三方库,对我们的代码倒是没有任何侵入性,特别是jsonpickle,由于它是基于pickle标准序列化库实现,可以实现像pickle一样序列化任何对象,一行代码都不需要修改 。
但是我们观察这类第三方库的输出的时候,会发现所有的这些类库都会在输出的json中增加一个特殊的标明对象类型的属性 。这是为什么呢?Python是一门动态类型的语言,我们无法在对象还没有开始构建的时候知道对象的某一属性的类型信息,为了对反序列化提供支持,看起来确实是不得不这么做 。
【如何实现一个优雅的Python的Json序列化库】有人可能觉得这也无可厚非,似乎不影响使用 。但是在跨语言通信的时候,这就成为了一个比较麻烦的问题 。比如我们有一个Python实现的API,客户端发送了一个json请求过来,我们想在统一的一个地方将json反序列化为我们Python代码的对象 。由于客户端不知道服务器端的类型信息,json请求里面就没法加入这样的类型信息,这也就导致这样的类库在反序列化的时候遇到问题 。
能不能有一个相对完美的实现呢?先看一下我们理想的json序列化库的需求:
  1. 我们希望能简单的序列化任意自定义对象,只添加一行代码,或者不加入任何代码
  2. 我们希望序列化的结果不加入任何非预期的属性
  3. 我们希望能按照指定的类型进行反序列化,能自动处理嵌套的自定义类,只需要自定义类提供非常简单的支持,或者不需要提供任何支持
  4. 我们希望反序列化的时候能很好的处理属性不存在的情况,以便在我们加入某一属性的时候,可以设置默认值,使得旧版本的序列化结果可以正确的反序列化出来
如果有一个json库能支持上面的四点,那就基本是比较好用的库了 。下面我们来尝试实现一下这个类库 。
对于我们想要实现的几个需求,我们可以建立下面这样的测试来表达我们所期望的库的API设计:
class A(JsonSerializable):def __init__(self, a, b):super().__init__()self.a = aself.b = b if b is not None else B(0)@propertydef id(self):return self.adef _deserialize_prop(self, name, deserialized):if name == 'b':self.b = B.deserialize(deserialized)returnsuper()._deserialize_prop(name, deserialized)class B(JsonSerializable):def __init__(self, b):super().__init__()self.b = bclass JsonSerializableTest(unittest.TestCase):def test_model_should_serialize_correctly(self):self.assertEqual(json.dumps({'a': 1, 'b': {'b': 2}}), A(1, B(2)).serialize())def test_model_should_deserialize_correctly(self):a = A.deserialize(json.dumps({'a': 1, 'b': {'b': 2}}))self.assertEqual(1, a.a)self.assertEqual(2, a.b.b)def test_model_should_deserialize_with_default_value_correctly(self):a = A.deserialize(json.dumps({'a': 1}))self.assertEqual(1, a.a)self.assertEqual(0, a.b.b)这里我们希望通过继承的方式来添加支持,这将在反序列化的时候提供一个好处 。因为有了它我们就可以直接使用A.deserialize方法来反序列化,而不需要提供任何其他的反序列化函数参数,比如这样json.deserialize(serialized_str, A) 。
同时为了验证我们的框架不会将@property属性序列化或者反序列化,我们特意在类A中添加了这样一个属性 。
由于在反序列化的时候,框架是无法知道某一个对象属性的类型信息,比如测试中的A.b,为了能正确的反序列化,我们需要提供一点简单的支持,这里我们在类A中覆盖实现了一个父类的方法_deserialize_prop对属性b的反序列化提供支持 。


推荐阅读