解决protobuf数据丢失bug
protobuf是Google开发的一个开源序列化框架,类似XML,JSON,其最大的特点是基于二进制,比传统的XML表示同样一段内容要短小得多。通过protobuf,可以很轻松的调用相关方法来完成业务数据的序列化与反序列化。但是,protobuf在使用当中也发现一些问题,数据在protobuf序列化后无法反序列化,或者丢失部分数据,这就与protobuf的目的违背。下面我们来看下这个问题吧。
首先定义一个protobuf结构,如下:
[plain] view plain copy
1. message Person {
2. required int32 mid = 1;
3. required int32 type = 2;
4. }
再来看下这段代码,看似没有问题:
[cpp] view plain copy
1. Person psn0;
2. psn0.set_mid(1);
3. psn0.set_type(0);
4. string str0;
5. psn0.SerializeToString(&str0);
6. // 由于网络传输, string 需要转换成 char*
7. const char* buf = str0.c_str();
8. // 如果是这样解析,将会引起bug
9. string str1 = buf;
10. People psn1;
11. bool ret1 = psn1.ParseFromString(str1);
12. if (ret1)
13. {
14. cout << \"str1 parse success\" << endl;
15. }
16. else
17. {
18. cout << \"str1 parse fail\" << endl;
19. }
20. // 这样解析不会引起bug
21. string str2;
22. str2.assign(buf, str0.length());
23. People psn2;
24. bool ret2 = psn2.ParseFromString(str2);
25. if (ret2)
26. {
27. cout << \"str2 parse success\" << endl;
28. }
29. else
30. {
31. cout << \"str2 parse fail\" << endl;
32. }
运行结果,如下:
[plain] view plain copy
1. str1 parse fail
2. str2 parse success
这里解释一下原因:在以上例子中,protobuf 序列化的 string 数据里含有 '\\0' 字符。如果以 char* 取protobuf序列化后的数据,将会丢失部分数据。
虽然这个严格意义来讲也不算protobuf的bug,但在protobuf的使用中一般很少人注意protobuf 的数据中带有 '\\0' 字符,这就导致了bug的发生。
因篇幅问题不能全部显示,请点此查看更多更全内容