解决protobuf数据丢失bug

来源：意榕旅游网

解决protobuf数据丢失bug

protobuf是Google开发的一个开源序列化框架，类似XML，JSON，其最大的特点是基于二进制，比传统的XML表示同样一段内容要短小得多。通过protobuf，可以很轻松的调用相关方法来完成业务数据的序列化与反序列化。但是，protobuf在使用当中也发现一些问题，数据在protobuf序列化后无法反序列化，或者丢失部分数据，这就与protobuf的目的违背。下面我们来看下这个问题吧。

首先定义一个protobuf结构，如下：

[plain] view plain copy

1. message Person {

2. required int32 mid = 1;

3. required int32 type = 2;

4. }

再来看下这段代码，看似没有问题：

[cpp] view plain copy

1. Person psn0;

2. psn0.set_mid(1);

3. psn0.set_type(0);

4. string str0;

5. psn0.SerializeToString(&str0);

6. // 由于网络传输， string 需要转换成 char*

7. const char* buf = str0.c_str();

8. // 如果是这样解析，将会引起bug

9. string str1 = buf;

10. People psn1;

11. bool ret1 = psn1.ParseFromString(str1);

12. if (ret1)

13. {

14. cout << \"str1 parse success\" << endl;

15. }

16. else

17. {

18. cout << \"str1 parse fail\" << endl;

19. }

20. // 这样解析不会引起bug

21. string str2;

22. str2.assign(buf, str0.length());

23. People psn2;

24. bool ret2 = psn2.ParseFromString(str2);

25. if (ret2)

26. {

27. cout << \"str2 parse success\" << endl;

28. }

29. else

30. {

31. cout << \"str2 parse fail\" << endl;

32. }

运行结果，如下：

[plain] view plain copy

1. str1 parse fail

2. str2 parse success

这里解释一下原因：在以上例子中，protobuf 序列化的 string 数据里含有 '\\0' 字符。如果以 char* 取protobuf序列化后的数据，将会丢失部分数据。

虽然这个严格意义来讲也不算protobuf的bug，但在protobuf的使用中一般很少人注意protobuf 的数据中带有 '\\0' 字符，这就导致了bug的发生。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文