这篇教程一篇文章搞懂Python反斜杠的相关问题写得很实用,希望能帮到您。 大家在开发Python的过程中,一定会遇到很多反斜杠的问题,很多人被反斜杠的数量搞得头大。 首先我们写一段非常简单的Python代码,它的作用是把一个字段先转换为JSON格式的字符串,然后把这个字符串再转换为JSON格式的字符串: import json info = {'name': 'kingname', 'address': '杭州', 'salary': 99999}info_json = json.dumps(info) # 第一次转换以后,打印出来print(info_json) info_json_json = json.dumps(info_json) # 第二次转换以后,再打印出来print(info_json_json) 它的运行效果如下图所示。 
第一次,字典转成JSON格式的字符串,只有中文杭州变成了Unicode编码/u676d/u5dde ,其余地方没有出现反斜杠。 在Python里面,反斜杠不能单独出现,这里/u676d/u5dde 中的两根反斜杠,实际上应该是/u 。表示这两个编码是Unicode编码。 接下来,把第一次生成的JSON字符串:{"name": "kingname", "address": "/u676d/u5dde", "salary": 99999} 再一次转成JSON格式的字符串,这一次变成了: "{/"name/": /"kingname/", /"address/": /"//u676d//u5dde/", /"salary/": 99999}" 为什么突然出现了这么多反斜杠?这是因为,JSON格式的字符串本身是使用双引号来表示字符串的。如果原来的字符串里面本身就有双引号,那就会导致混淆。此时,Python需要把原来字符串的双引号变成普通的字符,失去双引号的作用。因此使用/" 让双引号变成普通的字符。 这就相当于在Python中,可以这样定义一个包含双引号的字符串: >>> a = "跟我说:/"你好/"">>> print(a)跟我说:"你好" 这里,你好两侧的双引号都加上了反斜杠,让它成为普通的字符,防止它们提前与最外层的双引号配对。 如果不加反斜杠,就会导致字符串里面的双引号提前与外层的双引号配对,引起语法错误: >>> b = "跟我说:"你好"" File "<stdin>", line 1 b = "跟我说:"你好"" ^SyntaxError: invalid syntax 这里,"跟我说:" 成为了一个字符串,末尾的""成为了一个空字符串。那么中间的你好就变成了一个没有定义的变量。而Python里面,是不存在字符串未定义的变量字符串 这种写法的,所以会报语法错误。 而JSON格式的字符串,本质上也是字符串,所以自然而然也需要遵循这样的规则。因此,字符串原来自带的双引号左侧就被加上了反斜杠。 那么,原来的/u676d/u5dde 为什么变成了//u676d//u5dde ? 这是因为,当第二次执行json.dumps 的时候,传入的参数是一个JSON格式的字符串,本质就是字符串。而一个字符串里面如果自带反斜杠,那么JSON在对他再次转换的时候,需要标记这是一个普通的字符串形式的反斜杠,不是一个有特殊意义的反斜杠,所以使用// 表示一个普通的反斜杠。 好了,那么你可以猜一下,如果把info_json_json 再json.dumps 一下会怎么样? 会变成: "/"{///"name///": ///"kingname///", ///"address///": ///"////u676d////u5dde///", ///"salary///": 99999}/"" 为什么出现了三个反斜杠连用和四个反斜杠连用的问题? 实际上非常简单,当你对info_json_json 执行json.dumps 的时候,Python是怎么转换的? 我们来看: "{/"name/": /"kingname/", /"address/": /"//u676d//u5dde/", /"salary/": 99999}" 对字符串 执行json.dumps 的时候,记住一个关键方法——从左到右,一个字符一个字符的转换。 1. 第一个字符是双引号,所以变成/" 2. 第二个字符是{,不是特殊符号,保留 3. 第三个字符是/,把它变成// 4. 第四个字符是",把它变成/" 5. ……
全部执行完成了,由于这次转换是把一个字符串转换为JSON格式的字符串,所以最外侧加上双引号。 于是就得到了: "/"{///"name///": ///"kingname///", ///"address///": ///"////u676d////u5dde///", ///"salary///": 99999}/"" 我们在爬虫开发过程中,可能会遇到上面这种经过多次JSON转换后的字符串,此时,千万不要轻易使用字符串的.replace 方法把多个反斜杠替换为空或者把两个反斜杠替换为一个反斜杠。那样做只会导致你的数据更难解析。 正确的做法应该是尝试对数据一层一层使用json.loads ,把它一层一层还原,还原到最初的{'name': 'kingname', 'address': '杭州', 'salary': 99999} 这种简单形式。 好了,今天的介绍就到这里,最后留一个思考题: 还是上面的代码,现在把PyCharm的调试模式打开,然后数一数info_json 和info_json_json 里面反斜杠的个数,如下图所示: 
为什么在info_json 里面,出现了//u676d//u5dde ,为什么在info_json_json 里面双引号前是两根反斜杠,而/"//u676d//u5dde/" 竟然变成了//"////u676d////u5dde 。 总结 到此这篇关于一篇文章搞懂Python反斜杠的文章就介绍到这了,更多相关Python反斜杠内容请搜索51zixue.net以前的文章或继续浏览下面的相关文章希望大家以后多多支持51zixue.net! PyQt QMainWindow的使用示例 Django学习笔记之View操作指南 |