Python对Url内容进行编码
发布时间:2023-11-27 11:09:14 点击量:
在进行爬虫或者网络访问相关的编程时,经常需要对url进行拼接参数或其他内容,此时如果内容中出现空格等特殊字符显然我们的url就会编程两节,也就不完整了,访问肯定是要出错的,所以人们发明了url编码这个东西,即将特殊字符按照一定的规则进行编码替换,比如: 空格编码之后的值是%20 但是我总不能每次遇见空格都手动将空格替换成%20吧,各类编程语言肯定都会有提供的相关方法进行编码的。 比如JavaScript中提供了“encodeURIComponent”方法。同样的python中也提供了对应的方法进行编码,而且是原生方法: from urllib import parse #这个是js对中文的编码的结果 # encodeURIComponent('中国') # "%E4%B8%AD%E5%9B%BD" jsRet='%E4%B8%AD%E5%9B%BD' print(parse.unquote(jsRet)) #unquote方法能够解码,输出:中国 print(jsRet==parse.quote('中国')) #quote能够编码,输出:True说明编码之后的结果和js编码的结果是相同的参考链接 URL 编码 - 从 %00 到 %8f ASCII ValueURL-encodeASCII ValueURL-encodeASCII ValueURL-encode?%000%30`%60%011%31a%61%022%32b%62%033%33c%63%044%34d%64%055%35e%65%066%36f%66%077%37g%67backspace%088%38h%68tab%099%39i%69linefeed%0a:%3aj%6a%0b;%3bk%6b%0c%3en%6e%0f?%3fo%6f%10@%40p%70%11A%41q%71%12B%42r%72%13C%43s%73%14D%44t%74%15E%45u%75%16F%46v%76%17G%47w%77%18H%48x%78%19I%49y%79%1aJ%4az%7a%1bK%4b{%7b%1cL%4c|%7c%1dM%4d}%7d%1eN%4e~%7e%1fO%4f%7fspace%20P%50%80!%21Q%51%81"%22R%52?%82#%23S%53?%83$%24T%54?%84%%25U%55…%85&%26V%56?%86’%27W%57?%87(%28X%58?%88)%29Y%59‰%89*%2aZ%5a?%8a+%2b[%5b?%8b,%2c\%5c?%8c-%2d]%5d%8d.%2e^%5e?%8e/%2f_%5f%8f URL 编码 - 从 %90 到 %ff ASCII ValueURL-encodeASCII ValueURL-encodeASCII ValueURL-encode%90à%c0e%f0‘%91á%c1?%f1’%92?%c2ò%f2“%93?%c3ó%f3”%94?%c4?%f4?%95?%c5?%f5–%96?%c6?%f6—%97?%c7÷%f7?%98è%c8?%f8?%99é%c9ù%f9?%9aê%caú%fa?%9b?%cb?%fb?%9cì%ccü%fc%9dí%cdy%fd?%9e?%cet%fe?%9f?%cf?%ff%a0D%d0?%a1?%d1¢%a2ò%d2£%a3ó%d3%a4?%d4¥%a5?%d5|%a6?%d6§%a7%d7¨%a8?%d8?%a9ù%d9a%aaú%da?%ab?%db?%acü%dcˉ%adY%dd?%aeT%deˉ%af?%df°%b0à%e0±%b1á%e12%b2a%e23%b3?%e3′%b4?%e4μ%b5?%e5?%b6?%e6·%b7?%e7?%b8è%e81%b9é%e9o%baê%ea?%bb?%eb?%bcì%ec?%bdí%ed?%be?%ee?%bf?%ef |
【本文地址】