首页 前端知识 js对url进行编码解码(三种方式)

js对url进行编码解码(三种方式)

2024-03-04 10:03:38 前端知识 前端哥 295 315 我要收藏

目录

前言

一、为什么要编码

二、需要编码的字符

三、编码的三种方式

第一种:escape和 unescape

第二种:encodeURI 和 decodeURI

第三种: encodeURIComponent 和 decodeURIComponent

三、总结


前言

我们在项目开发中用url进行参数传递时,经常会传递一些中文名的参数或URL地址,在后台处理时会发生转换错误。本文主要针对URI编解码的相关问题做了介绍,对url为什么需要编码,编码有哪几种方式,并对比分析了Javascript中和编解码相关的几对函数escape / unescape,encodeURI / decodeURI和encodeURIComponent / decodeURIComponent。下面我们一起来看看吧。

一、为什么要编码

 对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。比如以下几种场景:

1.场景一

路径中包含有中文。然而Url中不能包含任何非ASCII字符,如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。

https://code-nav.top/download/3?type=视频教程

2.场景二

Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。

根据RFC标准,有些符号在URI中是不能直接传递的,要按照规定格式进行编码,下面我们看看哪些字符需要编码传递。

二、需要编码的字符

RFC3986文档规定,Url中只允许包含英文字母(a-zA-Z)、数字(0-9)、-_.~4个特殊字符以及所有保留字符。因此对于Url而言,只有普通英文字符和数字,特殊字符$-_.+!*'()还有保留字符,才能出现在未经编码的Url之中。其他字符均需要经过编码之后才能出现在Url中。

不安全的字符

字符描述
空格Url在传输的过程,有可能引入无关紧要的空格,或者去掉一些有意义的空格
引号以及<>引号和尖括号通常用于在普通文本中起到分隔Url的作用
#通常用于表示书签或者锚点
%百分号本身用作对不安全字符进行编码时使用的特殊字符,因此本身需要编码
{}|^[]`~一些网关或者传输代理会篡改这些字符

对于上面提到的这些字符,如果不经过编码,那么它们有可能会造成Url语义的不同。

三、编码的三种方式

第一种:escape和 unescape

escape()不能直接用于URL编码,它的真正作用是返回一个字符的Unicode编码值。规则如下:

方法描述返回值
escape()使用转义序列替换某些字符来对字符串进行编码,除了ASCII字母、数字、标点符号"@ * _ + - . /"以外返回Unicode编码字符串
unescape(String)对使用 escape() 编码的字符串进行解码

除了ASCII字母、数字、标点符号"@ * _ + - . /"以外,对其他所有字符进行编码。在u0000到u00ff之间的符号被转成%xx的形式,其余符号被转成%uxxxx的形式。对应的解码函数是unescape()。

编码:

"https://code-nav.top/download/3?type=" + escape('视频教程')

解码:

"https://code-nav.top/download/3?type=" + unescape('%u89C6%u9891%u6559%u7A0B')

 

注意点:

1.首先,无论网页的原始编码是什么,一旦被Javascript编码,就都变为unicode字符。也就是说,Javascipt函数的输入和输出,默认都是Unicode字符。这一点对下面两个函数也适用。

2.其次,escape()不对 "+" 编码。但是我们知道,网页在提交表单的时候,如果有空格,则会被转化为+字符。服务器处理数据的时候,会把+号处理成空格。所以,使用的时候要小心。

第二种:encodeURI 和 decodeURI

 encodeURI()是Javascript中真正用来对URL编码的函数。规则如下:

方法描述返回值
encodeURI(String)通过转义某些字符对 URI 进行编码,除了常见的符号以外(ASCII 字符),对其他一些在网址中有特殊含义的符号"; / ? : @ & = + $ , #",也不进行编码输出utf-8形式字符串
decodeURI(String)对使用 encodeURI() 方法编码的字符串进行解码

它用于对URL的组成部分进行个别编码,除了常见的符号以外,对其他一些在网址中有特殊含义的符号"; / ? : @ & = + $ , #",也不进行编码。编码后,它输出符号的utf-8形式,并且在每个字节前加上%,,然后用十六进制的转义序列(形式为%xx)对生成的 1 字节、2 字节或 4 字节的字符进行编码。
它对应的解码函数是decodeURI()。

编码:

encodeURI('https://code-nav.top/download/3?type=视频教程')

解码:

decodeURI('https://code-nav.top/download/3?type=视频教程')

第三种: encodeURIComponent 和 decodeURIComponent

与encodeURI()的区别是,它用于对整个URL进行编码。"; / ? : @ & = + $ , #",这些在encodeURI()中不被编码的符号,在encodeURIComponent()中统统会被编码。

规则如下:

方法描述返回值
encodeURIComponent(String)通过某些转义字符对 URI 进行编码,会编译所有(包含特殊字符),ASCII 字符不编码,可以将参数中的中文、特殊字符进行转义输出utf-8形式字符串
deencodeURIComponent(String)对使用 encodeURIComponent() 方法编码的字符串进行解码


它对应的解码函数是decodeURIComponent()。

编码:

encodeURIComponent('https://code-nav.top/download/3?type=视频教程')

解码:

decodeURIComponent('https://code-nav.top/download/3?type=视频教程')

注意:参数包含特殊字符可能会造成间断。

三、总结

escape 官方已不推荐使用了,基本淘汰了,如果想对URL编码,最好不要使用此方法,encodeURIencodeURIComponent比较常用。

后面两个函数区别:

前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。

如果文章对你有所帮助,❤️关注+点赞❤️鼓励一下博主会持续更新。。。。

我的博客:https://code-nav.top

往期回顾

 css实现元素居中的6种方法 

Angular8升级至Angular13遇到的问题 

前端vscode必备插件(强烈推荐) 

Webpack性能优化

vite构建如何兼容低版本浏览器

前端性能优化9大策略(面试一网打尽)!

vue3.x使用prerender-spa-plugin预渲染达到SEO优化

 vite构建打包性能优化

 vue3.x使用prerender-spa-plugin预渲染达到SEO优化

 ES6实用的技巧和方法有哪些?

 css超出部分显示省略号

vue3使用i18n 实现国际化 

vue3中使用prismjs或者highlight.js实现代码高亮 

什么是 XSS 攻击?什么是 CSRF?什么是点击劫持?如何防御 

转载请注明出处或者链接地址:https://www.qianduange.cn//article/3174.html
标签
评论
会员中心 联系我 留言建议 回顶部
复制成功!