www.qjdy.com-奇迹赌场 > www.qjdy.com官网 > 那个时候有很多个版本的 Data URL Schema

原标题:那个时候有很多个版本的 Data URL Schema

浏览次数:177 时间:2019-09-26

细说 Data URI

2015/08/27 · HTML5 · URI

原来的小说出处: 李靖(@Barret李靖)   

Data U猎豹CS6L 早在 1993 年就被提议,那年有众三个本子的 Data URAV4L Schema 定义陆陆续续出现在 VRML 之中,随后不久,个中的三个版本被提上了议案——将它做个二个嵌入式的财富放置在 HTML 语言之中。从 RFC 文书档案定稿的日子来看(一九九五年),它是贰个异常受招待的表明。

Data U奥德赛Is 定义的剧情能够看作小文件被插入到别的文书档案之中。ULacrosseI 是 uniform resource identifier 的缩写,它定义了接受内容的磋商以及附带的有关内容,要是附带的连带内容是二个地点,那么此时的 U路虎极光I 也是贰个 UCRUISERL (uniform resource locator),如:

ftp://10.1.1.10/path/to/filename.ext

1
2
ftp://10.1.1.10/path/to/filename.ext
http://example.com/source/id

说道后边的剧情,能够告诉客户端八个准儿下载能源的地点,而 U凯雷德I 并不一定包涵一个地方音信,如(demo):

data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

1
data:image/gif;base64,R0lGODlhEAAOALMAAOazToeHh0tLS/7LZv/0jvb29t/f3//Ub//ge8WSLf/rhf/3kdbW1mxsbP//mf///yH5BAAAAAAALAAAAAAQAA4AAARe8L1Ekyky67QZ1hLnjM5UUde0ECwLJoExKcppV0aCcGCmTIHEIUEqjgaORCMxIC6e0CcguWw6aFjsVMkkIr7g77ZKPJjPZqIyd7sJAgVGoEGv2xsBxqNgYPj/gAwXEQA7

其情商为 data,并告诉顾客端将以此内容作为 image/gif 格式来深入分析,供给剖析的剧情使用的是 base64 编码。它直接包罗了内容但并未有三个分明的能源地址。

图片 1

☞ 格式

Data U瑞鹰I 的格式拾壹分简短,如下所示:

  • 首先片段是 data: 左券头,它标记那么些情节为一个 data U路虎极光I 能源。
  • 第二部分是 MIME 类型,表示这串内容的显现格局,举个例子:text/plain,则以文件类型体现,image/jpeg,以 jpeg 图片方式显得,同样,客商端也会以那些 MIME 类型来解析数据。
  • 其三部分是编码设置,暗许编码是 charset=US-ASCII, 即数据部分的每一种字符都会自动编码为 %xx,关于编码的测验,可以在浏览器地址框输入分别输入下边两串内容,查看效果:

// output: ä½ å¥½ -> 使用暗中认可的编码体现,故乱码 data:text/html,你好 // output: 你好 -> 使用 UTF-8 映现 data:text/html;charset=UTF-8,你好 // output: 浣犲ソ -> 使用 gbk 体现(浏览器暗中同意编码 UTF-8,故乱码) data:text/html;charset=gbk,你好 // output: 你好 -> UTF-8 编码,内容先使用 base64 解码,然后呈现data:text/html;charset=UTF-8;base64,5L2g5aW9

1
2
3
4
5
6
7
8
// output: ä½ å¥½ -> 使用默认的编码展示,故乱码
data:text/html,你好  
// output: 你好 -> 使用 UTF-8 展示
data:text/html;charset=UTF-8,你好
// output: 浣犲ソ -> 使用 gbk 展示(浏览器默认编码 UTF-8,故乱码)
data:text/html;charset=gbk,你好
// output: 你好 -> UTF-8 编码,内容先使用 base64 解码,然后展示
data:text/html;charset=UTF-8;base64,5L2g5aW9
  • 第四片段是 base64 编码设定,那是一个可选拔,base64 编码中仅包括 0-9,a-z,A-Z, ,/,=,个中 = 是用来编码补白的。
  • 最后一有的为那些 Data UEscortI 承载的内容,它能够是纯文本编写的剧情,也得以是由此 base64编码 的原委。

无数时候大家运用 data UTucsonI 来显示一些较长的始末,如一串二进制数据编码、图片等,接纳 base64 编码能够让内容变得愈加简明。而对图纸来讲,在 gzip 压缩之后,base64 图片实际上比原图 gzip 压缩要大,容量扩张差不离为十分之六,所以采用的时候供给权衡。

☞ 兼容性

出于出现时间较早,近来主流的浏览器基本都扶助 data U中华VI:

  • Firefox 2
  • Opera 7.2
  • Chrome (全体版本)
  • Safari (全体版本)
  • Internet Explorer 8

唯唯有个别浏览器对 data U大切诺基I 的利用存在限制:

  • 长度限制,长度超长,在有个别利用下会促成内部存款和储蓄器溢出,程序崩溃

Opera 下限制为 4100 个字符,近来曾经去掉了那么些范围 IE 8 下限制为 32,7陆21个字符(32kb),IE9 之后移除了那一个限制

1
2
Opera 下限制为 4100 个字符,目前已经去掉了这个限制
IE 8 下限制为 32,768 个字符(32kb),IE9 之后移除了这个限制
  • 在 IE 下,data ULANDI 只允许被用到如下地点:
    • object (images only)
    • img、input type=image、link
    • CSS 中允许选取 U中华VL 表明的地点,如 background
  • 在 IE 下,Data U凯雷德I 的内容必得是透过编码转变的,如 “#”、”%”、非 US-ASCII 字符、多字节字符等,必需经过编码转换

☞ 低版本IE的化解之道 – MHTML

MHTML 就是 MIME HTML,是 “Multipurpose Internet Mail Extensions HyperText 马克up Language” 的简称,它就好像一个带着附属类小部件的邮件日常,如下所示:

/** FilePath: */ /*!@ignore Content-Type: multipart/related; boundary="_ANY_SEPARATOR" --_ANY_SEPARATOR Content-Location:myidBackground Content-Transfer-Encoding:base64 iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg== --_ANY_SEPARATOR-- */ .myid { background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg=="); *background-image: url(mhtml:); }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
/** FilePath: http://example.com/test.css */
/*!@ignore
Content-Type: multipart/related; boundary="_ANY_SEPARATOR"
 
--_ANY_SEPARATOR
Content-Location:myidBackground
Content-Transfer-Encoding:base64
 
iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==
--_ANY_SEPARATOR--
*/
 
.myid {
  background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==");
  *background-image: url(mhtml:http://example.com/test.css!myidBackground);
}

上面的一串注释就疑似八个附属类小部件,那几个附属类小部件内容是贰个名叫 myidBackground 的 base64 编码图片,在三个 class 叫做 myid 的 css 中用到了它。这里有几点须求介意:

  • _ANY_SEPARATOR 能够是轻松内容
  • 在”附属类小部件”甘休位置要求加上得了符 _ANY_SEPARATOR,否则在 Vista 和 Win7 的 IE7 中会出错。
  • 附属类小部件代码注意不要被压缩工具给干掉了

此间存在二个坑:部分体系协作形式下的 IE8 也认知 css 中的 hack 符号 *,可是不支持 mhtml,所以地方的情节不会收效。管理方案揣测就唯有选拔IE 的尺码注释了。

☞ HTTPS 下的莱芜提示

HTTPS 张开页面,当在 IE6、7 下行使 data ULX570Is 时,拜望到如下提示:

图片 2

MS 的解释是:

你正在查阅的网址是个安全网站。它选取了 SSL (保险套接字层)或 PCT(保密通讯技能)这样的乌兰察布公约来确定保证您所收发消息的安全性。
当站点使用安全磋商时,您提供的新闻例如姓名或银行卡号码等都由此加密,其余人无法读取。可是,那几个网页同不常候含有未使用该安全合同的体系

很明确,IE 嗅到了”未使用安全公约的门类”。

浏览器在条分缕析到一个 U传祺I 的时候,会首先判别左券头,如若是以 http(s) 初始,它便会创设八个网络链接下载财富,如若它开采左券头为 data:,便会将其看作一个Data U翼虎I 财富进行分析。

图片 3

但是从 chrome 的瀑布流,大家得以做这么的推断:

图中各类 Data ULANDI 都倡导了哀告,然则情形都以 data(from cache),禁止使用缓存之后,依然那样。所以能够看清,浏览器在下载源码分析成 DOM 的时候,会将 Data ULANDI 的能源分析出来,并缓存在本地,最后 Data UEnclaveI 种种对应地方都会倡导三遍呼吁,只是那么些央浼还未创建链接,就被察觉存在缓存的浏览器给拍死了。

☞ 安全阀门

Data U812 SuperfastI 在 IE 下有好多安全限制,事实上,相当多 xss 注入也得以将 data U奇骏I 的源流作为入口,使用 data U途观I 绕过浏览器的过滤。

JavaScript

// 绕过浏览器过滤 src="data:text/html,<script>alert("Xss")</script><!--

1
2
// 绕过浏览器过滤
http://example.com/text.php?t="><script src="data:text/html,<script>alert("Xss")</script><!--

此地能够相当大程度的粗放,很有趣,值得读者去追究。

☞ 扩大阅读

  • RFC 2397 RFC文档
  • MDN – data_URIs MDN文档
  • MSDN – data Protocal.aspx) MSDN文档
  • NC – data_uris_explained
  • phpied – MHTML

    1 赞 1 收藏 评论

图片 4

本文由www.qjdy.com-奇迹赌场发布于www.qjdy.com官网,转载请注明出处:那个时候有很多个版本的 Data URL Schema

关键词: bbin电子平台 HTML5

上一篇:Web性能优化系列 &#8211; 通过提前获取DNS来提升网

下一篇:没有了