VB.NET 解析剪贴板中的HTML内容
.NET 可以很容易地从剪贴板内读取文本、图片、文件等数据,但若是剪贴板内拥有HTML内容,则读取出来的是 HtmlFragment 格式,需要自己进行格式转换和读取。
其实这种 HtmlFragment 格式非常简单,只是将一些描述信息放在头部,包括版本、HTML内容位置、Fragment内容位置、源文件地址等……
然而当我尝试读取此格式时,发现读取出来的HTML内容乱码严重,即便对文本内容进行转码,依然无法解决缺字和部分乱码。
后来我又搜索了很久,才发现原来.NET的剪贴板类本身就有BUG,内部的文本需要自己通过读取剪贴板的内存流,再进行文本的数据转换,才能正确读取出数据。
一个编写好的函数如下:
- 阅读全文 -