我的编程空间,编程开发者的网络收藏夹
学习永远不晚

解决远程页面抓取中的乱码方法步骤

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

解决远程页面抓取中的乱码方法步骤

本篇内容介绍了“解决远程页面抓取中的乱码方法步骤”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

  ff提供了overrideMimeType方法,可以指定返回值的编码,所以解决起来比较简单,只要把这个方法指向gb2312就可以了。对于IE,可以用vbs配合来作编码转换,用gb2utf8来转换接收到的二进制数据,其中利用到execScript方法来调用vbs的函数。

代码如下:

<body></body>
<script>
loadPage("index.htm")
function loadPage(url){
    var xh=window.Event?new XMLHttpRequest():new ActiveXObject("Microsoft.XMLHTTP")
    xh.open("GET",url,true)
    if(window.Event)
        xh.overrideMimeType("text/xml;charset=gb2312")
    xh.onreadystatechange=function(){
        if(xh.readyState!=4)
            return
        var v
        v=window.Event?xh.responseText:window.gb2utf8(xh.responseBody)
        alert(v)
    }
    window.gb2utf8=function(data){
        var glbEncode=[],t,i,j,len
        gb2utf8_data=data
        execScript("gb2utf8_data = MidB(gb2utf8_data, 1)+' '", "vbscript")
        t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2")
        t=t.split("@")
        i=0
        len=t.length
        while(++i<len){
            j=t[i].substring(0,4)
            if(!glbEncode[j]) {
                gb2utf8_char = eval("0x"+j)
                execScript("gb2utf8_char=Chr(gb2utf8_char)","vbscript")
                glbEncode[j]=escape(gb2utf8_char).substring(1,6)
            }
            t[i]=glbEncode[j]+t[i].substring(4)
        }
        gb2utf8_data=gb2utf8_char=null
        return unescape(t.join("%")).slice(0,-1)
    }
    xh.send(null)
}
</script>

“解决远程页面抓取中的乱码方法步骤”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

解决远程页面抓取中的乱码方法步骤

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Node.js抓取中文网页乱码问题和解决方法

Node.js 抓取非 utf-8 的中文网页时会出现乱码问题,比如网易的首页编码是 gb2312,抓取时会出现乱码var request = require('request') var url = 'http://www.163.co
2022-06-04

python抓取并保存html页面时乱码问题的解决方法

本文实例讲述了python抓取并保存html页面时乱码问题的解决方法。分享给大家供大家参考,具体如下: 在用Python抓取html页面并保存的时候,经常出现抓取下来的网页内容是乱码的问题。出现该问题的原因一方面是自己的代码中编码设置有问题
2022-06-04

php页面中文乱码的解决方法

这篇文章给大家分享的是有关php页面中文乱码的解决方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。php页面中文乱码的解决办法:1、在PHP文件的最上面加入“2023-06-07

java页面中文乱码解决方法

1、设置eclips , window->Preferences->web->JSP Files中的Encoding选项为UTF-82、修改jsp文件头部为UTF-83、设置servlet中request对象编码public class RegisterSer
java页面中文乱码解决方法
2015-12-27

php页面输出乱码的解决方法

小编给大家分享一下php页面输出乱码的解决方法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!php页面输出乱码的解决办法:1、php文件编码和网页输出编码设置成一致;2、php文件编码和数据库存储的字符编码设置为一致;3、
2023-06-14

jsp页面传中文到数据库乱码的解决方法

这篇文章主要介绍jsp页面传中文到数据库乱码的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!在web.xml中加入拦截器SpringEncodingorg.springframew
2023-06-05

R语言中RStudio中文读取乱码的解决方法

这期内容当中小编将会给大家带来有关R语言中RStudio中文读取乱码的解决方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。RStudio中使用rjson包读取处理json数据时,遇到中文会显示为 “
2023-06-02

Java程序中文显示乱码的解决方法

Java程序中文显示乱码的解决方法有时我们使用编辑器写java代码,默认会保存为utf-8格式,当代码中有中文,就会出现下面的乱码情况:解决方法很简单,只需要更改一下文件的编码格式即可。具体的实现步骤如下:1、使用记事本打开源码文件,点击文件——另存为2、在编
Java程序中文显示乱码的解决方法
2022-03-09

php中使用substr截取字符串乱码的解决方法

这篇文章主要介绍php中使用substr截取字符串乱码的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!php substr截取字符串乱码的解决办法:1、使用mbstring扩展库的“mb_substr()”截
2023-06-14

java文件读取中文乱码的原因与解决方法

最近遇到一个问题,Java读取文本文件(例如csv文件、txt文件等),遇到中文就变成乱码。(推荐:java视频教程)读取代码如下:List lines=new ArrayList(); BufferedReader br = new BufferedR
java文件读取中文乱码的原因与解决方法
2015-03-18

Android编程向服务器发送请求时出现中文乱码问题的解决方法

本文实例讲述了Android编程向服务器发送请求时出现中文乱码问题的解决方法。分享给大家供大家参考,具体如下: 我们在andorid项目中通过get方式向服务器发送请求,其中url参数带有中文,将会产生乱码,乱码产生的原因有两种: 1、 在
2022-06-06

计算机中win10远程桌面连接显示内部错误的解决方法

这篇文章主要介绍了计算机中win10远程桌面连接显示内部错误的解决方法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。win10远程桌面连接出现了内部错误怎么解决1、右击开始点
2023-06-10

局域网中win7旗舰版的两台电脑无法连接远程桌面的解决方法

问:捣腾了半天,试了又试,还是不行,请小编指点迷津!我家有两台电www.cppcns.com脑,都是Windows 7旗舰版,现在的问题是,在同一个局域网内,www.cppcns.com访问时也输入php了正确的密码,任何一台电脑访问另一台
2023-06-03

Android编程中聊天页面背景图片、标题栏由于键盘引起问题的解决方法

本文实例讲述了Android编程中聊天页面背景图片、标题栏由于键盘引起问题的解决方法。分享给大家供大家参考,具体如下: 在一个群里面有人问到 聊天页面由于键盘弹出来,导致自定义的标题栏不见和背景图片都变形了,然后自己也折腾了一下,在stac
2022-06-06

win10远程桌面连接没有授权服务器提供许可证会话中断的解决方法

这篇文章主要介绍win10远程桌面连接没有授权服务器提供许可证会话中断的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!win10远程桌面连接没有授权服务器提供许可证会话中断怎么解决:1、打开“运行”输入 re
2023-06-10

编程热搜

目录