我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Java如何实现获取行政区划

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Java如何实现获取行政区划

今天小编给大家分享一下Java如何实现获取行政区划的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

一、导入jar包

下面是笔者用到的全部jar包

<dependency>        <groupId>org.apache.poi</groupId>        <artifactId>poi-ooxml</artifactId>        <version>3.9</version>    </dependency>    <dependency>        <groupId>com.google.guava</groupId>        <artifactId>guava</artifactId>        <version>30.1.1-jre</version>    </dependency>    <dependency>        <groupId>cn.hutool</groupId>        <artifactId>hutool-json</artifactId>        <version>5.4.0</version>    </dependency>    <dependency>        <groupId>com.alibaba</groupId>        <artifactId>fastjson</artifactId>        <version>1.2.44</version>    </dependency>    <dependency>        <groupId>org.jsoup</groupId>        <artifactId>jsoup</artifactId>        <version>1.14.3</version>    </dependency>    <dependency>        <groupId>org.apache.httpcomponents</groupId>        <artifactId>httpclient</artifactId>        <version>4.5.5</version>    </dependency>    <dependency>        <groupId>org.springframework.boot</groupId>        <artifactId>spring-boot-starter-web</artifactId>        <version>2.5.4</version>    </dependency>

这里说下,maven配置要从阿里云下载jar,若是从中央仓库将会非常的慢。

二、代码展示

这里是代码的展示,笔者是网上搜的代码改造的,不然网站有反爬,大概爬取2000条左右就会中断,笔者加了延时这样就避开了反爬(可能还有别的规避措施)。这里爬取的是4级行政区划:省、市、区县、街道

package com.cheng.controller;import org.apache.poi.ss.usermodel.Row;import org.apache.poi.xssf.streaming.SXSSFSheet;import org.apache.poi.xssf.streaming.SXSSFWorkbook;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.select.Elements;import java.io.FileOutputStream;import java.io.IOException;import java.net.ConnectException;import java.net.SocketTimeoutException;import java.util.*;public class JsoupTestPluMdm {static int i = 1;static String url1 = “http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2022”;static String url2 = “”;public static void main(String[] args) throws IOException { try{     List<Map<String,String>> listMap = new ArrayList<>();     Document document = Jsoup.connect(url1)             .header("Cookie", "wzws_sessionid=oGQAAyWBMmNlMWZkgjdlZDJkMIAyMjEuMjM4LjEzMi41MA==; SF_cookie_1=15502425; wzws_cid=6e8cdc0aea81349b05c8a0b6c05cd7204b6e0f10e5a48d462175473d23abcb4891edf1ceb73464398cb1ce7e6f53999f7545dd0014a15b1fb4eec5c6cf37421f0c2b08528de36f728ec4c676ed264c7d")             .get();     //获取他所有的省     Elements elements = document.select("body > table:nth-child(3) > tbody > tr:nth-child(1) > td > table > tbody > tr:nth-child(2) > td > table > tbody > tr > td > table > tbody");     //解析省的超链接     Elements elements1 = elements.select("tbody > tr > td > a");     for(int j=0;j<elements1.size();j++){// Thread.sleep(100);String s = elements1.get(j).select(“a”).attr(“href”);String provinceCode = s.replaceAll(“.html”,“”)+“0000”;System.out.println(“省代码:” + provinceCode);String provinceName = elements1.get(j).text();System.out.println(“省名称:” + provinceName);Map<String,String> map = new HashMap<>();map.put(provinceCode,provinceName);listMap.add(map);}        for (int i1 = 0; i1 <31; i1++) {            System.out.println("**********************i********************:"+i);            if(i%1000==0){                Thread.sleep(1000*60*10);            }            Map<String, String> stringStringMap = listMap.get(i1);            Iterator<Map.Entry<String, String>> iterator = stringStringMap.entrySet().iterator();            while(iterator.hasNext()){                Map.Entry<String,String> entry = iterator.next();                String provinceCode = entry.getKey();                String provinceName = entry.getValue();                String index = provinceCode.substring(0,2)+".html";                SXSSFWorkbook wb = new SXSSFWorkbook(100);                SXSSFSheet sheet = (SXSSFSheet) wb.createSheet();                // TODO 这里改成自己的地址即可,也可以存放到一个文件里                String enterFileName = "C:\\Users\\pcc\\Desktop\\xingzhengquhua\\"+provinceName+".xlsx";                FileOutputStream fileOut = new FileOutputStream(enterFileName);                Row row = sheet.createRow(0);                sheet.createRow(i).createCell(0).setCellValue(provinceCode);// id                sheet.getRow(i).createCell(1).setCellValue(provinceName);// name                sheet.getRow(i).createCell(2).setCellValue(""); // pid                sheet.getRow(i).createCell(3).setCellValue("1"); // type                i++;                try {                    jsoupList2(url1 + "/" + index, provinceName, provinceCode, sheet);                } catch (SocketTimeoutException e) {                    e.printStackTrace();                    jsoupList2(url1 + "/" + index, provinceName, provinceCode, sheet);                } catch (ConnectException e) {                    e.printStackTrace();                    jsoupList2(url1 + "/" + index, provinceName, provinceCode, sheet);                }                row.createCell(0).setCellValue("id");                row.createCell(1).setCellValue("district_name");                row.createCell(2).setCellValue("pid");                row.createCell(3).setCellValue("type");                wb.write(fileOut);                fileOut.close();            }        }    }catch (Exception e){        e.printStackTrace();    }finally {    }}//市级页面public static void jsoupList2(String url,String provinceName,String provinceCode,SXSSFSheet sheet) throws Exception {    String cityName = "";    String cityCode = "";    url2 = url.replace(".html","");    Document document = Jsoup.connect(url).get();    Elements elements = document.select("body > table:nth-child(3) > tbody > tr:nth-child(1) > td > table > tbody > tr:nth-child(2) > td > table > tbody > tr > td > table > tbody");    Elements elements1 = elements.select("tbody > tr > td");    //j从2开始是因为他有个表头 统计用区划代码 名称    for (int j = 2; j < elements1.size(); j++) {        System.out.println("**********************i********************:"+i);        if(i%1000==0){            Thread.sleep(1000*60*10);        }// Thread.sleep(500);//判断是否是超链接,不是超链接也要获取数据if(elements1.get(j).select(“td > a”).toString().equals(“”)){String text = elements1.get(j).text();if (j % 2 == 0) {System.out.println(“市代码:” + text);sheet.createRow(i).createCell(0).setCellValue(text);} else {System.out.println(“市名称:” + text);sheet.getRow(i).createCell(1).setCellValue(text);sheet.getRow(i).createCell(2).setCellValue(provinceCode);sheet.getRow(i).createCell(3).setCellValue(“3”);i++;}}else {Elements elements2 = elements1.get(j).select(“td > a”);for (int j1 = 0; j1 < elements2.size(); j1++) {String text = elements2.get(j1).text();if (j % 2 == 0) {System.out.println(“市代码:” + text);cityCode = text;sheet.createRow(i).createCell(0).setCellValue(text);} else {System.out.println(“市名称:” + text);cityName = text;sheet.getRow(i).createCell(1).setCellValue(text);sheet.getRow(i).createCell(2).setCellValue(provinceCode);sheet.getRow(i).createCell(3).setCellValue(“2”);i++;String s = elements2.get(j1).select(“a”).attr(“href”);//TODO 这里排除了海南的几个市区,更改为不排除任何市区if(true) {try {jsoupList3(url1 + “/” + s,cityName,cityCode,provinceName,provinceCode, sheet);} catch (SocketTimeoutException e) {e.printStackTrace();jsoupList3(url1 + “/” + s,cityName,cityCode,provinceName,provinceCode, sheet);} catch (ConnectException e) {e.printStackTrace();jsoupList3(url1 + “/” + s,cityName,cityCode,provinceName,provinceCode, sheet);}}}}}}}//县级页面public static void jsoupList3(String url,String cityName,String cityCode,String provinceName,String provinceCode,SXSSFSheet sheet) throws Exception {Document document = Jsoup.connect(url).get();Elements elements = document.select(“body > table:nth-child(3) > tbody > tr:nth-child(1) > td > table > tbody > tr:nth-child(2) > td > table > tbody > tr > td > table > tbody”);Elements elements1 = elements.select(“tbody > tr > td”);String xianName = “”;String xianCode = “”;//j从2开始是因为他有个表头 统计用区划代码 名称for (int j = 2; j < elements1.size(); j++) {System.out.println(“i:"+i);if(i%1000==0){Thread.sleep(10006010);}// Thread.sleep(500);//判断是否是超链接,不是超链接也要获取数据if(elements1.get(j).select(“td > a”).toString().equals(”“)){String text = elements1.get(j).text();if (j % 2 == 0) {System.out.println(“县代码:” + text);sheet.createRow(i).createCell(0).setCellValue(text);} else {System.out.println(“县名称:” + text);sheet.getRow(i).createCell(1).setCellValue(text);sheet.getRow(i).createCell(2).setCellValue(cityCode);sheet.getRow(i).createCell(3).setCellValue(“3”);i++;}}else {Elements elements2 = elements1.get(j).select(“td > a”);for (int j1 = 0; j1 < elements2.size(); j1++) {String text = elements2.get(j1).text();xianName = text;if (j % 2 == 0) {xianCode = text;System.out.println(“县代码:” + xianCode);sheet.createRow(i).createCell(0).setCellValue(text);} else {System.out.println(“县名称:” + text);sheet.getRow(i).createCell(1).setCellValue(text);sheet.getRow(i).createCell(2).setCellValue(cityCode);sheet.getRow(i).createCell(3).setCellValue(“3”);i++;String s = elements2.get(j1).select(“a”).attr(“href”);try {jsoupList4(url1 + “/” +provinceCode.substring(0,2)+”/“+ s,xianName,xianCode,cityName,cityCode,provinceName,provinceCode, sheet);} catch (SocketTimeoutException e) {e.printStackTrace();jsoupList4(url1 + “/” +provinceCode.substring(0,2)+”/“+ s,xianName,xianCode,cityName,cityCode,provinceName,provinceCode, sheet);} catch (ConnectException e) {e.printStackTrace();jsoupList4(url1 + “/” +provinceCode.substring(0,2)+”/"+ s,xianName,xianCode,cityName,cityCode,provinceName,provinceCode, sheet);}}}}}}//街道页面public static void jsoupList4(String url,String xianName,String xianCode,String cityName,String cityCode,String provinceName,String provinceCode,SXSSFSheet sheet) throws Exception {    Document document = Jsoup.connect(url).get();    Elements elements = document.select("body > table:nth-child(3) > tbody > tr:nth-child(1) > td > table > tbody > tr:nth-child(2) > td > table > tbody > tr > td > table > tbody");    Elements elements1 = elements.select("tbody > tr > td");    //j从2开始是因为他有个表头 统计用区划代码 名称    for (int j = 2; j < elements1.size(); j++) {        System.out.println("**********************i********************:"+i);        if(i%1000==0){            Thread.sleep(1000*60*10);        }// Thread.sleep(500);//判断是否是超链接,不是超链接也要获取数据if(elements1.get(j).select(“td > a”).toString().equals(“”)){String text = elements1.get(j).text();if (j % 2 == 0) {System.out.println(“街道代码:” + text);sheet.createRow(i).createCell(0).setCellValue(text);} else {System.out.println(“街道名称:” + text);sheet.getRow(i).createCell(1).setCellValue(text);sheet.getRow(i).createCell(2).setCellValue(xianCode);sheet.getRow(i).createCell(3).setCellValue(“4”);i++;}}else {Elements elements2 = elements1.get(j).select(“td > a”);for (int j1 = 0; j1 < elements2.size(); j1++) {String text = elements2.get(j1).text();if (j % 2 == 0) {System.out.println(“街道代码:” + text);// TODO 这里不能截取,不然街道界别数据截不全sheet.createRow(i).createCell(0).setCellValue(text);} else {System.out.println(“街道名称:” + text);sheet.getRow(i).createCell(1).setCellValue(text);sheet.getRow(i).createCell(2).setCellValue(xianCode);sheet.getRow(i).createCell(3).setCellValue(“4”);i++;}}}}}}

以上就是“Java如何实现获取行政区划”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Java如何实现获取行政区划

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Java如何实现获取行政区划

今天小编给大家分享一下Java如何实现获取行政区划的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。一、导入jar包下面是笔者用
2023-07-05

Java实现获取行政区划的示例代码

这篇文章主要为大家详细介绍了如何利用Java语言实现获取行政区划的功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习游戏
2023-03-13

Java如何获取Tomcat运行情况

要获取Tomcat的运行情况,可以使用以下方法:1. 通过JMX(Java Management Extensions)获取Tomcat的MBean(Managed Bean)信息,包括连接数、线程池使用情况、内存使用情况等。可以使用`MB
2023-09-26

java如何获取class实例

这篇文章给大家分享的是有关java如何获取class实例的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、说明(1)已知具体的类,通过类的 class 属性获取,该方法最为安全可靠,程序性能最高 (2)已知某个类
2023-06-15

利用Java如何实现获取UTC时间

本篇文章为大家展示了利用Java如何实现获取UTC时间,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。本文实例讲述了Java获取UTC时间的方法。分享给大家供大家参考,具体如下:取得本地时间:java
2023-05-31

Java如何实现获取wav时间长度

这篇文章主要为大家展示了“Java如何实现获取wav时间长度”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Java如何实现获取wav时间长度”这篇文章吧。Maven依赖
2023-06-25

Java如何实现获取MP3音频时长

这篇文章主要介绍Java如何实现获取MP3音频时长,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!Maven依赖 org
2023-06-25

代码行号如何利用Java获取

这篇文章将为大家详细讲解有关代码行号如何利用Java获取,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。具体实现代码:package leo.demo.training;/***
2023-05-31

java如何获取文件最后一行

可以使用 `java.io.RandomAccessFile` 类来实现获取文件的最后一行。具体步骤如下:1. 创建一个 `RandomAccessFile` 对象,指定要读取的文件路径和打开文件的模式为只读模式。2. 使用 `Random
2023-08-17

Java如何获取接口所有的实现类

这篇文章主要介绍了Java如何获取接口所有的实现类,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-01-09

Java如何实现家政服务平台系统

这期内容当中小编将会给大家带来有关Java如何实现家政服务平台系统,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。一、项目简述功能包括: 家政服务网站系统,用户注册,登录,分为家政人员,普 通用户,以及最高
2023-06-25

Java如何实现获取Excel中的表单控件

这篇文章主要介绍“Java如何实现获取Excel中的表单控件”,在日常操作中,相信很多人在Java如何实现获取Excel中的表单控件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何实现获取Excel
2023-06-30

利用Java如何实现获取properties配置文件

利用Java如何实现获取properties配置文件?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。Java读取Properties文件Properties类读取Proper
2023-05-31

用户的MAC地址如何利用java实现获取

用户的MAC地址如何利用java实现获取?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。java实现获取用户的MAC地址方法:方法一:将本机地址与局域网内其他机器区分开来/*
2023-05-31

Java如何实现获取内网的所有IP地址

本篇内容主要讲解“Java如何实现获取内网的所有IP地址”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java如何实现获取内网的所有IP地址”吧!题目描述在进行网络编程时,有时需要对局域网的所有
2023-07-02

php如何实现获取验证码

php实现获取验证码的方法:【<?php session_start();$image = imagecreatetruecolor(100, 30);imagecolorallocate(int im, int red, int...】。
2021-08-11

C#如何实现获取文件大小并进行比较

本文小编为大家详细介绍“C#如何实现获取文件大小并进行比较”,内容详细,步骤清晰,细节处理妥当,希望这篇“C#如何实现获取文件大小并进行比较”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一、实现功能①需要获取到文
2023-07-05

displaytag如何实现获取到每行的id字段的值

要获取每行的id字段的值,你可以使用displaytag的EL表达式来获取。下面是一种可能的实现方法:1. 在JSP页面中,使用displaytag的``标签来展示数据列表,并设置`uid`属性为当前行的索引值(从0开始)。```jsp``
2023-09-15

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录