我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Java判断中英文符号、标点的实现

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Java判断中英文符号、标点的实现

本文介绍了Java判断中英文符号、标点的实现,分享给大家,具体如下:

方法一、用unicodeBlock和unicodeScript判断

在Java中,主要使用 Character类处理字符有关功能,而JDK 1.7中Character是按照Unicode 6.0版本实现的,所以这个要先学习下常用的 Unicode编码。

其中的UnicodeBlock 和 UnicodeScript类可以帮助我们判断字符类型,UnicodeBlock是Unicode标准协会组织unicode码的一个基本单位,实际上一个 UnicodeBlock代表一片连续的Unicode号码段,UnicodeBlock之间不重叠。例如,通常我们利用Unicode编码是否在 0x4E00–0x9FCC 来判断某字符是否为汉字,就是因为,有个UnicodeBlock 专门划分为存储汉字 (准确的说是 CJK统一汉字),这个UnicodeBlock叫做 CJK Unified Ideographs,总共定义了 74,617 个汉字。

UnicodeBlock 与 UnicodeScript 关系:

所以UnicodeScript 是从语言书写规则层次对Unicode字符的分类,这是用使用角度划分,而UnicodeBlock是从硬的编码角度划分。

UnicodeBlock是简单的数值范围 (其中可能有些Block中会有一些尚未分配字符的“空号”)。

在一个UnicodeScript中的字符可能分散在多个UnicodeBlock中;

一个UnicodeBlock中的字符可能会被划进多个UnicodeScript中。

判别中文标点符号。

因为中文的标点符号主要存在于以下5个UnicodeBlock中,

U2000-General Punctuation (百分号,千分号,单引号,双引号等)

U3000-CJK Symbols and Punctuation ( 顿号,句号,书名号,〸,〹,〺 等;PS: 后面三个字符你知道什么意思吗? : )    )

UFF00-Halfwidth and Fullwidth Forms ( 大于,小于,等于,括号,感叹号,加,减,冒号,分号等等)

UFE30-CJK Compatibility Forms  (主要是给竖写方式使用的括号,以及间断线﹉,波浪线﹌等)

UFE10-Vertical Forms (主要是一些竖着写的标点符号,    等等)

// 根据UnicodeBlock方法判断中文标点符号   public boolean isChinesePunctuation(char c) {     Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);     if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION         || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION         || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS         || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_FORMS         || ub == Character.UnicodeBlock.VERTICAL_FORMS) {       return true;     } else {       return false;     }   } 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Java判断中英文符号、标点的实现

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Java判断中英文符号、标点的实现

本文介绍了Java判断中英文符号、标点的实现,分享给大家,具体如下:方法一、用unicodeBlock和unicodeScript判断在Java中,主要使用 Character类处理字符有关功能,而JDK 1.7中Character是按照U
2023-05-31

python 过滤中文、英文标点特殊符号

在工作中经常遇到很多特殊的标点符号,像中文标点符号,英文标点符号。英文的标点符号比较容易过滤,而过滤中文的标点符号较麻烦。下面是从邮件中过滤特殊符号的方式供参考。下面是一封垃圾邮件的过滤实例:"想做/ 兼_职/学生_/ 的 、加,我Q:  
2023-01-31

WordPress取消英文标点符号自动替换中文标点符号的优雅方法

众所周知,WordPress中文版有个特性,会将每一处英文引号("")都稀里哗啦转化为中文引号(“”)。不仅仅是英文引号,在WordPress翻译文件定义了不少自动转换符号,具体可以参考这里。 对文字博客来说,这是个
2022-06-12

java中如何判断字符串是否包含英文

1.判断字符串中是否全为英文 boolean result = str.matches("[a-zA-Z]+"); //true:全文英文str.matches("[a-zA-Z0-9]+") //判断英文和数字 2.提取字符串中所有的英文s
java中如何判断字符串是否包含英文
2018-01-28

php判断字符串是中文还是英文的方法

这篇文章主要介绍了php判断字符串是中文还是英文的方法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。php判断字符串是中文还是英文的方法:1、通过“preg_match("/
2023-06-15

java判断字符是否中文字符的方法

1、中文汉字的编码范围:[u4e00-u9fa5](java相关视频教程推荐:java视频教程)下面的方法判断一个字符是不是汉字//如果是一个汉字返回true,否则返回falsepublic static boolean checkCharCN(char c)
java判断字符是否中文字符的方法
2022-04-21

Java 判断字符串中是否包含中文的实例详解

Java 判断字符串中是否包含中文的实例详解 Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 不过通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会
2023-05-31

PHP 判断字符串中文和数字的简单实现

PHP是一种被广泛应用的服务器端脚本语言,具有灵活、强大和易学的特点。在使用PHP进行字符串处理的过程中,判断字符串中是否包含中文和数字是一种常见需求。本文将介绍如何在PHP中实现简单的判断字符串中是否包含中文和数字的功能,并附带具体的代码
PHP 判断字符串中文和数字的简单实现
2024-03-08

PHP 实现中文与数字的判断技巧

PHP 是一种常用的服务器端脚本语言,广泛应用于 Web 开发中。在进行字符串处理时,我们有时会遇到需要判断中文字符和数字字符的情况,本文将介绍在 PHP 中实现中文与数字的判断技巧,并通过具体的代码示例来说明。在 PHP 中,可以通过使
PHP 实现中文与数字的判断技巧
2024-03-07

java实现判断file文件是否存在的方法

此示例显示如何使用File类的file.exists()方法检查文件的存在。package com.yiibai;import java.io.File;public class FileExistence { public static void ma
java实现判断file文件是否存在的方法
2017-07-11

java中判断字符串是否包含中文汉字或字符的方法有哪些

判断中文字符(包括中文汉字和中文符号)(1)使用中文的编码区间来判断(推荐,效率高)String str1 = "T恤;https://blog.csdn.net/vpqtxzmzezeqjj9977";//中文汉字String str2 = ";https:
java中判断字符串是否包含中文汉字或字符的方法有哪些
2016-06-21

java中实现判断文件是否存在,不存在则创建

一、判断文件是否存在,不存在则创建File file = new File("d:\test.txt");if (!file.exists()) { try { file.createNewFile(); } catch (IOExc
java中实现判断文件是否存在,不存在则创建
2019-07-31

使用Java怎么实现统计字符串中汉字与英文的数量

这期内容当中小编将会给大家带来有关使用Java怎么实现统计字符串中汉字与英文的数量,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。具体如下:package org.zhy.demo.algorithm;/*
2023-05-31

shell 判断字符串是否存在数组中的实现示例

语法格式: [[ "${array[@]}" =~ "字符串" ]] 示例:#!/bin/sh ##数组 array=( address base cart company store )# $1 如果存在,输出 $1 exists,$1w
2022-06-04

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录