public static void main(String[] args) {
String s = "哈哈!@#W";
s = s.replaceAll("\\pP", "");
System.out.print(s);
}
注:从他人处学习到的。
采用 Unicode 标点属性方式的正则表达式,可以去掉所有的标点符号,
包括全角、半角、横排、竖排等的标点符号。
注意一下,如果在 JDK 5 或以下的环境中,全角单引号对、双引号对
无法替换掉,这是 JDK 5 及以下版本缺失的,在 JDK 6 中由于加入了
Pi 和 Pf 两个 Unicode 子属性,因此就能替换掉。
在 JDK 6 以下的版本中可以这样:
Java code
str = str.replaceAll("[\\pP‘’“”]", "");
\\pP解释
Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:……
分享到:
相关推荐
正则表达式判断不包涵特殊字符(除了 指定字符 以外)
字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等等。字符串是0个或更多个字符的序列。文本也就是文字,字符串。说某个字符串匹配某个正则表达式,通常是指这个字符串里...
正则表达式列举 项目中用到的 需者下载
正则表达式只可以输入只允许输入中文、数字、字母、下划线
如果想在正则表达式中使用特殊的标点符号,必须在它们之前加上一个 "\" . 2.字符类 将单独的直接符放进中括号内就可以组合成字符类.一个字符类和它所包含的任何一个字符都匹配,所以正则表达式 / [abc] / 和字母 ...
最重要的是——请给我30分钟,如果你没有使用正则表达式的经验,请不要试图在30秒内入门——除非你是超人 :) 别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表达式其实并没有你想像中的那么困难...
* Summary of regular-expression constructs 正则表达式结构简介: * Construct Matches * Characters 字符: * x The character x x 字符 x * \\ The ...
用正则表达式除字符串中所有标点符号 代码如下:[removed] var str=”jfkldsjalk,.23@#!$$k~! @#$%^&*()(_+-=|\{}[]’;:,./<>??gg g~“`gf”; str=str.replace(/[\ |\~|\`|\!|\@|\#|\$|\%|\^|\&|\*|\(|\)|\-|\...
如果记不清楚那些标点符号需要转移,可以在使用标点符号时都使用反斜杠“\” 简单匹配 1、直接量 /javascript/ 匹配带有“javascript”的字符串 比如“javascript is an object-oriented scripting language” 2、...
ereg() and eregi() 有一个特性是允许用户通过正则表达式去提取字符串的一部分(具体用法你可以阅读手册). 比如说,我们想从 path/URL 提取文件名 – 下面的代码就是你需要: ereg("([^\\/]*)$", $pathOrUrl, $regs);...
明智的做法是知道链接在何处结束(例如使用尾随标点符号)。 介绍 您可能会想:“为此我需要一个库吗?我可以为此编写一个正则表达式!”。 让我们看一些情况: 以https://example.com/.文字显示...
它经常使用英语关键字,而其他语言使用标点符号,并且它的句法结构比其他语言少。 Python 是一种高级通用编程语言,可以应用于许多不同类别的问题。 该语言带有一个大型标准库,涵盖了诸如正则表达式等字符串处理、...
其中key没有意义,value就是这两个标签(包括标签本身)的值,可以通过.toString()方法转化为字符串进行下一步处理src/documentParserTextParser.java正则表达式处理String,能够去除大部分标点符号,需要补全...