`

正则表达式匹配域名、网址、url

 
阅读更多

 

DNS规定,域名中的标号都由英文字母和数字组成,每一个标号不超过63个字符,也不区分大小写字母。标号中除连字符(-)外不能使用其他的标点符号。级别最低的域名写在最左边,而级别最高的域名写在最右边。由多个标号组成的完整域名总共不超过255个字符。

由此匹配完整域名的正则表达式:

   ^(?=^.{3,255}$)[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+$

例如:baidu.com 

 

 匹配网址:

^(?=^.{3,255}$)(http(s)?:\/\/)?(www\.)?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+(:\d+)*(\/\w+\.\w+)*$

例如: http://www.baidu.com

 

匹配http url:

^(?=^.{3,255}$)(http(s)?:\/\/)?(www\.)?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+(:\d+)*(\/\w+\.\w+)*([\?&]\w+=\w*)*$

例如: http://www.tetet.com/index.html?q=1&m=test

 

 

 

分享到:
评论
1 楼 hongbai 2016-03-08  
不能匹配这个:http://harveyzeng.iteye.com/blog/1776991,本文的链接

相关推荐

    regex-url:正则表达式以匹配网址

    正则表达式以匹配网址。 安装 使用可以: $ npm install regex-url --save-dev 用法 var regexUrl = require ( 'regex-url' ) ; console . log ( 'Favourite website https://github.com/' . match ( regexUrl ) )...

    匹配URL的正则表达式(推荐)

    正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 则表达式: var match = /^((ht|f)tps?):\/\/[\w\...

    正则表达式经典实例

    3.6 检查正则表达式能否整个匹配目标字符串 3.7 获取匹配文本 3.8 决定匹配的位置和长度 3.9 获取匹配文本的一部分 3.10 获取所有匹配的列表 3.11 遍历所有匹配 3.12 在过程代码中对匹配结果进行验证 3.13 在...

    正则表达式经典实例.pdf

    3.6 检查正则表达式能否整个匹配目标字符串 3.7 获取匹配文本 3.8 决定匹配的位置和长度 3.9 获取匹配文本的一部分 3.10 获取所有匹配的列表 3.11 遍历所有匹配 3.12 在过程代码中对匹配结果进行验证 3.13 在另一个...

    js匹配网址url的正则表达式集合

    所以验证则网址url的正则可以如下几种 方法一: function checkUrl(urlString){ if(urlString!=""){ var reg=/(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?/; if(!re

    urlregexp:正则表达式以匹配纯文本正文中的URL

    URLRegExp 此模块提供了一个正则表达式,以匹配纯文本正文中的Web URL。介绍URLRegExp受( 在与RegExp匹配的自由URL上启发,但是更加注​​重全面性和正确性,而不是简洁。 它还不会尝试匹配非Web URL,例如mailto:...

    PHP经典实用正则表达式小结

    对于开发人员来说,正则表达式是一个非常有用的功能,它提供了 查找,匹配,替换 句子,单词,或者其他格式的字符串。这里介绍了几个超实用的php正则表达式,需要的朋友可以参考下。 1. 验证域名检验一个字符串是否...

    chrome插件修改请求头

    如果匹配规则是正则表达式,则修改结果(目前包括重定向至)支持使用形似$1的占位符 网址前缀:包括http://在内的网址前缀  域名:包含子域名在内的完整的域名  网址:包括“?”及之后的所有内容的完整地址  2、...

    java项目源码之UrlRewriter Java v2.0 RC1-urlrewriterjava.rar

    提供灵活的 URL 重写规则配置,包括正则表达式匹配、通配符匹配等多种方式。 支持对 URL 的各个部分(如路径、参数、域名等)进行精确匹配和替换。 缓存和性能优化: 实现重写规则的缓存机制,减少重复解析配置文

    对DJango视图(views)和模版(templates)的使用详解

    Django使用正则表达式匹配请求的URL,一旦匹配成功,则调用应用的视图 注意:只匹配路径部分,即除去域名、参数后的字符串 在test1/urls.py插入booktest,使主urlconf连接到booktest.urls模块 视图代码 # views.py ...

    详解IIS中URL重写工具的匹配URL-规则模式(rule patterns)

    规则模式的匹配URL设置主要是匹配URL中的路径部分,一般使用正则表达式和通配符对URL路径进行匹配,下面会仔细的说明。   首先要了解规则模式是匹配URL中的哪一部分,假设当前有网站的URL地址为...

    WordPress的404 errors重定向插件

    注意,我建议您在原始URL的末尾加上(.*),并开启正则表达式匹配。这样可以匹配上所有以你的URL为前缀的页面,防止在指向某条评论的URL上出现问题。 404错误重定向 开启404监视功能,需要到“Modules”页面,编辑...

    阿里云javasdk源码-aliyun_ddns:这个库是阿里云的ddns,用java1.5写的,可以放在mipsel-openwrt路由器中

    匹配RR的正则表达式 recordPattern= 请参考、、 recordPattern填写正则表达式,用来匹配RR的值。RR指的是二级url,如@、www、wap等。只有匹配了recordPattern的、而且是A记录的才会被匹配,只匹配第一个。如果不填写...

    切换域「Switch Domain」-crx插件

    它使用简单的正则表达式来使您能够匹配域并替换URL的部分。 这个扩展是为了在有大量服务器和URL的大型项目时使用而开发的。例如,在AEM(正式的Adobe CQ)中,您可能希望从编辑器CRXDE中的当前页面跳转到分派器上的...

    Download All Images-crx插件

    按图像URL过滤(正则表达式匹配) )5.按相同的来源政策进行过滤有关常见问题解答,请访问:http://add0n.com/save-images.html有关错误报告,请使用:https://github.com/belaviyo/save-images/issues注意:按下...

    自定义按钮「Custom Button」-crx插件

    自定义一个按钮。 自定义按钮就是这样,您可以使用URL和图标自定义按钮。特点:-设置自定义URL以在单击时打开 -在当前标签页,新标签页...-使用正则表达式设置应该工作的域 -当域名不匹配时显示通知。 支持语言:English

    下载所有图像「Download all Images」-crx插件

    按图像URL(正则表达式匹配)过滤5.按相同的来源策略过滤有关常见问题解答,请访问:http://add0n.com/save-images.html有关错误报告,请使用:https://github.com/belaviyo/save-images/issues注意:当您按时单击...

    Python入门网络爬虫之精华版

    常见的分析工具有正则表达式,BeautifulSoup,lxml等等。 存储 分析出我们需要的内容之后,接下来就是存储了。 我们可以选择存入文本文件,也可以选择存入MySQL或MongoDB数据库等。 存储有两个需要注意的问题: ...

    ASP.net技术内幕

    3.2 必填域:RequiredFieldValidator控件 3.3 检验表达式:RegularExpressionValidator控件 3.3.1 检验电子邮件地址 3.3.2 检验用户名和口令 3.3.3 检验电话号码 3.3.4 检验网址 ...

    Java开发技术大全 电子版

    13.7.3正则表达式中的一些高级规则421 13.7.4正则表达式中的其他通用规则424 13.7.5使用技巧425 13.8Pattern类的使用426 13.9Matcher类的使用428 13.9.1匹配方法的使用429 13.9.2替换方法的使用430 13.9.3组...

Global site tag (gtag.js) - Google Analytics