正则表达式各部分的解释:
(?:https?://|www.):此部分匹配 URL 中的协议部分(http 或 https)或 "www" 前缀。
S+:匹配一或多个非空白字符,捕获域名。
.S+:匹配一个句点("."),后面跟一或多个非空白字符,捕获顶级域名或文件扩展名。
示例:
以下 URL 符合给定的正则表达式:
https://www.google.com/search
http://example.com/index.html
www.wikipedia.org
使用正则表达式提取 URL 组件
除了匹配 URL 之外,正则表达式还可以用来提取 URL 的各个组件,例如协议、域名和文件路径。以下是用于提取这些组件的正则表达式: