웹 페이지 를 캡 처 하고 정규 표현 식 으로 메 일 주소 와 일치 합 니 다.
4359 단어 정규 표현 식
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Net;
using System.IO;
namespace _07 _
{
class Program
{
static void Main(string[] args)
{
List<Uri> listUrl = new List<Uri>() {
new Uri("http://gb.corp.163.com/gb/contactus.html"),
new Uri("https://passport.csdn.net/help/faq"),
new Uri("http://www.kuaipan.cn/"),
new Uri("http://www.ksyun.com/home/joinUs/campus"),
new Uri("http://www.cnblogs.com/about/ad.aspx"),
new Uri("http://www.cnblogs.com/about/contactus.aspx"),
new Uri("http://www.csdn.net/company/statement.html"),
new Uri("http://hb.qq.com/job/dczp/index.htm")
};
List<string> listMail = new List<string>();
foreach (Uri ur in listUrl)
{
GetMails(ur, listMail);
}
cw(listMail);
Console.ReadKey();
}
private static void GetMails(Uri uri,List<string> list)
{
try
{
WebClient wc = new WebClient();
Console.WriteLine(" WebClient - [{0}]", uri.ToString());
Stream stream = wc.OpenRead(uri);
//Console.WriteLine(" :{0}", uri.ToString());
StreamReader reader = new StreamReader(stream, Encoding.Default);
string input = reader.ReadToEnd();
string reg = @"(?<mail1>[a-zA-Z0-9_]+@[a-zA-Z0-9]+(?:\.[a-zA-Z0-9]+)+)" //[email protected]
+ @"|((?<mail2>[a-zA-Z0-9_]+#[a-zA-Z0-9]+(?:\.[a-zA-Z0-9]+)+))" //zhangsan#163.com
+ @"|((?<mail3>[a-zA-Z0-9_]+\(at\)[a-zA-Z0-9]+(?:\.[a-zA-Z0-9]+)+))";//zhangsan(at)163.com
Regex regex = new Regex(reg);
Console.WriteLine(Regex.IsMatch(input, reg));
MatchCollection matches = regex.Matches(input);
for (int i = 0; i < matches.Count; i++)
{
Match match = matches[i];
//Console.WriteLine("match: {0}",match.Value);
//Console.WriteLine(match.Groups.Count);
for (int j = 1; j < match.Groups.Count; j++)
{
string mail = match.Groups[j].Value;
if (!string.IsNullOrEmpty(mail))
{
mail = Regex.Replace(mail, @"(.+)(?:@)(.+)", "$1@$2");
mail = Regex.Replace(mail, "(.+)#(.+)", "$1@$2"); // zhangsan#163.com [email protected]
mail = Regex.Replace(mail, @"(.+)\(at\)(.+)", "$1@$2");
if (!list.Contains(mail))
{
list.Add(mail);
}
}
//Console.WriteLine("group: {0}", match.Groups[j].Value);
}
}
}
catch (Exception e)
{
Console.WriteLine(e.Message);
}
}
static void cw(List<string> list)
{
Console.WriteLine(" {0}", list.Count);
int i = 0;
foreach (string str in list)
{
i++;
Console.WriteLine("{0} - [{1}]", i, str);
}
Console.WriteLine("______________________");
}
}
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
awk 상용 명령awk 는 모든 입력 줄 을 하나의 기록 으로 인식 하고 그 줄 의 모든 단어 도 메 인 을 하나의 필드 로 인식 합 니 다. ARGC 명령 줄 에 awk 스 크 립 트 가 들 어 오 는 매개...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.