Python 대량 검색 키워드 위 챗 지수 인 스 턴 스 방법

Python 으로 키워드 위 챗 지 수 를 대량으로 조회 하 는 것 을 알려 드 립 니 다.
초기 에 Python 개발 환경 과 Fiddler 패키지 도 구 를 설치 할 준비 가 되 어 있 습 니 다.초기 에 Python 개발 환경 과 Fiddler 패키지 도 구 를 설치 할 준비 가 되 어 있 습 니 다.
먼저 Fiddler 소프트웨어 를 열 고 Tools 를 클릭 하고 드 롭 다운 메뉴 에서 Options 를 선택 한 다음 HTTPS 를 선택 하여 HTTPS 설정 을 합 니 다.아래 그림 과 같 습 니 다.

다음 그림 과 같이 connections 설정 을 진행 합 니 다.

핸드폰 설정 은 주로 컴퓨터 와 핸드폰 을 같은 랜 에 두 고 핸드폰 WLAN 설정 을 켜 고 수 동 프 록 시 를 켜 고 프 록 시 호스트 이름과 프 록 시 포트 를 설정 합 니 다.프 록 시 호스트 이름 은 컴퓨터 IPv 4 주소 입 니 다.컴퓨터 가 cmd 를 실행 하고 ipconfig 리 턴 을 입력 하면 가 져 올 수 있 습 니 다.다음 그림:

프 록 시 포트 는 Fiddler 소프트웨어 connections 가 설정 한 기본 포트 8888 입 니 다.물론 이 포트 는 다른 것 으로 수정 할 수 있 습 니 다.일치 하면 됩 니 다.여 기 는 기본 포트 를 직접 사용 합 니 다.최종 설정 은 다음 그림 과 같 습 니 다:

그리고 핸드폰 브 라 우 저 는 http:/+IPv 4 주소+포트 를 방문 합 니 다.예 를 들 어http://192.168.100.226:8888/,페이지 에서 FiddlerRoot certificate 다운로드 인증 서 를 클릭 하여 알림 에 따라 설치 하면 됩 니 다.이렇게 하면 모든 설정 이 이 루어 지고 핸드폰 액세스 페이지 에서 Fiddler 에서 패키지 데 이 터 를 볼 수 있 습 니 다.그리고 핸드폰 브 라 우 저 는 http:/+IPv 4 주소+포트 를 방문 합 니 다.예 를 들 어http://192.168.100.226:8888/,페이지 에서 FiddlerRoot certificate 다운로드 인증 서 를 클릭 하여 알림 에 따라 설치 하면 됩 니 다.이렇게 하면 모든 설정 이 이 루어 지고 핸드폰 액세스 페이지 에서 Fiddler 에서 패키지 데 이 터 를 볼 수 있 습 니 다.
위 챗 지수 애플 릿 을 열 고 키 워드 를 검색 합 니 다.예 를 들 어'콘서트'와 같이 Host 를 찾 아 search.weixin.qq.com 의 요청 을 클릭 하여 Request Headers 의 몇 가지 인 자 를 꺼 냅 니 다.GET,즉 연결 을 요청 합 니 다.User-agent 사용자 에이전트 및 refer(아래 그림 참조).코드 에서 요청 헤더 의 이 세 가지 설정 을 수정 해 야 합 니 다.

코드 예제:

import requests,urllib,json,random,time
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)

headers = {'Accept-Encoding': 'gzip',
    'referer': 'https://servicewechat.com/wxc026e7662ec26a3a/7/page-frame.html',#        
    'content-type': 'application/json',
    'User-Agent': 'Mozilla/5.0 (Linux; Android 5.1.1; vivo V3Max A Build/LMY47V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/39.0.0.0 Mobile Safari/537.36 MicroMessenger/7.0.4.1420(0x27000435) Process/appbrand2 NetType/WIFI Language/zh_CN', #        
    'Host': 'search.weixin.qq.com',
    'Connection': 'Keep-Alive'
    }

with open('weixin.txt','w',encoding='utf-8') as f:
 for line in open('keywords.txt',encoding='utf-8-sig'):
   word = line.rstrip()
   kw = urllib.parse.quote(word)
   url = 'https://search.weixin.qq.com/cgi-bin/searchweb/wxindex/querywxindexgroup?group_query_list={}&wxindex_query_list={}&gid=&openid=ov4ns0NiA4_Cshlsxa5pT640jC5w&search_key=1560843991380393_3137533225'.format(kw,kw) #        
   html = requests.get(url,headers=headers,verify=False).text
   time.sleep(random.uniform(2, 4))
   datas = json.loads(html)
   if datas.get('data'):
    try:
      wxindex_str = datas['data']['group_wxindex'][0]['wxindex_str']
      if wxindex_str:
       index = wxindex_str.split(',')[-1]
      else:
       index = 0
    except:
      index = 0
   else:
    index = 0
   data = '{}\t{}
'.format(word,index) print(data.rstrip()) f.write(data)
요청 링크 의 수정 을 주의 하 십시오.꺼 낸 원본 링크 의 groupquery list 및 wxindexquery list 등 번호 뒤의 문 자 를{}로 수정 해 야 합 니 다.키 워드 는 keywords.txt 파일 에 한 줄 씩 저 장 됩 니 다.스 크 립 트 를 실행 합 니 다.데이터 출력 은 다음 그림 과 같 습 니 다.데 이 터 는 최종 적 으로 weixin.txt 에 저 장 됩 니 다.

요약:
이상 은 Python 대량 조회 키워드 인 위 챗 지수 에 관 한 모든 지식 입 니 다.여러분 의 학습 과 저희 에 대한 지지 에 감 사 드 립 니 다.

좋은 웹페이지 즐겨찾기