python에서 gbizinfo를 통해 법인 번호를 단숨에 얻다
개시하다
그런 일 없어요?
TOB의 기업 정보를 입수했지만 CRM에는 법인 번호가 없다.
법인명과 설립연도 등 기본 정보도 있다.
이럴 때 다른 목록의 데이터 집합과 결합할 때 무엇을 키로 조합해야 합니까?
나는 매우 괴로워한다.
행정적으로 정해진 법인 번호만 있으면 모든 기업 정보를 결합해 하나의 정보로 만들 수 있다.
예를 들어 다음과 같이 표 A와 표 B를 결합시키려는 경우가 있을 수 있다.
표 A(엔터프라이즈 정보)
회사 이름
설립 연도
도도부 현
hoge
fuga
3
테이블 B(접촉 정보)
회사 이름
추정 금액
수주 상황
hoge
3000
첫 번째 연결
gbizinfo로 볼게요.
sql 등 데이터베이스 언어를 접한 사람이라면 알 수 있을 것이다.
문자열 간의 결합에는 DB 부하가 필요합니다.
법인 번호만 있으면 공통의 그룹 키로 활용할 수 있다.
법인 번호를 취득할 때 가장 편리한 것은 경제산업성의 gbiz info이다
이 서비스 REST API라니.
따라서 취득법인 번호는 매우 간단하다.
https://info.gbiz.go.jp/api/index.html
왜냐하면 나중에 헤드즈의 정보는 X-hojinInfo-appi-token이 필요하거든요.
API 사용을 미리 신청해야 합니다.
불러봐요.
샘플 데이터
아래와 같이 회사 명칭과 설립 연도의 데이터만 포함한다.
이 데이터에 법인번호를 입력하고 싶습니다.
팟캐스트 방법은 GET입니다.
회사 이름
설립 연도
롯데모바일주식회사
2018
송옥식품주식회사
2018
부탁을 해봐
request.py
import json
import pandas as pd
import requests
class CorporateNumbers:
def __init__(self):
self.headers = {
"Accept": "application/json",
"X-hojinInfo-api-token": "###token###"
}
self.endpoint_url = 'https://info.gbiz.go.jp/hojin/v1/hojin'
def _create_taeger_company_dataframe(self):
df = pd.read_clipboard()
return df
def _get_corporate_number(self,df):
#df = self._create_taeger_company_dataframe()
name = df.name
founded_year = df.founded
results = []
for name,founded in zip(name,founded_year):
data = {
'name':name,
'founded':founded
}
res = requests.get(
url = self.endpoint_url,
headers = self.headers,
params = data
)
json = res.json()['hojin-infos']
results.extend(json)
df = pd.io.json.json_normalize(results)
return df
def _merge_dataframe(self):
df1 = self._create_taeger_company_dataframe()
df2 = self._get_corporate_number(df = df1)
df3 = pd.merge(df1,df2,on='name',how='left')
return df3
결실
Reference
이 문제에 관하여(python에서 gbizinfo를 통해 법인 번호를 단숨에 얻다), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kosei_KB/items/103b5e9bc60b33ca4d26텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)