python에서 gbizinfo를 통해 법인 번호를 단숨에 얻다

개시하다


그런 일 없어요?
TOB의 기업 정보를 입수했지만 CRM에는 법인 번호가 없다.
법인명과 설립연도 등 기본 정보도 있다.
이럴 때 다른 목록의 데이터 집합과 결합할 때 무엇을 키로 조합해야 합니까?
나는 매우 괴로워한다.
행정적으로 정해진 법인 번호만 있으면 모든 기업 정보를 결합해 하나의 정보로 만들 수 있다.
예를 들어 다음과 같이 표 A와 표 B를 결합시키려는 경우가 있을 수 있다.
표 A(엔터프라이즈 정보)
회사 이름
설립 연도
도도부 현
hoge
fuga
3
테이블 B(접촉 정보)
회사 이름
추정 금액
수주 상황
hoge
3000
첫 번째 연결

gbizinfo로 볼게요.


sql 등 데이터베이스 언어를 접한 사람이라면 알 수 있을 것이다.
문자열 간의 결합에는 DB 부하가 필요합니다.
법인 번호만 있으면 공통의 그룹 키로 활용할 수 있다.
법인 번호를 취득할 때 가장 편리한 것은 경제산업성의 gbiz info이다
이 서비스 REST API라니.
따라서 취득법인 번호는 매우 간단하다.
https://info.gbiz.go.jp/api/index.html
왜냐하면 나중에 헤드즈의 정보는 X-hojinInfo-appi-token이 필요하거든요.
API 사용을 미리 신청해야 합니다.

불러봐요.


샘플 데이터


아래와 같이 회사 명칭과 설립 연도의 데이터만 포함한다.
이 데이터에 법인번호를 입력하고 싶습니다.
팟캐스트 방법은 GET입니다.
회사 이름
설립 연도
롯데모바일주식회사
2018
송옥식품주식회사
2018

부탁을 해봐


request.py
import json
import pandas as pd
import requests

class CorporateNumbers:
    def __init__(self):
        self.headers = {
            "Accept": "application/json",
            "X-hojinInfo-api-token": "###token###"
        }
        self.endpoint_url = 'https://info.gbiz.go.jp/hojin/v1/hojin'
    def _create_taeger_company_dataframe(self):
        df = pd.read_clipboard()
        return df
    def _get_corporate_number(self,df):
        #df = self._create_taeger_company_dataframe()
        name = df.name
        founded_year = df.founded
        results = []
        for name,founded in zip(name,founded_year):
            data = {
                'name':name,
                'founded':founded
            }
            res = requests.get(
                url = self.endpoint_url,
                headers = self.headers,
                params = data
            )
            json = res.json()['hojin-infos']
            results.extend(json)
            df = pd.io.json.json_normalize(results)
        return df
    def _merge_dataframe(self):
        df1 = self._create_taeger_company_dataframe()
        df2 = self._get_corporate_number(df = df1)
        df3 = pd.merge(df1,df2,on='name',how='left')
        return df3

결실


좋은 웹페이지 즐겨찾기