tldjs로 URL에서domain을 꺼내는 방법

3695 단어 Node.js

너는 tldjs로 할 수 있다


돌이켜보니 나는 이런 느낌 때문에 괴로웠다.

이번에 이루고 싶은 거.


URL에서 domain 추출
나는 최고급 구역과 근역을 조사했다.
제가 존에서 dns랑 URL을 해봤어요.
제가 하고 싶은 게 이거예요.
https://aaaaa.google.co.jp/1234/455/ をこうしたい → google.co.jp
http://bbbb.google.com/?q=domain    をこうしたい → google.com
https://ccccc.saitama.co.jp?      をこうしたい → saitama.co.jp
https://www.meti.go.jp/         をこうしたい → meti.go.jp
다음 화면에서 알 수 있듯이 이것은 바로 생각할 수 있는 가능성이므로 위치에서 얻을 수 없다.

그럼 이렇게 하겠습니다.
トップレベルドメインを列挙して、それが出てくる場所を探して、そこからみつからる最初の ピリオド「.」を探して・・・
근데 안 돼요?

그래서 저는 tldjs를 쓰고 싶어요.


tldjs를 사용하면 이렇게 분해됩니다.


url에서domain 꺼내기
아마 전에 열거한 공격 같은 것도 했을 거예요.
600개의 사이트를 확인해 보았지만 오류가 발생하지 않았다.

사용법이 매우 간단하다


하면, 만약, 만약...
const tldjs = require('tldjs');
tldjs.parse('https://www.enecho.meti.go.jp/about/special/johoteikyo/interview14ushikubo02.html');

결과는 이렇다
{ hostname: 'www.enecho.meti.go.jp',
  isValid: true,
  isIp: false,
  tldExists: true,
  publicSuffix: 'go.jp',
  domain: 'meti.go.jp',
  subdomain: 'www.enecho' }

일련의 코드 감각


const tldjs = require('tldjs');
const result = tldjs.parse('https://www.enecho.meti.go.jp/about/special.html');
console.log(result.domain); 

결과가 좋다
 => meti.go.jp
현재 이 대량의 사이트를 사용하면 최고급 지역에 있는 특정한 정보를 수확해야 한다.他にparse-domainでもできるよ 自前でも作ることができるよ여러 가지 방법이 있지만 ltdjs는 매우 편리하다

좋은 웹페이지 즐겨찾기