arXiv의 트렌드 워드를 슬랙 게시! (논문 검색을 더 편하게!!)

소개



 여러분, 최근의 트렌드를 논문으로부터 알고 싶다~라고 할 때 어떻습니까?
논문을 한쪽 끝에서 읽어 잡을 수 있으면 그것이 이상입니다만, 논문수는 매일 대량으로 발표되고, 어느 것을 쫓으면 좋은 것인가......
그래서 arXiv에서 발표된 최근 논문에서 키워드를 분석하고 트렌드 워드를 slack에 게시하는 기능을 만들어 보았습니다!

완성예(이렇게 Slack에 투고합니다!)



위에서 순서대로 트렌드 워드 베스트 15를 게시하고 있습니다! (CS.AI 카테고리 내)


만들기의 흐름


  • arXiv API에서 논문 정보 얻기
  • TF-IDF를 사용하여 트렌드 워드 얻기
  • IFTTT를 사용하여 webhooks를 통해 slack에 게시
    이번에는 카테고리 "CS(Computer Science)"중에서 tf-idf로 취득한 상위 단어를 트렌드 워드로 정의하고 CS.AI의 트렌드 워드를 표시하는 것을 작성합니다!



  • 1. arXiv API로 논문 정보 얻기



    이번에 취득하는 논문으로서는, arXiv가 취득하기로 했습니다!
    이유는 주로 두 가지입니다.
  • 논문으로서의 정보가 빠르다 (트렌드성이 높다)
  • API가 갖추어져 있기 때문에 데이터를 쉽게 얻을 수 있습니다

  • arXivAPI에서는 많은 데이터를 얻을 수 있습니다만, 이번 이용하는 것은, Abstract의 문장으로부터 트랜드 워드를 분석해 갑니다!

    2. TF-IDF를 이용하여 트렌드 워드 취득



    이번에는 CS 카테고리에 대해 TF-IDF를 실시했습니다. 그건 그렇고, 당신은 CS의 하위 카테고리를 몇 가지 알고 있습니까? (저자는 세지 않았지만 상상 이상이었습니다 ......)

    무려, 40 카테고리! !
    이만큼의 카테고리를 이치에서 보고 가면 날커녕 해도 살아버립니다군요(웃음)
    이 사실을 알고 더욱이 분석을 완성하고 싶어졌습니다!

    (참고)
    CS 카테고리 목록

    3. IFTTT를 사용하여 webhooks를 통해 slack은 게시



    IFTTT 을 사용해, 프로그래밍상에서 리퀘스트를 보내는 것을 트리거로 하고, 리퀘스트를 받으면 Slack 에 투고하는 구조로 하고 있다. (상당히 심플한 제작으로 만들 수 있으므로 편리합니다!)


    완성



    이 세 단계에서 arXiv의 트렌드 워드를 Slack에 게시 할 수있었습니다!
    아래 사진은 위의 완성 예와는 다른 날의 트렌드 워드입니다.


    결론



    Slack을 보는 것만으로, 최근 많이 나와 있는 논문의 테마는 무엇인가~라고 하는 것을 알면 편리하네요. 논문을 읽고 계속 잡는 것은 어렵고이 게시물을 확인하는 것만으로는 장애물도 내려간다! 라고 생각하기 때문에, 저자도 정기적인 정보 캐치 업 툴로서 사용할 수 있으면 좋겠습니다.
    이번, 작성한 기능은 실제로 동해 인공 지능 연구회(TAIR)의 Slack에서 실장하고 있습니다! 학부생·원생에서 흥미가 있는 사람이 있으면 초대할 수 있으면 좋다고 생각하므로, 트위터 로부터 팔로우+DM으로 연락해 주세요!

    ※도카이 인공지능연구회(TAIR)는 도카이 지구를 중심으로 AI·기계학습에 흥미가 있는 학생들을 위한 커뮤니티입니다.

    좋은 웹페이지 즐겨찾기