트위터 링크에서 만든 자기소개
이 글은 12월 3일Shimasan의 글이다.
평소 자신의 블로그나 노트에 많이 기고하는데, 큐타 첫 기고이니 잘 부탁드립니다.
무슨 소식이요?
안녕하세요, 저는 SNS 관련 데이터를 만지는 것을 좋아합니다.
이처럼 자기소개의 기회는 엔지니어 관련 활동, 학회 등 다양한 장소에 존재한다.
당연하긴 하지만 자기소개를 생각하는 건 자기다.
자신이 어떤 직업, 경력, 입장을 가지고 있는지, 취미가 무엇인지 이야기하는 것은 자신이다.
이 글은 사회학적 관점에서 트위터의 팔로우 사용자와 팔로우 사용자의 관계 정보만으로 자기소개 정보를 만들어보자!이런 시도.
이 문장의 종점
본고는 트위터의 관심 사용자와 관심 사용자의 관계 정보를 이용하여
Advent Calendar 2021: 소셜 미디어 데이터를 이용한 분석, 활용 방법
↑ 이것은 내가 흥미를 느끼는 분야로 흥미를 표시한다.
마지막으로 본 수법의 제한과 발전 가능성을 언급한다.
사전 요구 사항 공유
말하자면 사회학적 관점에 근거한 것은
사회학에서 사용자로 구성된 네트워크가 있을 때 이 사용자는 어떤 특성을 가지고 있을까
그 사용자 자신의 정보는 필요 없고 연결된 사용자가 결정한다고 한다.
나는 이런 생각을 트위터라는 소셜네트워크서비스에 적용할 것이다.
당신은 자신 이외의 사람에게 적용한 적이 있습니까?
네.
자신의 블로그나 note에서 VTuber,
조금 다르지만 사회학적 관점에 기반한 분석으로 APEX의 문화적 배경이 다른 사용자 교류에 대한 분석이 있다.
트위터에 자기소개를 하지 않아도 자신의 소속사무소를 명확히 하는 수법이 있지 않나요?
네.
과학자 식별과 분석을 기계적으로 하는 연구로, 트위터의 리스트 기능을 구체적으로 활용했다.
대상을 포함하는 사용자의 목록을 수집하고 이 목록의 이름에 따라 사용자가 무엇인지 식별하는 것은 어느 정도 유명한 사용자에게만 유효하다.
이것은 나 같은 무명 사용자와 인연이 없는 수법이다.
또 트위터 데이터를 쓰면 되지 않겠느냐는 의견도 있지만, 사용하더라도 각 사용자 단위의 내용이 크게 흔들리기 때문에 별로 사용하고 싶지 않다.
그래서 이번에는 개인 자료를 사용했습니다.
수법
다음 순서에 따라 진행한다.
컨디션
팔로우, 팔로우 사용자 각자의 정보는 아래의 트위터 API를 통해 얻을 수 있다.
사용자 추적
https://api.twitter.com/1.1/friends/ids.json
https://api.twitter.com/1.1/users/show.json
description
참조 필드사용자 주시
https://api.twitter.com/1.1/followers/ids.json
관심 사용자와 관심 사용자를 집합으로 간주할 때 그 조합은 6가지로 만들어진다.
쉽게 말하면 일방적으로 추적하는 사용자 그룹과 일방적으로 추적하는 사용자 그룹이다.
위에서 설명한 블로그에서 분석했지만 일방적으로 관심을 가진 사용자는 자신의 소망, 흥미와 흥미를 강하게 표현한다.
일방적으로 추적된 사용자 그룹은 자신의 속성을 표시합니다.
직관적인 결과 아닙니까?
WordCloud 만들기
작성된 컬렉션은 WordCloud를 만듭니다.
집합 사용자의 프로필 부분을 추출하고 사전 처리를 거쳐'명사'만 추출합니다.
이미 몇 개의 정지어를 설정했지만 실행하는 사람에게 달렸다고 생각한다.
전처리는 간단하지만 neologdn을 사용해서 URL을 삭제했습니다.
명사만 꺼내서 형태소를 분석했다. 어휘는full이다.딕트입니다.
꺼내서 워드클라우드를 만들고 끝냅니다.
결실
일방적인 사용자 추적
Shimasan
이것은 흥미로운 분야로 재미가 일목요연하다.
그들은 NLP, 기계 학습 시스템, 데이터 분석, 엔지니어 등에 강한 흥미를 가지고 게임과 뉴스를 좋아한다.
연구에 관심이 많은 사람처럼 보인다.
최신 논문 정보를 쉽게 얻을 수 있는 가장 좋은 수단은 트위터다.
일방적인 사용자 추적
원래 고등학생이 편입된 학생 속성이 있습니다. 관심자 데이터만 있습니다.
트위터에서 인터넷을 열었을 때 그 시기에 자신과 관련된 사용자들이 연결됐다는 것은 자연스러운 결과다.
이는 관심 있는 사용자의 속성으로도 이해할 수 있기 때문에 발송자와 Influencer에 이 방법을 적용해 팬층을 확정할 수 있다.
제한과 수법의 발전에 관하여
이런 방법은 트위터 계정 비공개 계정에서는 어렵다.
또 트위터 계정은 자신의 개성을 분할해 여러 계정으로 표현할 수 있어 자신의 일부를 강하게 표현할 수 있다.
사용자가 여러 계정을 통해 개성을 구분하지 않으면 LDA를 사용하면 자신이 관심 있는 분야를 화제수로 표현할 수 있다.
시각화는 PyLDAviz 등을 사용하여 간단히 확인할 수 있습니다.
내 상황은 여러 화제를 설정해도 연구와 기계학습을 피할 수 없고 여러 화제를 관측할 수 없다. 내 워드클라우드를 보면 여러 화제와는 거리가 멀다.
최후
이번에는 워드클라우드 등 도구로만 트위터 관련 정보를 자기소개했다.
나는 대상인 사용자 그룹을 적절하게 설정함으로써 어느 정도 정보를 사용할 수 있다고 생각한다.
트위터 API를 하는 사람도 수법이 간단하니 꼭 해보세요.
나는 내가 본 자기소개는 다른 사람과의 연락을 통해서만 자기소개라는 단락을 하는 것이 좋다고 생각한다(사용하고 싶다).
Reference
이 문제에 관하여(트위터 링크에서 만든 자기소개), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/shimasan0x00/items/ead337a57f493a65acb3텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)