누가 당신의 사이트에 있습니까?

6895 단어

소개하다.
사이트 데이터는 당신의 사이트를 방문하는 인터넷 사용자를 가리킨다.
인터넷 데이터는 방문량을 통해 측정되는데 이것은 온라인 업무가 관중을 끌어들이는 데 있어서의 유효성을 평가하는 좋은 방법이다.
방문자들이 당신의 사이트에 온 것은 분명히 그 내용에 대해 흥미를 느끼기 때문이다.
방문자가 귀하의 사이트를 방문한 횟수를 검사할 수 있을 뿐만 아니라, 그들의 사용자 에이전트를 검사함으로써 방문자의 더 많은 상세한 정보를 얻을 수 있습니다.

그렇다면 사용자 에이전트는 도대체 무엇일까?
현재 웹 페이지를 조회하는 모든 사람은 사용자 대리인이 있다.소프트웨어는 당신, 사용자, 인터넷 사이의 다리입니다.
사용자 에이전트 요청 헤더는 서버와 네트워크가 사용자 에이전트를 요청하는 응용 프로그램, 운영체제, 공급업체 및/또는 버전을 식별할 수 있도록 하는 특징 문자열이다.
사용자 프록시 문자열의 예:
Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.85 Safari/537.36

사용자 에이전트는 어떻게 작동합니까?
브라우저(또는 유사한 장치)가 웹 사이트를 불러올 때, 웹 사이트는 사용자가 요청한 내용을 검색할 때 자신을 에이전트로 표시합니다.
브라우저는 사용자 프록시 ID 외에 해당 장치와 네트워크에 대한 많은 정보를 보냅니다.
웹 개발자에게 이것은 매우 중요한 데이터이다. 왜냐하면 웹 페이지를 불러오는 사용자 에이전트에 따라 맞춤형 체험을 할 수 있기 때문이다.

사용자 에이전트를 찾읍시다!
이 작업에 대해python의flask 프레임워크를 사용할 것입니다.
여기서 코드를 찾을 수 있습니다: https://github.com/Awinja-j/user_agent
from flask import Flask, request

app = Flask(__name__)


@app.route('/', methods=['GET'])
def hello():
    data = request.headers.get('User-Agent')
    return data
if __name__ == '__main__':
    app.run(debug=True)
다음과 같이 표시됩니다.
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36

저희가 되돌아오는 문자열을 분해할게요.User-Agent: <product> / <product-version> <comment>웹 브라우저 형식:User-Agent: Mozilla/5.0 (<system-information>) <platform> (<platform-details>) <extensions>
기억해라. 너의 결과는 너의 컴퓨터와 네트워크에 있어서 유일무이하다.Mozilla/5.0: 사용자 에이전트 애플리케이션은 Mozilla 버전 5.0입니다.대부분의 사용자 에이전트는 Mozilla 버전에서 시작됩니다.즉, 브라우저가 Mozilla와 호환됩니다.역사적 이유로 오늘날 거의 모든 브라우저가 그것을 보낸다(Macintosh; Intel Mac OS X 10_15_6): 브라우저를 실행하는 시스템에 대한 세부 정보입니다.운영 체제는 OSX 버전 10.15.6(Mac에서 실행됨)입니다.AppleWebKit/537.36: WebKit은 웹 브라우저 엔진입니다.이것은 애플이 개발한 소스 렌더링 엔진이다.(KHTML, like Gecko): 처음에 Linux KDE 데스크톱에서 Konquer를 위해 개발한 "like Gecko"라는 글자를 추가하여 Gecko를 위한 현대적인 페이지를 얻을 수 있습니다.
Gecko는 Mozilla에서 개발한 브라우저 엔진입니다.Gecko는 개방된 인터넷 표준을 지원하고 서로 다른 응용 프로그램에 의해 웹 페이지를 표시하는 데 사용된다.Chrome/85.0.4183.83 Safari/537.36: 클라이언트는 Chrome 버전 85.0.4183.83이며 Safari 버전 537.36을 기반으로 합니다.

이제 이 데이터를 분석해 봅시다.

해석은 텍스트 흐름을 가져와 의미 있는 블록으로 분해하는 것을 의미합니다.
사용자 프록시 문자열에서 브라우저, 장치, 운영체제 정보를 얻을 수 있습니다.Python의 정규 표현식은 이 데이터를 검색하는 데 가장 좋은 도구입니다.이 목표를 실현하기 위해서 우리는 반드시 다음과 같이 해야 한다.
  • 모든 브라우저, 장치 및 운영 체제 목록을 표시합니다.
  • 파일을 만들고 다음 목록을 추가합니다.
  • browser = [], os = [], device= []
    
  • ua_list_types.py에regex기능을 추가하여 파생 사용자 에이전트에 대한 상세한 정보를 제공합니다.
  • 다행히도, 몇 개의 개원 도구가 우리가 이 임무를 완성하는 것을 도울 수 있다.
    적절한 이름 라이브러리 user agent parser를 사용합니다.
    여기서 -> https://pypi.org/project/user-agents/
    다음과 같이 설치합니다app.py.
    코드를 이렇게 보이게 수정하기;
    from flask import Flask, request
    from user_agents import parse
    
    app = Flask(__name__)
    
    
    @app.route('/', methods=['GET'])
    def hello():
        ua_string = request.headers.get('User-Agent')
        user_agent = parse(ua_string)
    
        data = {
            # Accessing user agent's browser attributes
            "browser": user_agent.browser,
            "browser_family": user_agent.browser.family,
            "browser_version": user_agent.browser.version,
            "browser_version_string": user_agent.browser.version_string,
    
            # Accessing user agent's operating system properties
            "os": user_agent.os, 
            "os_family": user_agent.os.family,
            "os_version": user_agent.os.version,
            "os_version_string": user_agent.os.version_string,
    
            # Accessing user agent's device properties
            "device": user_agent.device,
            "device_brand": user_agent.device.brand,  
            "device_family": user_agent.device.family ,
            "device_model": user_agent.device.model
    
        }
        return data
    
    
    if __name__ == '__main__':
        app.run(debug=True)
    

    그러면 당신은 이 사용자 에이전트 데이터로 무엇을 할 수 있습니까?
    가장 직접적인 장점은 개발자가 페이지를 불러오는 사용자 에이전트에 따라 맞춤형 체험을 할 수 있다는 것이다.
    구글 분석과 페이스북 픽셀이 엄격한 국가에서는 사용자 에이전트가 알고리즘을 만들어 같은 사용자가 이 사이트를 방문한 적이 한 번이 아니라는 것을 식별할 수 있다.
    웹 사이트를 방문하는 데 사용되는 장치의 유형도 알려줄 수 있다.
    한 마디로 하면 사용자 에이전트 기술은 곧 도태될 수 있는 오래된 기술일 수 있다. 그 전에 우리는 사용자에게 제공된 웹 버전이 어느 웹 버전인지 확인하고 추적 알고리즘을 제시하여 귀하의 사이트를 방문하는 데 사용되는 장치 유형을 파악할 수 있다.이것은 당신이 더욱 좋은 상업 결정을 내리는 데 도움을 주고 당신의 조직에 이윤을 가져다 줄 것이다.
    참조 자료:
    https://towardsdatascience.com/the-user-agent-that-crazy-string-underpinning-a-bunch-of-analytics-86507ef632f0
    https://www.whoishostingthis.com/tools/user-agent/
    https://pypi.org/project/user-agents/

    좋은 웹페이지 즐겨찾기