파충류 노트pyquery

5866 단어 파충류

pyquery

  • 구축doc
  • 속성 선택기
  • 스타일 선택기
  • 체인식 호출
  • 다중 속성 포지셔닝
  • 위조 선택기
  • contains
  • disable
  • empty
  • eq
  • even
  • odd
  • first
  • gt
  • lt
  • has()
  • header
  • hidden
  • image
  • input
  • last
  • parent
  • pseudo
  • password radio reset submit select text

  • 조종
  • each

  • 두루 다니다
  • make_links_absolute





  • 구축doc

    from pyquery import PyQuery as pq
    
    url = "https://news.163.com"
    # doc = pq(url) #  html 
    html = '''
    
    
    
        
        pyquery test
    
    
        

    this is test page

    ''' doc = pq(html)

    속성 선택기

    #  id baidu 
    doc("#baidu")
    doc('[id="baidu"]')
    doc.find("*[id='baidu']")
    

    스타일 선택기

    #  class meta tt 
    doc(".meta")(".tt")
    doc(".meta").filter(".tt") 
    doc(".meta.tt")
    

    체인 호출

    #  id list class meta tt li a href
    doc("#list li.meta.tt a").attr.href
    

    다중 속성 포지셔닝

    이 탭을 찾으면 이 방법으로 찾을 수 있습니다
    doc("#a.b.b")

    위조 종류 선택기


    위조 클래스 선택기는 탭 이름이나 속성 값이 이 요소와 일치할 수 있습니다
    #  
    d = pq(('
    ')) d(':button') #
    contains

    匹配包含指定文本的标签,即使只有一个,可能会返回多个元素,因为会把父标签算进去

    doc(":contains(‘bbb’)")

    disable

    匹配所有禁用标签

    d = PyQuery('
    ') d('input:disabled') []

    empty
    다른 요소가 없는 모든 태그 일치
    d = PyQuery('

    title

    ') d(':empty') [

    ]


    eq
    색인별로 일치
    d = PyQuery('

    ') >>> d('h1:eq(0)') [] >>> d('h1:eq(1)') []

    even
    짝수 색인 요소 일치
    d = PyQuery('

    ') >>> d('p:even') [

    ]


    odd
    일치 홀수 인덱스 및 0 인덱스
    first
    첫 번째 일치
    d = PyQuery('

    ') >>> d('p:first') []

    gt
    일치하는 인덱스가 지정한 값보다 큰
    d = PyQuery('

    ') >>> d('p:first') []

    lt
    일치하는 인덱스가 지정된 값보다 작은
    d = PyQuery('

    ') >>> d('p:first') []

    has()
    매개변수는 속성일 수도 있고 요소일 수도 있습니다.
    >>> from pyquery import PyQuery
    >>> d = PyQuery('
    ') >>> d('.foo:has(".baz")') [] >>> d('.foo:has(".foo")') [] >>> d('.foo:has(".bar")') [] >>> d('.foo:has(div)') []
    header

    匹配h1-h6标签

    >>> from pyquery import PyQuery
    >>> d = PyQuery('

    title

    ') >>> d(':header') [

    ]


    hidden
    모든 숨겨진 input 태그 일치
    >>> from pyquery import PyQuery
    >>> d = PyQuery('
    ') >>> d('input:hidden') []

    image
    모든 type이 image인 Input 태그와 일치
    >>> from pyquery import PyQuery
    >>> d = PyQuery('
    ') >>> d('input:image') []

    input
    모든 input 태그 일치
    last
    마지막
    parent
    다른 원소를 포함하는 원소 일치 (parent 원소로)
    pseudo
    위조 원소를 번역합니까?
    password radio reset submit select text
    input는 상기 유형의 d('input:xxx')

    조종하다


    each
    apply func on each nodes
    #  a haha 
    doc("a").each(lambda i,e:pq(e).add_class("haha"))
    

    두루 다니다


    점선 ID를 선택하려면 점을 전환해야 합니다.
    d = pq('

    ') >>> d('#hello\.you')

    make_links_absolute
    링크의 상대 주소를 절대 주소로 바꾸기
    html = '''
    
    
    
        
        pyquery test
    
    
        

    test

    this is test page

    ''' doc = pq(html,parser="html") doc.make_links_absolute(base_url="https://www.baidu.com")

    좋은 웹페이지 즐겨찾기