CentOS 에 Scrapy 설치
설치 환경:
- centos5.4
- python2.7.3
설치 절차:
1. python 2.7 다운로드 http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgz
- [root@zxy-websgs ~]# wget http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgz -P /opt
- [root@zxy-websgs opt]# tar xvf Python-2.7.3.tgz
- [root@zxy-websgs Python-2.7.3]# ./configure
- [root@zxy-websgs Python-2.7.3]# make && make install
python 2.7 설치 검증
- [root@zxy-websgs Python-2.7.3]# python2.7
- Python 2.7.3 (default, Feb 28 2013, 03:08:43)
- [GCC 4.1.2 20080704 (Red Hat 4.1.2-50)] on linux2 Type "help", "copyright",
- "credits" or "license" for more information.
- >>> exit()
2. setuptools 설치
- [root@zxy-websgs ~]# wget http://pypi.python.org/packages/source/s/setuptools/setuptools-0.6c11.tar.gz -P /opt/
- [root@zxy-websgs opt]# tar zxvf setuptools-0.6c11.tar.gz
- [root@zxy-websgs setuptools-0.6c11]# python2.7 setup.py install
setuptools:http://pypi.python.org/packages/source/s/setuptools/setuptools-0.6c11.tar.gz
3. Twisted 설치
- [root@zxy-websgs setuptools-0.6c11]# easy_install Twisted
- ......
- Installed /usr/local/lib/python2.7/site-packages/Twisted-12.3.0-py2.7-linux-x86_64.egg
- ......
- Installed /usr/local/lib/python2.7/site-packages/zope.interface-4.0.4-py2.7-linux-x86_64.egg
Twisted 는 zope. interface 를 설치 하려 면 아래 주소 에서 다운로드 할 수 있 습 니 다.
zope.interface:http://pypi.python.org/packages/source/z/zope.interface/zope.interface-4.0.1.tar.gz
twisted:http://twistedmatrix.com/Releases/Twisted/12.1/Twisted-12.1.0.tar.bz2
5. w3lib 설치
- [root@zxy-websgs setuptools-0.6c11]# easy_install -U w3lib
- Searching for w3lib Reading http://pypi.python.org/simple/w3lib/
- Reading http://github.com/scrapy/w3lib Best match: w3lib 1.2
- Downloading http://pypi.python.org/packages/source/w/w3lib/w3lib-1.2.tar.gz#md5=f929d5973a9fda59587b09a72f185a9e
- Processing w3lib-1.2.tar.gz
- Running w3lib-1.2/setup.py -q bdist_egg --dist-dir /tmp/easy_install-wm_1BB/w3lib-1.2/egg-dist-tmp-2DQHY_ zip_safe flag not set;
- analyzing archive contents... Adding w3lib 1.2 to easy-install.pth file
- Installed /usr/local/lib/python2.7/site-packages/w3lib-1.2-py2.7.egg
- Processing dependencies for w3lib Finished processing dependencies for w3lib
w3lib:http://pypi.python.org/packages/source/w/w3lib/w3lib-1.2.tar.gz
6. libxml 2 를 설치 하거나 easy설치 lxml
- [root@zxy-websgs lxml-3.1.0]# easy_install lxml
lxml 설치 검증
- [root@zxy-websgs lxml-3.1.0]# python2.7
- Python 2.7.3 (default, Feb 28 2013, 03:08:43)
- [GCC 4.1.2 20080704 (Red Hat 4.1.2-50)] on linux2 Type "help", "copyright", "credits" or "license" for more information.
- >>> import lxml
- >>> exit()
libxml 2 도 설치 할 수 있 습 니 다. 홈 페이지 에 2.6.28 이상 의 버 전 을 설치 하 는 것 을 추천 합 니 다. 하지만 홈 페이지 에서 찾 지 못 했 습 니 다. 제 가 먼저 설치 한 2.6.9 버 전 입 니 다. scrapy 타 임 스 를 실행 하 는 중 오류 가 발생 했 습 니 다.
- Traceback (most recent call last):
- File "/usr/local/bin/scrapy", line 5, in <module>
- pkg_resources.run_script('Scrapy==0.14.4', 'scrapy')
- File "build/bdist.linux-x86_64/egg/pkg_resources.py", line 489, in run_script
- File "build/bdist.linux-x86_64/egg/pkg_resources.py", line 1207, in run_script
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/EGG-INFO/scripts/scrapy", line 4, in <module>
- execute()
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/cmdline.py", line 112, in execute
- cmds = _get_commands_dict(inproject)
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/cmdline.py", line 37, in _get_commands_dict
- cmds = _get_commands_from_module('scrapy.commands', inproject)
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/cmdline.py", line 30, in _get_commands_from_module
- for cmd in _iter_command_classes(module):
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/cmdline.py", line 21, in _iter_command_classes
- for module in walk_modules(module_name):
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/utils/misc.py", line 65, in walk_modules
- submod = __import__(fullpath, {}, {}, [''])
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/commands/shell.py", line 8, in <module>
- from scrapy.shell import Shell
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/shell.py", line 14, in <module>
- from scrapy.selector import XPathSelector, XmlXPathSelector, HtmlXPathSelector
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/selector/__init__.py", line 30, in <module>
- from scrapy.selector.libxml2sel import *
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/selector/libxml2sel.py", line 12, in <module>
- from .factories import xmlDoc_from_html, xmlDoc_from_xml
- File "/usr/local/lib/python2.7/site-packages/Scrapy-0.14.4-py2.7.egg/scrapy/selector/factories.py", line 14, in <module>
- libxml2.HTML_PARSE_NOERROR + \
- AttributeError: 'module' object has no attribute 'HTML_PARSE_RECOVER'
2.6.21 버 전 으로 업그레이드 해서 해 결 했 습 니 다.
libxml2.6.1:ftp://xmlsoft.org/libxml2/python/libxml2-python-2.6.21.tar.gz
7. pyOpenSSL 설치 (이것 은 선택 적 으로 설치 할 수 있 습 니 다. 주로 scrapy 가 https 를 지원 할 수 있 도록 하기 위해 서 입 니 다)
easy 로설치 pyOpenSSL 은 pyOpenSSL - 0.13 버 전 을 설치 하 였 으 나 설치 에 성공 하지 못 하여 수 동 으로. 011 버 전 을 다운로드 하여 설치 하 였 습 니 다.
- [root@zxy-websgs opt]# wget http://launchpadlibrarian.net/58498441/pyOpenSSL-0.11.tar.gz -P /opt
- [root@zxy-websgs opt]# tar zxvf pyOpenSSL-0.11.tar.gz
- [root@zxy-websgs pyOpenSSL-0.11]# python2.7 setup.py install
pyOpenSSL:http://launchpadlibrarian.net/58498441/pyOpenSSL-0.11.tar.gz
8. scrapy 설치
- [root@zxy-websgs pyOpenSSL-0.11]# easy_install -U Scrapy
인증 설치
- [root@zxy-websgs pyOpenSSL-0.11]# scrapy
- Scrapy 0.16.4 - no active project
-
- Usage:
- scrapy <command> [options] [args]
-
- Available commands:
- fetch Fetch a URL using the Scrapy downloader
- runspider Run a self-contained spider (without creating a project)
- settings Get settings values
- shell Interactive scraping console
- startproject Create new project
- version Print Scrapy version
- view Open URL in browser, as seen by Scrapy
-
- [ more ] More commands available when run from project directory
-
- Use "scrapy <command> -h" to see more info about a command
scrapy:http://pypi.python.org/packages/source/S/Scrapy/Scrapy-0.14.4.tar.gz
요약:
pyOpenSSL 단독 설치 에 성공 하지 못 했 을 경우, 먼저 pyOpenSSL 0.11 을 다운로드 하여 설치 한 후 easy 를 사용 할 수 있 습 니 다.install - U Scrapy 풀 코스 설치
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
CentOS 7에서 OpenLDAP 서버 설치 및 구성LDAP(Lightweight Directory Access Protocol)는 ID와 개체를 쉽게 관리할 수 있는 디렉터리 서비스입니다. Windows 세계에서 서버는 일반적으로 Active Directory입니다...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.