pyspark 다운로드 설정 및 간단 한 사용

813 단어 빅 데이터
앞 에 쓰다
Windows 로 spark 를 배 울 때 pyspark 의 api 를 이용 하여 프로 그래 밍 을 하고 설치 와 구 덩이 를 밟 는 곳 을 기록 하 기 를 바 랍 니 다.
순서
1. jdk 8 설치
2. jdk 8 환경 변수 설정
3. 아 나 콘 다 설치
4. conda install - c conda - forge pyspark 라 는 말로 설치
네 번 째 단계 에 구덩이 가 있 습 니 다. conda install pyspark 로 설치 한 후에 spark 는 항상 일어나 지 못 합 니 다.
5. 간단 한 코드 예시
from pyspark import SparkConf, SparkContext

conf = SparkConf().setMaster("local").setAppName("my app")
sc = SparkContext(conf=conf)

#       ,      /
logFile = "file:///D:\learnSpark\my_file.txt"

logData = sc.textFile(logFile, 2).cache()

numAs = logData.filter(lambda line: 'a' in line).count()
numBs = logData.filter(lambda line: 'b' in line).count()
print("a: %d, b: %d"%(numAs, numBs))

보충 을 기다리다.

좋은 웹페이지 즐겨찾기