텍스트 레코드를 NumPy로 변환하는 해결자

1661 단어 기계 학습
datingTestSet2.txt 파일에는 줄마다 4개의 데이터가 있는데, 앞의 3개는 대상 특징값이고, 네 번째는 대상 라벨이다.txt 데이터를numpy 그룹으로 변환하여 특징 값과 탭을 분리합니다.코드:
def file2matrix(filename):
    fr = open(filename)
    arrayOLines = fr.readlines() #     
    numberOfLines = len(arrayOLines) #  
    returnMat = zeros((numberOfLines, 3))  #    ,   
    classLabelVector = [] #   
    index = 0
    for line in arrayOLines:
        line = line.strip()   #        
        listFromLine = line.split('\t')  #       \t        
        returnMat[index,:] = listFromLine[0:3] # listFromLine        returnMat
        classLabelVector.append(int(listFromLine[-1])) #  listFromLine           classLabelVector   
        index += 1
    return returnMat, classLabelVector

#datingDatamat      ,datingLabels    
datingDataMat, datingLabels = file2matrix('datingTestSet2.txt')

좋은 웹페이지 즐겨찾기