python pandas 병합 Sheet, 열 혼란 처리 및 Unnamed 열 발생 해결

python의pandas,xlrd,openpyxl 라이브러리를 사용하여 excel에서 지정한sheet를 통합하는 작업 완료

# -*- coding: UTF-8 -*- 
import xlrd
import pandas as pd
from pandas import DataFrame
from openpyxl import load_workbook

# 
excel_name = '1.xlsx'
#  workbook 
wb = xlrd.open_workbook(excel_name)
# sheets
sheets = wb.sheet_names()

#  sheet
newdata = DataFrame()
#in () sheet 
for i in (3,4,5):
  df = pd.read_excel(excel_name, sheet_name=(i-1), header = None,index_col=0,encoding='utf-8')
  newdata = newdata.append(df,ignore_index = False)
# sheet, sheet, sheet 
writer = pd.ExcelWriter('1.xlsx',engin='openpyxl')
book = load_workbook(writer.path)
writer.book = book
# dataframe.to_excel sheet, sheet newdata
newdata.to_excel(excel_writer=writer,sheet_name="newdata")
writer.save()
writer.close()
print(' !')
그 가운데

df = pd.read_excel(excel_name, sheet_name=(i-1), header = None,index_col=0,encoding='utf-8')
header = None을 지정해야 합니다. 그렇지 않으면 다음과 같은 warning이 나타납니다.
FutureWarning: Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.
그리고 생성된 새 sheet의 열은 혼란스럽고 Unnamed 열이 나타납니다.
추가: pandas에서 csv 파일을 읽고 쓸 때 Unnamed:0의 해결 방안이 나타납니다.
csv 파일을 읽을 때 기본값은 자동으로 새 열을 추가합니다. Unnamed:0

솔루션:


read_csv() 시 index_ 설정col=0이면 됩니다.
csv 파일을 쓸 때 기본값은 자동으로 새 열에 추가됩니다. Unnamed:0

솔루션:


to_csv () 에서 index=False를 설정합니다.아니면 index=True, index_label="id"
이상의 개인적인 경험으로 여러분께 참고가 되었으면 좋겠습니다. 또한 많은 응원 부탁드립니다.만약 잘못이 있거나 완전한 부분을 고려하지 않으신다면 아낌없이 가르침을 주시기 바랍니다.

좋은 웹페이지 즐겨찾기