[python] Pandas에서 공백으로 구분 된 값으로 파일을 읽는 방법

파일을 팬더로 읽어 보려고합니다. 파일에는 공백으로 구분 된 값이 있지만 시도한 공백 수가 다릅니다.

pd.read_csv('file.csv', delimiter=' ')

하지만 작동하지 않습니다



답변

delim_whitespace=True인수를 추가하면 정규식보다 빠릅니다.


답변

정규식을 구분 기호로 사용할 수 있습니다.

pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")


답변

허용 된 답변을 사용하여 텍스트 구문 분석을 수행 할 수없는 경우 (예 : 텍스트 파일에 균일하지 않은 행이 포함 된 경우) Python의 csv 라이브러리를 사용해 볼 가치가 있습니다. 다음은 사용자 정의 Dialect 를 사용하는 예제입니다 .

 import csv

 csv.register_dialect('skip_space', skipinitialspace=True)
 with open(my_file, 'r') as f:
      reader=csv.reader(f , delimiter=' ', dialect='skip_space')
      for item in reader:
          print(item)


답변