아래와 같이 kkma 모듈을 활용하여 단어(명사) 분석을 하다가 오류가 발생했다. print(i)를 통해 오류가 발생한 위치도 확인했다.
for i in range(len(df['words'])):
title = df['words'][i]
morphemes = kkma.nouns(title)
morphemes = [word for word in morphemes if word not in stopwords]
all_keywords.append(morphemes)
print(i)
이 오류는 데이터에 \n가 포함되어 있을 때 나타날 수 있다. 따라서 str.replace 함수를 활용하여 \n, \t, \r와 같은 단어들을 공백으로 대치해주면 된다.
df['words'] = df['words'].str.replace('\n','').str.replace('\t','').str.replace('\r','')
728x90
반응형
'Data Analysis > Python' 카테고리의 다른 글
[Python] 토픽 모델링 (Topic Modeling) (2) | 2024.02.21 |
---|---|
[Python] 키워드 네트워크 분석 - 명사 분석, 동시 출현 빈도 분석, 키워드 네트워크 그래프 생성 (2) | 2024.02.19 |
[Python] Window 10에 konlpy 설치하는 방법 (0) | 2024.02.07 |
[Python] 파이썬으로 한글 Word cloud 만들기 (0) | 2024.02.06 |
[Python] 한글 자연어 처리하기, Kkma, konlpy, 문장 분석, 단어 분석, 형태소 분석 (1) | 2024.02.06 |