반응형
3단계) 모델 학습 수행 ( Training )
전체 순서
- 데이터 수집
- 기존에 수집되어 있는 데이타가 없다면 수집을 하는 단계
- Python을 이용한 크롤러 만들기
- 데이터 전처리 (Data preprocessing)
- 특수문자, 단어 형태소 분석 등의 처리 등을 하는 단계
- 스페이스로 자르기 (어절 단위)
- 불용어 제거하기 (ex. stop > stopped > stopping)
- 어간 추출하기 (어간, 어미, 어근, 어절...)
- 문서 표현
- 모델 학습 수행 (Training)
- 데이타에 알고리즘 적용
- 학습결과 확인 및 평가
- 완료된 학습에 대한 결과를 평가하고 성능을 더 높이고 싶다면 전저리나 알고리즘을 변경하며 작업한다.
- 2~3단계를 수정하며 반복
'◼︎ 개발 > 뉴스 카테고리 추천 시스템 만들기' 카테고리의 다른 글
2단계) 데이터 전처리(Preprocessing 및 파이썬 자연어처리 라이브러리 정리) (1) | 2017.12.08 |
---|