Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- #Java
- 피보나치수열
- 비교연산자
- JAVA기초
- java
- 팩토리얼
- 이진수
- switch-case문
- 삼항 연산자
- 연산자
- #java_festival
- 변수의특징
- if문
- plusgame
- 2차원배열
- switch문
- for문 369게임
- 논리연산자
- else if문
- 로또 프로그램
- 복합대입연산자
- 별찍기
- 소인수분해
- 데이터타입
- 증감연산자
- #이차원배열
- java조건문
- #알고리즘
- #완전수구하기
- 알고리즘
Archives
- Today
- Total
숭어 개발 블로그
[머신러닝] 한글 Text Mining < konlpy_Okt / Kkma) 본문
konlpy_한글 Text Mining
- 한국어 정보처리를 위한 파이썬 패키지
- 한글 TextMining
- konlpy 설치
- konply에서 Okt 라이브러리 가져오기
- .nouns를 통해 명사만 추출
- .pos 를통해 품사를 확인
- Kkma 생성
- .morphs 를 통해 형태소 추출
CountVectorizer를 이용해 단어장 생성
- myTokenizer 함수를 만들어 Kkma(꼬꼬마)를 이용해 명사만 추출
- CountVectorizer(tokenizer = myTokenizer) 를 이용해 명사만 추출된 단어장을 볼 수 있다.
'Machine Learning > Text Mining' 카테고리의 다른 글
[머신러닝] 한글 Text Mining <네이버 영화 리뷰 데이터 다루기> (0) | 2022.09.23 |
---|---|
[머신러닝] 텍스트 마이닝 분석 프로세스 (0) | 2022.09.22 |
[머신러닝] Text Mining ? (0) | 2022.09.22 |
Comments