본문 바로가기

konlpy3

대규모 텍스트 분석을 위한 한국어 형태소 분석기의 실행 성능 비교 이 글은 논문 [대규모 텍스트 분석을 위한 한국어 형태소 분석기의 실행 성능 비교]를 읽고 정리한 글이다. 원혜진, 이현영, 강승식. (2020). 대규모 텍스트 분석을 위한 한국어 형태소 분석기의 실행 성능 비교. 한국정보과학회 학술발표논문집, (), 401-403. 대규모 텍스트 분석을 위한 한국어 형태소 분석기의 실행 성능 비교 - 한국정보과학회 학술발표논문집 - 한국정보과학회 : 논문 - DBpia, 연구를 돕는 똑똑한 학술콘텐츠 플랫폼 대규모 텍스트 분석을 위한 한국어 형태소 분석기의 실행 성능 비교 논문, 학술저널 검색 플랫폼 서비스 www.dbpia.co.kr 내가 멋대로 이해한 위 논문의 한 줄 요약! 대규모 텍스트인 KCC 원시 말뭉치를 사용해 형태소를 분석해 본 결과 KLT2010 형태.. 2021. 1. 25.
01. 텍스트 전처리 - 원-핫 인코딩 www.wikidocs.net/book/2155 의 [딥 러닝을 이용한 자연어 처리 입문]을 공부하고 정리한 글입니다. 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 단어 집합(vocabulary) 단어 집합은 앞으로 자연어 처리에 있어서 자주 등장하는 개념이다. 단어 사전이라고도 칭하며 이 책에선 단어 집합이라는 정의를 사용하였다. 여기서의 단어 집합은 서로 다른 단어의 집합이다. 서로 다른 단어는 기본적으로 어근, 의미가 같아도 형태가 다른 단어이면 서로 다른 단어로 간주한다. 예컨대, book과 books는 의미는 같고 단순히 단수, 복수의 차이지만 단어 집합 내에서는 다른 단어로 간주하는 것이다. 이제 배울 원-핫 인코딩을 하기 위해서는 가장 먼저 해야할 일이 단어 집합.. 2020. 3. 14.
Konlpy 다운로드 및 오류 해결 법 1. Konlpy 다운로드 하기 pip install konlpy 여타의 다른 파이썬 라이브러리처럼 이렇게 쉽게 깔리면 얼마나 좋을까... 하지만 우리의 친절하지 못한 Konlpy께선 Java를 요구하기 때문에 따로 컴퓨터에 Java를 설치해 주어야한다. 1) JDK(Java) 설치하기 https://www.oracle.com/technetwork/java/javase/downloads/index.html Java SE - Downloads | Oracle Technology Network | Oracle Java API Documentation Updater Tool 1.3 Java API Documentation Updater Tool repairs-in-place Java API Documentat.. 2020. 3. 14.