본문 바로가기

전체 글36

형태소 분석기 (Kiwi와 Soynlp) Kiwi 형태소 분석기 정의 Kiwipiepy는 한국어 형태소 분석기인 Kiwi(Korean Intelligent Word Identifier)의 Python 모듈입니다. C++로 작성되었고 다른 패키지에 의존성이 없으므로 C++ 컴파일이 가능한 환경이라면 어디에서나 Kiwipiepy를 사용 가능합니다. 출처: 설치법 python pip install kiwipiepy 특징 멀티스레딩 지원 단순 analyze는 단일 스레드를 지원하기에 코드를 직접 짜야한다. 코퍼스로부터 미등록 단어 추출 가능 extract_word(reader, min_cnt= , max_word_len= , min_score= ) reader -> 호출 가능한(callable) 객체여야 한다? min_cnt -> 추출할 단어가 입력 .. 2020. 5. 7.
퍼셉트론 이 글은 [밑바닥부터 시작하는 딥러닝]을 읽고 정리한 글이다. 1. 퍼셉트론(Perceptron)이란? 퍼셉트론은 다수의 신호를 입력으로 받아 하나의 신호로 출력한다. 이 그래프에서 각 x는 입력 신호, y는 출력 신호, w는 가중치를 뜻한다. 그리고 그림의 원은 뉴런 혹은 노드라고 불린다. 입력 신호가 뉴런에 보내질 때는 각각 고유한 가중치가 곱해진다. 각 노드에서 보내온 신호의 총합이 정해진 한계를 넘을때만 1을 출력한다. 그 한계를 임계값이라고 한다. 2. 단순한 논리 회로 2.1 AND, NAND, OR 게이트 3. 다층 퍼셉트론 위에서 살펴본 3 가지 논리 회로는 모두 한 가지의 퍼셉트론만 사용해서도 구현이 가능하였다. 하지만 배타적 논리합인 XOR 게이트는 단일 퍼셉트론만으로 해결할 수 없다... 2020. 3. 24.
10. 회귀 분석으로 연속적 타깃 변수 예측 이 글은 [머신러닝 교과서 with 파이썬, 사이킷런, 텐서프로]를 읽고 정리한 글이다. 10.1 선형 회귀 선형 회귀란? 지도 학습의 하위 카테고리로 하나 이상의 특성과 연속적인 타깃 변수 사이의 관계를 모델링하는 것이 목적이다. 즉, 샘플 포인터에 가장 잘 맞는 직선을 찾는 것이다. 10.1.1 단변량 선형 회귀 (Univariate linear regression) 하나의 특성(설명 변수(explanatory variable) x)과 연속적인 타깃(응답 변수(response variable) y) 사이의 관계를 모델링 하는 것을 단변량 선형 회귀이다. 그림에서 각 주황 점은 샘플 포인트를 뜻하며, 샘플 포인트를 가장 잘 맞추어 통과하는 직선을 회귀 직선(regression line)이라고 한다. 회.. 2020. 3. 17.
새우 레몬 파스타 기존의 Shrimp Scampi pasta를 응용한 파스타이다 필요한 재료는 다음과 같다 (나만의 2인분 기준) 올리브 오일, 생새우 8마리, 마늘 6쪽, 스파게티면 2인분, 칠리후레이크, 소금, 후추, 파슬리, 파르메지아노 레지아노, 버터 15g, 레몬 반개, 청주(화이트와인) 50ml 레시피 1. 오븐 전용 판에 마늘을 다져서 올리브 오일과 칠리 후레이크를 골고루 뿌려준다. 2. 오븐 220도에 판을 넣고 예열을 해준다. 3. 새우 수염과 다리를 제거하고 머리를 몸통과 분리한 후 배를 기준으로 반을 갈라 손질한다. 4. 예열된 팬을 꺼내서 새우 머리와 몸통을 골고루 배치시킨다. 5. 레몬껍질을 갈아 골고루 뿌려주고 소금, 후추, 버터, 다진 파슬리도 골고루 뿌려준다. 6. 레몬 반개를 짜서 넣고 청주.. 2020. 3. 16.
01. 텍스트 전처리 - 원-핫 인코딩 www.wikidocs.net/book/2155 의 [딥 러닝을 이용한 자연어 처리 입문]을 공부하고 정리한 글입니다. 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 단어 집합(vocabulary) 단어 집합은 앞으로 자연어 처리에 있어서 자주 등장하는 개념이다. 단어 사전이라고도 칭하며 이 책에선 단어 집합이라는 정의를 사용하였다. 여기서의 단어 집합은 서로 다른 단어의 집합이다. 서로 다른 단어는 기본적으로 어근, 의미가 같아도 형태가 다른 단어이면 서로 다른 단어로 간주한다. 예컨대, book과 books는 의미는 같고 단순히 단수, 복수의 차이지만 단어 집합 내에서는 다른 단어로 간주하는 것이다. 이제 배울 원-핫 인코딩을 하기 위해서는 가장 먼저 해야할 일이 단어 집합.. 2020. 3. 14.
Konlpy 다운로드 및 오류 해결 법 1. Konlpy 다운로드 하기 pip install konlpy 여타의 다른 파이썬 라이브러리처럼 이렇게 쉽게 깔리면 얼마나 좋을까... 하지만 우리의 친절하지 못한 Konlpy께선 Java를 요구하기 때문에 따로 컴퓨터에 Java를 설치해 주어야한다. 1) JDK(Java) 설치하기 https://www.oracle.com/technetwork/java/javase/downloads/index.html Java SE - Downloads | Oracle Technology Network | Oracle Java API Documentation Updater Tool 1.3 Java API Documentation Updater Tool repairs-in-place Java API Documentat.. 2020. 3. 14.