본문 바로가기

자연어처리13

Korean RAG - with gemini 석사 코스워크 시절, 논문을 하나하나 읽고, 방대한 양의 전공서적을 하나하나 읽는 게 너무 힘들었던 기억이 있어서 이번에 RAG를 알게된 기념으로 PDF, Word, PPT 파일을 제공해주면 답을 해주는 웹사이트를 만들어봤다! 체험 사이트 링크 : https://korean-gemini-rag.streamlit.app/ 사용법 사실 사용법이라고 적을 것도 없다. UI 자체가 직관적으로 구성되어있고 뭐 큰 기능들도 없어서... 우선 가장 먼저 필요한건 gemini API 키 발급이다. 위 링크를 참고해서 API 키를 발급 받았으면 잘 복사해두었다가 아래 빨갛게 표시한 섹션에 붙여넣으면 된다. 그 후 빨간 섹션 위에 파일 업로드 섹션에 본인이 정보 추출에 사용할 파일을 입력하면 된다. 현재 다중 파일 입력을.. 2024. 1. 28.
Emotion Analysis (감정 분석) 1. 감정 분석(Emotion Analysis, EA)이란? 감정 분석은 감성 분석(Sentiment Analysis, SA)과 비슷하게 텍스트에 나타난 감정을 분석하는 자연어처리 태스크이다. 하지만 주로 긍,부정 혹은 긍정, 부정, 중립으로 분류되는 감성 분석과는 다르게 감정 분석은 텍스트에 나타난 더 세분화된 감정을 분석하는 것에 중점을 두고 있다. 감정에 관한 연구들은 심리, 사회, 철학 등 많은 분야에서 연구되어왔지만 언어적 표현의 관점에서 이루어진 연구는 매우 드물다. 감정은 Emotion, Affect, Mood 등의 용어로 사용되지만 학자들에 따라 위 용어들에 대한 정의가 다르다. Affect를 emotion, feeling, mood를 모두 포함하는 개념으로 정의하기도 하며 위 표현들을 모.. 2023. 12. 20.
감성 분석이란? 대학원 강의 과제로 작성했던 두 번째 개념 정리 파트이다 나쁘지 않으면 이런식으로라도 개념 정리 계속할 예정~~ 감성 분석(Sentiment Analysis)은 텍스트 데이터에서 특정 문장, 문서 또는 단어의 감정, 의견, 또는 감성을 식별하고 분류하는 자연어 처리 태스크 중 하나이다. 감성 분석이 이루어지는 층위는 문서(Document), 문장(Sentence), 속성(Aspect) 3가지 층위에서 이루어진다. 문서 층위(Document Level)의 감성 분석은 지도 학습에 기반한 감성 분류와 비지도 학습에 기반한 감성 분류가 존재한다. 지도 학습 방법론은 문서 내의 단어의 빈도와 역문서 빈도인 TF-IDF를 활용하여 임베딩을 하여 품사(Part Of Speech, POS)와 같은 언어 정보를 고려하.. 2023. 11. 16.
자연어처리란? 이번에 대학원 강의 과제로 강의에 나온 키워드 기반으로 배운 내용을 정리하라는 과제가 있었다. 학위논문을 쓰는 중이라 완전히 잊고 있다가 후다다닥 당일에 정리해서 끝내버렸는데 그대로 과제로만 내기에는 아까워서 블로그에 올려보려고 한다. 정리는 추후 찬찬히 하는 걸로 하고 우선 올려보겠다. 관점 자체는 문과 및 비전공자 대상으로 설명하는 내용이라고 생각하고 감안하고 읽어주면 정말 감사하겠다!!!!! 자연어처리(Natural Language Processing, NLP)는 컴퓨터가 인간의 언어인 자연어를 이해하고 처리하는 분야이다. 컴퓨터가 인간의 언어를 처리하기 위해선 다양한 방식이 존재한다. 첫 번째로, 언어학적인 접근 방식인 규칙 기반 접근법(rule-based approach)은 언어 현상을 이해하고.. 2023. 11. 16.