자연어 처리를 통한 학술논문 처리 방법
본 내용은
"
자연어 처리를 통한 학술논문 처리 (정보처리, 문헌정보학과)
"
의 원문 자료에서 일부 인용된 것입니다.
2023.11.14
문서 내 토픽
-
1. 자연어처리(NLP)자연어처리는 일상생활에서 사용되는 자연어를 기계가 이해할 수 있도록 처리하는 것으로, 컴퓨터가 자연어를 이해하고 출력하도록 하는 처리 과정을 의미한다. 본 연구에서는 Python의 KoNLPy 라이브러리를 활용하여 한글 형태소 분석을 수행했으며, 꼬꼬마, 한나눔, 코모란, Okt 등 다양한 형태소 분석기를 비교 검토하여 한나눔 형태소 분석기의 정확성이 가장 높다고 판단했다.
-
2. 웹 크롤링 및 텍스트 추출Google Colab 환경에서 BeautifulSoup 라이브러리를 이용하여 KCI 등재 논문 사이트의 HTML을 분석하고 초록 부분을 추출했다. 웹사이트의 소스코드를 확인하여 초록이 포함된 div class='innerBox open' 태그를 식별하고, find() 함수로 해당 요소를 추출한 후 get_text()를 통해 텍스트만 분리하여 한글과 영문 초록을 각각 처리했다.
-
3. 형태소 분석 및 불용어 처리형태소 분석기를 통해 추출한 명사들을 리스트 형태로 정렬하고, 조사, 접미사, 의미 없는 단어 등 불용어를 제거했다. '비대면'이 '비대'로 잘못 추출된 경우를 수정하고, '신뢰할 수 있는', '검증할 수 있는' 등에서 불필요한 '수'를 제거했으며, 검색어로서 의미가 없는 '논문', '마지막' 등을 삭제하여 최종 단어 목록을 완성했다.
-
4. 비대면 본인확인 기술연구 대상 논문은 '빅데이터 기반 비대면 본인확인 기술에 대한 연구'로, 코로나19로 인한 비대면 서비스 확대 시대에 온라인 금융서비스에서 사용자 인증의 중요성을 다룬다. 워드클라우드 분석 결과 '본인확인'(10회), '사용자'(7회), '검증'(6회), '비대면'(5회), '방법'(5회), '기술'(4회) 등이 주요 키워드로 도출되었으며, 논문의 핵심 주제는 사용자가 본인확인을 위해 검증하는 비대면 방법에 대한 기술임을 확인했다.
-
1. 자연어처리(NLP)자연어처리는 현대 인공지능의 핵심 기술로서 매우 중요한 분야입니다. 기계가 인간의 언어를 이해하고 처리할 수 있게 함으로써 챗봇, 기계번역, 감정분석 등 다양한 실용적 응용이 가능해졌습니다. 특히 트랜스포머 기반의 대규모 언어모델 등장으로 NLP의 성능이 비약적으로 향상되었습니다. 다만 언어의 문맥적 뉘앙스, 다의성, 문화적 차이 등을 완벽하게 처리하기 위해서는 지속적인 연구가 필요합니다. 또한 편향된 학습 데이터로 인한 윤리적 문제도 해결해야 할 과제입니다.
-
2. 웹 크롤링 및 텍스트 추출웹 크롤링과 텍스트 추출은 빅데이터 수집의 기초가 되는 중요한 기술입니다. 인터넷상의 방대한 정보를 자동으로 수집하고 정제할 수 있어 데이터 기반 의사결정을 가능하게 합니다. 그러나 저작권 침해, 개인정보 보호, 서버 부하 등의 법적·윤리적 문제가 존재합니다. 웹사이트의 이용약관을 준수하고 robots.txt를 존중하는 책임감 있는 크롤링이 필수적입니다. 또한 동적 웹페이지 처리, 구조화되지 않은 데이터 정제 등 기술적 난제도 계속 개선되어야 합니다.
-
3. 형태소 분석 및 불용어 처리형태소 분석과 불용어 처리는 자연어처리의 전처리 단계에서 매우 중요한 역할을 합니다. 문장을 의미 있는 최소 단위로 분해하고 불필요한 단어를 제거함으로써 후속 분석의 정확도를 높입니다. 특히 한국어는 교착어 특성상 형태소 분석이 필수적입니다. 다만 동음이의어, 신조어, 복합어 처리 등에서 여전히 도전과제가 있습니다. 또한 도메인별로 불용어 목록이 달라질 수 있어 상황에 맞는 유연한 처리가 필요합니다. 최근 딥러닝 기반 방식들이 성능을 개선하고 있습니다.
-
4. 비대면 본인확인 기술비대면 본인확인 기술은 디지털 시대에 보안과 편의성을 동시에 제공하는 중요한 기술입니다. 얼굴인식, 음성인식, 생체인식 등을 활용하여 원격에서도 신원을 확인할 수 있게 되었습니다. 금융거래, 행정서비스 등 다양한 분야에서 활용되고 있습니다. 그러나 개인정보 보호, 프라이버시 침해, 오인식 위험 등의 문제가 있습니다. 또한 딥페이크 등 악의적 기술로 인한 보안 위협도 증가하고 있습니다. 따라서 기술 개선과 함께 법적 규제, 윤리 기준 마련이 병행되어야 합니다.
-
5G, 6G, ChatGPT 시대에 내가 하고 싶은 창업1. ChatGPT 시대의 의의 ChatGPT는 단순한 질문에 대한 대답과 의사소통을 위한 도구일 뿐이지만, 인간과의 자유로운 대화를 가능하게 하는 기술이다. 이는 인간의 고유 영역이라고 여겨지던 의사소통 능력을 대체할 수 있는 기술로 주목받고 있다. 하지만 ChatGPT는 아직 학술적이고 깊이 있는 소통을 하기에는 부족한 면이 있으며, 전문가의 역할을 완...2025.01.07 · 정보통신/데이터
-
보어 설정에 대한 자신의 찬반 견해를 그 근거와 함께 밝히시오1. 보어의 정의와 역할 보어는 문장에서 주어와 서술어만으로는 완전한 의미 전달이 어려운 경우, 그 의미를 보충하여 문장을 완전하게 만드는 역할을 한다. 보어는 주로 명사, 형용사, 부사 등 다양한 형태로 존재하며, 문장의 의미를 풍부하게 만드는 데 기여한다. 2. 보어 설정에 대한 찬반 논란 보어 설정에 대한 논란은 주로 부사격 조사의 사용과 필수적 부사...2025.01.29 · 교육
-
GPT의 사용에 따른 문제점과 활용방안1. GPT(chatGPT)란? ChatGPT는 내 질문에 답변해 주는 인공지능 채팅 서비스이다. ChatGPT란 Chat Generative Pre-trained Transfomer의 약자로 오픈AI 사가 개발한 '대화 전문 인공지능 챗봇'이다. 기존 챗봇보다 상세하게 답변할 수 있는 능력 때문에 '사전 훈련 변환기', 또는 '초거대 AI'로도 불린다. ...2025.04.30 · 정보통신/데이터
-
AI 생성 영상과 현실의 경계 - 우리는 무엇을 믿어야 할까? 8페이지
1.1 연구 배경 및 목적최근 몇 년간 인공지능(AI) 기술의 발전은 디지털 콘텐츠 제작 방식에 큰 변화를 가져왔 다. 특히 AI 생성 영상은 딥러닝과 GAN(Generative Adversarial Network) 기술을 기반으 로 실제 인간과 거의 구분되지 않는 영상을 제작할 수 있게 되었다. SNS 플랫폼, 특히 쇼츠와 릴스에서 AI 영상이 빠르게 확산되면서, 일반 소비자들은 콘텐츠가 실제 사람에 의해 만들어졌는지 AI에 의해 생성되었는지를 구별하기 어려워지고 있다.이러한 변화는 단순한 기술적 흥미를 넘어, 소비자의 인식, 정...2025.08.29· 8페이지 -
[미래사회와 IT A+ 과제] 스마트폰 인공지능 활용 레포트 과제 8페이지
스마트폰활용과제학과학번이름목차개요Ai의 개념 및 유형주요 기능 및 특징 1)ai의 주요 기능 및 특징 2)ai의 이점과 단점인공지능 기술 활용 사례 1)인공지능 기술의 응용분야 2)인공지능과 스마트폰 활용 사례결론 및 느낀점참고문헌개요인공 지능(AI)은 기계나 컴퓨터가 인간의 정신 능력을 모방하는 능력이다. AI는 다양한 기술을 활용하여 기계가 계획, 행동, 이해, 학습, 감지하는 데 인간과 같은 지능을 갖출 수 있도록 합니다. AI 시스템은 환경을 인식하고, 사물을 인식하고, 의사 결정을 내리고, 문제를 해결하고, 경험을 통해 학...2025.08.27· 8페이지 -
특허와 기술개발 선행기술 조사 보고서 과제(인공지능 데이터마이닝) A+ 13페이지
12345 김 00 컴퓨터공학부 인공지능의 데이터마이닝 기술목차 0 1. 0 2. 0 3. 기술 분야 선정 이유 국내외 기술문헌 조사 한국특허 검색 및 분석01. 기술 분야 선정 이유 (1) 세상을 뜨겁게 달군 OpenAI 의 Chat-GPT 두 달 만에 월간 활성 사용자 수 (MAU) 1 억 명 돌파 인공지능이 우리의 삶에 빠르게 녹아들고 있다는 신호탄 ! 산업 전반에 큰 영향을 끼치는 AI, 어떤 기술이 이용될까 ? AI , 과연 좋은 점들만 있을까 ? 딥페이크로 인한 퍼블리시티권 침해 , 딥보이스 피싱 피해 사례 다수 해커들은...2024.02.11· 13페이지 -
개방형 발문과 폐쇄형 발문에 대한 자신의 생각을 서술하시오 3페이지
개방형 발문과 폐쇄형 발문에 대한 자신의 생각을 서술하시오? 본 문1. 서론개방형 발문과 폐쇄형 발문은 글의 전반적인 분위기와 구성, 논리 전개 등에 큰 영향을 미치는 중요한 요소 중 하나이다. 개방형 발문은 독자의 관심을 끌고 이목을 끌며, 글의 주제를 간략하게 소개하는 역할을 한다. 반면 폐쇄형 발문은 글의 내용을 간략하게 요약하고, 글의 주된 목적을 분명하게 제시하여 독자들의 이해를 돕는 역할을 한다. 개방형 발문은 감성적인 분위기를 형성하며, 독자들에게 긍정적인 인상을 주는 반면, 폐쇄형 발문은 명확하고 객관적인 분위기를 형...2023.12.27· 3페이지 -
보어 설정에 대한 자신의 찬반 견해를 그 근거와 함께 밝히시오. 9페이지
보어 설정에 대한 자신의 찬반 견해를 그 근거와 함께 밝히시오.Ⅰ. 서론현대 사회에서 언어는 인간 간의 소통을 원활하게 하는 중요한 도구로 자리매김하고 있다. 특히, 문장은 이러한 소통의 기본 단위로서 그 완결성과 명확성이 필수적이다. 그러나 최근 들어 문법 교육의 중요성이 상대적으로 저하되는 추세를 보이고 있으며, 이는 다양한 요인에 기인한 것으로 보인다. 디지털 매체의 발달과 글로벌화의 영향으로 간결하고 빠른 소통이 요구되면서, 전통적인 문법 교육의 필요성이 재평가되고 있는 상황이다. 이러한 맥락에서, 문법의 핵심 요소 중 하나...2024.12.17· 9페이지
