• 파일시티 이벤트
  • LF몰 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

A Probabilistic Visual Question Answering Model Based VQA

(주)코리아스칼라
최초 등록일
2023.04.24
최종 저작일
2022.09
9페이지/파일확장자 어도비 PDF
가격 4,000원 할인쿠폰받기
다운로드
장바구니

* 본 문서는 배포용으로 복사 및 편집이 불가합니다.

서지정보

발행기관 : 한국컴퓨터게임학회 수록지정보 : 한국컴퓨터게임학회 논문지 / 35권 / 3호
저자명 : Manva Trivedi, Sabah Mohammed

목차

ABSTRACT
1. Introduction
2. Literature Review
3. Research Methodology
3.1 Visual Question Answering Model Prototype
3.2 The Proposed Model
3.3 Image pre-processing for feature engineering
3.4 Understanding type of Questions
3.5 Process Diagram – Proposed Model
3.6 How does the probabilistic model work?
4. Analysis and Evaluation
4.1 Hyperparameter Tuning
4.2 Model Layers
4.3 Results
5. Conclusion
References
국문초록
결론 및 향후 연구

한국어 초록

시각적 데이터는 도처에 존재하며 자연어는 인간이 이해할 수 있는 의사소통 수단이다. VQA(Visual Question Answering)는 이미지를 이미지에 대한 입력과 질문으로 취하고 복잡한 추론을 사용하여 자연어 답변을 생성 하는 시스템이다. 따라서, VQA는 답을 예측하기 위해 이미지에 대한 자세한 이해와 복잡한 이유가 필요하 다. 멀티모달 구조와 가능한 실제 구현을 고려할 때, VQA는 인공지능에게 매우 중요한 과제이다. VQA를 위한 심층 신경망에 사용되는 아키텍처와 하이퍼 파라미터는 결과에 큰 영향을 미친다. 이 프로젝트는 이미 지 특징을 추출하기 위해 사전 훈련된 모델(VGGNet)과 단어를 내장하기 위해 Word2Vec를 도입하고 질문에 서 단어 특징을 얻기 위해 LSTM을 도입하고 결과를 결합한 후 가장 높은 확률을 가진 답을 예측한다.

영어 초록

Visual data is present everywhere and natural language is a way of communication understandable to humans. Visual Question Answering (VQA) is a system which takes image as an input and a question about the image and generates a natural language answer using complex reasoning. Thus, a VQA needs detailed understanding of the image and complex reason to predict the answer. Given its multimodal structure and possible real-world implementations, VQA is a challenge of critical importance for artificial intelligence. The architectures and hyperparameters used in deep neural networks for VQA have a big impact on their results. This project introduces a pretrained model (VGGNet) to extract image features and Word2Vec to embed the words and LSTM to get word features from the question and after combining the results will predict the answer having highest probability.

참고 자료

없음

자료문의

제휴사는 별도로 자료문의를 받지 않고 있습니다.

판매자 정보

코리아스칼라는 정직과 신뢰를 기반으로 학술단체 발전에 도움을 드리고자 하는 기업입니다. 본 사는 본 사가 자체 개발한 솔루션을 통하여 보다 효율적인 업무 관리 뿐만 아니라, 학술지의 데이터베이스화, ARCHIVE를 돕습니다. 본 사의 One Stop Service를 통해 국제적인 학술단체로 함께 도약 할 수 있다고 믿습니다.

주의사항

저작권 본 학술논문은 (주)코리아스칼라와 각 학회간에 저작권계약이 체결된 것으로 AgentSoft가 제공 하고 있습니다.
본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
A Probabilistic Visual Question Answering Model Based VQA
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업