• AI글쓰기 2.1 업데이트
PARTNER
검증된 파트너 제휴사 자료

A Probabilistic Visual Question Answering Model Based VQA

방대한 850만건의 자료 중 주제별로 만들수 있는 최적의 산출물을 해피 캠퍼스에서 체험 하세요 전문가의 지식과 인사이트를 활용하여 쉽고 폭넓게 이해하고 적용할수 있는 기회를 놓치지 마세요
9 페이지
어도비 PDF
최초등록일 2023.04.24 최종저작일 2022.09
9P 미리보기
A Probabilistic Visual Question Answering Model Based VQA
  • * 본 문서는 배포용으로 복사 및 편집이 불가합니다.

    미리보기

    서지정보

    · 발행기관 : 한국컴퓨터게임학회
    · 수록지 정보 : 한국컴퓨터게임학회 논문지 / 35권 / 3호
    · 저자명 : Manva Trivedi, Sabah Mohammed

    목차

    ABSTRACT
    1. Introduction
    2. Literature Review
    3. Research Methodology
    3.1 Visual Question Answering Model Prototype
    3.2 The Proposed Model
    3.3 Image pre-processing for feature engineering
    3.4 Understanding type of Questions
    3.5 Process Diagram – Proposed Model
    3.6 How does the probabilistic model work?
    4. Analysis and Evaluation
    4.1 Hyperparameter Tuning
    4.2 Model Layers
    4.3 Results
    5. Conclusion
    References
    국문초록
    결론 및 향후 연구

    초록

    시각적 데이터는 도처에 존재하며 자연어는 인간이 이해할 수 있는 의사소통 수단이다. VQA(Visual Question Answering)는 이미지를 이미지에 대한 입력과 질문으로 취하고 복잡한 추론을 사용하여 자연어 답변을 생성 하는 시스템이다. 따라서, VQA는 답을 예측하기 위해 이미지에 대한 자세한 이해와 복잡한 이유가 필요하 다. 멀티모달 구조와 가능한 실제 구현을 고려할 때, VQA는 인공지능에게 매우 중요한 과제이다. VQA를 위한 심층 신경망에 사용되는 아키텍처와 하이퍼 파라미터는 결과에 큰 영향을 미친다. 이 프로젝트는 이미 지 특징을 추출하기 위해 사전 훈련된 모델(VGGNet)과 단어를 내장하기 위해 Word2Vec를 도입하고 질문에 서 단어 특징을 얻기 위해 LSTM을 도입하고 결과를 결합한 후 가장 높은 확률을 가진 답을 예측한다.

    영어초록

    Visual data is present everywhere and natural language is a way of communication understandable to humans. Visual Question Answering (VQA) is a system which takes image as an input and a question about the image and generates a natural language answer using complex reasoning. Thus, a VQA needs detailed understanding of the image and complex reason to predict the answer. Given its multimodal structure and possible real-world implementations, VQA is a challenge of critical importance for artificial intelligence. The architectures and hyperparameters used in deep neural networks for VQA have a big impact on their results. This project introduces a pretrained model (VGGNet) to extract image features and Word2Vec to embed the words and LSTM to get word features from the question and after combining the results will predict the answer having highest probability.

    참고자료

    · 없음
  • 자료후기

      Ai 리뷰
      매번 새로운 인사이트를 제공해 주어 지식의 폭이 넓어지는 기분입니다. 지식판매자 덕분에 많은 것을 배우고 있습니다. 정말 추천하고 싶습니다!
    • 자주묻는질문의 답변을 확인해 주세요

      해피캠퍼스 FAQ 더보기

      꼭 알아주세요

      • 본 학술논문은 (주)코리아스칼라와 각 학회간에 저작권계약이 체결된 것으로 AgentSoft가 제공 하고 있습니다.
        본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
      • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
        파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
        파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

    “한국컴퓨터게임학회 논문지”의 다른 논문도 확인해 보세요!

    문서 초안을 생성해주는 EasyAI
    안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
    저는 아래와 같이 작업을 도와드립니다.
    - 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
    - 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
    - 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
    이런 주제들을 입력해 보세요.
    - 유아에게 적합한 문학작품의 기준과 특성
    - 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
    - 작별인사 독후감
    해캠 AI 챗봇과 대화하기
    챗봇으로 간편하게 상담해보세요.
    2026년 01월 26일 월요일
    AI 챗봇
    안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
    9:31 오전