맥락 정보를 이용한 시각 장면 이해

저작시기 2018.12 |등록일 2018.12.20 파일확장자어도비 PDF (pdf) | 8페이지 | 가격 6,000원
다운로드
장바구니관심자료
상세신규 배너

* 본 문서는 배포용으로 복사 및 편집이 불가합니다.

서지정보

발행기관 : 한국정보과학회 수록지정보 : 정보과학회논문지 / 45권 / 12호
저자명 : 신동협, 김인철

목차

요약
Abstract
1. 서론
2. 관련연구
3. 캡션 및 장면 그래프 생성 모델
4. 구현 및 실험
5. 결론
References

한국어 초록

본 논문에서는, 시각 장면 이해의 한 문제로서, 입력 영상들로부터 장면 그래프와 영상 캡션을 동시에 생성하는 문제를 다룬다. 장면 그래프는 영상 내 물체들과 그들 간의 관계들을 나타내는 정형 지식 표현이며, 영상 캡션은 주어진 영상에 담긴 장면을 서술하는 자연어 문장이다. 본 논문에서는 이러한 문제를 효과적으로 해결하기 위해, 맥락 정보를 서로 교환함으로써 서로 다른 두 가지 표현을 상호보완적으로 생성하는 새로운 심층 신경망 모델을 제안한다. 제안 모델은 물체 탐지, 관계 탐지, 캡션 생성 등 각기 다른 세 가지 계층들로 구성되며, 각 계층은 그 계층에 부여된 작업을 성공적으로 수행하기 위해 맥락정보를 적절히 활용한다. 제안 모델의 성능을 평가하기 위해, 대규모 벤치마크 데이터 집합인 Visual Genome을 이용한 다양한 실험들을 수행하였다. 이러한 실험들을 통해, 맥락 정보를 활용하는 제안 모델이 기존의 경쟁 모델들에 비해 높은 성능 향상이 있었음을 확인할 수 있었다.

영어 초록

In this paper, as a visual scene understanding problem, we address the problem of generating corresponding scene graphs and image captions from input images. While a scene graph is a formal knowledge representation expressing in-image objects and their relationships, an image caption is a natural language sentence describing the scene captured in the given image. To address the problem effectively, we propose a novel deep neural network model, CSUN(Context-based Scene Understanding Network), to generate two different representations in a complementary way, by exchanging useful contexts with each other. The proposed model consists of three different layers, such as object detection, relationship detection, and caption generation, each of which makes use of proper context to accomplish its own task. To evaluate performance of the proposed model, we conduct various experiments on a large-scale benchmark dataset, Visual Genome. Through these experiments, we demonstrate that our model using useful contexts, achieves significant improvements in accuracy over state-of-the-art models.

참고 자료

없음

구매평가

판매자에게 문의하기 최근 구매한 회원 학교정보 보기

ㆍ다운로드가 되지 않는 등 서비스 불편사항은 고객센터 1:1 문의하기를 이용해주세요.
ㆍ이 자료에 대해 궁금한 점을 판매자에게 직접 문의 하실 수 있습니다.
ㆍ상업성 광고글, 욕설, 비방글, 내용 없는 글 등은 운영 방침에 따라 예고 없이 삭제될 수 있습니다.

문의하기

판매자 정보

본 학술논문은 (주)누리미디어와 각 학회간에 저작권계약이 체결된 것으로 AgentSoft가 제공 하고 있습니다.
본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.

상세하단 배너
우수 콘텐츠 서비스 품질인증 획득
최근 본 자료더보기
상세우측 배너
맥락 정보를 이용한 시각 장면 이해
페이지
만족도 조사

페이지 사용에 불편하신 점이 있으십니까?

의견 보내기