회적 약자를 위한 ‘위로의 글’ 추천 및 감정 공감형 AI 모델 개발을 위해 구축된 레이블링 데이터입니다. 2021년 ㈜튜플랙아이에이시스템에서 제작하였으며, 특정 상황에 적합한 위로 문구를 자동으로 매칭하거나 감정 대응형 챗봇에 활용할 수 있도록 구성되었습니다.
데이터는 인터넷에 게시된 공개 이미지 중 감정 상황을 적절히 표현할 수 있는 이미지를 선별하고, 해당 상황에 맞는 위로 문구를 수집하여 조합한 뒤 레이블링 과정을 통해 정제되었습니다. 이 과정에서 저작권 또는 초상권 문제가 발생할 수 있는 연예인·유명인 이미지 등은 제외하여 안전성을 확보하였습니다.
또한 단순 문구 매칭을 넘어 상황 이해 기반의 감정 공감을 가능하게 하기 위해, 상황 설명과 관련 질문·답변 쌍을 포함하는 TableMRC 방식의 질의응답 레이블링이 수행되었습니다. 이를 통해 모델이 상황의 의미를 해석하고 적절한 위로 표현을 선택할 수 있도록 학습이 가능해지는 것이 특징입니다.
데이터는 이미지와 텍스트 파일 세트로 구성되어 있으며, 총 19만 7,563건, 약 2.6GB 규모입니다. 각 데이터에는 위로 상황 설명, 위로 문구, 질문·응답 정보, 감정 상태를 표현하는 이미지가 포함되어 있습니다.
이 데이터는 심리 상담 챗봇, 감정 공감형 AI 모델 학습, 우울·불안 등 감정 상태에 따른 개인 맞춤형 위로 문구 추천 시스템, 감정 분석 기반 상황 대응형 음성/텍스트 응답 모델, 사회복지·상담센터·정신건강 서비스 자동 응답 시스템 개선 등 다양한 분야에서 활용 가능합니다. 예를 들어, ‘힘든 하루를 보낸 사람’이라는 상황에 대해 해당 감정에 어울리는 이미지와 “오늘 정말 수고했어요. 당신이 겪은 일은 절대 가벼운 게 아니에요.”와 같은 문구를 함께 학습시킬 수 있도록 구성되어 있습니다.