Multi-modal tasks I (Visual data & Text)
·
AI/이론
Multi-modal tasks I (Visual data & Text)¶ ✅ Multi-modal learning Overview¶ 큰 의미에서 Mult-modal learning이라는 것은 다양한 데이터 타입, 데이터 형태, 다양한 특성을 갖는 데이터를 사용하는 학습법을 의미한다. 서로 다른 데이터를 이용해서 학습을 하는 것이다. 1️⃣ Multi-modal learning의 어려움¶ 📌 데이터 표현 방법이 매우 다양하다.¶ 📌 feature spaces간 Unbalance하다.¶ 우리가 Text로 아보카도 모양의 의자를 찾아 달라고 할 때 이런 shape를 가지는 의자의 형태는 Image데이터에 대해서 많이 존재 한다. 1:N 매칭이다. 그 반대도 마찬가지이다. 📌 특정 modality에 편향된 M..