यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) झिहांग रेन, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: peter.zhren@berkeley.edu);
(2) जेफरसन ऑर्टेगा, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: jefferson_ortega@berkeley.edu);
(3) यिफान वांग, कैलिफोर्निया विश्वविद्यालय, बर्कले और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया (ईमेल: wyf020803@berkeley.edu);
(4) झिमिन चेन, कैलिफोर्निया विश्वविद्यालय, बर्कले (ईमेल: zhimin@berkeley.edu);
(5) युनहुई गुओ, यूनिवर्सिटी ऑफ टेक्सास एट डलास (ईमेल: yunhui.guo@utdallas.edu);
(6) स्टेला एक्स. यू, कैलिफोर्निया विश्वविद्यालय, बर्कले और मिशिगन विश्वविद्यालय, एन आर्बर (ईमेल: stellayu@umich.edu);
(7) डेविड व्हिटनी, कैलिफोर्निया विश्वविद्यालय, बर्कले (ईमेल: dwhitney@berkeley.edu).
लिंक की तालिका
- सार और परिचय
- संबंधित वोक
- VEATIC डेटासेट
- प्रयोगों
- बहस
- निष्कर्ष
- उत्तेजनाओं के बारे में अधिक जानकारी
- एनोटेशन विवरण
- आउटलाइअर प्रसंस्करण
- वीडियो में विषय सहमति
- परिचितता और आनंद रेटिंग और संदर्भ
10. वीडियो में विषय की सहमति
VEATIC डेटासेट का एक लाभ यह है कि इसमें प्रत्येक वीडियो के लिए कई एनोटेटर्स होते हैं, किसी भी वीडियो के लिए एनोटेटर्स की न्यूनतम संख्या 25 और अधिकतम 73 होती है। भावना की धारणा व्यक्तिपरक होती है और पर्यवेक्षकों का निर्णय कई लोगों में अलग-अलग हो सकता है। पहले प्रकाशित किए गए कई भावना डेटासेट्स में एनोटेटर्स की संख्या बहुत कम होती है, अक्सर एनोटेटर्स की संख्या केवल एकल अंक (n < 10) होती है। पर्यवेक्षकों में बढ़ती भिन्नता के कारण इतने कम एनोटेटर्स का होना समस्याग्रस्त है। इसे दिखाने के लिए, हमने गणना की कि हमारे डेटासेट में प्रत्येक वीडियो के लिए औसत रेटिंग कैसे भिन्न होती है यदि हम प्रतिस्थापन के साथ पांच बनाम सभी एनोटेटर्स का नमूना लेते हैं। हमने प्रत्येक वीडियो के लिए इस प्रक्रिया को 1000 बार दोहराया इस विश्लेषण से पता चलता है कि अधिक व्याख्याताओं के होने से सर्वसम्मति रेटिंग में मानक विचलन बहुत कम हो जाता है, जिससे वीडियो में वास्तविक भावना का अधिक सटीक प्रतिनिधित्व हो सकता है।
इसके अतिरिक्त, हमने प्रत्येक वीडियो के लिए पर्यवेक्षकों के बीच मानक विचलन की गणना करके जांच की कि वीडियो में पर्यवेक्षकों की प्रतिक्रियाएँ कैसे भिन्न होती हैं। चित्र 12बी वीडियो में मानक विचलन दिखाता है। हम पाते हैं कि वैलेंस और उत्तेजना दोनों आयामों के लिए मानक विचलन छोटे थे, वैलेंस का औसत मानक विचलन µ = 0.248 और माध्यिका 0.222 था और उत्तेजना का औसत मानक विचलन µ = 0.248 और माध्यिका 0.244 था, जो EMOTIC [32] से वैलेंस और उत्तेजना रेटिंग भिन्नता के साथ तुलनीय है।
यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।