এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।
লেখক:
(1) ঝিহাং রেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: peter.zhren@berkeley.edu);
(2) জেফারসন ওর্তেগা, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: jefferson_ortega@berkeley.edu);
(3) ইফান ওয়াং, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: wyf020803@berkeley.edu);
(4) ঝিমিন চেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: zhimin@berkeley.edu);
(5) Yunhui Guo, ডালাসে টেক্সাস বিশ্ববিদ্যালয় (ইমেল: yunhui.guo@utdallas.edu);
(6) স্টেলা এক্স ইউ, ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, বার্কলে এবং ইউনিভার্সিটি অফ মিশিগান, অ্যান আর্বার (ইমেল: stellayu@umich.edu);
(7) ডেভিড হুইটনি, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: dwhitney@berkeley.edu)।
লিঙ্কের টেবিল
- বিমূর্ত এবং ভূমিকা
- সম্পর্কিত Wok
- VEATIC ডেটাসেট
- পরীক্ষা-নিরীক্ষা
- আলোচনা
- উপসংহার
- উদ্দীপক সম্পর্কে আরও
- টীকা বিবরণ
- আউটলিয়ার প্রসেসিং
- ভিডিও জুড়ে বিষয় চুক্তি
- পরিচিতি এবং উপভোগ রেটিং এবং রেফারেন্স
10. ভিডিও জুড়ে বিষয় চুক্তি
VEATIC ডেটাসেটের একটি সুবিধা হল যে এটিতে প্রতিটি ভিডিওর জন্য একাধিক টীকা রয়েছে এবং যেকোনো ভিডিওর জন্য সর্বনিম্ন সংখ্যক 25 টি এবং সর্বাধিক 73 টি। আবেগের উপলব্ধি বিষয়ভিত্তিক এবং পর্যবেক্ষকদের রায় একাধিক ব্যক্তির মধ্যে পরিবর্তিত হতে পারে। পূর্বে প্রকাশিত অনেক ইমোশন ডেটাসেটে টীকাকারের সংখ্যা খুবই কম, প্রায়শই শুধুমাত্র একক সংখ্যা (n <10) সংখ্যক টীকা থাকে। পর্যবেক্ষকদের মধ্যে বর্ধিত বৈচিত্র্যের কারণে এত কম টীকা থাকা সমস্যাযুক্ত। এটি দেখানোর জন্য, আমরা গণনা করেছি কিভাবে আমাদের ডেটাসেটে প্রতিটি ভিডিওর গড় রেটিং পরিবর্তিত হয় যদি আমরা এলোমেলোভাবে নমুনা করে, প্রতিস্থাপন সহ, পাঁচটি বনাম সমস্ত টীকাকার। আমরা প্রতিটি ভিডিওর জন্য এই প্রক্রিয়াটি 1000 বার পুনরাবৃত্তি করেছি এবং পুনঃগণনা করা গড় রেটিংয়ের মানক বিচ্যুতি গণনা করেছি। চিত্র 12a দেখায় কিভাবে ভিডিও জুড়ে সম্মতি রেটিংয়ের মানক বিচ্যুতি পরিবর্তিত হয় যদি আমরা প্রতিটি ভিডিওর জন্য পাঁচটি বা সমস্ত টীকা ব্যবহার করি। এই বিশ্লেষণটি দেখায় যে আরও বেশি টীকা থাকার ফলে ঐকমত্য রেটিংয়ে অনেক ছোট স্ট্যান্ডার্ড বিচ্যুতি ঘটে যা ভিডিওগুলিতে গ্রাউন্ড ট্রুথ ইমোশনের আরও সঠিক উপস্থাপনা করতে পারে।
উপরন্তু, আমরা প্রতিটি ভিডিওর জন্য পর্যবেক্ষক জুড়ে মানক বিচ্যুতি গণনা করে ভিডিও জুড়ে পর্যবেক্ষকদের প্রতিক্রিয়াগুলি কীভাবে পরিবর্তিত হয়েছে তা তদন্ত করেছি। চিত্র 12b ভিডিও জুড়ে আদর্শ বিচ্যুতি দেখায়। আমরা দেখতে পাই যে ভ্যালেন্স এবং উত্তেজনা উভয় মাত্রার মানক বিচ্যুতি ছোট ছিল যেখানে ভ্যালেন্সের গড় প্রমিত বিচ্যুতি µ = 0.248 এবং একটি মধ্যক 0.222 এবং উত্তেজনার গড় মান বিচ্যুতি µ = 0.248 এবং 0.244 এর মধ্যম, যা তুলনাযোগ্য। ইমোটিক [৩২] থেকে ভ্যালেন্স এবং উত্তেজনা রেটিং বৈচিত্র সহ।
এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।