328 পড়া
328 পড়া

VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তি

অতিদীর্ঘ; পড়তে

এই গবেষণাপত্রে, গবেষকরা মানব প্রভাবিত স্বীকৃতির জন্য VEATIC ডেটাসেট প্রবর্তন করেছেন, বিদ্যমান ডেটাসেটের সীমাবদ্ধতাগুলিকে মোকাবেলা করে, প্রসঙ্গ-ভিত্তিক অনুমান সক্ষম করে৷
featured image - VEATIC: ভিডিও-ভিত্তিক আবেগ এবং প্রসঙ্গ ডেটাসেটে ট্র্যাকিংকে প্রভাবিত করে: ভিডিও জুড়ে বিষয় চুক্তি
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ।

লেখক:

(1) ঝিহাং রেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: peter.zhren@berkeley.edu);

(2) জেফারসন ওর্তেগা, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: jefferson_ortega@berkeley.edu);

(3) ইফান ওয়াং, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন (ইমেল: wyf020803@berkeley.edu);

(4) ঝিমিন চেন, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: zhimin@berkeley.edu);

(5) Yunhui Guo, ডালাসে টেক্সাস বিশ্ববিদ্যালয় (ইমেল: yunhui.guo@utdallas.edu);

(6) স্টেলা এক্স ইউ, ইউনিভার্সিটি অফ ক্যালিফোর্নিয়া, বার্কলে এবং ইউনিভার্সিটি অফ মিশিগান, অ্যান আর্বার (ইমেল: stellayu@umich.edu);

(7) ডেভিড হুইটনি, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলে (ইমেল: dwhitney@berkeley.edu)।

লিঙ্কের টেবিল

10. ভিডিও জুড়ে বিষয় চুক্তি

VEATIC ডেটাসেটের একটি সুবিধা হল যে এটিতে প্রতিটি ভিডিওর জন্য একাধিক টীকা রয়েছে এবং যেকোনো ভিডিওর জন্য সর্বনিম্ন সংখ্যক 25 টি এবং সর্বাধিক 73 টি। আবেগের উপলব্ধি বিষয়ভিত্তিক এবং পর্যবেক্ষকদের রায় একাধিক ব্যক্তির মধ্যে পরিবর্তিত হতে পারে। পূর্বে প্রকাশিত অনেক ইমোশন ডেটাসেটে টীকাকারের সংখ্যা খুবই কম, প্রায়শই শুধুমাত্র একক সংখ্যা (n <10) সংখ্যক টীকা থাকে। পর্যবেক্ষকদের মধ্যে বর্ধিত বৈচিত্র্যের কারণে এত কম টীকা থাকা সমস্যাযুক্ত। এটি দেখানোর জন্য, আমরা গণনা করেছি কিভাবে আমাদের ডেটাসেটে প্রতিটি ভিডিওর গড় রেটিং পরিবর্তিত হয় যদি আমরা এলোমেলোভাবে নমুনা করে, প্রতিস্থাপন সহ, পাঁচটি বনাম সমস্ত টীকাকার। আমরা প্রতিটি ভিডিওর জন্য এই প্রক্রিয়াটি 1000 বার পুনরাবৃত্তি করেছি এবং পুনঃগণনা করা গড় রেটিংয়ের মানক বিচ্যুতি গণনা করেছি। চিত্র 12a দেখায় কিভাবে ভিডিও জুড়ে সম্মতি রেটিংয়ের মানক বিচ্যুতি পরিবর্তিত হয় যদি আমরা প্রতিটি ভিডিওর জন্য পাঁচটি বা সমস্ত টীকা ব্যবহার করি। এই বিশ্লেষণটি দেখায় যে আরও বেশি টীকা থাকার ফলে ঐকমত্য রেটিংয়ে অনেক ছোট স্ট্যান্ডার্ড বিচ্যুতি ঘটে যা ভিডিওগুলিতে গ্রাউন্ড ট্রুথ ইমোশনের আরও সঠিক উপস্থাপনা করতে পারে।


চিত্র 9. VEATIC-এ আরও নমুনা ভিডিও ফ্রেম। VEATIC-এর ভিডিও ক্লিপগুলিতে বিভিন্ন ব্যাকগ্রাউন্ড, আলোর অবস্থা, চরিত্রের মিথস্ক্রিয়া ইত্যাদি রয়েছে, যা এটিকে শুধুমাত্র আবেগ শনাক্তকরণের কাজই নয়, অন্যান্য ভিডিও বোঝার কাজগুলির জন্যও একটি ব্যাপক ডেটাসেট তৈরি করে।


চিত্র 10. VEATIC-এ অনির্বাচিত অক্ষর এবং বিশুদ্ধ পটভূমির নমুনা ভিডিও ফ্রেম। প্রতিটি সারির প্রথম নমুনা ফ্রেম নির্বাচিত অক্ষর দেখায়। বাকি নমুনা ফ্রেমগুলি হয় অনির্বাচিত অক্ষর বা বিশুদ্ধ পটভূমি।


উপরন্তু, আমরা প্রতিটি ভিডিওর জন্য পর্যবেক্ষক জুড়ে মানক বিচ্যুতি গণনা করে ভিডিও জুড়ে পর্যবেক্ষকদের প্রতিক্রিয়াগুলি কীভাবে পরিবর্তিত হয়েছে তা তদন্ত করেছি। চিত্র 12b ভিডিও জুড়ে আদর্শ বিচ্যুতি দেখায়। আমরা দেখতে পাই যে ভ্যালেন্স এবং উত্তেজনা উভয় মাত্রার মানক বিচ্যুতি ছোট ছিল যেখানে ভ্যালেন্সের গড় প্রমিত বিচ্যুতি µ = 0.248 এবং একটি মধ্যক 0.222 এবং উত্তেজনার গড় মান বিচ্যুতি µ = 0.248 এবং 0.244 এর মধ্যম, যা তুলনাযোগ্য। ইমোটিক [৩২] থেকে ভ্যালেন্স এবং উত্তেজনা রেটিং বৈচিত্র সহ।


এই কাগজটি CC 4.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks