شنبه ۲۹ خرداد ۱۴۰۰ - ۰۸:۵۸

مروری بر تبِ داغ تحلیل‌های آماری انتخابات ریاست‌جمهوری در فضای مجازی

داده‌کاوی در خیابان پاستور

مرتضی رزمی

انتخابات

انتخابات ریاست‌جمهوری امسال هم تمام شد. این دوره با وجود تمام حاشیه‌های رسانه‌ای و تبلیغاتی خاص خود اما یک مورد متفاوت از دوره‌های قبل داشت.

بررسی‌های آماری، بیگ‌دیتا، توجه تطبیقی و نمودارهایی با این کلیدواژه‌ها که تلاش داشتند تا با نگاه آماری برنده انتخابات، میزان مشارکت و سایر شاخص‌ها را پیش‌بینی کنند. در انتخابات این دوره بیشتر از ۱۰ سازمان یا شرکت به سراغ تهیه این دست گزارش‌ها رفته‌اند و تلاش داشتند با استفاده از موج انتخابات برای خودشان مخاطب و حتی مشتری پیدا کنند. چه شد که این میزان بالا از پیش‌بینی‌های با اعداد و نمودار در رسانه‌ها و در بین مردم جا باز کردند و چه اشکال‌هایی دارند؟

سونامیِ رسانه‌های نامعتبر

شبکه‌های اجتماعی با وجود تمام مزیت‌هایی که داشتند، راه را برای انتشار و گسترده‌ شدن اخبار جعلی باز کردند. هر کسی به تنهایی یا با دوستانش می‌تواند رسانه‌ای تأسیس کند یا اخبار را منتشر کند و نیازی به آموزش رسانه‌ای و سواد رسانه‌ای و حرفه‌ای‌گری نمی‌بیند. در این محیط و شرایطی که شاید اعتماد سابق به صداوسیما در بین مردم نباشد، خلأ رسانه‌هایی که بتوانند بدون جهت‌گیری و بی‌طرفی، اخبار انتخاباتی را منتشر کنند، حس می‌شد. آمار و تحلیل داده‌ها در این خلأ توانستند خودی نشان بدهند و بخشی از خلأ اطلاع‌رسانی درست به مردم را پر کنند. تحلیل داده‌ها منبعی هستند که جهت‌گیری سیاسی افرادِ تولیدکننده محتوا کمتر می‌تواند تأثیرگذار باشد و از این جهت برای پر کردن جای رسانه‌های نامعتبر تا حدودی تأثیرگذار بودند.

موجِ بیگ‌دیتا در جهان

روی دیگر شبکه‌های اجتماعی و دیجیتالی شدن کارها، داشتن حجم بسیار بالایی از اطلاعات در مورد افراد و کاربران مختلف اینترنت در جهان است. این اطلاعات همزمان می‌تواند هم مؤثر و هم مخرب باشد. بخش مؤثر آن استفاده از دیتا برای ارائه خدمات بهتر توسط سازمان‌های دولتی و شرکت‌های خصوصی در جهان است. به همین دلیل موج استفاده از بیگ‌دیتا در جهان بسیار رشد کرده است. جست‌وجوی کلمه Big Data و کلمات هم‌خانواده در گوگل، در ۱۰ سال اخیر ۱۰ برابر شده است. همچنین در لینکدین، شبکه اجتماعی کسب‌وکار در جهان، رشد کارمندانی که با عنوان دانشمند داده (Data Scientist) فعالیت می‌کنند، در سال ۲۰۲۰ نسبت به سال ۲۰۱۲، ۶۵۰درصد افزایش داشته است. این در حالی است که عنوان شغلی دانشمند  داده تنها یک عنوان است و چندین عنوان دیگر در حوزه تحلیل بیگ‌دیتا وجود دارد. بنا به گزارش وب‌سایت glassdoor که در زمینه نیروی‌انسانی فعالیت می‌کند، در سال ۲۰۲۰ بیش از ۶هزار تقاضای شغلی برای حوزه تحلیل داده منتشر شده است. این عدد در سال ۲۰۱۶، یک‌هزارو۷۰۰ و در سال ۲۰۱۸، ۴هزارو۵۰۰ تقاضای شغلی بوده است.همچنین این وب‌سایت پیش‌بینی کرده تا سال ۲۰۲۶ بیش از ۱۱.۵میلیون شغل در این حوزه در جهان وجود داشته باشد.

کشور ما هم از این موج جدا نبوده و در سال‌های اخیر به ویژه از سال ۹۴، استفاده از آمار و ارقام و تشکیل تیم دیتا در استارت‌آپ‌ها و بانک‌ها رونق داشته است. طبیعی است که در این مواقع گزارش آماری از تمایل مردم به نامزدهای ریاست‌جمهوری نیز افزایش یابد.

نقاط ضعف گزارش‌ها

با توجه به نو بودن این حرکت طبیعی است که اشکال‌های فراوانی نیز وجود داشته باشد. نخستین اشکالی که به این گزارش‌ها وارد است، نداشتن شاخص‌های دقیق است و به همین دلیل آمارهایی که ارائه می‌شد تفاوت‌های فاحشی با یکدیگر داشتند. در روزهای پایانی هفته گذشته برخی از این گزارش‌ها آرای آقای رئیسی را ۴۴ درصد و برخی ۷۶درصد پیش‌بینی کرده بودند. این فاصله زیاد نشان‌دهنده نداشتن شاخص‌های دقیق است. این عامل نشان می‌دهد هنوز قدرت تحلیل متن توسط هوش مصنوعی در بسیاری از سامانه‌هایی که اطلاعات را استخراج می‌کنند، پایین است. علاوه بر این مورد، بیشتر گزارش‌ها براساس داده‌های شبکه‌های اجتماعی بودند. به جز برخی از مؤسسات مثل ایسپا که سال‌هاست فعالیت دارد و مبتنی بر تماس تلفنی است، سایر گزارش‌ها و نمودارهایی که دیدیم عمدتاً از شبکه‌های اجتماعی استخراج شد و این بسترها نمی‌توانند نشان‌دهنده واقعیت جامعه باشند. بسیاری از مردم در شبکه‌های اجتماعی نظرات سیاسی خود را ابراز نمی‌کنند و به همین دلیل شمرده نمی‌شود و از طرفی بسترهایی مانند توییتر به شدت سیاسی است و امکان حضور کاربران غیرفعال و روبات نیز زیاد است.

مشکل دیگری که در این گزارش‌ها بود تلاش نکردن این منتشرکنندگان در معرفی دقیق شاخص‌ها بود. یکی از مهم‌ترین شاخص‌هایی که بررسی شد، میزان توجه بود. این توجه با نام بردن از نامزد در یک توییت یا پست تلگرامی انجام می‌شود که هم می‌تواند در حمایت از نامزد و هم در نقد نامزد باشد. اگر به سراغ کامنت‌های زیر یکی از پست‌های آماری بروید احتمالاً با کاربرانی برخورد می‌کنید که فکر می‌کنند این توجه همان میزان رأی است. به همین دلیل گاهی ممکن است در بعضی از این آمارها توجه به آقای همتی بیشتر از آقای رئیسی بوده باشد اما بعید به نظر می‌رسد در هیچ بازه زمانی آرای آقای همتی بیشتر شده باشد. سایر شاخص‌ها هم مشابه با همین شاخص به خوبی به مردم معرفی نشد و روش استخراج و تحلیل داده‌ها نیز معرفی نشدند. بی‌توجهی به آگاه‌سازی مردم سبب می‌شود میزان استقبال از نگاه آماری که نگاه دقیق‌تری است، کاهش یابد. همچنین جامعه آماری محاسبه‌شده چندان بالا به نظر نمی‌رسید به ویژه که بیشتر گزارش‌ها درصدی بود که این عامل نشان می‌دهد صرفاً بخش کوچکی از مجموعه بزرگ اطلاعات را بررسی کرده‌اند و با درصد زدن، آن را به کل جامعه تعمیم داده‌اند که چندان کار درستی نمی‌تواند باشد.

در نهایت باید گفت نگاه آماری می‌تواند به کسانی که جهت‌گیری سیاسی شدیدی ندارند و تمایل دارند که با تحلیل بیشتری به مسائل سیاسی بپردازند، کمک‌کننده است. مشکلی که در جهت‌گیری رسانه‌ها وجود دارد در زمینه انتشار این گزارش‌ها هم خودش را نشان می‌داد. رسانه‌ها تمایل داشتند گزارش‌هایی را منتشر کنند که نامزد مدنظر خودشان را بهتر نشان دهند. اگر این مؤسسات منتشرکننده دست به دست هم بدهند و رسانه‌ای را مخصوص انتشار گزارش‌های آماری فراهم کنند می‌توانند این خلأ را نیز پر کنند.

ارسال نظر

شما در حال ارسال پاسخ به نظر « » می‌باشید.