مقدمه: تحلیل آماری انتخابات ریاست جمهوری 1403 ایران
انتخابات ریاست جمهوری 1403 ایران به پایان رسید و نتایج آن به سرعت در سراسر کشور و جهان منتشر شد. در هر انتخاباتی، به خصوص در کشوری با تاریخچهای پیچیده و حساس مانند ایران، تحلیل آماری نتایج انتخابات و بررسی صحت و دقت آنها از اهمیت ویژهای برخوردار است. انتخابات نه تنها یک فرآیند دموکراتیک برای تعیین سرنوشت سیاسی کشور است، بلکه بازتابی از میزان اعتماد عمومی به نهادهای دولتی و فرآیندهای انتخاباتی نیز میباشد.
در این مطلب، قصد داریم با رویکردی آماری به تحلیل نتایج انتخابات ریاست جمهوری 1403 بپردازیم. هدف اصلی ما این است که بررسی کنیم آیا آمار مشارکت ارائه شده توسط نهادهای رسمی قابل اعتماد است یا احتمال دستکاری و عددسازی در آن وجود دارد. برای رسیدن به این هدف، از روشهای مختلف تحلیل آماری استفاده خواهیم کرد تا به یک نتیجهگیری منطقی و مستدل برسیم.
منبع داده های ما گزارش منتشر شده در تسنیم نیوز و مقایسه دقیق آن با آمار های وزارت کشور و دیگر خبرگزاری ها بود. این داده ها را به فرمت اکسل میتوانید از این لینک دانلود کنید. با ما همراه باشید تا به تحلیل آماری نتایج انتخابات بپردازیم و با تحلیل دادهها و شواهد، تصویری واضحتر از واقعیت انتخابات اخیر ایران ارائه دهیم.
برای بررسی احتمال دستکاری و عددسازی در آمار انتخابات، میتوان به چندین جنبه و فاکتور توجه کرد:
بررسی ناهنجاریهای آماری
ناهنجاریهای عددی: یکی از روشهای ابتدایی بررسی تقلب، بررسی ناهنجاریهای آماری در دادهها است. برای مثال، اگر تعداد رأیهای یک نامزد در یک منطقه خاص بسیار بیشتر از سایر مناطق باشد و این تفاوت غیرمنطقی به نظر برسد، میتواند نشانهای از دستکاری باشد.
قوانین بنفورد: یکی از روشهای ریاضی برای بررسی تقلب در آمار، استفاده از قوانین بنفورد است. طبق این قوانین، توزیع ارقام در یک مجموعه دادههای بزرگ باید الگوی مشخصی داشته باشد. انحراف از این الگو میتواند نشانهای از دستکاری باشد.
مقایسه با دادههای گذشته
تاریخچه انتخابات قبلی: مقایسه نتایج این انتخابات با انتخاباتهای قبلی در همان مناطق میتواند نشاندهنده تغییرات غیرعادی باشد. تغییرات ناگهانی و غیرمنطقی در میزان حمایت از یک نامزد میتواند نشاندهنده دستکاری باشد. این مورد را زمانی که داده های کامل مستند و تفکیکی دوره دوم به دستمان رسید انجام می دهیم و گزارش را آپدیت میکنیم.
تحلیل دقیقتر دادهها
مقایسه نسبت آراء: بررسی نسبت آراء هر نامزد به تعداد کل آراء در هر استان و مقایسه آن با میانگین کشوری میتواند به شناسایی ناهنجاریها کمک کند.
تعداد آراء باطله: بررسی میزان آراء باطله در هر استان و مقایسه آن با میانگین کشوری و انتخاباتهای قبلی میتواند نشانههای از دستکاری را آشکار کند. این مورد را کمی جلوتر در این گزارش کاملا بررسی کرده ایم.
بررسی نرخ مشارکت: اگر نرخ مشارکت در برخی مناطق به طور غیرمعمولی بالا یا پایین باشد، میتواند نشانهای از دستکاری در آمار باشد. از آنجا که ما نتوانستیم داده ی قابل استناد یکپارچه ای در رابطه با نرخ مشارکت به تفکیک استان پیدا کنیم بررسی این مورد غیرممکن بود. اگر شما داده ای از یک منبع قابل استناد دارید به ما معرفی کنید.
تحلیلهای مستقل از داده
نظارتهای انتخاباتی: بررسی گزارشهای ناظران انتخاباتی و شکایات ثبتشده توسط نامزدها و احزاب میتواند به شناسایی دستکاریها کمک کند.
برای اینکه به طور دقیقتر بتوان به احتمال دستکاری یا عددسازی در این دادهها پی برد، باید به تحلیلهای آماری دقیقتری پرداخته و دادههای بیشتری را بررسی کرد.
تحلیل آماری نتایج انتخابات با استفاده از قانون بنفورد
برای بررسی اعداد داده شده با استفاده از قانون بنفورد، باید بررسی کنیم که توزیع رقمهای اول این اعداد چقدر با توزیع مورد انتظار بر اساس قانون بنفورد همخوانی دارد. قانون بنفورد بیان میکند که در بسیاری از مجموعههای دادههای واقعی، رقمهای اول با توزیع خاصی ظاهر میشوند.
برای مثال، طبق قانون بنفورد، رقم 1 به عنوان رقم اول باید در حدود 30.1٪ از موارد ظاهر شود، رقم 2 در حدود 17.6٪، و به همین ترتیب تا رقم 9 که باید در حدود 4.6٪ از موارد ظاهر شود.
ابتدا باید رقمهای اول همه اعداد را استخراج کرده و سپس فراوانی آنها را محاسبه کنیم. پس از آن، فراوانیهای بهدستآمده را با توزیع مورد انتظار بر اساس قانون بنفورد مقایسه خواهیم کرد.
مراحل:
استخراج رقم اول همه اعداد.
محاسبه فراوانی رقمهای اول.
مقایسه فراوانیهای بهدستآمده با توزیع بنفورد.
بیایید با استفاده از کد پایتون این تحلیل را انجام دهیم.
import numpy as np
import re
from collections import Counter
import matplotlib.pyplot as plt
# دادهها به صورت متن
data_text = """
1,067,087 7,033 244,369 57,382 1,375,871 26,237
...
# استخراج همه اعداد از متن
numbers = re.findall(r'\d+', data_text.replace(",", ""))
# استخراج رقمهای اول
first_digits = [int(num[0]) for num in numbers]
# محاسبه فراوانی رقمهای اول
digit_counts = Counter(first_digits)
# محاسبه توزیع بنفورد
benford_dist = [np.log10(1 + 1/d) for d in range(1, 10)]
# تعداد کل اعداد
total_numbers = len(first_digits)
# محاسبه فراوانی نسبی رقمهای اول
digit_freqs = [digit_counts[d] / total_numbers for d in range(1, 10)]
# رسم نمودار
digits = range(1, 10)
plt.figure(figsize=(10, 6))
plt.bar(digits, digit_freqs, alpha=0.6, label='Data')
plt.plot(digits, benford_dist, 'ro-', label='Benford\'s Law')
plt.xlabel('Digits')
plt.ylabel('Frequency')
plt.title('First Digit Distribution Comparison')
plt.xticks(digits)
plt.legend()
plt.grid(True)
plt.show()
# چاپ فراوانیهای نسبی رقمهای اول و توزیع بنفورد
digit_freqs, benford_dist
در نمودار، فراوانی نسبی رقمهای اول دادههای شما (ستونهای آبی) با توزیع بنفورد (خط قرمز) مقایسه شده است. به طور خلاصه:
رقم 1: در دادهها 31.77٪، و طبق قانون بنفورد 30.10٪
رقم 2: در دادهها 19.79٪، و طبق قانون بنفورد 17.61٪
رقم 3: در دادهها 11.98٪، و طبق قانون بنفورد 12.49٪
رقم 4: در دادهها 13.02٪، و طبق قانون بنفورد 9.69٪
رقم 5: در دادهها 6.77٪، و طبق قانون بنفورد 7.92٪
رقم 6: در دادهها 6.25٪، و طبق قانون بنفورد 6.69٪
رقم 7: در دادهها 4.17٪، و طبق قانون بنفورد 5.80٪
رقم 8: در دادهها 3.13٪، و طبق قانون بنفورد 5.12٪
رقم 9: در دادهها 3.13٪، و طبق قانون بنفورد 4.58٪
فراوانی نسبی رقمهای اول در دادههای شما با توزیع بنفورد تا حد زیادی همخوانی دارد، اما تفاوتهای جزئی نیز مشاهده میشود. تفاوتهای موجود ممکن است نشاندهنده عددسازی یا دستکاری دادهها نباشند و میتوانند به دلیل تنوع در دادههای واقعی باشند.
تحلیل آماری نتایج انتخابات روش میانگین آرای باطله
برای تعیین طبیعی بودن نسبت آرای باطله به کل آرا در یک انتخابات، باید چندین فاکتور مختلف را در نظر گرفت، از جمله تاریخچه انتخابات قبلی، شرایط سیاسی و اجتماعی، سطح آموزش و آگاهی رأیدهندگان، و شیوههای رایگیری. با این حال، برای ارائه یک دید کلی:
1. مقایسه با استانداردهای بینالمللی:
در بسیاری از کشورهای دموکراتیک، نسبت آرای باطله معمولاً بین 1 تا 3 درصد از کل آرا است. هرچند که این عدد میتواند بسته به شرایط خاص هر انتخابات و کشوری متفاوت باشد.
2. مقایسه با انتخاباتهای گذشته:
مقایسه این نسبت با انتخاباتهای گذشته در همان کشور میتواند نشاندهنده تغییرات و ناهنجاریها باشد. اگر این نسبت در مقایسه با انتخاباتهای قبلی به طور قابلتوجهی بالاتر یا پایینتر باشد، میتواند نشانهای از مسائل خاص در این انتخابات باشد.
3. تحلیل عوامل موثر:
کیفیت آموزش و آگاهی رأیدهندگان: در مناطقی که سطح آموزش و آگاهی عمومی بالاتر است، معمولاً نسبت آرای باطله کمتر است.
پیچیدگی فرآیند رایگیری: اگر فرآیند رایگیری پیچیده باشد یا مشکلات فنی وجود داشته باشد، ممکن است نسبت آرای باطله بیشتر باشد.
شرایط سیاسی: در شرایط خاص سیاسی مانند تحریم انتخابات توسط بخشی از جمعیت یا مشکلات در سازماندهی انتخابات، ممکن است نسبت آرای باطله افزایش یابد.
در انتخابات 1403 میانگین آرای باطله 3.9 درصد و با انحراف از معیار 1.18 می باشد. در استان های ترک زبان کشور کمترین درصد آرای باطله و استان کردستان بالاترین میزان آرای باطله با 8 درصد را داشته است. این رقم در مقایسه با نرخ 13 درصدی سال 1400 و 3 درصدی سال 96 کاملا مطابقت دارد. به این صورت که به دلیل نارضایتی سیاسی در سال 1400 نرخ آرای باطله بسیار بالا بود و نرخ سه درصدی سال 96 که نرخ مشارکت بسیار بالایی داشت هم تطابق دارد.
همچنین در آمار امسال هم استان کردستان که نارضایتی سیاسی بالاتری دارد نرخ آرای باطله زیاد و استان های ترک زبان که حامیان اصلی کاندید پیروز هستند نرخ آرای باطله ی کمی دارئ.
نتیجهگیری: بررسی علمی و تحلیل آماری نتایج انتخابات ریاست جمهوری 1403 ایران
پس از بررسی دقیق و همهجانبه و تحلیل آماری نتایج انتخابات 1403 ایران با استفاده از روشهای مختلف آماری و ریاضیاتی، به نتایجی قابل توجه دست یافتیم. تحلیلهای ما نشان میدهد که آمار مشارکت ارائه شده از سوی نهادهای رسمی با توجه به دادهها و شواهد موجود، از دقت بالایی برخوردار است و احتمال دستکاری و عددسازی به شکل عمده و گسترده رد میشود.
در پاسخ به کسانی که همچنان معتقدند آمار صحیح نیست و به احتمال دستکاری اشاره میکنند، باید گفت که نتایج ما نشان میدهد اگر هم چنین دستکاریای صورت گرفته باشد، به هیچ وجه ناشیانه و سادهلوحانه نبوده است. نمیتوان فرض کرد که حکومت به طور آشکارا آمار را ضربدر سه کرده یا به شکلی ناپخته دستکاری کرده باشد. بلکه اگر دستکاریای هم انجام شده، این کار به صورت بسیار دقیق و مهندسی شده بوده که در تحلیلهای ما قابل تشخیص نبوده است.
در نهایت، تحلیل ما بر پایه روشهای علمی و دقیق نشان میدهد که نتایج انتخابات به احتمال زیاد با واقعیت تطابق دارد و هر گونه ادعای خلاف آن نیاز به مدارک و شواهد قویتر و دقیقتر دارد.