قانون اعداد کوچک: چرا مردها سروته یک کرباس‌اند؟

قانون اعداد کوچک: چرا مردها سروته یک کرباس‌اند؟

قانون اعداد کوچک بحثی در علم آمار است که به بررسی اندازه نمونه آماری می‌پردازد. مثلا یک روستای کوچک را تصور کنید. بررسی نشان می‌دهد که هیچ‌کس در این روستا سرطان ندارد. چرا؟ هوای سالم، غذای خوب، فعالیت بدنی کافی، دغدغه‌های کم و در کل سبک زندگی روستایی باعث شده که هیچ‌کس در این روستا سرطان نگیرد!

یک روستا دیگر با جمعیت کوچک را بررسی می‌کنیم. در این روستا همه سرطان دارند. چرا؟ سطح پایین بهداشت، عدم دسترسی به خدمات درمانی، اطلاعات کم مردم روستا در مورد سرطان، ازدواج فامیلی، نگرانی‌های زیاد به‌خاطر فقر و اضطراب‌های مرسوم زراعت و به‌طورکلی سبک زندگی روستایی باعث شده که در این روستا همه سرطان بگیرند!

قطعا اشتباه می‌کنیم!

نتیجه‌گیری ما قطعا درست نیست. نمی‌توانیم بگوییم که سبک زندگی روستایی هم دلیل ابتلا به بیماری است و هم دلیل عدم ابتلا به بیماری. اما ذهن ما دوست دارد دنبال علت بگردد.

اگر بگوییم یک تحقیق نشان می‌دهد که مردم روستایی اضطراب کم‌تری دارند، سریع به ترافیک، سروصدا و هزینه‌های زندگی در شهر فکر خواهیم کرد. اگر تحقیق نشان داده باشد که مردم روستا استرس بیشتری دارند به‌سختی تامین آب کشاورزی، دشواری فروش محصول و نبود زیرساخت‌ها فکر می‌کنیم.

ذهن ما دوست دارد دنبال علت بگردد.

ما دوست داریم برای هر چیزی دلیل بیاوریم. حتی برای پدیده‌های اتفاقی. مثلا در یک بازی فوتبال، شوت تیم سفید به تیرک می‌خورد و وارد دروازه می‌شود. شوت تیم سیاه به تیرک می‌خورد و به بیرون می‌رود. بازی با نتیجه یک بر صفر تمام می‌شود.

بعد از بازی کارشناسان ورزشی از عملکرد خوب مربی سفید و مشکلات تیم سیاه می‌گویند. درحالی‌که شانس، خیلی بیشتر از استراتژی‌های دو مربی در تعیین قهرمان اثر گذار بوده است.

آیا همه‌چیز دلیلی دارد؟

دانشمندان هم دچار همین خطا می‌شوند. آن‌ها اول یک موضوع را بررسی می‌کنند و به یک رابطه می‌رسند. بعد از خود می‌پرسند چرا این اثر دیده می‌شود و سعی می‌کنند مشاهده خود را توجیه کنند.

اما اگر آزمایش‌های بعدی نتیجه عکس را نشان دهد، حالا برای توجیه نتیجه عکس وقت می‌گذارند.

اعداد کوچک تصادفی
آلمان‌ها فکر می‌کردند مناطقی که بمباران نمی‌شوند، محل سکونت جاسوس‌ها هستند!

برای مثال یک بررسی نشان داد کسانی که رژیم دشوار می‌گیرند، بعد از پنج‌سال وزنی بیشتر از امروز دارند. این یک نتیجه آماری است. اما دانشمندان سعی می‌کنند موضوع را توضیح دهند. آیا رژیم سخت اثری بر روی هیپوفیز می‌گذارد؟

یک توجیه این است که کسانی رژیم سخت می‌گیرند، که در کنترل تغذیه خود مشکل دارند. یعنی شاید دلیل بالارفتن وزن رژیم سخت نباشد، بلکه رژیم سخت به‌خاطر بالارفتن وزن گرفته می‌شود. اما اگر نتیجه این باشد که رژیم وزن را کم می‌کند، توجیه دیگری ارائه می‌دهیم.

روستایی که در آن همه…

روستاهای اعجاب‌آور برای رسانه‌ها جذابیت دارند. روستای شهرآباد که به روستای دوقلوها معروف است، روستای چهاربرج که تعداد نابیناهای آن زیاد است و ده‌ها روستای دیگر که در آن عده زیادی از مردم یک صفت مشترک دارند. فقط کافی است عبارت «روستایی که در آن همه» را جستجو کنید.

زندگی در روستا تاثیری در ابتلا به بیماری ندارد، هرچند خیلی‌ها دلیل صفت مشترک را در آب، هوا یا خاک روستا جستجو می‌کنند. دلیل این‌که صفتی عجیب در روستایی با جمعیت کم دیده می‌شود، جمعیت کم روستا است. موضوعی که به آن قانون اعداد کوچک می‌گوییم.

احتمال انتخاب توپ‌ها

در یک استخر بزرگ، هزار توپ قرمز و هزار توپ آبی می‌ریزیم. از داخل استخر یک توپ بر می‌دارم. قطعا توپ یا قرمز است یا آبی. مثلا ممکن نیست توپ بنفش یا راه‌راه قرمز-آبی باشد.

این بار دو توپ بر می‌داریم. احتمال این‌که توپ‌ها هم‌رنگ باشند (قرمز-قرمز و آبی-آبی) برابر احتمال همرنگ نبودن توپ‌ها (قرمز-آبی و آبی-قرمز) یعنی ۵۰% است.

اگر سه توپ برداریم به‌احتمال ۲۵% و اگر چهار توپ برداریم به‌احتمال ۱۲٫۵% توپ‌ها همه یک رنگ خواهند شد. اما اگر از استخر ۱۰۰ توپ برداریم، خیلی بعید است که تمام آن‌ها همرنگ باشند.

هرقدر که اندازه نمونه آزمایشی کوچک‌تر باشد، احتمال این‌که حالت‌های حدی پیش بیایند، بیشتر خواهد شد. یعنی در یک نمونه کوچک احتمال این‌که همه یک صفت مشترک داشته باشند زیاد است.

بازگشت به روستای شگفت‌انگیز

در ایران بیش از ۶۰ هزار روستا وجود دارد. این روستاها جمعیت کمی دارند. به خاطر قانون اعداد کوچک احتمال این‌که یک وضعیت حدی در آن‌ها مشاهده شود زیاد است. اگر یک آزمایش بیش از ۶۰ هزار بار تکرار شود، یک رخداد با احتمال زیاد، بالاخره اتفاق می‌افتد.

دلیل این‌که هیچ‌کس در روستای اول سرطان نداشت کم‌بودن جمعیت روستا است. دلیل سرطان داشتن ساکنین روستای دوم هم جمعیت کم آن است. نه این‌که جمعیت بر روی بیماری تاثیر بگذارد. جمعیت کم احتمالِ پیشامد یک حالت حدی آماری را بالا می‌برد.

وقتی می‌گوییم همه آلمانی‌ها این صفت را دارند، تمام مردم فنلاند آن‌طور هستند، همه برزیلی‌ها، ژاپنی‌ها یا چینی‌ها… عملا داریم به‌خاطر یک نمونه آماری خیلی محدود دچار خطای اعداد کوچک می‌شویم. با چند آلمانی آشنایی نزدیک داریم؟

یک نکته جالب اینجا است که تمام آدم‌هایی که از نزدیک می‌شناسید (حدود چندهزار نفر) برای نتیجه‌گیری و صدور حکم کلی، نمونه‌ای کوچک به‌حساب می‌آید. وقتی می‌گوییم تمام مردها، تمام زن‌ها، تمام آدم‌های تحصیل‌کرده و تمام کارمندان بانک یک صفت را دارا هستند، حتی اگر واقعا شواهد ما این ادعا را تایید کنند، قانون اعداد کوچک دلیل خطای ما است.

ریسک مطالعه در اعداد کوچک

در روانشناسی اثری به نام اثر لنگر وجود دارد. مثلا اگر بگوییم انیشتین در سنی کم‌تر از ۱۴۲ سالگی از دنیا رفت، سن او در زمان مرگ چقدر بود؟ مخاطب به سنی بالا مثل ۸۰ سال فکر می‌کند. اما اگر بگوییم شوپن بعد از ۳۰ سالگی فوت کرد، سن او در موقع مرگ چقدر بود، به سنی کم‌تر مثل ۶۰ فکر می‌کنیم.

اعداد ۱۴۲ و ۳۰ در ذهن ما لنگر می‌اندازند و حدس‌ها را به سمت خود می‌کشند. اما ممکن است همین پرسش را از دوست خود بپرسید و ببینید ذهن او لنگر نمی‌اندازد. آیا اثر لنگر وجود ندارد؟

فرض کنید یک قاعده درست بین آدم‌ها وجود دارد. مثلا فرض کنید دایره لغات خانم‌ها وسیع‌تر از آقایان باشد. اگر جامعه آماری خود را کوچک در نظر بگیرید ممکن است به نتیجه عکس برسید. این اتفاق بارها در تاریخ علم رخ داده است.

درست است که بزرگ کردن نمونه هزینه پژوهش را زیاد می‌کند، اما گرفتن یک نمونه کوچک تمام هزینه را به باد می‌دهد و ما را به نتایج نادرست می‌رساند.

تغییر در اندازه نمونه

بین ۱۰ هزار نفر نظرسنجی می‌کنیم و متوجه می‌شویم که ۹۵۱ نفر از خدمات یک شرکت راضی هستند. چه می‌شود اگر بعد از نظرسنجی، ۹ هزار نفر را حذف کنیم؟ ۹۵٫۱% شرکت‌کنندگان در نظرسنجی از خدمات شرکت راضی بوده‌اند!

نتایج این نظرسنجی به‌سادگی قابل مستندسازی و ارائه است. می‌توانیم رای هر ۹۵۱ نفر راضی را نشان بدهیم و دلایل تمام ۴۹ ناراضی را بیان کنیم. اما خودمان می‌دانیم که تنها ۹٫۵% مشتری‌ها رضایت داشته‌اند.

این اتفاق در دنیای واقعی به‌کرات رخ می‌دهد. برای تبلیغ یک فیلم سینمایی یا موسسه آموزشی با مشتری‌های راضی مصاحبه می‌کنند. قرار است مخاطب فکر کند که مشتری‌های مجموعه از خدمات آن راضی هستند.

مثلا یک مجموعه آموزشی مصاحبه با رتبه یک کنکور را به‌عنوان تبلیغ خود نشان می‌دهد. معنای این تبلیغ چیست؟ هر کس که به این موسسه بیاید رتبه یک می‌شود؟ در واقعیت یک نفر رتبه ۱ شده، اما بیشتر مشتری‌های مجموعه در کنکور قبول نشده‌اند. اما موسسه این بخش از واقعیت را مخفی می‌کند.

دلیل برای رخدادهای تصادفی

ذهن ما به‌قاعده علیت عادت دارد. برای همین دوست دارد برای هر پیشامدی یک علت پیدا کند. رخداد‌های غیر علّی ترسناک و آزاردهنده هستند. چون هرلحظه ممکن است رخ بدهند و محاسبات ما را به هم بزنند.

اگر به‌ من بگویید ترجیح می‌دهی همین الان سه سیلی بخوری، یا در زمانی نامشخص یک سیلی محکم دریافت کنی، سه سیلی پیش‌بینی‌پذیر را انتخاب می‌کنم. گاهی رنج نااطمینانی از زمان رخداد پیشامدی منفی، از خود پیشامد دردناک‌تر است.

رخداد‌های غیر علّی ترسناک و آزاردهنده هستند.

این رفتار در تمام تاریخ و تمام جوامع دیده می‌شود. مصریان باستان دوست داشتند رفتارهای خوبی را که منجر به افزایش باران می‌شود پیش‌بینی کنند، مردم امروز آمریکا دوست دارند قیمت سهام را پیش‌بینی کنند.

در مصر باستان و نیویورک معاصر، دروغ‌بافان و شیادان با نمونه‌های آماری کوچک مدعی می‌شوند که توان پیش‌بینی دارند. و مردم از این شیادی استقبال می‌کنند. چرا؟

سیستم ۱ سیستم ۲

در مقاله فکر کردن سریع و آهسته گفتیم که ما دو سیستم برای فکر کردن داریم. یک سیستم فکری انرژی‌بر، دردناک و سخت است (سیستمی که برای حل معادلات چند مجهولی به کار می‌رود) سیستم دیگر ساده، خودکار و بی‌تلاش است.

مردم ترجیح می‌دهند روی صندلی بنشینند یا بدوند؟ قطعا نشستن انرژی کم‌تری صرف می‌کند. برای همین آن‌ها تمام طول راهروی مترو و پله‌ها را می‌دوند تا به یک صندلی خالی برای نشستن برسند.

قانون اعداد کوچک
فکر کردن فرایند انرژی‌بر و دردناکی است.

هر چیزی که فکر کردن از سیستم دشوار ۲ را به سیستم ۱ برساند، دل‌چسب است. فکر کردن مداوم به‌احتمال ریزش بازار . از دست دادن پول، درد دارد. اعتماد به یک پیش‌بینی بی‌اساس خیلی ساده‌تر است.

قبول کردن سریع یک گزاره اشتباه، ساد‌ه‌تر از فکر کردن برای رد آن است. برای همین اسیر مغالطه می‌شویم. قانون اعداد کوچک یکی از همین مغالطه‌های بی‌درد و ساده است.

آیا بورس پیش‌بینی‌پذیر است؟

فرض کنید که تصادفی بودن تغییر قیمت سهام را کنار می‌گذاریم و باور می‌کنیم که واقعا الگویی پیش‌بینی‌پذیر در قیمت سهم وجود دارد که باید آن را کشف کرد.

کسانی که مدعی کشف الگو هستند باید بتوانند نبود وهم اعداد کوچک را توضیح دهند. اول، در طول یک روز چند معامله انجام شده است؟ دوم، چند روز معاملاتی برای تشخیص الگو به‌کار رفته‌ است؟ قبلا چند بار الگو تکرار شده که آن را به‌عنوان یک قاعده بپذیریم؟

از طرف دیگر می‌توانیم با تغییر اندازه نمونه، تحلیل خود را تغییر دهیم. مثلا ممکن است با در نظر گرفتن روند دو ماه به یک نتیجه برسیم و با چهار ماه به نتیجه‌ای دیگر. به هر نتیجه‌ای که بخواهیم برسیم، با دست‌کاری اندازه نمونه می‌توانیم آن را محقق کنیم.


این مطلب را به اشتراک بگذارید