قانون اعداد کوچک: چرا مردها سروته یک کرباساند؟
قانون اعداد کوچک بحثی در علم آمار است که به بررسی اندازه نمونه آماری میپردازد. مثلا یک روستای کوچک را تصور کنید. بررسی نشان میدهد که هیچکس در این روستا سرطان ندارد. چرا؟ هوای سالم، غذای خوب، فعالیت بدنی کافی، دغدغههای کم و در کل سبک زندگی روستایی باعث شده که هیچکس در این روستا
قانون اعداد کوچک بحثی در علم آمار است که به بررسی اندازه نمونه آماری میپردازد. مثلا یک روستای کوچک را تصور کنید. بررسی نشان میدهد که هیچکس در این روستا سرطان ندارد. چرا؟ هوای سالم، غذای خوب، فعالیت بدنی کافی، دغدغههای کم و در کل سبک زندگی روستایی باعث شده که هیچکس در این روستا سرطان نگیرد!
یک روستا دیگر با جمعیت کوچک را بررسی میکنیم. در این روستا همه سرطان دارند. چرا؟ سطح پایین بهداشت، عدم دسترسی به خدمات درمانی، اطلاعات کم مردم روستا در مورد سرطان، ازدواج فامیلی، نگرانیهای زیاد بهخاطر فقر و اضطرابهای مرسوم زراعت و بهطورکلی سبک زندگی روستایی باعث شده که در این روستا همه سرطان بگیرند!
قطعا اشتباه میکنیم!
نتیجهگیری ما قطعا درست نیست. نمیتوانیم بگوییم که سبک زندگی روستایی هم دلیل ابتلا به بیماری است و هم دلیل عدم ابتلا به بیماری. اما ذهن ما دوست دارد دنبال علت بگردد.
اگر بگوییم یک تحقیق نشان میدهد که مردم روستایی اضطراب کمتری دارند، سریع به ترافیک، سروصدا و هزینههای زندگی در شهر فکر خواهیم کرد. اگر تحقیق نشان داده باشد که مردم روستا استرس بیشتری دارند بهسختی تامین آب کشاورزی، دشواری فروش محصول و نبود زیرساختها فکر میکنیم.
ذهن ما دوست دارد دنبال علت بگردد.
ما دوست داریم برای هر چیزی دلیل بیاوریم. حتی برای پدیدههای اتفاقی. مثلا در یک بازی فوتبال، شوت تیم سفید به تیرک میخورد و وارد دروازه میشود. شوت تیم سیاه به تیرک میخورد و به بیرون میرود. بازی با نتیجه یک بر صفر تمام میشود.
بعد از بازی کارشناسان ورزشی از عملکرد خوب مربی سفید و مشکلات تیم سیاه میگویند. درحالیکه شانس، خیلی بیشتر از استراتژیهای دو مربی در تعیین قهرمان اثر گذار بوده است.
آیا همهچیز دلیلی دارد؟
دانشمندان هم دچار همین خطا میشوند. آنها اول یک موضوع را بررسی میکنند و به یک رابطه میرسند. بعد از خود میپرسند چرا این اثر دیده میشود و سعی میکنند مشاهده خود را توجیه کنند.
اما اگر آزمایشهای بعدی نتیجه عکس را نشان دهد، حالا برای توجیه نتیجه عکس وقت میگذارند.
آلمانها فکر میکردند مناطقی که بمباران نمیشوند، محل سکونت جاسوسها هستند!
برای مثال یک بررسی نشان داد کسانی که رژیم دشوار میگیرند، بعد از پنجسال وزنی بیشتر از امروز دارند. این یک نتیجه آماری است. اما دانشمندان سعی میکنند موضوع را توضیح دهند. آیا رژیم سخت اثری بر روی هیپوفیز میگذارد؟
یک توجیه این است که کسانی رژیم سخت میگیرند، که در کنترل تغذیه خود مشکل دارند. یعنی شاید دلیل بالارفتن وزن رژیم سخت نباشد، بلکه رژیم سخت بهخاطر بالارفتن وزن گرفته میشود. اما اگر نتیجه این باشد که رژیم وزن را کم میکند، توجیه دیگری ارائه میدهیم.
روستایی که در آن همه…
روستاهای اعجابآور برای رسانهها جذابیت دارند. روستای شهرآباد که به روستای دوقلوها معروف است، روستای چهاربرج که تعداد نابیناهای آن زیاد است و دهها روستای دیگر که در آن عده زیادی از مردم یک صفت مشترک دارند. فقط کافی است عبارت «روستایی که در آن همه» را جستجو کنید.
زندگی در روستا تاثیری در ابتلا به بیماری ندارد، هرچند خیلیها دلیل صفت مشترک را در آب، هوا یا خاک روستا جستجو میکنند. دلیل اینکه صفتی عجیب در روستایی با جمعیت کم دیده میشود، جمعیت کم روستا است. موضوعی که به آن قانون اعداد کوچک میگوییم.
احتمال انتخاب توپها
در یک استخر بزرگ، هزار توپ قرمز و هزار توپ آبی میریزیم. از داخل استخر یک توپ بر میدارم. قطعا توپ یا قرمز است یا آبی. مثلا ممکن نیست توپ بنفش یا راهراه قرمز-آبی باشد.
این بار دو توپ بر میداریم. احتمال اینکه توپها همرنگ باشند (قرمز-قرمز و آبی-آبی) برابر احتمال همرنگ نبودن توپها (قرمز-آبی و آبی-قرمز) یعنی 50% است.
اگر سه توپ برداریم بهاحتمال 25% و اگر چهار توپ برداریم بهاحتمال 12.5% توپها همه یک رنگ خواهند شد. اما اگر از استخر 100 توپ برداریم، خیلی بعید است که تمام آنها همرنگ باشند.
هرقدر که اندازه نمونه آزمایشی کوچکتر باشد، احتمال اینکه حالتهای حدی پیش بیایند، بیشتر خواهد شد. یعنی در یک نمونه کوچک احتمال اینکه همه یک صفت مشترک داشته باشند زیاد است.
بازگشت به روستای شگفتانگیز
در ایران بیش از 60 هزار روستا وجود دارد. این روستاها جمعیت کمی دارند. به خاطر قانون اعداد کوچک احتمال اینکه یک وضعیت حدی در آنها مشاهده شود زیاد است. اگر یک آزمایش بیش از 60 هزار بار تکرار شود، یک رخداد با احتمال زیاد، بالاخره اتفاق میافتد.
دلیل اینکه هیچکس در روستای اول سرطان نداشت کمبودن جمعیت روستا است. دلیل سرطان داشتن ساکنین روستای دوم هم جمعیت کم آن است. نه اینکه جمعیت بر روی بیماری تاثیر بگذارد. جمعیت کم احتمالِ پیشامد یک حالت حدی آماری را بالا میبرد.
وقتی میگوییم همه آلمانیها این صفت را دارند، تمام مردم فنلاند آنطور هستند، همه برزیلیها، ژاپنیها یا چینیها… عملا داریم بهخاطر یک نمونه آماری خیلی محدود دچار خطای اعداد کوچک میشویم. با چند آلمانی آشنایی نزدیک داریم؟
یک نکته جالب اینجا است که تمام آدمهایی که از نزدیک میشناسید (حدود چندهزار نفر) برای نتیجهگیری و صدور حکم کلی، نمونهای کوچک بهحساب میآید. وقتی میگوییم تمام مردها، تمام زنها، تمام آدمهای تحصیلکرده و تمام کارمندان بانک یک صفت را دارا هستند، حتی اگر واقعا شواهد ما این ادعا را تایید کنند، قانون اعداد کوچک دلیل خطای ما است.
ریسک مطالعه در اعداد کوچک
در روانشناسی اثری به نام اثر لنگر وجود دارد. مثلا اگر بگوییم انیشتین در سنی کمتر از 142 سالگی از دنیا رفت، سن او در زمان مرگ چقدر بود؟ مخاطب به سنی بالا مثل 80 سال فکر میکند. اما اگر بگوییم شوپن بعد از 30 سالگی فوت کرد، سن او در موقع مرگ چقدر بود، به سنی کمتر مثل 60 فکر میکنیم.
اعداد 142 و 30 در ذهن ما لنگر میاندازند و حدسها را به سمت خود میکشند. اما ممکن است همین پرسش را از دوست خود بپرسید و ببینید ذهن او لنگر نمیاندازد. آیا اثر لنگر وجود ندارد؟
فرض کنید یک قاعده درست بین آدمها وجود دارد. مثلا فرض کنید دایره لغات خانمها وسیعتر از آقایان باشد. اگر جامعه آماری خود را کوچک در نظر بگیرید ممکن است به نتیجه عکس برسید. این اتفاق بارها در تاریخ علم رخ داده است.
درست است که بزرگ کردن نمونه هزینه پژوهش را زیاد میکند، اما گرفتن یک نمونه کوچک تمام هزینه را به باد میدهد و ما را به نتایج نادرست میرساند.
تغییر در اندازه نمونه
بین 10 هزار نفر نظرسنجی میکنیم و متوجه میشویم که 951 نفر از خدمات یک شرکت راضی هستند. چه میشود اگر بعد از نظرسنجی، 9 هزار نفر را حذف کنیم؟ 95.1% شرکتکنندگان در نظرسنجی از خدمات شرکت راضی بودهاند!
نتایج این نظرسنجی بهسادگی قابل مستندسازی و ارائه است. میتوانیم رای هر 951 نفر راضی را نشان بدهیم و دلایل تمام 49 ناراضی را بیان کنیم. اما خودمان میدانیم که تنها 9.5% مشتریها رضایت داشتهاند.
این اتفاق در دنیای واقعی بهکرات رخ میدهد. برای تبلیغ یک فیلم سینمایی یا موسسه آموزشی با مشتریهای راضی مصاحبه میکنند. قرار است مخاطب فکر کند که مشتریهای مجموعه از خدمات آن راضی هستند.
مثلا یک مجموعه آموزشی مصاحبه با رتبه یک کنکور را بهعنوان تبلیغ خود نشان میدهد. معنای این تبلیغ چیست؟ هر کس که به این موسسه بیاید رتبه یک میشود؟ در واقعیت یک نفر رتبه 1 شده، اما بیشتر مشتریهای مجموعه در کنکور قبول نشدهاند. اما موسسه این بخش از واقعیت را مخفی میکند.
دلیل برای رخدادهای تصادفی
ذهن ما بهقاعده علیت عادت دارد. برای همین دوست دارد برای هر پیشامدی یک علت پیدا کند. رخدادهای غیر علّی ترسناک و آزاردهنده هستند. چون هرلحظه ممکن است رخ بدهند و محاسبات ما را به هم بزنند.
اگر به من بگویید ترجیح میدهی همین الان سه سیلی بخوری، یا در زمانی نامشخص یک سیلی محکم دریافت کنی، سه سیلی پیشبینیپذیر را انتخاب میکنم. گاهی رنج نااطمینانی از زمان رخداد پیشامدی منفی، از خود پیشامد دردناکتر است.
رخدادهای غیر علّی ترسناک و آزاردهنده هستند.
این رفتار در تمام تاریخ و تمام جوامع دیده میشود. مصریان باستان دوست داشتند رفتارهای خوبی را که منجر به افزایش باران میشود پیشبینی کنند، مردم امروز آمریکا دوست دارند قیمت سهام را پیشبینی کنند.
در مصر باستان و نیویورک معاصر، دروغبافان و شیادان با نمونههای آماری کوچک مدعی میشوند که توان پیشبینی دارند. و مردم از این شیادی استقبال میکنند. چرا؟
سیستم 1 سیستم 2
در مقاله فکر کردن سریع و آهسته گفتیم که ما دو سیستم برای فکر کردن داریم. یک سیستم فکری انرژیبر، دردناک و سخت است (سیستمی که برای حل معادلات چند مجهولی به کار میرود) سیستم دیگر ساده، خودکار و بیتلاش است.
مردم ترجیح میدهند روی صندلی بنشینند یا بدوند؟ قطعا نشستن انرژی کمتری صرف میکند. برای همین آنها تمام طول راهروی مترو و پلهها را میدوند تا به یک صندلی خالی برای نشستن برسند.
فکر کردن فرایند انرژیبر و دردناکی است.
هر چیزی که فکر کردن از سیستم دشوار 2 را به سیستم 1 برساند، دلچسب است. فکر کردن مداوم بهاحتمال ریزش بازار . از دست دادن پول، درد دارد. اعتماد به یک پیشبینی بیاساس خیلی سادهتر است.
قبول کردن سریع یک گزاره اشتباه، سادهتر از فکر کردن برای رد آن است. برای همین اسیر مغالطه میشویم. قانون اعداد کوچک یکی از همین مغالطههای بیدرد و ساده است.
آیا بورس پیشبینیپذیر است؟
فرض کنید که تصادفی بودن تغییر قیمت سهام را کنار میگذاریم و باور میکنیم که واقعا الگویی پیشبینیپذیر در قیمت سهم وجود دارد که باید آن را کشف کرد.
کسانی که مدعی کشف الگو هستند باید بتوانند نبود وهم اعداد کوچک را توضیح دهند. اول، در طول یک روز چند معامله انجام شده است؟ دوم، چند روز معاملاتی برای تشخیص الگو بهکار رفته است؟ قبلا چند بار الگو تکرار شده که آن را بهعنوان یک قاعده بپذیریم؟
از طرف دیگر میتوانیم با تغییر اندازه نمونه، تحلیل خود را تغییر دهیم. مثلا ممکن است با در نظر گرفتن روند دو ماه به یک نتیجه برسیم و با چهار ماه به نتیجهای دیگر. به هر نتیجهای که بخواهیم برسیم، با دستکاری اندازه نمونه میتوانیم آن را محقق کنیم.
نظرات