سه شنبه ۲ بهمن ۱۴۰۳
يکشنبه ۳ آذر ۱۳۹۲ 6724 0 5

با این که ممکن است این مساله عجیب به نظر برسد، اما من زمانی دانشجوی آمار بوده ام.

علم آمار: ویرانی از درون؟!

با این که ممکن است این مساله عجیب به نظر برسد، اما من زمانی دانشجوی آمار بوده ام.پس از گذراندن همه درس های دوره کارشناسی آمار، من در یک درس دوره ارشد آمار ریاضیاتی در دانشگاه کلمبیا ثبت نام کردم که استاد برجسته آن هارولد هتلینگ، یکی از بنیادگذاران اقتصاد ریاضیاتی جدید بود.پس از شرکت در چند جلسه از کلاس هتلینگ، من دچار تجربه معرفتی خاصی شدم: فهم ناگهانی این نکته که استنتاج آماری بر فرضی قاطع استوار است و آن فرض اساسا پا در هوا است. من از کلاس هتلینگ بیرون آمدم و حتی از جهان آمار نیز برای همیشه خداحافظی کردم.
 
علم آمار، البته چیزی بس بیش تر از صرف مجموعه ای از داده ها است. «استنتاج» آماری، نتیجه گیری هایی است که می توان از آن داده ها بیرون کشید. به طور خاص، از آن جا که ما هرگز همه داده ها را نمی دانیم_از سرشماری های ده ساله ایالات متحده که بگذریم_، نتیجه گیری های ما باید بر مثال های بسیار کوچکی که از جمعیت بیرون کشیده می شود، استوار شود. پس از آن که مثال یا مثال هایمان را انتخاب کردیم، مجبوریم راهی بیابیم تا توضیحی راجع به کل جمعیت ارائه دهیم. مثلا فرض کنید ما بخواهیم نتیجه ای راجع به متوسط قد جمعیت مذکر آمریکا ارائه دهیم. از آنجا که ما نمی توانیم قد تمام مردان آمریکایی را اندازه بگیریم، نمونه ای با شمارگان کم انتخاب می کنیم، فرض کنید ۵۰۰ نفر که به روش های مختلف انتخاب شده اند و از طریق آنها تخمین می زنیم که متوسط قد مردان آمریکایی چقدر است.
 
در علم آمار، آنچه ما از طریق آن از نمونه های شناخته شده به جمعیت ناشناخته گذر می کنیم، یک فرض قاطع است: در همه جا چه ما با قد افراد طرف باشیم، چه مساله بیکاری باشد چه نتایج انتخابات، نمونه ها بر اساس «منحنی نرمال» پخش می شوند.
 
منحنی نرمال یک منحنی متقارن و زنگوله ای شکل است که در همه کتاب های درسی آمار آمده است. از آن جا که فرض شده است، همه نمونه ها طبق این منحنی دور نمودار جمعیت می ریزند، علم آمار خود را موجه می داند که با چند نمونه محدود مشخص کند مثلا میانگین قد آمریکایی ها، یا نرخ بیکاری یا هر چیز دیگری، دقیقا با «سطح دقت» ۹۰ تا ۹۵ درصد چیست. کوتاه سخن آنکه اگر برای مثال میانگین قد افراد ۱ متر و ۹۰سانت باشد، ۹۰ تا ۹۵ نفر از هر صد نفر، دقیقا قدی نزدیک به این اندازه خواهند داشت. این نمودارهای دقیق به سادگی از این فرض برآمده اند که همه نمونه ها بر اساس منحنی نرمال در اطراف جمعیت پخش شده اند.
 
این به دلیل خصوصیات منحنی نرمال است که مثلا ناظر انتخابات می تواند با اطمینان کافی مدعی شود بوش از سوی درصد خاصی از رای دهندگان حمایت شده بود و دوکاکیس با درصدی دیگر و همه این آمارها تنها «خطایی» سه تا پنج درصدی دارند. این منحنی نرمال است که به متخصصان آمار اجازه می دهد ادعای معرفت دقیق نسبت به کل نمودار جمعیتی نداشته باشند، اما به جایش ادعای چنان معرفتی در مورد درصد های پایین خطا کنند.
 
خب؛ چه شاهدی برای درستی فرض حیاتی پخش شدن پیرامون منحنی نرمال وجود دارد؟ هیچ شاهدی! این فرض، حاصل کنشی خالص و افسانه ای از سر امید است. در متون درسی آمار من، تنها «شاهد» صادق بودن منحنی نرمال این گزاره بود که اگر یک تیرانداز خوب، تیری را به قصد خوردن به هدف شلیک کند، گلوله ها در اطراف خال هدف به صورت شکلی شبیه به منحنی نرمال پخش می شوند. فرض حیاتی اعتبار همه استنتاج های آماری مبتنی بر چنین بنیاد سستی است.
 
متاسفانه، علوم اجتماعی نیز تمایل دارند قانونی را پیروی کنند مشابه چیزی که دکتر روبرت مندلسون نشان داد در پزشکی پذیرفته شده است: هیچ وقت هیچ رویه ای را فارغ از اینکه چقدر اشتباه است، فرو نگذارید تا اینکه رویه ای بهتر پیشنهاد شود و اکنون به نظر می رسد که ساختار کاملا غلط استنتاج مبتنی بر منحنی نرمال، تسلیم تکنولوژی پیشرفته شده است.
 
ده سال پیش، بردلی افرون، متخصص آمار دانشگاه استنفورد از کامپیوترهای پرسرعت برای تولید «مجموعه داده های مصنوعی» که مبتنی بر یک نمونه واقعی بودند، استفاده کرد و میلیون ها محاسبه عددی ضروری انجام داد تا به تخمینی در مورد جمعیت برسد بی آنکه از منحنی نرمال یا هر فرض ریاضیاتی دلخواه دیگری استفاده کند که مدعی هستند نمونه ها چطور پیرامون یک نمودار جمعیت پخش می شوند. پس از یک دهه بحث و جدل، متخصصان آمار روش های استفاده عملی از این «بوتستراپ» (Boot strap)[تکنیک استفاده از منابع موجود برای تولید چیزهایی پیچیده تر و موثرتر. م.] را پذیرفته اند و در حال حاضر این روش کل این حرفه را به تصرف خود در آورده است.
 
جروم اچ فریدمن، متخصص آمار دانشگاه استنفورد، یکی از پیشگامان روش جدید، آن را «مهم ترین اندیشه جدید در علم آمار طی بیست سال گذشته و شاید ۵۰ سال گذشته» می خواند. در این مرحله، متخصصین آمار در نهایت می خواهند اجازه دهند خروسی که دمش مشخص بود، رخ بنماید. فریدمن اکنون تصدیق می کند که «داده ها همیشه منحنی های زنگوله ای شکل را پیروی نمی کنند و وقتی چنین می شود، شما» با روش هایی که استاندارد است «دچار اشتباه می شوید.» در حقیقت او می افزاید «داده ها به طور متناوب به نحوی کاملا متفاوت از منحنی های زنگوله ای شکل پخش می شوند.» خب، مساله دقیقا همین است؛ حال ما دریافته ایم که پادشاه منحنی نرمال اصلا لباسی بر تن ندارد. امید افسانه ای پیشین اکنون می تواند کنار گذاشته شود.

آی هوش: گنجینه دانستنی ها و معماهای هوش و ریاضی

نظراتی که درج می شود، صرفا نظرات شخصی افراد است و لزوماً منعکس کننده دیدگاه های آی هوش نمی باشد.
آی هوش: مرجع مفاهیم هوش و ریاضی و انواع تست هوش، معمای ریاضی و معمای شطرنج
 
در زمینه‌ی انتشار نظرات مخاطبان، رعایت برخی موارد ضروری است:
 
-- لطفاً نظرات خود را با حروف فارسی تایپ کنید.
-- آی هوش مجاز به ویرایش ادبی نظرات مخاطبان است.
-- آی هوش از انتشار نظراتی که در آنها رعایت ادب نشده باشد معذور است.
-- نظرات پس از تأیید مدیر بخش مربوطه منتشر می‌شود.
 
 
 
 

نظر شما

پرطرفدارترین مطالب امروز

قواعد بخش پذیری بر اعداد  1 تا 20
زندگینامه ریاضیدانان: محمد خوارزمی
طنز ریاضی: لطیفه های ریاضی!
بررسی تعلیم و تربیت از دیدگاه جان دیوئی
زندگینامه ریاضیدانان: جان فوربز نش
ظرفیت حافظه کوتاه مدت چقدر است؟
زندگینامه بزرگان ریاضی: ابوریحان بیرونی
پالیندروم چیست؟
هوش سیّال در مقابل هوش متبلور