تاریخچه علم آمار
بسیاری بر این باورند که یکی از بارزترین ویژگیهای تمدنهای باستانی، توانایی آنها در تولید آمار و کاربرد مؤثر اطلاعات حاصل از آنهاست. به عنوان مثال در بینالنهرین 4500 سال پیش از میلاد، تمدنهایی شکل گرفتند که از جمله نکات قابل توجه این تمدنها این است که در آنها سوابق فعالیتها و امور بر لوحههای گلی با شکلها و اندازههای مختلف به نحو پیشرفتهای ثبت و نگهداری میشد. این روش بایگانی دادهها، آمارها و اطلاعات بسیاری در مورد دریافتیها، هزینهها، موجودیها و غیره به دست میداد. در ایران باستان به خصوص در زمان هخامنشیان، شمار سربازان ارتش به وسیله پیکانهای هر یک از افراد نگاه داشته میشد. مخصوصا به هنگام جنگ، سربازانی که برای نبرد اعزام میشدند، هر یک پیکانی را در سبدهای مشخصی قرار میدادند. این سبدها بایگانی میشد و در پایان، هر یک از سربازان از جنگ بازگشته، تیری از درون سبدها برمیداشت. به این ترتیب تعداد دقیق کاهش نیروی ارتش مشخص شده و بر اساس آن برنامهریزیهای مختلفی صورت میگرفت.
بیش از 500 سال پیش، سرخپوستان اینکایی آمریکای جنوبی، سیستمهای نسبتا جامعی به وجود آوردند که از پایگاههای اطلاعاتی و مدلهای پردازش دادهها برخوردار بود و از هزاران رشته نخ گره خورده به نام کویپوس (Quipus) تشکیل میشد. این کویپوسها جمعیت یک روستا، عوارضی که به آن تعلق میگرفت، مقدار غله هر انبار، معاملات تجاری، سوابق جنگی و سایر وقایع تاریخی را نشان میدادند. اینکاها با آراستن گرهها و رنگهای گوناگون در نظمهای مختلف، ترکیبی از فرمولهای یاری دهنده حافظه و ارقام و اطلاعات توصیفی به وجود میآوردند.
در اواسط قرن هجدهم میلادی، نیاز به دادهها و آمارهای حاصل از آنها فزونی یافت. انقلاب صنعتی، لوازم اساسی تولید را از خانه به کارخانه انتقال داد. پیدایش تولیدکنندگان بزرگ به ایجاد صنایع خدماتی به منظور فروش و حمل و نقل فرآوردههای کارخانهها منجر شد. افزایش اندازه و پیچیدگی این سازمانهای تولیدی موجب شد کسی نتواند بدون استمداد از آمار و ارقام و وسایل پردازش دادهها، مدیریت این سازمانها را به عهده گیرد. در قرن بیست و یکم، نیاز به اطلاعات گستردهای که در دسترس گروههای مختلف و متنوعتری از کاربران این آمار و اطلاعات قرار گیرد، به مراتب بیشتر از گذشته است چرا که سرمایهگذاران در شرکتها درباره وضع مالی شرکت و دورنمای فعالیتهای آتی آن به آمارهای متنوعی نیاز دارند. همچنین سازمانهای و ادارات دولتی برای وضع مقررات به گزارشهایی نیاز دارند که بیان کننده وضعیت موجود و عملکرد آنها و جامعه باشند و... .
در این جا یادآوری تفاوت دادهها و اطلاعات برای خواننده گرامی، ضروری به نظر میرسد. دادهها شامل اعداد و ارقام، تصاویر، متون، اسناد و اصوات است. دادههایی که در قالبی مفید و با معنی شکل گرفته و در اختیار استفادهکنندگان قرار میگیرند تا از آنها برای تصمیمگیری و برنامهریزی استفاده شود نیز اطلاعات نام دارند. میتوان چنین نتیجه گرفت که تولید آمارهایی به صورت جداول و نمودارها، خود گونهای از تولید اطلاعات است چرا که دادهها را با روشهای مختلف خلاصه میسازد. اما این نکته را نیز نباید از نظر دور داشت که این مطلب، همه آمار نیست.
ریشه و تعریف آمار
در کتاب ریشههای لغت انگلیسی آکسفورد (The Oxford English etymology dictionary) آمار به صورت زیر تعریف میگردد:
کلمه آمار مشتق از واژه لاتینی status است و یکی از معانی state یا دولت است و در آغاز برای بیان واقعیتهای یک جامعه یا یک کشور در علوم سیاسی به کار گرفته شد ( قرن 18 میلادی).
کلمه آمار دارای معانی بسیاری است و در قالب یک اسم عام، عبارت از مجموعهای از دادههای عددی مانند آمار بیکاران، حوادث، بیمه شدگان، درآمدها، هزینهها و ... است. امروزه بیساری از مردم همچنان آمار را تنها به عنوان مجموعهای گیج کننده از اعداد و ارقام و جداولی میدانند که بیان کننده وضعیتهای گوناگون جمعیتی، اقتصادی، سیاسی و ... هستند. علم آمار در یکی، دو قرن گذشته، چنان تحول شگرفی پیدا کرده است که به عنوان مهمترین ابزار استدلالی مبتنی بر دادهها معرفی میشود. پیشرفتهای به دست آمده در علم آمار باعث تأیید و تثبیت بسیاری از نظریههای علوم دیگر شده که این نکته، خود به توسعه سایر علوم انجامیده است. همچنین نمایشهای عددی صرف به صورت جنبهای فردی از علم آمار در آمده است و تعداد بسیار محدودی از کارشناسان حرفهای آمار به فعالیتهای معمولی جدولبندی و رسم نمودارها اشتغال دارند. امروزه آمارشناسان از روشهای مختلف آماری بر استنتاج بر اساس مجموعهای از دادههای گردآوری شده و استخراج اطلاعات از آنها به صورت جداول، نمودارها، خلاصهسازی و تحلیلهای تخصصی بهره میگیرند.
آمار به عنوان یک اسم عام را میتوان به صورت زیر تعریف کرد: «آمار ابزاری برای خلاصه سازی وقایعی است که تحت تأثیر دلایل متنوعی رخ داده و به صورت عددی در سطح قابل قبولی از خطا بیان میشوند. دادههای این وقایع به روشی نظاممند و با هدفی مشخص و از پیش تعیین شده گردآوری شده در جداول و نمودارها با یکدیگر در ارتباط قرار داده می شوند.»
تعریف قبل، تمامی ویژگیهای آمار را در قالب صفات زیر بیان میکند:
1- خلاصهای از وقایع
2- تحت تأثیر چند علت
3- توصیف شده به صورت عددی
4- برآورده شده با سطح قابل قبولی از خطا
5- گردآوری شده با سطح قابل قبولی از خطا
6- گردآوری شده برای هدفی مشخص
7- مرتب شده در ارتباط با یکدیگر در جداول و نمودارها
آمار در قالب یک اسم خاص، به عنوان شاخهای از علم ریاضیات است که هدف آن توسعه روشهایی برای استنتاج بر اساس مجموعهای از دادهها گردآوری شده و استخراج اطلاعات از آنها به صورت جداول، نموداردها، خلاصه سازیها و تحلیلهای تخصصی است. روشهای متنوع به کار گرفته شده در این علم روشهای آماری (statistical methods) و کسانی که این روشها را به کار میبرند، آمارشناس نامیده میشوند.
در تعریف مدرن، علم آمار عبارت از «گردآوری، توصیف، تجزیه و تحلیل و تفسیر دادهها کمی و کیفی» است. روشهای آماری، مخصوصا هنگامی که تغییرپذیری در اندازهها و یا دادهها مشاهده میشود (در پدیدههای طبیعی و موجود در زندگی بشر) مفید بوده و به کار گرفته میشوند. شاید بتوان مهمترین وجه تمایز آمار و ریاضیات را در این نکته دانست که در ریاضیات، یک عدد (به عنوان مثال 100 تنها یک عدد است که میتوان با آن محاسبات ریاضی انجام داد، اما در آمار این عدد هویت مییابد؛ به این مفهوم که 100 در جایی عددی بزرگ و مهم است، ولی همین عدد در جایی دیگر مقداری ناچیز به شمار میرود. نکته دیگری که باید به ان توجه کرد، این است که در علم ریاضی صحبت از قطعیت است (اینکه همواره دو به علاوه دو برابر چهار میشود) اما در علم آمار بحث بر سر عدم قطعیتهاست، یعنی در علم آمار، دو علاوه دو لزوما برابر چهار نیست و در این علم آن را با درصدی از اطمینان، برابر چهار میدانند.
در تعریف مدرن، چهار مرحله زیر در علم آمار بیان میشود:
1- گردآوری دادهها
2- توصیف دادهها
3- تحلیل دادهها
4- تفسیر دادهها
شاید بتوان مرحله پنجمی را نیز برای علم در نظر گرفت. این مرحله میتواند به عنوان سازماندهی دادهها بیان میشود.
تکنیک و هدف آمار
با تمام تعاریف و زوایای مختلف موجود برای علم آمار، هدف این علم چیست؟ میتوان بیان کرد که: «هدف علم آمار توسعه و به کارگیری روشهایی برای استخراج اطلاعات مفید از دادهها و تجربیات است.» به علاوه، به دلیل نقش اساسی این علم در تحلیل دادهها لزوم به کارگیری داههای موثق و قابل اعتماد در این علم از اهمیت بالایی برخوردار است. پس یکی دیگر از اهداف این علم تعیین روشهای گردآوری مفیدی برای دادهها است. این روشهای گردآوری در قالب روشهای ثبتی، بررسیهای نمونهای، طراحی آزمایشها و ... طرح میشوند.
روشهای بررسی دادهها به دو روش آمار توصیفی(Descriptive statistics) و آمار تحلیلی (Inferential statistics)یا استنباطی انجام میشود. آمار توصیفی به بررسی های اکتشافی، نمایشی و خلاصهسازی دادهها میپردازد، بدون این که بر روی دادهها هیچ گونه مدلی را برازش دهد. این روش توصیف دادهها اولین گام در تحلیل دادههاست. در این مرحله به دلیل این که هیچ گونه مدلی برای دادهها فرض نشده است، هیچ گونه آزمون فرض یا برآورد قابل آزمونی نمیتواند به کار گرفته شود. اگر چه نباید این نکته را از نظر دور داشت که این مرحله در تحلیلهای آماری از اهمیت خاصی برخوردار است، چرا که میتواند آشکار کننده خصوصیات بسیار جالب و مهم دادهها باشد. آمار استنباطی گام بعدی تحلیل دادهها است و هدف آن، شناسایی مدل مناسبی برای دادههاست. پس از برازش مدل به دادهها، هدف برآورد بهینه پارامترهای مدل است. در نهایت اعتبار مدل با انجام آزمونهای مناسبی برای برآوردهای به دست آمده و فرضیات مدل مورد بررسی قرار میگیرد. در این مرحله نتایج به دست آمده از یک نمونه خاصی را میتوان به جامعه تعمیم داد.
چه زمانی از آمار استفاده میشود؟
* به منظور توصیف دادهها به مشکلی محدود و خلاصه. روشهای آماری در کلاسه بندی، گروهبندی و جدولبندی کردن دادههای خام اولیه به منظور پردازشها یا جدولبندیهای بیشتر به کار میروند.
* به منظور سادگی در بیان دادههای حجیم و پیچیده: برای رسیدن به این منظور دادهها به صورت جداول، نمودارها، گرافها و ... نمایش داده میشوند و یا با استفاده از شاخصهای تمرکز و پراکندگی بیان میگردند.
* برای مقایسه دو یا چند مجموعه از دادهها: جداول، اندازه میانگین و پراکندگیها در مقایسه مجموعههای مختلفی از دادهها به کار میروند.
* به منظور تصمیمگیری و برنامهریزی: از آمارها میتوان برای تصمیمگیری و شکلدادن سیاستهای کاری بهره گرفت. به عنوان مثال بر اساس آمارها میتوانند برای پیش بینی تقاضای بازار به کارگرفته شوند.
* برای اندازهگیری شدت و اندازه پدیدهها: مکان شمارش جمعیت یک کشور و رشد آن، رشد صنعتی، کشاورزی، سطح تحصیلات و ...با استفاده از آمار به دست میآید.
محدودیتهای آمار
* آمار راجع به پارامترهای جامعه است و بر اساس اندازههای به دست آمده از یک فرد جامعه بحث نمیکند. به دلیل این که آمار بر اساس آمارهای خلاصه شدهای از وقایع بحث میکند، در مطالعاتی که تنها بر روی یک عضو جامعه انجام میشوند، کاربردی ندارد. به عنوان مثال، حق بیمه پرداخت شده کارگری در یک شرکت خاص در یک زمان مشخص نمیتواند به عنوان مأخذ آماری قلمداد شود. حال آن که اگر حق بیمههای پرداخت شده از تمامی کارگران شرکت در یک زمان و یا زمانهای متوالی گردآوری شود به عنوان منبعی برای پردازشهای آماری به شمار خواهد رفت. همچنین نمره یک دانشجو در درس آمار، نمیتواند به عنوان شاخصی برای نمره آمار کلاس محسوب شود (در حقیقت میتواند، ولی شاخص خوب نیست) در صورتی که متوسط نمره تمامی افراد کلاس آمار میتواند به عنوان یک شاخص آماری بسیار خوب و مناسب برای نمره آمار کلاس در نظر گرفته شود.
* سازههای ذهنی کیفی مانند اخلاق، هوش و استعداد، زیبایی و غیره تنها در صورتی که کمی شوند میتوانند به عنوان آمارهایی برای پردازشهای آماری به کار گرفته شوند.
* نتایج آماری در یک قالب کلی صحیح هستند: نتیجهگیریهای به دست آمده بر اساس محاسبات آماری، برای تکتک افراد صادق نیستند. این نتایج تنها تحت شرایط خاصی صحیح میباشند.
* روشهای آماری بر اساس عدم قطعیت بنیان گذارده شدهاند. از این رو این روشهای آماری تنها زمانی که به دقت ریاضیات نیازی نیست و یا دستیابی به این دقت امکانپذیر نیست، به کار میروند.
پس از مطالعه و شناخت مفهوم آمار و علم آمار، مسایل مورد توجه در علم آمار و همچنین نقاط ضعف آن در ادامه به معرفی آمارشناسان و مسایلی که معمولاً به حل آنها میپردازند و حیطههای کاربردی آمار در سایر علوم پرداخته میشود.
آمار شناس کیست؟
آمار شناس کسی است که این سؤالات را مورد توجه قرار میدهد:
* چه دادههایی باید گردآوری شوند؟
* منابع چگونه میتوانند به شکل کاراتری برای گردآوری دادهها به کار روند؟
* چگونه میتواند یک مدل آماری را به دادههای گردآوری شده برازش داد؟
*چگونه میتوان دادهها را به گونهای ارایه کرد که ویژگیهای آنها را به خوبی بیان کند؟
* چه نتیجهای از دادهها باید استنتاج شود و میزان عدم قطعیت این نتیجه تا چه اندازه است؟
* بر اساس نتایج به دست آمده از دادههای گردآوری شده، چه فعالیتهایی باید صورت گیرد؟
پیش زمینه بسیار خوب از ریاضیات، به خصوص در ریاضی عمومی و نظریه احتمالات برای متخصصان علم آمار ضروری است؛ چرا که این روشهای ریاضی و احتمالی ابزاری برای مدلسازی آماری و حل مسایل است. با توجه به پیشرفتهای شگرف علم ریاضی در دهههای اخیر، به دلیل حضور و استفاده از رایانههای سریع و پرقدرت، امروزه، اشراف بر علم آمار و ریاضی به تنهایی برای آمارشناسان کافی نبوده و فراگیری کامپیوتر نیز برای این آمارشناسان از اهمیت بالایی برخوردار است. به علاوه، به دلیل این که امروزه هر یک از آمارشناسان به عنوان مشاور و دستیابی علمی محققین علوم مختلف فعالیت میکنند، باید دانش مناسبی از حیطه تخصصی که در آن به مشاوره میپردازند نیز داشته باشند.
کاربرد آمار در سایر علوم
آمار کاربردهای گوناگونی دارد و روز به روز هم بر کاربردهای آن افزوده میشود. برخی از علومی که آمار به صورت تخصصی در آنها نقش بازی میکند، عبارتند از :
* علوم بیمه:
تعیین نرخهای مرگ و میر، طراحی طرحهای بازنشستگی، اندازهگیری اثرات برنامههای مربوط به کنترل و پیشگیری از مخاطرات، تناسب و توازن منابع و مصارف و یا تعیین نرخ حق بیمههای مختلف و غیره.
*کشاورزی:
توسعه گونههای جدید و مقاومتری از غلات، افزایش تولید شیر و تخم مرغ ، ارزیابی اثرات و خطرات بالقوه سموم آفتهای گیاهی و حشرهکشهای و غیره.
* زیستشناسی:
مطالعه سیر تکامل، مدلبندی رشد، بررسی اثرات متقابل گونههای مختلف و محیط اطرافیانش و غیره.
* علوم رایانه:
ارزیابی الگوریتمها بر اساس مدلهای تصادفی، ارزیابی سیستمهای صف در مصارف کامپیوتری (به خصوص در خدمات مربوط به خطوط دیتا در انتقال اطلاعات و شبکههای کامپوتری)، استخراج اطلاعات از مجموعههای دادههای بزرگ و غیره.
* حسابداری و تجارت:
برآورد حجم خرده فروشی، طراحی سیستمهای کنترل مالی، تولید روشهای محاسباتی و حسابداری و غیره.
* اقتصاد:
اندازهگیری و محاسبه شاخصهای مختلف مانند تورم، حجم تجارت، حجم نیروی کار فعال، نیروی کار بالقوه، استانداردهای زندگی، برآوردهای کوتاه و بلندمدت از شاخصهای اقتصادی و غیره.
* مهندسی:
بهبود کیفیت محصولات و آزمون عملکرد آنها، برآورد اعتماد و سیستمها و اجزای آنها، طراحی الگوریتمهایی به منظور تشخیص و شناسایی خودکار و غیره.
* مالی:
مدلبندی و مدیریت مخاطرات مالی، ارزشگذاری و ...
*جنگلداری و منابع آبزیان:
برآورد جمعیت گونههای مختلف حیوانات و ماهیها، مدیریت و تخصیص منابع طبیعی و غیره.
*پزشکی و سلامت:
بررسی، تولید و توسعه داروهای جدید، ارزیابی و بهبود برنامههای پیشگیری و درمان سرطانها، تعیین عوامل ژنتیکی بیماریها و سرطانها، ارزیابی عوامل خطر محیطی برای بیماریهای مختلف و غیره.
*حقوق:
ارزیابی شواهد و مدارک.
*مدیریت:
نیازسنجیهای گوناگون در زمینه نیروی کار، آموزش، امکانات و تجهیزات، ارزیابی، بهرهوری، ارزیابی بازارهای مختلف، ارزیابی رضایت کارکنان، مشتریان و غیره.
* روانشناسی:
اندازهگیری تواناییهای آموزش، هوش و ویژگیهای شخصیتی، مطالعه رفتارهای نرمال و غیرنرمال و غیره.
* روانشناسی:
اندازهگیری تواناییهای آموزش، هوش و ویژگیهای شخصیتی، مطالعه رفتارهای نرمال و غیرنرمال و غیره.
* کنترل کیفیت: ارزیابی کیفیت با استفاده از نمونهگیری، کنترل فرآیندها، طراحی آزمایشها در توسعه محصولات و غیره.
* جامعه شناسی:
آزمون نظریههای مختلف درباره سیستمهای اجتماعی، طراحی و انجام بررسیهای نمونهای به منظور مطالعه عادت و رفتار اجتماعی، توصیف و تفسیر تفاوتهای بین فرهنگها و غیره.