در اهمیت سرشماری و لزوم جمعآوری اطلاعات برای برنامهریزی و سیاستگذاری در سالهای آینده، در ماهها و روزهای گذشته در رسانهها، زیاد نوشته و گفته شده است.
محتوای این نوشتهها و برنامههای رسانهای، عمدتاً بر ترغیب مردم به همکاری با کارمندان سرشمار و کارگزاران مرکز آمار ایران در اجرای بیعیب و نقص سرشماری است و کمتر به مطلبی علمی در این ارتباط برمیخوریم.
به همین منظور و برای ارتقای دانش آماری مردم، مقاله حاضر را تقدیم خوانندگان محترم میکنیم. در این نوشته، سعی شده است اطلاعاتی تخصصی درباره آمار، آمارشناس و سرشماری ارائه شود.
تاریخچه علم آمار
بسیاری بر این باورند که یکی از بارزترین ویژگیهای تمدنهای باستانی، توانایی آنها در تولید آمار و کاربرد مؤثر اطلاعات حاصل از آنهاست.
به عنوان مثال در بینالنهرین4500سال پیش از میلاد، تمدنهایی شکل گرفتند که از جمله نکات قابل توجه این تمدنها این است که در آنها سوابق فعالیتها و امور بر لوحههای گلی با شکلها و اندازههای مختلف به نحو پیشرفتهای ثبت و نگهداری میشد.
این روش بایگانی دادهها، آمارها و اطلاعات بسیاری در مورد دریافتیها، هزینهها، موجودیها و غیره به دست میداد.
در ایران باستان به خصوص در زمان هخامنشیان، شمار سربازان ارتش به وسیله پیکانهای هر یک از افراد نگاه داشته میشد. مخصوصا به هنگام جنگ، سربازانی که برای نبرد اعزام میشدند، هریک پیکانی را در سبدهای مشخصی قرار میدادند.
این سبدها بایگانی میشد و در پایان، هر یک از سربازان از جنگ بازگشته، تیری ازدرون سبدها برمیداشت. به این ترتیب تعداد دقیق کاهش نیروی ارتش مشخص شده و بر اساس آن برنامهریزیهای مختلفی صورت میگرفت.
بیش از500 سال پیش، سرخپوستان اینکایی آمریکای جنوبی، سیستمهای نسبتا جامعی به وجود آوردند که از پایگاههای اطلاعاتی و مدلهای پردازش دادهها برخوردار بود و از هزاران رشته نخ گرهخورده به نام کویپوس(Quipus) تشکیل میشد.
این کویپوسها جمعیت یک روستا، عوارضی که به آن تعلق میگرفت، مقدار غله هر انبار، معاملات تجاری، سوابق جنگی و سایر وقایع تاریخی را نشان میدادند. اینکاها با آراستن گرهها و رنگهای گوناگون در نظمهای مختلف، ترکیبی از فرمولهای یاریدهنده حافظه و ارقام و اطلاعات توصیفی به وجود میآوردند.
در اواسط قرن هجدهم میلادی، نیاز به دادهها و آمارهای حاصل از آنها فزونی یافت. انقلاب صنعتی، لوازم اساسی تولید را از خانه به کارخانه انتقال داد. پیدایش تولیدکنندگان بزرگ به ایجاد صنایع خدماتی به منظور فروش و حمل و نقل فرآوردههای کارخانهها منجر شد. افزایش اندازه و پیچیدگی این سازمانهای تولیدی موجب شد کسی نتواند بدون استمداد از آمار و ارقام و وسایل پردازش دادهها، مدیریت این سازمانها را به عهده گیرد. در قرن بیستویکم، نیاز به اطلاعات گستردهای که در دسترس گروههای مختلف و متنوعتری از کاربران این آمار و اطلاعات قرار گیرد، به مراتب بیشتر از گذشته است چرا که سرمایهگذاران در شرکتها درباره وضع مالی شرکت و دورنمای فعالیتهای آتی آن به آمارهای متنوعی نیاز دارند. همچنین سازمانها و ادارات دولتی برای وضع مقررات به گزارشهایی نیاز دارند که بیانکننده وضعیت موجود و عملکرد آنها و جامعه باشند و... .
در اینجا یادآوری تفاوت دادهها و اطلاعات برای خواننده گرامی، ضروری به نظر میرسد. دادهها شامل اعداد و ارقام، تصاویر، متون، اسناد و اصوات است. دادههایی که در قالبی مفید و با معنی شکل گرفته و در اختیار استفادهکنندگان قرار میگیرند تا از آنها برای تصمیمگیری و برنامهریزی استفاده شود نیز اطلاعات نام دارند. میتوان چنین نتیجه گرفت که تولید آمارهایی به صورت جداول و نمودارها، خود گونهای از تولید اطلاعات است چرا که دادهها را با روشهای مختلف خلاصه میسازد. اما این نکته را نیز نباید از نظر دور داشت که این مطلب، همه آمار نیست.
ریشه و تعریف آمار
در کتاب ریشههای لغت انگلیسی آکسفورد
(The Oxford English etymology dictionary) آمار به صورت زیر تعریف میگردد:
کلمه آمار مشتق از واژه لاتینیstatus است و یکی از معانی آن State یا دولت است و در آغاز برای بیان واقعیتهای یک جامعه یا یک کشور در علوم سیاسی به کار گرفته شد(قرن18میلادی).
کلمه آمار دارای معانی بسیاری است و در قالب یک اسم عام، عبارت از مجموعهای از دادههای عددی مانند آمار بیکاران، حوادث، بیمهشدگان، درآمدها، هزینهها و... است. امروزه بسیاری از مردم همچنان آمار را تنها به عنوان مجموعهای گیجکننده از اعداد و ارقام و جداولی میدانند که بیانکننده وضعیتهای گوناگون جمعیتی، اقتصادی، سیاسی و... هستند. علم آمار در یکی،دو قرن گذشته، چنان تحول شگرفی پیدا کرده است که به عنوان مهمترین ابزار استدلالی مبتنی بر دادهها معرفی میشود. پیشرفتهای بهدستآمده در علم آمار باعث تأیید و تثبیت بسیاری از نظریههای علوم دیگر شده که این نکته، خود به توسعه سایر علوم انجامیده است. همچنین نمایشهای عددی صرف به صورت جنبهای فرعی از علم آمار درآمده است و تعداد بسیار محدودی از کارشناسان حرفهای آمار به فعالیتهای معمولی جدولبندی و رسم نمودارها اشتغال دارند. امروزه آمارشناسان از روشهای مختلف آماری برای استنتاج بر اساس مجموعهای از دادههای گردآوریشده و استخراج اطلاعات از آنها به صورت جداول، نمودارها، خلاصهسازیها و تحلیلهای تخصصی بهره میگیرند.
آمار به عنوان یک اسم عام را میتوان به صورت زیر تعریف کرد: «آمار ابزاری برای خلاصهسازی وقایعی است که تحت تأثیر دلایل متنوعی رخ داده و به صورت عددی در سطح قابل قبولی از خطا بیان میشوند. دادههای این وقایع به روشی نظاممند و با هدفی مشخص و ازپیشتعیینشده گردآوری شده و در جداول و نمودارها با یکدیگر در ارتباط قرار داده میشوند».
تعریف قبل، تمامی ویژگیهای آمار را در قالب صفات زیر بیان میکند:
1 - خلاصهای از وقایع
2 - تحت تأثیر چند علت
3 - توصیفشده به صورت عددی
4 - برآوردشده با سطح قابل قبولی از خطا
5 - گردآوریشده به روشی نظاممند
6 - گردآوریشده برای هدفی مشخص
7 - مرتبشده در ارتباط با یکدیگر در جداول و نمودارها
آمار در قالب یک اسم خاص، به عنوان شاخهای از علم ریاضیات است که هدف آن توسعه روشهایی برای استنتاج براساس مجموعهای از دادههای گردآوریشده و استخراج اطلاعات از آنها به صورت جداول، نمودارها، خلاصهسازیها و تحلیلهای تخصصی است. روشهای متنوع بهکارگرفتهشده در این علم روشهای آماری (statistical methods) و کسانی که این روشها را به کار میبرند، آمارشناس نامیده میشوند.
در تعریف مدرن، علم آمار عبارت از «گردآوری، توصیف، تجزیه و تحلیل و تفسیر دادههای کمی و کیفی» است. روشهاری آماری، مخصوصا هنگامی که تغییرپذیری در اندازهها یا دادهها مشاهده میشود(در پدیدههای طبیعی و موجود در زندگی بشر) مفید بوده و به کار گرفته میشوند. شاید بتوان مهمترین وجه تمایز آمار و ریاضیات را در این نکته دانست که در ریاضیات، یک عدد(به عنوان مثال 100) تنها یک عدد است که میتوان با آن محاسبات ریاضی انجام داد، اما در آمار این عدد هویت مییابد؛ به این مفهوم که 100 در جایی عددی بزرگ و مهم است، ولی همین عدد در جایی دیگر مقداری ناچیز به شمار میرود. نکته دیگری که باید به آن توجه کرد، این است که در علم ریاضی صحبت از قطعیت است( اینکه همواره دو به علاوه دو برابر چهار میشود) اما در علم آمار بحث بر سر عدم قطعیتهاست، یعنی در علم آمار، دو به علاوه دو لزوما برابر چهار نیست و در این علم آن را با درصدی از اطمینان، برابر چهار میدانند.
در تعریف مدرن، چهار مرحله زیر در علم آمار بیان میشود:
1 - گردآوری دادهها
2 - توصیف دادهها
3 - تحلیل دادهها
4 - تفسیر دادهها
شاید بتوان مرحله پنجمی را نیز برای این علم در نظر گرفت. این مرحله میتواند به عنوان سازماندهی دادهها بیان شود.
تکنیک و هدف آمار
با تمام تعاریف و زوایای مختلف موجود برای علم آمار، هدف این علم چیست؟ میتوان بیان کرد که: «هدف علم آمار توسعه و بهکارگیری روشهایی برای استخراج اطلاعات مفید از دادهها و تجربیات است.» بهعلاوه، به دلیل نقش اساسی این علم در تحلیل دادهها، لزوم بهکارگیری دادههای موثق و قابل اعتماد در این علم از اهمیت بالایی برخوردار است. پس یکی دیگر از اهداف این علم تعیین روشهای گردآوری مفیدی برای دادهها است. این روشهای گردآوری در قالب روشهای ثبتی، بررسیهای نمونهای، طراحی آزمایشها و... طرح میشوند.
روشهای بررسی دادهها به دو روش آمار توصیفی (Descriptive Statistics) و آمار تحلیلی یا استنباطی (Inferential Statistics) انجام میشود. آمار توصیفی به بررسیهای اکتشافی، نمایشی و خلاصهسازی دادهها میپردازد، بدون اینکه بر روی دادهها هیچگونه مدلی را برازش دهد. این روش توصیف دادهها اولین گام در تحلیل دادههاست. در این مرحله به دلیل اینکه هیچگونه مدلی برای دادهها فرض نشده است، هیچگونه آزمون فرض یا برآورد قابل آزمونی نمیتواند بهکار گرفته شود. اگرچه نباید این نکته را از نظر دور داشت که این مرحله در تحلیلهای آماری از اهمیت خاصی برخوردار است، چرا که میتواند آشکارکننده خصوصیات بسیار جالب و مهم دادهها باشد. آمار استنباطی گام بعدی تحلیل دادهها است و هدف آن، شناسایی مدل مناسبی برای دادههاست. پس از برازش مدل به دادهها، هدف برآورد بهینه پارامترهای مدل است. در نهایت اعتبار مدل با انجام آزمونهای مناسبی برای برآوردهای بهدست آمده و فرضیات مدل مورد بررسی قرار میگیرد. در این مرحله نتایج بهدست آمده از یک نمونه خاص را میتوان به جامعه تعمیم داد.
چه زمانی از آمار استفاده میشود؟
* به منظور توصیف دادهها به شکلی محدود و خلاصه: روشهای آماری در کلاسهبندی، گروهبندی و جدولبندی کردن دادههای خام اولیه به منظور پردازشها یا جدولبندیهای بیشتر بهکار میروند.
* به منظور سادگی در بیان دادههای حجیم و پیچیده: برای رسیدن به این منظور دادهها به صورت جداول، نمودارها، گرافها و... نمایش داده میشوند و یا با استفاده از شاخصهای تمرکز و پراکندگی بیان میگردند.
* برای مقایسه دو یا چند مجموعه از دادهها: جداول، اندازه میانگین و پراکندگیها در مقایسه مجموعههای مختلفی از دادهها بهکار میروند.
* به منظور تصمیمگیری و برنامهریزی: از آمارها میتوان برای تصمیمگیری و شکل دادن سیاستهای کاری بهره گرفت. به عنوان مثال بر اساس آمارها میتوانند برای پیشبینی تقاضای بازار بهکار گرفته شوند.
* برای اندازهگیری شدت و اندازه پدیدهها: امکان شمارش جمعیت یک کشور و رشد آن، رشد صنعتی، کشاورزی، سطح تحصیلات و... با استفاده از آمار بهدست میآید.
محدودیتهای آمار
* آمار راجع به پارامترهای جامعه است و بر اساس اندازههای بهدست آمده از یک فرد جامعه بحث نمیکند. به دلیل اینکه آمار بر اساس آمارهای خلاصه شدهای از وقایع بحث میکند، در مطالعاتی که تنها بر روی یک عضو جامعه انجام میشوند، کاربردی ندارد. به عنوان مثال، حق بیمه پرداخت شده کارگری در یک شرکت خاص در یک زمان مشخص نمیتواند به عنوان مأخذ آماری قلمداد شود. حال آنکه اگر حق بیمههای پرداخت شده از تمامی کارگران شرکت در یک زمان و یا زمانهای متوالی گردآوری شود بهعنوان منبعی برای پردازشهای آماری بهشمار خواهد رفت. همچنین نمره یک دانشجو در درس آمار، نمیتواند به عنوان شاخصی برای نمره آمار کلاس محسوب شود (در حقیقت میتواند، ولی شاخص خوبی نیست) در صورتی که متوسط نمره تمامی افراد کلاس آمار میتواند به عنوان یک شاخص آماری بسیار خوب و مناسب برای نمره آمار کلاس در نظر گرفته شود.
* سازههای ذهنی کیفی مانند اخلاق، هوش و استعداد، زیبایی و غیره تنها در صورتی که کمی شوند میتوانند به عنوان آمارهایی برای پردازشهای آماری بهکار گرفته شوند.
* نتایج آماری در یک قالب کلی صحیح هستند: نتیجهگیریهای بهدست آمده بر اساس محاسبات آماری، برای تکتک افراد صادق نیستند. این نتایج تنها تحت شرایط خاصی صحیح میباشند.
* روشهای آماری بر اساس عدم قطعیت بنیان گذارده شدهاند. از این رو این روشهای آماری تنها زمانی که به دقت ریاضیات نیازی نیست و یا دستیابی به این دقت امکانپذیر نیست، بهکار میروند.
پس از مطالعه و شناخت مفهوم آمار و علم آمار، مسایل مورد توجه در علم آمار و همچنین نقاط ضعف آن در ادامه به معرفی آمارشناسان و مسایلی که معمولاً به حل آنها میپردازند و حیطههای کاربردی آمار در سایر علوم پرداخته میشود.
آمارشناس کیست؟
آمارشناس کسی است که این سؤالات را مورد توجه قرار میدهد:
* چه دادههایی باید گردآوری شوند؟
* منابع چگونه میتوانند به شکل کاراتری برای گردآوری دادهها بهکار روند؟
* چگونه میتوان یک مدل آماری را به دادههای گردآوری شده برازش داد؟
* چگونه میتوان دادهها را بهگونهای ارایه کرد که ویژگیهای آنها را بهخوبی بیان کند؟
* چه نتیجهای از دادهها باید استنتاج شود و میزان عدم قطعیت این نتیجه تا چه اندازه است؟
* بر اساس نتایج بهدست آمده از دادههای گردآوری شده، چه فعالیتهایی باید صورت گیرد؟
پیشزمینه بسیار خوب از ریاضیات، بهخصوص در ریاضی عمومی و نظریه احتمالات برای متخصصان علم آمار ضروری است؛ چرا که این روشهای ریاضی و احتمالی ابزاری برای مدلسازی آماری و حل مسایل است. با توجه به پیشرفتهای شگرف علم ریاضی در دهههای اخیر، به دلیل حضور و استفاده از رایانههای سریع و پرقدرت، امروزه، اشراف بر علم آمار و ریاضی بهتنهایی برای آمارشناسان کافی نبوده و فراگیری کامپیوتر نیز برای این آمارشناسان از اهمیت بالایی برخوردار است. به علاوه، به دلیل این که امروزه هر یک از آمارشناسان به عنوان مشاور و دستیابی علمی محققین علوم مختلف فعالیت میکنند، باید دانش مناسبی از حیطه تخصصی که در آن به مشاوره میپردازند نیز داشته باشند.
کاربرد آمار در سایر علوم
آمار کاربردهای گوناگونی دارد و روزبهروز هم بر کاربردهای آن افزوده میشود. برخی از علومی که آمار به صورت تخصصی در آنها نقش بازی میکند، عبارتند از:
* علوم بیمه: تعیین نرخهای مرگومیر، طراحی طرحهای بازنشستگی، اندازهگیری اثرات برنامههای مربوط به کنترل و پیشگیری از مخاطرات، تناسب و توازن منابع و مصارف و یا تعیین نرخ حق بیمههای مختلف و غیره.
* کشاورزی: توسعه گونههای جدید و مقاومتری از غلات، افزایش تولید شیر و تخممرغ، ارزیابی اثرات و خطرات بالقوه سموم آفتهای گیاهی و حشرهکشها و غیره.
* زیستشناسی: مطالعه سیر تکامل، مدلبندی رشد، بررسی اثرات متقابل گونههای مختلف و محیط اطرافشان و غیره.
* علوم رایانه: ارزیابی الگوریتمها بر اساس مدلهای تصادفی، ارزیابی سیستمهای صف در مصارف کامپیوتری (بهخصوص در خدمات مربوط به خطوط دیتا در انتقال اطلاعات و شبکههای کامپیوتری)، استخراج اطلاعات از مجموعه دادههای بزرگ و غیره.
* حسابداری و تجارت: برآورد حجم خردهفروشی، طراحی سیستمهای کنترل مالی، تولید روشهای محاسباتی و حسابداری و غیره.
* اقتصاد: اندازهگیری و محاسبه شاخصهای مختلف مانند تورم، حجم تجارت، حجم نیروی کار فعال، نیروی کار بالقوه، استانداردهای زندگی، برآوردهای کوتاه و بلندمدت از شاخصهای اقتصادی و غیره.
* مهندسی: بهبود کیفیت محصولات و آزمون عملکرد آنها، برآورد اعتماد و سیستمها و اجزای آنها، طراحی الگوریتمهایی به منظور تشخیص و شناسایی خودکار و غیره.
* مالی: مدلبندی و مدیریت مخاطرات مالی، ارزشگذاری و...
* جنگلداری و منابع آبزیان: برآورد جمعیت گونههای مختلف حیوانات و ماهیها، مدیریت و تخصیص منابع طبیعی و غیره.
* پزشکی و سلامت: بررسی، تولید و توسعه داروهای جدید، ارزیابی و بهبود برنامههای پیشگیری و درمان سرطانها، تعیین عوامل ژنتیکی بیماریها و سرطانها، ارزیابی عوامل خطر محیطی برای بیماریهای مختلف و غیره.
* حقوق: ارزیابی شواهد و بررسی مدارک.
* مدیریت: نیازسنجیهای گوناگون در زمینه نیروی کار، آموزش، امکانات و تجهیزات، ارزیابی بهرهوری، ارزیابی بازارهای مختلف، ارزیابی رضایت کارکنان، مشتریان و غیره.
* روانشناسی: اندازهگیری تواناییهای آموزش، هوش و ویژگیهای شخصیتی، مطالعه رفتارهای نرمال و غیر نرمال و غیره.
* کنترل کیفیت: ارزیابی کیفیت با استفاده از نمونهگیری، کنترل فرآیندها، طراحی آزمایشها در توسعه محصولات و غیره.
* جامعهشناسی: آزمون نظریههای مختلف درباره سیستمهای اجتماعی، طراحی و انجام بررسیهای نمونهای به منظور مطالعه عادت و رفتار اجتماعی، توصیف و تفسیر تفاوتهای بین فرهنگها و غیره.