آمار پارامتری

آمار پارامتری به مجموعه روش‌های آماری‌ای گفته می‌شود که مدل‌ای پارامتری برای پدیدهٔ احتمالی مورد مطالعه فرض می‌شود و همهٔ استنتاج‌های آماری از آن پس بر اساس آن مدل انجام می‌شود.






به عنوان مثال فرض می‌شود که توزیع نمره‌های یک امتحان از توزیع نرمال پیروی می‌کند. در نتیجه برای مشخص‌شدن توزیع احتمال، کافی است میانگین و واریانس توزیع را از روی داده‌های تجربی (نمره‌های دانش‌آموزان) به دست بیاوریم. حال برای پاسخ‌گفتن به سوال‌هایی چون «درصد دانش‌آموزانی که نمره‌ای بین ۱۰ تا ۱۵ آورده‌اند» از تابع توزیع به دست آمده استفاده می‌کنیم (البته بدیهی است که روش‌های ساده‌تری نیز برای چنین کاری وجود دارد).

نقطهٔ ضعف این شیوهٔ تحلیل آماری این است که در صورتی که مدل فرض‌شده با واقعیت تطبیق نداشته باشد، نتیجه‌گیری‌ها صحیح نخواهد بود.





آماره

آماره در آمار به عددی گویند که یک توزیع نمونه‌برداری را خلاصه‌سازی یا توصیف می‌کند.

تابع U=g(X۱, X۲, …, Xn)‎ از نمونهٔ تصادفی X۱, X۲, …, Xn را که در آن پارامتر مجهولی وجود نداشته باشد یک آماره می‌گویند. در این تعریف U یک متغیر تصادفی است که توزیع آن ممکن است به پارامتر بستگی نداشته باشد؛ اما تنها آماره‌هایی برای برآورد کردن مفید هستند که توزیعشان به پارامتر مجهول بستگی داشته باشد و اطلاعاتی در مورد این پارامتر به ما بدهند.





آنتروپی آماری
انتروپی آماری یک کمیت ترمودینامیکی است که در شیمی‌فیزیک کاربردهای فراوان دارد.





استنباط آماری
چنانچه به جای مطالعه کل اعضای جامعه، بخشی از آن با استفاده از فنون نمونه‌گیری انتخاب شده، و مورد مطالعه قرار گیرد و بخواهیم نتایج حاصل از آن را به کل جامعه تعمیم دهیم از روش‌هایی استفاده می‌شود که موضوع آمار استنباطی (Inferential statistics) است. آن چه که مهم است این است که در گذر از آمار توصیفی به آمار استنباطی یا به عبارت دیگر از نمونه به جامعه بحث و نقش احتمال شروع می‌شود. در واقع احتمال، پل رابط بین آمار توصیفی و استنباطی به حساب می‌آید.





توزیع جامعه

توزیع جامعه یا توزیع جمعیت (به انگلیسی: Population distribution) در آمار به توزیع تمام مشاهدات امکان پذیر را گویند.





چولگی

در آمار و نظریه احتمالات چولگی نشان دهنده میزان عدم تقارن توزیع احتمالی است. اگر داده‌ها نسبت به میانگین متقارن باشند، چولگی برابر صفر خواهد بود.






تعریف

چولگی برابر با گشتاور سوم نرمال شده است. چولگی در حقیقت معیاری از وجود یا عدم تقارن تابع توزیع می باشد. برای یک توزیع کاملاً متقارن چولگی صفر و برای یک توزیع نامتقارن با کشیدگی به سمت مقادیر بالاتر چولگی مثبت و برای توزیع نامتقارن با کشیدگی به سمت مقادیر کوچکتر مقدار چولگی منفی است.





داده‌کاوی

داده کاوی، پایگاه‌ها و مجموعه‌های حجیم داده‌ها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی (و نیمه‌ماشینی) قرار می‌دهد. این گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید.

در سال 1960 آماردانان اصطلاح "Data Fishing" یا "Data Dredging"به معنای "صید داده" را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از داده ها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن داده ها در پایگاه های داده یا Database اصطلاح "Data Mining" یا داده کاوی در حدود سال 1990 رواج بیشتری یافت. اصطلاحات دیگری نظیر "Data Archaeology"یا "Information Harvesting" یا "Information Discovery" یا"Knowledge Extraction" نیز بکار رفته اند.

اصطلاح Data Mining همان طور که از ترجمه آن به معنی داده کاوی مشخص می‌شود به مفهوم استخراج اطلاعات نهان و یا الگوها وروابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ است.






مقدمه

بسیاری از شرکت‌ها و موسسات دارای حجم انبوهی از اطلاعات هستند. تکنیک‌های داده‌کاوی به طور تاریخی به گونه‌ای گسترش یافته‌اند که به سادگی می‌توان آنها را بر ابزارهای نرم‌افزاری و ... امروزی تطبیق داده و از اطلاعات جمع آوری شده بهترین بهره را برد.

در صورتی که سیستم‌های Data Mining بر روی سکوهای Client/Server قوی نصب شده باشد و دسترسی به بانک‌های اطلاعاتی بزرگ فراهم باشد، می‌توان به سوالاتی از قبیل :کدامیک از مشتریان ممکن است خریدار کدامیک از محصولات آینده شرکت باشند، چرا، در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد.






ویژگی‌ها

یکی از ویژگیهای کلیدی در بسیاری از ابتکارات مربوط به تامین امنیت ملی، داده کاوی است. داده کاوی که به عنوان ابزاری برای کشف جرایم، ارزیابی میزان ریسک و فروش محصولات به کار می‌رود، در بر گیرنده ابزارهای تجزیه و تحلیل اطلاعات به منظور کشف الگوهای معتبر و ناشناخته در بین انبوهی از داده هاست. داده کاوی غالباً در زمینه تامین امنیت ملی به منزله ابزاری برای شناسایی فعالیت‌های افراد خرابکار شامل جابه جایی پول و ارتباطات بین آنها و همچنین شناسایی و ردگیری خود آنها با برسی سوابق مربوط به مهاجرت و مسافرت هاست. داده کاوی پیشرفت قابل ملاحظه‌ای را در نوع ابزارهای تحلیل موجود نشان می‌دهد اما محدودیت‌هایی نیز دارد. یکی از این محدودیت‌ها این است که با وجود اینکه به آشکارسازی الگوها و روابط کمک می‌کند اما اطلاعاتی را در باره ارزش یا میزان اهمیت آنها به دست نمی‌دهد. دومین محدودیت آن این است که با وجود توانایی شناسایی روابط بین رفتارها و یا متغیرها لزوماً قادر به کشف روابط علت و معلولی نیست. موفقیت داده کاوی در گرو بهره گیری از کارشناسان فنی و تحلیل گران کار آزموده‌ای است که از توانایی کافی برای طبقه بندی تحلیل‌ها و تغییر آنها برخوردار هستند. بهره برداری از داده کاوی در دو بخش دولتی و خصوصی رو به گسترش است. صنایعی چون بانکداری، بیمه، بهداشت و بازار یابی آنرا عموماً برای کاهش هزینه‌ها، ارتقاء کیفی پژوهش‌ها و بالاتر بردن میزان فروش به کار می‌برند. کاربرد اصلی داده کاوی در بخش دولتی به عنوان ابزاری برای تشخیص جرایم بوده‌است اما امروزه دامنه بهره برداری از آن گسترش روزافزونی یافته و سنجش و بهینه سازی برنامه‌ها را نیز در بر می‌گیرد. بررسی برخی از برنامه‌های کاربردی مربوط به داده کاوی که برای تامین امنیت ملی به کار می‌روند، نشان دهنده رشد قابل ملاحظه‌ای در رابطه با کمیت و دامنه داده‌هایی است که باید تجزیه و تحلیل شوند. توانایی‌های فنی در داده کاوی از اهمیت ویژه‌ای برخوردار اند اما عوامل دیگری نیز مانند چگونگی پیاده سازی و نظارت ممکن است نتیجه کار را تحت تأثیر قرار دهند. یکی از این عوامل کیفیت داده هاست که بر میزان دقت و کامل بودن آن دلالت دارد. عامل دوم میزان سازگاری نرم‌افزار داده کاوی با بانکهای اطلاعاتی است که از سوی شرکت‌های متفاوتی عرضه می‌شوند عامل سومی که باید به آن اشاره کرد به بیراهه رفتن داده کاوی و بهره برداری از داده‌ها به منظوری است که در ابتدا با این نیت گرد آوری نشده‌اند. حفظ حریم خصوصی افراد عامل دیگری است که باید به آن توجه داشت. اصولاً به پرسش‌های زیر در زمینه داده کاوی باید پاسخ داده شود:

سازمانهای دولتی تا چه حدی مجاز به بهره برداری از داده‌ها هستند؟
آیا از داده‌ها در چارچوبی غیر متعارف بهره برداری می‌شود؟
کدام قوانین حفظ حریم خصوصی ممکن است به داده کاوی مربوط شوند؟

کاوش در داده‌ها بخشی بزرگ از سامانه‌های هوشمند است. سامانه‌های هوشمند زیر شاخه‌ایست بزرگ و پرکاربرد از زمینه علمی جدید و پهناور یادگیری ماشینی که خود زمینه‌ای‌ست در هوش مصنوعی.

فرایند گروه گروه کردن مجموعه‌ای از اشیاء فیزیکی یا مجرد به صورت طبقه‌هایی از اشیاء مشابه هم را خوشه‌بندی می‌نامیم.

با توجه به اندازه‌های گوناگون (و در اغلب کاربردها بسیار بزرگ و پیچیده) مجموعه‌های داده‌ها مقیاس‌پذیری الگوریتم‌های به کار رفته معیاری مهم در مفاهیم مربوط به کاوش در داده‌ها است.

کاوش‌های ماشینی در متون حالتی خاص از زمینهٔ عمومی‌تر کاوش در داده‌ها بوده، و به آن دسته از کاوش‌ها اطلاق می‌شود که در آن‌ها داده‌های مورد مطالعه از جنس متون نوشته شده به زبان‌های طبیعی انسانی باشد.






چیستی

داده کاوی به بهره گیری از ابزارهای تجزیه و تحلیل داده‌ها به منظور کشف الگوها و روابط معتبری که تا کنون ناشناخته بوده‌اند اطلاق می‌شود. این ابزارها ممکن است مدلهای آماری، الگوریتم‌های ریاضی و روش‌های یاد گیرنده (Machine Laming Method) باشند که کار این خود را به صورت خودکار و بر اساس تجربه‌ای که از طریق شبکه‌های عصبی (Neural Networks) یا درخت‌های تصمیم گیری (Decision Trees) به دست می‌آورند بهبود می‌بخشد. داده کاوی منحصر به گردآوری و مدیریت داده‌ها نبوده و تجزیه و تحلیل اطلاعات و پیش بینی را نیز شامل می‌شود برنامه‌های کاربردی که با بررسی فایل‌های متن یا چند رسانه‌ای به کاوش داده‌ها می پردازند پارامترهای گوناگونی را در نظر می‌گیرد که عبارت اند از:

قواعد انجمنی (Association): الگوهایی که بر اساس آن یک رویداد به دیگری مربوط می‌شود مثلاً خرید قلم به خرید کاغذ.
ترتیب (Sequence): الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص می‌کند کدام رویداد، رویدادهای دیگری را در پی دارد مثلاً تولد یک نوزاد و خرید پوشک.
پیش بینی(Prediction): در پیش بینی هدف پیش بینی یک متغیر پیوسته می باشد. مانند پیش بینی نرخ ارز یا هزینه های درمانی.
رده بندی یا طبقه بندی (Classification): فرآیندی برای پیدا کردن مدلی است که رده های موجود در داده‌ها را تعریف می نماید و متمایز می کند، با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها(متغیر هدف) ناشناخته می باشد، استفاده نمود. در حقیقت در رده بندی بر خلاف پیش بینی، هدف پیش بینی مقدار یک متغیر گسسته است. روش های مورد استفاده در پیش بینی و رده بندی عموما یکسان هستند.
خوشه بندی(Clustering): گروه بندی مجموعه ای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشه های دیگر داشته باشند.
مصورسازی (visualization): مصورسازی داده ها یکی از قدرتمندترین و جذابترین روش های اکتشاف در داده ها می باشد.

برنامه‌های کاربردی که در زمینه تجزیه و تحلیل اطلاعات به کار می‌روند از امکاناتی چون پرس و جوی ساخت یافته (Structured query) که در بسیاری از بانک‌های اطلاعاتی یافت می‌شود و از ابزارهای تجزیه و تحلیل آماری برخوردارند اما برنامه‌های مربوط به داده کاوی در عین برخورداری از این قابلیت‌ها از نظر نوع با آنها تفاوت دارند. بسیاری از ابزارهای ساده برای تجزیه و تحلیل داده‌ها روشی بر پایه راستی آزمایی (verifiction)را به کار می‌برند که در آن فرضیه‌ای بسط داده شده آنگاه داده‌ها برای تایید یا رد آن بررسی می‌شوند. به طور مثال ممکن است این نظریه مطرح شود که فردی که یک چکش خریده حتماً یک بسته میخ هم خواهد خرید. کارایی این روش به میزان خلاقیت کاربر برای ارایه فرضیه‌های متنوع و همچنین ساختار برنامه بکار رفته بستگی دارد. در مقابل در داده کاوی روشهایی برای کشف روابط بکار برده می‌شوند و به کمک الگوریتم‌هایی روابط چند بعدی بین داده‌ها تشخیص داده شده و آنهایی که یکتا (unique) یا رایج هستند شناسایی می‌شوند. به طور مثال در یک فروشگاه سخت‌افزار ممکن است بین خرید ابزار توسط مشتریان با تملک خانه شخصی یا نوع خودرو، سن، شغل، میزان درآمد یا فاصله محل اقامت آنها با فروشگاه رابطه‌ای برقرار شود.

در نتیجه قابلیت‌های پیچیده‌اش برای موفقیت در تمرین داده کاوی دو مقدمه مهم است یکی فرمول واضحی از مشکل که قابل حل باشد و دیگری دسترسی به داده متناسب. بعضی از ناظران داده کاوی را مرحله‌ای در روند کشف دانش در پایگاه داده‌ها می‌دانند (KDD). مراحل دیگری در روند KDD به صورت تساعدی شامل، پاکسازی داده، انتخاب داده انتقال داده، داده کاوی، الگوی ارزیابی، و عرضه دانش می‌باشد. بسیاری از پیشرفت‌ها در تکنولوژی و فرایندهای تجاری بر رشد علاقه‌مندی به داده کاوی در بخش‌های خصوصی و عمومی سهمی داشته‌اند. بعضی از این تغییرات شامل:

رشد شبکه‌های کامپیوتری که در ارتباط برقرار کردن پایگاهها داده مورد استفاده قرار می‌گیرند.
توسعه افزایش تکنیکهایی بر پایه جستجو مثل شبکه‌های عصبی و الگوریتم‌های پیشرفته.
گسترش مدل محاسبه کلاینت سروری که به کاربران اجازه دسترسی به منابع داده‌های متمرکز شده را از روی دسک تاپ می‌دهد.
و افزایش توانایی به تلفیق داده از منابع غیر متناجس به یک منبع قابل جستجو می‌باشد.

علاوه بر پیشرفت ابزارهای مدیریت داده، افزایش قابلیت دسترسی به داده و کاهش نرخ نگهداری داده نقش ایفا می‌کند. در طول چند سال گذشته افزایش سریع جمع آوری و نگه داری حجم اطلاعات وجود داشته‌است. با پیشنهادهای برخی از ناظران مبنی بر آنکه کمیت داده‌های دنیا به طور تخمینی هر ساله دوبرابر می‌گردد. در همین زمان هزینه ذخیره سازی داده‌ها بطور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کرده‌است. مطابقا قدرت محاسبه‌ها در هر ۱۸ – ۲۴ ماه به دوبرابر ارتقاء پیدا کرده‌است این در حالی است که هزینه قدرت محاسبه رو به کاهش است. داده کاو به طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کرده‌است. سازمانها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده می‌کنند. با اینهمه ازدیاد داده کاوی به طبع بعضی از پیاده سازی و پیامد اشتباه را هم دارد.اینها شامل نگرانی‌هایی در مورد کیفیت داده‌ای که تحلیل می‌گردد، توانایی کار گروهی پایگاههای داده و نرم‌افزارها بین ارگانها و تخطی‌های بالقوه به حریم شخصی می‌باشد.همچنین ملاحظاتی در مورد محدودیتهایی در داده کاوی در ارگان‌ها که کارشان تاثیر بر امنیت دارد، نادیده گرفته می‌شود.






محدودیت‌های داده کاوی

در حالیکه محصولات داده کاوی ابزارهای قدرتمندی می‌باشند، اما در نوع کاربردی کافی نیستند.برای کسب موفقیت، داده کاوی نیازمند تحلیل گران حرفه‌ای و متخصصان ماهری می‌باشد که بتوانند ترکیب خروجی بوجود آمده را تحلیل و تفسیر نمایند.در نتیجه محدودیتهای داده کاوی مربوط به داده اولیه یا افراد است تا اینکه مربوط به تکنولوژی باشد.

اگرچه داده کاوی به الگوهای مشخص و روابط آنها کمک می‌کند، اما برای کاربر اهمیت و ارزش این الگوها را بیان نمی‌کند.تصمیماتی از این قبیل بر عهده خود کاربر است.برای نمونه در ارزیابی صحت داده کاوی، برنامه کاربردی در تشخیص مظنونان تروریست طراحی شده که ممکن است این مدل به کمک اطلاعات موجود در مورد تروریستهای شناخته شده، آزمایش شود.با اینهمه در حالیکه ممکن است اطلاعات شخص بطور معین دوباره تصدیق گردد، که این مورد به این منظور نیست که برنامه مظنونی را که رفتارش به طور خاص از مدل اصلی منحرف شده را تشخیص بدهد.

تشخیص رابطه بین رفتارها و یا متغیرها یکی دیگر از محدودیتهای داده کاوی می‌باشد که لزوماًروابط اتفاقی را تشخیص نمی‌دهد.برای مثال برنامه‌های کاربردی ممکن است الگوهای رفتاری را مشخص کند، مثل تمایل به خرید بلیط هواپیما درست قبل از حرکت که این موضوع به مشخصات درآمد، سطح تحصیلی و استفاده از اینترنت بستگی دارد.در حقیقت رفتارهای شخصی شامل شغل(نیاز به سفر در زمانی محدود)وضع خانوادگی(نیاز به مراقبت پزشکی برای مریض)یا تفریح (سود بردن از تخفیف دقایق پایانی برای دیدن مکان‌های جدید) ممکن است بر روی متغیرهای اضافه تاثیر بگذارد.
ابزارهای داده کاوی

معروف‌ترین ابزارهای داده‌کاوی به ترتیب پرطرفدار بودن

Clementine که نسخه ۱۳ ان با نام SPSS Modeler نامیده می‌شود.

رپیدماینر
نرم‌افزار وکا







نرم‌افزار
برنامه های کاربردی و نرم‌افزار های داده کاوی متن-باز رایگان

Carrot2: پلتفرمی برای خوشه بندی متن و نتایج جستجو
Chemicalize.org: یک کاوشگر ساختمان شیمیایی و موتور جستجوی وب
ELKI: یک پروژه تحقیقاتی دانشگاهی با تحلیل خوشه ای پیشرفته و روش های تشخیص داده های خارج از محدوده که به زبان جاوا نوشته شده است.
GATE: یک پردازشگر زبان بومی و ابزار مهندسی زبان.






برنامه های کاربردی و نرم‌افزار های داده کاوی تجاری

Angoss KnowledgeSTUDIO: ابزار داده کاوی تولید شده توسط Angoss.
BIRT Analytics: ابزار داده کاوی بصری و تحلیل پیش بینی گر تولید شده توسط Actuate Corporation.
Clarabridge: راه حل تحلیلگر کلاس متن.
(E-NI(e-mining, e-monitor: ابزار داده کاوی مبتنی بر الگوهای موقتی.
IBM SPSS Modeler: نرم‌افزار داده کاوی تولید شده توسط IBM
Microsoft Analysis Services: نرم‌افزار داده کاوی تولید شده توسط مایکروسافت
Oracle Data Mining: نرم‌افزار داده کاوی تولید شده توسط اوراکل (کمیک)






بررسی اجمالی بازار نرم‌افزار های داده کاوی

تا کنون چندین محقق و سازمان بررسی هایی را بر روی ابزار های داده کاوی و راهنماییهایی برای داده کاو ها تهیه دیده اند. این بررسی ها بعضی از نقاط ضعف و قوت بسته های نرم‌افزاری را مشخص می کنند. همچنین خلاصه ای را از رفتار ها، اولویت ها و دید های داده کاوها تهیه کرده اند





درجه آزادی (آمار)

درجه آزادی یکی از مفاهیم بنیادین در آمار است. درک بسیاری از مفاهیم مطرح در آمار وابسته به درک مناسبی از این مفهوم است. بر اساس زمینهٔ کاربرد و شیوهٔ نگرش می‌توان تعاریف مختلفی برای آن ارائه نمود که همه یک مفهومند:

در نظریهٔ برآورد:

تعداد مقادیری که یک آماره امکان تغییر دارد

تعداد مشاهدات مستقل منهای تعداد پارامترهای برآورد شده.

بطور معادل: تعداد مشاهدات مستقل منهای تعداد روابط معلوم میان مشاهدات

در نظریه آزمون:

بعد فضای مجهول (مدل کامل) منهای بعد فضای مفروض (مدل مقید)

در جبر خطی:

رتبهٔ یک فرم درجه دوم

بطور معادل: تعداد ابعاد یک زیر فضا که یک بردار می‌تواند آزادانه گردش کند (مربع طول بردار یک فرم درجه دوم است)






درک شهودی

مثال: یک عدد ثابت امکان تغییر ندارد پس درجه آزادی آن برابر صفر است.

یک نقطه در صفحه یک رابطه میان دو متغیر در فضای دو بعدی است. با این نقطه نمیتوان میزان همبستگی خطی دو متغیر را با برآورد خط رگرسیون تخمین زد. چون بینهایت خط از این نقطه گذراست. (تصویر مقابل) در این مثال درجه آزادی صفر است (تعداد مشاهدات مستقل - تعداد روابط معلوم میان مشاهدات = 0) اگر خطی را بعنوان خط رگرسیونی در نظر بگیریم، این مدل نه قابل رد و نه قابل قبول است. بنابراین تعداد نمونه های قابل استفاده برای این مدل صفر است.

برای رسم خط رگرسیون حداقل دو نقطه لازم است. با دو نقطه یک درجه آزادی وجود دارد. از دو نقطه فقط یک خط گذر میکند و این خط تنها برآورد ممکن است. با اینکه دقت برآورد 100 درصد است اما این دقت کاذب به علت کم بودن درجات آزادی و اطلاعات قابل استفاده است. نمونه های زیادی از تحقیقات با رسیدن به دقتی بالا تصور میکنند که مدل بدست آمده مناسب است . در حالی که درجات آزادی کم باعث این اشتباه شده است.

مثال: اگر دو مشاهده داشته باشیم، برای برآورد میانگین دو مشاهدهء مستقل داریم، اما برای برآورد واریانس تنها یک مشاهدهء مستقل وجود دارد. زیرا هر دو مشاهده دارای یک فاصله از میانگین هستند.






دیدگاه فلسفی

برای درک بهتر این مفهوم میتوان درجهء آزادی را یک معادل برای درجهء ابطال پذیری از دیدگاه فلاسفه ای مانند کارل پوپر دانست. اگر در مسئله ای درجات آزادی کم

باشد معادل است با اینکه ابطال پذیری آن مسئله کم است. یعنی با هر مشاهده ای تایید میشود و قابل ابطال نیست.





سازمان آماری
سازمان آماری سازمانی خدماتی است که وظیفهٔ تهیهٔ آمار را بر عهده دارد. دلیل وجود، رشد و مشارکت مشهود آنها در امور مربوط به دولت و جامعةخود، از توانایی آنها در تهیة اطلاعاتی برای حل مسائل مهم ریشه می‌گیرد. ولی اولویتها می‌توانند سریعتر از توانایی سازمان برای تعدیل تلاش تولیدی خود تغییر کنند. به این دلیل، مهم است که مسئولان ارشد آن دارای شم قوی و روابطی باشند که بتوانند مشکلات جدی را شناسایی کرده و آنها را از آنچه ممکن است چیزی جز مسایل گذرا نباشند متمایز کنند.





شاخص‌های پراکندگی

سنجش‌های پراکندگی (به انگلیسی: Measures of Variability) به اعدادی گویند که پراکندگی مجموعه‌ای از مشاهدات یا داده‌های اندازه گیری شده‌ای را خلاصه و توصیف می‌کنند.

دامنه، واریانس، و انحراف معیار، هر سه نمونه‌هایی از سنجش‌های پراکندگی هستند.





ضریب تغییرات
در نظریه احتمال و آمار ضریب تغییرات (به انگلیسی: coefficient of variation، مخفف:CV) یک معیار بهنجار است که برای اندازه‌گیری توزیع داده‌های آماری به کار می‌رود.

به عبارت دیگر ضریب تغییرات، میزان پراکندگی به ازای یک واحد از میانگین را بیان می‌کند. این مقدار زمانی تعریف شده است که میانگین صفر نباشد.

این مقدار بی‌بعد است به همین دلیل مناسب برای مقایسه داده‌های آماری است که واحدهای مختلفی دارند.

ضریب تغییرات تنها قابل کاربرد برای مقیاس‌های نسبی است و نمی‌توان ار آن برای سنجش مقادیری که می‌توانند مقدار منفی بگیرند استفاده کرد یا به بیان بهتر نمی‌توان از آن برای سنجش مقادیر فاصله‌ای بهره برد. مثلاً اگر درجه حرارت را با مقیاس فارنهایت در نظر بگیریم برای آن نمی‌توان از ضریب تغییر اسفاده کرد و باید از مقیاس کلوین که همیشه مقداری مثبت است استفاده کرد.





متغیر پنهان
متغیرهای پنهان(در مقابل متغیرهای مشاهده شده)در آمار، متغیرهای هستند که بصورت مسقیم قابل مشاهده نیستند اما از میان متغیرهای دیگر که قابل مشاهده هستند توسط یک الگوی ریاضی استنباط می‌شوند. آنها همچنین بعضی وقت‌ها تحت عنوان متغیرهای پنهان، پارامترها ی مدل، متغیرهای فرضی یا ساختارهای فرضی شناخته می‌شوند.. استفاده متغیرهای پنهان در علوم اجتماعی متداول است، اقتصاد، پزشکی و تا حدی روبوتیک اما تعریف دقیق یک متغیر پنهان در این رشته‌ها کمی متفاوت است. مثال‌های از متغیرهای پنهان در حوزه اقتصاد عبارتند از کیفیت زندگی، اطمینان کار، روحیه، خوشحالی و اصول محافظه‌کاری: اینها متغیرها هستند که مستقیماً نمی‌توان آنها را سنجید. با این وجود یک مدل اقتصادی را می‌توان از پیوند این متغیرهای پنهان با متغیرهای مشاهده شده (از قبیل تولید ناخالص داخلی) بدست آورد و مقادیر متغیرهای پنهان را از متغیرهای مشاهده شده محاسبه و استنباط نمود.





متغیر تصادفی

در آمار و احتمال متغیر تصادفی متغیری است که مقدار آن از اندازه‌گیری برخی از انواع فرآیندهای تصادفی بدست می‌آید. بطور رسمی‌تر، متغیر تصادفی تابعی است از فضای نمونه به اعداد حقیقی. بطور مستقیم متغیر تصادفی توصیف عددی خروجی یک آزمایش است (مثل برآمدهای ممکن از پرتاب دو تاس (۱و۱) و (۱و۲) و غیره).

متغیرهای تصادفی به دو نوع گسسته (متغیر تصادفی که ممکن است تعداد محدود یا توالی نامحدودی از مقادیر را بگیرد) و پیوسته (متغیری که ممکن است هر مقدار عددی در یک یا چند بازه را بگیرد) طبقه‌بندی می‌شوند. مقادیر ممکن یک متغیر تصادفی می‌تواند نشان‌دهندهٔ برآمدهای آزمایشی که هنوز انجام نشده یا مقادیر بالقوهٔ یک کمیت که مقدارهای موجود آن نامطمئن هستند (مثلا درنتیجه اطلاعات ناقص یا اندازه‌گیری نادقیق) باشد. یک متغیر تصادفی می‌تواند بعنوان یک کمیت که مقدارش ثابت نیست و مقادیر مختلفی را می‌تواند بگیرد در نظر گرفته شود و توزیع احتمال برای توصیف احتمال اتفاق افتادن آن مقادیر استفاده می‌شود.

متغیرهای تصادفی معمولاً با اعداد حقیقی مقداردهی می‌شوند؛ ولی می‌توان انواع دلخواهی مانند مقدارهای بولی، اعداد مختلط، بردارها، ماتریس‌ها، دنباله‌ها، درخت‌ها، مجموعه‌ها، شکل‌ها، منیوفیلدها، توابع و فرآیندها را درنظر گرفت. عبارت المان تصادفی همه این نوع مفاهیم را دربرمی گیرد.

متغیرهای تصادفی که با اعداد حقیقی مقداردهی می‌شوند، در علوم برای پیش‌بینی براساس داده‌های بدست آمده از آزمایش‌های علمی استفاده می‌شوند. علاوه بر کاربردهای علمی، متغیرهای تصادفی برای آنالیز بازیهای قمار و پدیده‌های تصادفی بوجود آمدند. در چنین مواردی تابعی که خروجی را به یک عدد حقیقی می‌نگارد معمولا یک تابع همانی یا بطور مشابه یک تابع بدیهی است و بطور صریح توصیف نشده است. با این وجود در بسیاری از موارد بهتر است متغیر تصادفی را بصورت توابعی از سایر متغیرهای تصادفی درنظر بگیریم که دراینصورت تابع نگاشت استفاده شده در تعریف یک متغیر تصادفی مهم می‌شود. بعنوان مثال، رادیکال یک متغیر تصادفی با توزیع استاندارد (نرمال) خود یک متغیر تصادفی با توزیع کی دو است. شهود این مطلب بدین صورت است که تصور کنید اعداد تصادفی بسیاری با توزیع نرمال تولید کرده و از هرکدام رادیکال بگیریم و سپس هیستوگرام داده‌های بدست آمده را بکشیم در اینصورت اگر داده‌ها به تعداد کافی باشند، نمودار هیستوگرام تابع چگالی توزیع کی دو را با یک درجه آزادی تقریب خواهد زد.






نام‌های دیگر

در برخی از کتاب‌های قدیمی‌تر به جای «متغیر تصادفی»، اصطلاح‌های «متغیر شانسی» و «متغیر استوکاستیکی» هم به کار رفته است.






انواع

متغیر تصادفی گسسته
متغیر تصادفی پیوسته

با توجه به وضع شمارایی فضای نمونه‌ای S، متغیر می‌تواند گسسته یا پیوسته باشد. اگر S متناهی یا نامتناهی شمارا باشد متغیر تصادفی X گسسته و اگر ناشمارا باشد X پیوسته خواهد بود.

یک توزیع همچنین می تواند از نوع مختلط (mixed) باشد به این صورت که بخشی از آن مقادیر خاصی را بگیرد و بخش دیگر آن مقادیر روی یک بازه را بگیرد.





مقدار موثر
در ریاضیات، جذر متوسط مربع (به انگلیسی: root mean square یا quadratic mean) که با نام مقدار RMS و مقدار مؤثر (به انگلیسی: effective value) نیز شناخته می‌شود، معیاری آماری از اندازه کمیت متغیر است.
2:22 am
خرید اینترنتی در ایران
با توجه به گسترش روزافزون فعالیت‌های اینترنتی، فضا برای کسب و کار پیرامون اینترنت نیز افزایش یافته است. در ایران، کاربران اینترنتی به این کسب و کار توجه جدی ندارند و اکثراً به عنوان شغل دوم از آن نام می‌برند و استفاده می‌کنند. در حالی که می‌توان به عنوان شغل اول و یک درآمد ثابت و پر سود از آن یاد کرد.





فروشگاه‌های موفق اینترنتی جهان
یکی از فروشگاههای معروف خرید و فروش اینترنتی در جهان سایت ئی بی هست. این سایت با نوآوری خدمات و همچنین گستردگی پوشش توانسته است یکی از سایتهای موفق در این زمینه باشد. تقریباً کمتر کالایی را می‌توان یافت که در این سایت به فروش نرسد. خرید اینترنتی در این سایت برای اکثر کشورها به راحتی میسر است. این سایت قابلیت عرضه کالا حتی به صورت دست دوم را نیز به کاربران خود می‌دهد. این سایت با ثبت کلیه اطلاعات خرید و فروش، خریداران و فروشندگان خود را نیز رتبه بندی می‌کند و بدین صورت اجازه سوء استفاده به کاربران خود را نمی‌دهد.

یکی دیگر از فروشگاههای موفق اینترنی در جهان سایت آمازون. کام است. این سایت در عرصه فروش کتاب‌های الکترونیکی نیز یکی از پیشتازان است. همین امر حتی این سایت را بر آن داشته است که خواننده الکترونیکی مخصوصی برای کتابهای الکترونیکی خود تولید کند. ولی همچنین در عرصه سایر محصولات نیز یکی از موفق ترین هاست.


فروش
به عمل تبادل هر چیز ارزشمند مانند کالا، اوراق بهادار، وجه نقد، خدمات، یا اطلاعات بطور قطعی و دائمی و یا بطور موقت در ازای هر چیز ارزشمند دیگری مانند کالا، اوراق بهادار، وجه نقد، خدمات یا اطلاعات باز هم بطور قطعی و دائمی و یا بطور موقت فروش گفته می شود.

این تعریف، تقریباً معادل بازاریابی است و با آنچه به عنوان بیع و یا فروش در قوانین مدنی اکثر کشورها (همچون ایران) و همچنین در فقه اسلامی تعریف شده است، تفاوت اساسی و ماهیتی دارد. بر اساس این قوانین فروش فقط وقتی اتفاق می افتد که کسی مالی را اعم از منقول یا غیر منقول به صورت دائمی به کسی واگذار نموده و در قبال آن عوضی گرفته باشد.




در صورتی که در تعریف ما، معلمی که به دنبال محصل برای تدریس خصوصی می گردد، کارگزاری که در تالار بورس برای سهام مشتری پیدا می کند، وقتی در یک صرافی پول نقد با پول نقد مبادله می شود، وقتی یک بانک به مشتری خود وام می دهد، وقتی یک پزشک بیماری را ویزیت می کند، وقتی کسی خودرویی را اجاره می‌کند و یا آپارتمان خود را به اجاره واگذار می کند، همه و همه فروش محسوب می شود.



کالا
در اصطلاح علم اقتصاد، محصولات و موادّ مختلفی که توسط تولیدکننده، به بازار عرضه شود و در برابر دریافت پول، یکی از نیازهای انسان را تأمین و رفع کند، کالا نام دارد. کالاهایی که در بازار عرضه می‌شوند، و به فروش می‌رسند تا توسط مصرف کنندگان خریداری شوند و به مصرف برسند، کالاهای مصرفی نام دارند. کالاهایی که تولیدکنندگان دیگری برای تولید کالاهای مختلف دیگر، آن‌ها را خریداری کنند و مورد استفاده قرار دهند، کالای واسطه‌ای نامیده می‌شود. کالاهایی که نیازهای اوّلیّهٔ مصرف کنندگان را تأمین می‌کند، کالاهای ضروری و کالاهایی که برای تأمین نیازهای کم اهمیت تر مصرف می‌شود، کالاهای تجملّی نامیده می‌شود.
کالا در اقتصاد کشورها
هیچ کشوری تنها یک کالا تولید و مصرف نمی‌کند. هر کشوری مجموعه‌ای از کالاهای تولیدی و مصرفی دارد.



تولید
واژه Production در لغت به معانی استخراج، فراورده، محصول، کار، عمل، نتیجه، ارائه و تولید آمده است

تولید یا فرآوری، از اصطلاحات علم اقتصاد، به معنی تهیه کالا و خدمات مورد نیاز با استفاده از منابع و امکانات موجود است. فعالیّت تولیدی سلسله اقداماتی است که برای تبدیل منابع به کالاهای مورد نیاز صورت می‌گیرد.

تولید یا ساخت نام صنعت بسیار مهمّی ست که از ماقبل تاریخ ایجاد شد. شاید بتوان تولید را اوّلین صنعت بشر دانست. نیاز به تولید، منجز به پیشرفت تمام رشته‌های مهندسی شد.

تولید یا فرآوری، از اصطلاحات علم اقتصاد، به معنی تهیه کالا و خدمات مورد نیاز با استفاده از منابع و امکانات موجود است. فعالیّت تولیدی سلسله اقداماتی است که برای تبدیل منابع به کالاهای مورد نیاز صورت می‌گیرد.

در اقتصاد، خلق مطلوبیت از طریق فعالیت انسانی است. تولید از نظر علم اقتصاد، دربردارنده خلق اشیا توسط انسان نیز هست؛ ولی شامل دیگر فعالیت‌های خدماتی چون حفاظت و نگهداری، پاکیزه‌سازی و ... هم می‌شود



تولید را ایجاد فایده و مطلوبیت برای ارضای خواسته های افراد می دانند؛ در عین حال تولید، رشته ای از فعالیت‌های انسانی است که عوامل تولید توسط آنها با یكدیگر تركیب شده و كالاها و خدمات مورد نیاز افراد را فراهم می كند. تولید كردن یعنی ایجاد فواید اقتصادی جدید. مفهوم تولید، علاوه‌بر جریان تغییر كالاها، شامل كلیه خدماتی است كه در بهبود فایده كالا مؤثر بوده و به‌هنگام نیاز در دسترس افراد قرار می گیرند. تولیدكنندگان اقتصادی برای كسب سود بیشتر عوامل تولیدی را به‌گونه‌ای مناسب با یكدیگر تركیب می كنند. همچنین روند فعالیت‌های تولیدی آنها چنان است كه كمترین هزینه های تولیدی را برای یك سطح تولید مشخصی به‌دنبال دارد. به این ترتیب، علاوه‌بر تولید و مباحث مربوط به آن، هزینه های تولید نیز نقش مهمی در فعالیت‌های اقتصادی ایفا می كنندمباحث تولید، بخش‌های عمده ای از علم اقتصاد را تشكیل می دهد. میزان تولیدات و ارزش اقتصادی آن یكی از مهم‌ترین ابزار اندازه گیری موفقیت‌های اقتصادی كشوهاست. به‌نظر ژان باتیست سی (Jean Baptiste Say: 1767-1832)، هر كالایی هنگامی تولید تلقی می شود، كه ارزش آن برای مصرفكننده مساوی هزینه‌های تولید باشد. تولیدكننده ای كه كالایی را تولید كند و قادر به فروش آن نباشد، در حقیقت چیزی تولید نكرده است منابع تولید: در علم اقتصاد مجموعه عواملی كه موجب ایجاد كالاها و خدمات می شوند، منابع یا عوامل تولید نام دارند. از تركیب انعطاف‌پذیری و قابلیت تغییرپذیری مزیت عوامل تولید، می‌توان كالاهای متنوعی تولید كرد. این منابع به منابع تولیدی اقتصادی نیز معروف اند. برخی منابع، مانند اكسیژن موجود در هوا فراوان بوده و افراد برای دریافت آنها پولی پرداخت نمی كنند. منابع تولید اقتصادی عبارتند از: منابع طبیعی؛ منابع انسانی؛ سرمایه مادی؛ انواع تولید 1) تولید با یك عامل متغیر برای تولید، مقادیر متفاوتی از محصول در نسبت‌های متفاوت، فرض می كنیم كه یك عامل متغیر وجود دارد. دوره ای كه در نظر می گیریم، دوره كوتاه‌مدت است؛ كه تمام عوامل، به‌جز یكی ثابت در نظر گرفته می شود. شكل این تابع، به‌صورت زیر ترسیم می شود كه در آن، تولید كل با TP و تولید متوسط با AP و تولید نهایی با MP نمایش داده می شود. تولید كل عبارت از حداكثر محصول قابل حصول از هر تعداد كارگر، تولید متوسط نیروی كار، عبارت از تقسیم تولید كل بر تعداد كارگران و محصول نهایی عبارت است از محصول اضافی منتسب به افزایش كمّی در مقدار عامل متغیر؛ كه با یك كارخانه ثابت بهكار گرفته می شود. محصول نهایی را غالباً با تغییر متغیر به مقدار یك واحد به‌دست می‌آوریم. تولید نهایی ابتدا افزایش و سپس كاهش می یابد و نهایتاً هنگامی كه كارگر اضافه می شود، تولید كل را كاهش می دهد و مقدارش را منفی می نماید.) تولید یکسان؛ تولید با دو یا چند عامل متغیر به تولید یكسان معروف است. منحنی تولید یکسان مکان هندسی تمام مقادیر کار و سرمایه است که سطح معینی از محصول را به‌دست می دهد. سالواتوره، دومینيك؛ اقتصاد خرد، ترجمه احمد یزدان‌پناه، تهران، چاپ و نشر بازرگانی، 1385، چاپ سوم، ج1، ص255 و جمعی از نویسندگان؛ مجموعه مقالات اقتصاد خرد و کلان، مترجمین احمد جعفری صمیمی وغلامعلی فرجادی، نشر دانشگاه مازندران، وثقي، 1378، چاپ اول، ص127.منحنی‌های تولید یکسان به سه شکل L، خطی و کاب داگلاس که عموماً به‌شکل محدب است، وجود دارند. در منحنی L شکل، سرمایه و نیروی کار تولید، به نسبت ثابت مصرف می‌شوند و فعالیت در نقطه ای به‌جز رأس منحنی یکسان، ناکارآ خواهد بود، در منحنی خطی، جانشینی كامل میان عوامل تولید وجود دارد كه به‌معنای ثبات نسبت جانشینی میان عوامل تولید است و در تابع کاب داگلاس، حالتی متعادل میان دو حالت افراطی خطی و L شکل به‌شمار می رود. منحنی تولید یکسان برای تابع کاب-داگلاس دارای حالت متعارف محدب استتولیدکنندگان برای تولید کالاها و خدمات به عوامل تولید نیاز دارند. تهیه این عوامل، مستلزم پرداخت هزینه هایی است. این مخارج، برای صاحبان عوامل، درآمد و برای تولیدکنندگان، هزینه محسوب می‌شود. هزینه تولید، قیمت عوامل تولیدی است که برای ساخت و تولید کالاها و خدمات به‌کار می رودانواع هزینه تولید هزینه های تولید از تنوع چشم‌گیری برخوردارند: 1. هزینه ثابت کل (Total Fixed Cost: TFC)؛ مؤسسات تولیدی هزینه های ثابتی دارند. هزینه‌های ثابت، غیرمستقیم یا عمومی، با تغییرات میزان تولیدات تغییر نمی کنند و برای حفظ عوامل ثابت تولید، به‌کار می روند . هزینه فرصت (Opportunity Cost)؛ بیانگر ارزش واقعی محصول تولیدشده در صورت به‌کارگیری منابع در مطلوب ترین گزینه ممکن و بالاترین ارزش تولید کالاهای دیگری که در صورت عدم تولید این کالا می توانستند با استفاده از عوامل موجود تولید شوند، است. هزینه نیمه متغیر (Semi Variable Cost)؛ هزینه ها تا آستانه معینی ثابت است و با افزایش ظرفیت از حد معینی، مجدداً تغییر کرده تا آستانه بعدی ثابت می ماند. هزینه متغیر کل (Total Variable Cost: TVC)؛ هزینه متغیر یا مستقیم، شامل کلیه هزینه‌های عوامل تولیدی است که مقدارشان در کوتاه‌مدت با افزایش یا کاهش میزان تولیدات، تغییر می‌کند. وقتی کالایی تولید نشود، میزان این هزینه ها برابر با صفر است. این هزینه ها دو گروه اند: الف) هزینه های متغیری که به تغییرات تولید کل وابسته اند؛ مثل مواد اولیه که متناسب با افزایش سطح تولیدات، میزان این هزینه ها نیز بالا می رود. . هزینه کل (Total Cost: TC)؛ هزینه کل، از جمع هزینه های ثابت و متغیر به‌دست می آید. عدم تولید کالا، موجب برابری میزان هزینه کل با هزینه های ثابت می شود؛ در غیر این صورت، همانند هزینه های متغیر افزایش پیدا می کند. هزینه های تولید در کوتاه‌مدت به هزینه کل و هزینه نهایی تقسیم می‌شوند. هزینه متوسط کل (Average Total Cost: ATC)؛ هزینه متوسط از تقسیم هزینه کل بر مجموع تولیدات و یا از راه جمع متوسط هزینه های ثابت و متغیر حاصل می شود. هزینه ثابت متوسط (Average Fixed Cost: AFC)؛ از تقسیم هزینه ثابت کل بر مقدار تولیدات هزینه ثابت متوسط حاصل می شود. با افزایش تولیدات، میزان این هزینه ها کم می شود. متوسط هزینه متغیر (Average Variable Cost: AVC)؛ با تقسیم تمام هزینه های متغیر را بر مقدار تولیدات، هزینه متغیر متوسط به‌دست می آید. با توجه به قانون بازدهی غیر نسبی در آغاز هزینه متغیر متوسط سیر نزولی داشته، اما با عبور از یک حداقل، افزایش پیدا می کند . هزینه نهایی Marginal Cost: MC))؛ در فعالیت‌های تولیدی هزینه مربوط به هر واحد اضافی تولید را هزینه نهایی می‌نامند. این نوع هزینه ها مانند هزینه های متوسط، براساس هزینه کل یعنی از تفاوت هزینه کل در تولید قبلی و هزینه کل در تولید بعدی، به‌دست می آید. در این هزینه ها، فقط هزینه‌های متغیّر دخالت دارند؛ به‌عنوان مثال، تولید یا عدم تولید یک واحد اضافی محصول، تغییری در هزینه های ثابت ندارد. یعنی افزایش تولید در حد یک واحد، افزایش هزینه-های ثابت را به‌دنبال نخواهد داشت؛ اما برای تولید یک واحد اضافی کالا، باید مواد اولیه اضافی داشته باشیم؛ که این، خود، موجب بالا رفتن هزینه متغیر می شود. منحنی هزینه نهایی ابتدا سیر نزولی داشته، سپس سیر صعودی پیدا خواهد کرد تولید متوسط (AP) در رابطه با تابع توليد سه مفهوم اساسى وجود دارد که از طريق آنها اصول و قوانين فيزيکى موجود بين عوامل توليد و محصول قابل بررسى است. اين مفاهيم عبارتند از: توليد کل، توليد نهائي، توليد متوسط.


توليد کل

توليد کل که گاهى به آن محصول کل يا توليد فيزيکى کل نيز گفته مىشود، عبارت از ماکزيمم مقدار محصولى است که مىتوان با هر ترکيب خاصى از نهاده‌هاى متغير و ثابت توليد نمود.

در واقع توابع توليد کوتاه‌مدت، کل مقدار محصول را به مقدار نهاده متغير ارتباط مىدهند. يادآورى اين نکته ضرورى است که توليد کل مربوط به يک محصول است. به عبارت ديگر نمىتوان مقادير کالاهاى مختلف را با يکديگر جمع کرد. بنابراين توليد کل فقط در ارتباط با يک محصول همگن تعريف مىشود
ساعت : 2:22 am | نویسنده : admin | مطلب قبلی | مطلب بعدی
نسیم باکس | next page | next page