
پايان نامه : تکنیک های داده کاوی در سازمانها (Data Mining )
چكيده:
در دو دهه قبل تو انايي های فنی بشر در برای توليد و جمع آوری دادهها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار، علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند.
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. اين رشد انفجاری در دادههای ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده و ديگر مخازن بزرگ اطلاعات، ذخيره شده است. داده کاوی بطور همزمان از چندين رشته علمی بهره مي برد نظير: تکنولوژی پايگاه داده، هوش مصنوعی، يادگيری ماشين، شبکه های عصبی، آمار، شناسايی الگو، سيستم های مبتنی بر دانش ، حصول دانش ، بازيابی اطلاعات ، محاسبات سرعت بالا و بازنمايی بصری داده . داده کاوی در اواخر دهه 1980 پديدار گشته، در دهه 1990 گامهای بلندی در اين شاخه از علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد.
واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان يک فرآيند در شکل1-1 نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند، به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.............................
داده کاوی، استخراج اطلاعات و دانش و کشف الگوهای پنهان از یک پایگاه داده های بسیار بزرگ، کاربردهای زیادی در کسب و کارهای امروزی پیدا کرده است. استفاده از تکنیک های داده کاوی در سازمان ها منتج به تعداد زیادی قانون و الگو می شود که با توجه به محدودیت در منابع و بودجه، پیاده سازی همه ی آنها امکان پذیر نمی باشد. می توان گفت که ارزیابی و رتبه بندی قوانین وابستگی کاری مهم و چالش برانگیز است. با استفاده از از تكنيك ناپارامتريك تحليل پوششي داده ها به ارائه چارچوبي براي ارزيابي و اولويت بندي قوانين وابستگي مي پردازيم. در اين تحقيق ابتدا مدلي براي شناسايي كاراترين واحد تصميم گيري در حالت بازده متغير به مقياس ارائه مي شود. پس از آن، با استفاده اين مدل، متدي نوين جهت رتبه بندي واحدهاي تصميم گيري ارائه مي شود. سپس با استفاده از مدل و متد پيشنهادي، چارچوبي نوين جهت رتبه بندي قوانين وابستگي داده كاوي توسعه داده مي شود. در انتها، با پياده سازي چارچوب پيشنهادي براي اولويت بندي قوانين وابستگي داده كاوي در بانك كشاورزي كاربردپذيري چارچوب پيشنهادي نشان داده مي شود.
فهرست موضوعات :
مقدمه ای بر دادهکاوی
فصل اول
1-1 مسئله اصلي تحقيق
1-2 تشريح و بيان موضوع
1-3 ضرورت انجام تحقيق
1-4 اهداف اساسي انجام تحقيق
فصل دوم
2-1 چه چيزی سبب پيدايش داده کاوی شده است؟
2-2 مراحل کشف دانش
2-3 جایگاه داده کاوی در میان علوم مختلف
2-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟
2-5 داده کاوی و انبار داده ها
2-6 داده کاوی و OLAP
2-7 کاربرد یادگیری ماشین و آمار در داده کاوی
2-8 توصیف داده ها در داده کاوی
2-8-1 خلاصه سازی و به تصویر در آوردن داده ها
2-8-2 خوشه بندی
2-8-3 تحلیل لینک
فصل سوم
3-1 مدل های پیش بینی داده ها
3-1-1 Classification
3-1-2 Regression
3-1-3 Time Series
3-2 مدل ها و الگوریتم های داده کاوی
3-2-1 شبکه های عصبی
3-2-2 Decision Trees
3-2-3 Multivariate Adaptive Regression Splines(MARS)
3-2-4 Induction Rule
3-2-5 (MBR) Earest Neibour and Memory-Based Reansoning -K
3-2-6 رگرسیون منطقی
3-2-7 تحلیل تفکیکی
3-2-8 مدل افزودنی کلی (GAM)
3-2-9 Boosting
فصل چهارم
4-1 سلسله مراتب انتخابها
4-2 نگاه عمیق تر به شبکه عصبی
4-3 آشنایی با الگوریتم ژنتیک
4-4 کاربردهای داده کاوی در کتابخانه ها و موسسات دانشگاهی
4-5 فرآيند تصميم گيري و سياستگذاري کلان
نتیجه گیری
فهرست منابع و مراجع
فهرست تصاویر
شكل 2-1 : داده کاوی به عنوان يک مرحله از فرآيند کشف دانش
شكل 2-2 : سير تکاملی صنعت پايگاه داده
شكل 2-3 : معماری يک نمونه سيستم داده کاوی
شكل 2-4 : داده ها از انباره داه ها استخراج می گردند
شكل 2-5 : داده ها از چند پایگاه داده استخراج شده اند
شکل 3-1: شبکه عصبی با یک لایه نهان
شكل 3-2 : Wx,y وزن یال بین X و Y است
شكل 3-3 : درخت تصمیم گیری
شكل 3-4 : محدوده همسایگی (بیستر همسایه ها در دسته X قرار گرفته اند)
شكل 4-1: فرایند عملیاتی
شكل4-2 : مورچگان بین منبع غذا و لانه یک مسیر را حفظ می کنند
شكل 4-3: مسیر مورچگان
شكل 3-3: مسیر یاب
شكل 3-4: میزبانان
شكل 3-5: تست انطباق
شكل3-6: اتصال
شكل3-6: بهینه محلی و بهینه کلی
فهرست جداول
جدول 1- کاربردهای داده کاوی در کتابخانه ها
جدول 2- کاربردهای داده کاوی در موسسات دانشگاهی
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
داده کاوی ,
|