
تحقیق بررسی روشهای مختلف خوشه بندي پايگاههاي داده
فرمت : word
تعداد صفحه : 62 قیمت : مبلغ ۹ هزار تومان
امروزه، يافتن الگوهاي مفيد در مجموعه هاي داده بزرگ بسيار مورد توجه مي باشد و يکي از مسائل مهم و بسيار مورد توجه در آن شناسايي خوشه ها يا نواحي داراي جمعيت متراکم در مجموعه داده چند بعدي مي باشد. خوشه بند ي در داده کاوي براي کشف گروهها و شناسايي توزيع ها بسيار مفيد مي باشد.
در اين گزارش چهار روش مختلف براي خوشه بندي پايگاههاي داده بزرگ معرفي شده و با يکديگر و ديگر روشهاي موجود مقايسه مي شوند. به اين منظور در بخش دوم روش BIRCH شرح داده مي شود [ZRL96] و با روش پيش از خود (CLARANS [NH94]) مقايسه مي شود. اين روش، اولين الگوريتم خوشه بنديي است که نويز را نيز مديريت مي کند. سپس CURE معرفي شده [GRS98] و با الگوريتمهاي پيش از خود و BIRCH مقايسه مي شود. در بخش چهارم DBCLASD معرفي شده [XEK98] و با CLARANS و DBSCAN مقايسه مي شود. در بخش پنجم الگوريتمي موازي براي خوشه بندي سريع پايگاههاي داده بزرگ معرفي مي شود. اين الگوريتم PFDC ناميده مي شود [M02] و نسخه موازي الگوريتم FDC مي باشد. در نهايت نتايج کلي اين روشها بررسي مي شوند.
فهرست مطالب
1- مقدمه
2- BIRCH
2-1- خلاصه کارهاي انجام شده قبلي
2-1-1- مزاياي BIRCH
2-2- مفاهيم پايه
2-3- ويژگي خوشه بندي و درخت CF
2-3-1- درخت CF
2-3-2- درج در درخت CF
2-4- الگوريتم خوشه بندي BIRCH
2-4-1- بررسي فاز 1
2-4-1-1- کاهش
2-4-1-2- مديريت نقاط دور افتاده
2-5- بررسي کارايي
2-5-1- آناليز
2-6- بررسي نتايج بدست آمده
3- CURE
3-1- بررسي کاستي هاي الگوريتمهاي خوشه بندي رايج
3-2- خصوصيات برجسته CURE
3-3- الگوريتم خوشه بندي سلسله مراتبي CURE
3-3-1- مرور کلي الگوريتم
3-3-2- بررسي جزئيات
3-3-3- پيچيدگي زمان و فضا
3-4- بهبود الگوريتم به منظور کار بر روي مجموعه داده بزرگ
3-4-1- نمونه برداري تصادفي
3-4-2- بخش بندي به منظور افزايش سرعت
3-4-3- برچسب دهي به داده در ديسک
3-4-4- مديريت نقاط دورافتاده
3-5- بررسي نتايج آزمايشات و نتايج کلي الگوريتم CURE
4-1- خوشه هاي برپايه توزيع فاصله
4-1-1- تعاريف
4-1-2- مدل آماري تعريف خوشه
4-1-3- محاسبه مساحت خوشه
4-2- الگوريتم DBCLASD
4-2-1- توليد کانديداها
4-2-2- تست کانديداها
4-2-3- الگوريتم ارائه شده
4-3- نتايج ارائه شده
5- الگوريتم PFDC
5-1- کارهاي انجام شده قبلي قابل مقايسه با PFDC
5-1-1- خوشه بندي بر مبناي چگالي
5-1-2- DBSCAN
5-1-3-FDC
5-2- طراحي الگوريتم موازي
5-3- ساختار داده k-d Tree
5-3-1- Guard k-d Tree
5-3-2- طرح هاي موازي k-d Tree
5-3-2-1- طرح بر مبناي مرتب سازي اوليه
5-3-2-2- طرح بر مبناي مرتب سازي ساده
5-3-2-3- طرح بر مبناي ميانه
5-4- تعيين خصوصيات خوشه بندي
5-5- پياده سازي
5-5-1- توليد ورودي و فراخواني
5-5-2- ساخت k-d Tree عمومي
5-5-3- خوشه بندي برگ
5-5-4- رفع مشکل هم ارزي خوشه ها
5-5-4-1- انجام موازي از طريق طرح بر مبناي مرتب سازي ساده
5-5-4-2- انجام موازي از طريق طرح بر مبناي مرتب سازي اوليه
5-5-5- توليد و ارائه خروجي
5-6- بررسي نتايج
6- خلاصه و نتايج
فهرست منابع
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
ساخت پایگاه دانش , پایگاه پردازش تحلیلی , پایگاه داده , پایگاه داده ,
|