انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

الگوریتم درخت تصمیم

الگوریتم درخت تصمیم

ساختار درخت تصمیم یک ساختار درختی ، شبیه فلوچارت میباشد


بالاترین گره در درخت گره ریشه است و گره های برگ ،دسته ها یا توزیع دسته ها را نشان می دهند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

درخت تصمیم یکی از ابزار های قوی و متداول برای دسته بندی و پیش بینی می باشد.در خت تصمیم بر خلاف شبکه های عصبی به تولید قاعده می پردازد.در ساختار درخت تصمیم ف پیش بینی به دست امده از درخت در قالب یگسری قواعد توضیح داده می شود . در حالی که در شبکه های عصبی تنها نتیجه پیش بینی بیان میشود و چگونگی به دست امدن انها در خود شبکه پنهان می ماند. همچنین در درخت تصمیم برخلاف شبکه های عصبی ضرورتی وجود ندارد که داده ها لزوما به صورت عددی باشند
:خصوصیات درخت تصمیم به موارد زیر می تواند اشاره کند :

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

روش درخت تصمیم در تقسیم بندی داده ها به گرو ه های مختلف به گونه ای است که هیچ داده ای حذف نمی شود ، تعداد داده ها در گروه مادر با مجموع داده ها در شاخه های در خت ایجاد شده برابر است


استفاده از درخت تصمیم اسان است


درک مدل ایجاد شده توسط درخت تصمیم اسان است


دسته بندی هایی که توسط درخت تصمیم ایجد می شوند ، از روی شباهت داده های ذخیره شده در پارامتر های پیش بینی کننده ، قابل انجام می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

انواع متغیر های موجود در داده های در خت تصمیم :

 

در مسائل مرتبط با درختهای تصمیم با دو نوع متغیر ها مواجه هستیم :

متغیر های عددی مثل مشخصه "سن که مقادیر ان عددی است


متغیر های طبقه ای مثل مشخصه نوع ماشین که مقادیر آن متنی و گروهی میباشد


از این متغیر ها برای پیش بینی متغیر هدف یا متغیر وابسته استفاده می کنیم در مثال فوق به متغیر های سن و نوع ماشین که متغیر های مستقل هستند ، متغیر پیش بینی کننده گویند و به متغیر های وابسته برچسب دسته گویند . در مثال بالا متغیر ریسک تصادف از نوع برچسب دسته می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

اگر متغیر وابسته از نوع عددی باشد مسئله رگرسیون یا پیش بینی تبدیل خواهد شد و اگر این متغیر از نوع طبقه ای باشد با یک مسئله دسته بندی مواجه هستیم

قواعد تلازمی

قواعد تلازمی

استخراج قواعد تلازمی یا قواهد انجمنی نوعی عملیات داده کاوی است که به جستجو برای یافتن ارتباط بین ویژ گیها در مجموعه دادها می پردازد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

نام دیگر روش تحلیل تلازمی ، تحلیل سبد بازار می باشد . به عبارت دیگر تحلیل تلازمی مطلالعه ویژگیها یا خصوصیاتی میباشد که با یکدیگر همراه بوده و به دنبال استخراج قواعد از میان این خصوصیات میباشد

این روش به دنبال استخراج قواعد به منظور کمی کردن ارتباط میان دو یا چند خصوصیت است .قواعد تلازمی به شکل اگر و انگاه به همراه دو معیار پشتیبان و اطمینان تعریف می شود


همان طور که اشاره شد ، یکی از کاربردی ترین حالت های تحلیل قواعد تلازمی ، تجزیه و تحلیل سبد بازار است . پیشرفت فناوری ، فروشگاه های خرده فروشی را قادر ساخته است تا حجم زیادی از داده های خرید مشتریان که از ان به عنوان سبد بازار یاد میشود را جمع اوری و ذخیره نماید . هر مشتری خرید مجزایی را در مقادیر مختلف و زمانهای متفاوت انجام میدهد و داده های موجود در سبد بازار ،نشان دهنده خرید مشتری در یک زمان خاص است .با تجزیه و تحلیل سبد بازار خرده فروشان می توانند رفتار خرید مشتریان را پیش بینی کنند . این کار به انها کمک می کند تا بتوانند کالاهای خود را بهتر سازماندهی کرده .و چیدمان بهتری از محصولات خود داشته باشند و از این طریق سود آوری خود را افزایش دهند

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

در اینجا به مثالهایی از کاربرد قواعد تلازمی اشاره میشود :


بررسی ارتباط بین توانایی خواندن کودکان با خواندن داستان توسط والدین برای آنها بررسی اینکه چه اقلامی در یک فروشگاه با یکدیکر خریداری میشوند و اینکه چه اقلامی هیچ گاه با یکدیگر خریداری نمی شوند تعیین نمونه ها در بررسی تاثیرات خطر ناک یک داروی جدید

انباره داده ها

انباره داده ها

سازمانها درک کرده اند که سیستم های انبارداده ابزارهای ارزشمندی در رقابتهای امروزه هستند بنگاهای بسیاری میلونها دلار برای ساخت انبار داده صرف کرده اند طبق تعریف اینمون یکی از پیشتازان معماری در ساخت سیستمهای انبار داده ، انبار داده مجموعه ای موضوع گرا ،یکپارچه از زمانهای مختلف و غیر فرار به منظور پشتیانی از فرایند تصمیم سازی است.داده کاوی چیزی فراتر از پردازش بر روی یک پایگاه داده معمولی می باشد .


مثالهای زیر این تفاوت را آشکار می کند :
یک پرس جوی ساده و پیدا کردن تمامی افراد با نام علی در یک پایگاه داده بسیار ساده ولی در مقابل پیدا کردن افرادی که کارت اعتباری انها وضعیت مناسبی ندارد و در مرز ورشکستگی می باشد، خیلی ساده نیست .پیدا کردن افرادی که بیش از یکصد هزار تومان خرید داشته اند ساده است ولی در مقابل پیدا کردن افرادی که عادتهای خرید مشاهی دارند و یکسری اقلام خاصی را با هم خرید می کنند کار ساده ای نیست .

پیدا کردن افرادی که در یک تاریخ خاص از یک فروشگاه خاص شیر خریده اند ساده است

ولی در مقابل افرادی که غالبا شیر خریداری می کنند خیلی ساده نیست


داده کاوی و انبار داده ها :


علت اهمیت انبار داده ها این است که انباره داده ها شامل داده های جزئی و داده های کلی ، در کنار یکدیگر می باشند . بدون تردید داده کاوی به اطلاعات جزئی برای تحلیل نیازمند است ، اما داده ای خلاصه شده نیز به کار می آیند . از انجا که در انبار داده انواع داده ای خلاصه شده وجود دارد ، داده کاوی می تواند .به سرعت داده ای انبارداده انواع داده ای خلاصه شده وجود دارد ف داده کاوی می تواند به سرعت داده ای انبارداده را بررسی و این باعث کاهش تکرار تحلیلها توسط داده کاوی شود


  ویزگیهای مهم یک انبار داده عبارتند از موضوع محوری :
جامعیت
پویا پذیری
پایانی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

موضوع محوری : داده ها طبق یک موضوع خاص سازماندهی می شوند


جامعیت :داده ای انباره ،از تجمع دیگر داده ها ساخته می شوند


افق زمانی برای انبارداده ها بسیار مهم تر از داده های مرتبط با سیستم های عملیاتی می باشد

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

پایگاه داده ها شامل داده های است که روزانه با انها کار می شود و بخشهای به آن اضافه و یا حذف می شود

پروژه آماده داده کاوی با نرم افزار weka - clementine 12

پروژه آماده داده کاوی با نرم افزار weka - clementine 12

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

مشاوره در زمینه پروژه های داده کاوی

مشاوره در زمینه پروژه های داده کاوی

در مقاطع کارشناسی و کارشناسی ارشد

با نرم افزار weka- clementine 12

از ابتدا تا انتها