انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

انجام پروژه داده کاوی با متلب matlab

انجام پروژه داده کاوی با متلب (matlab)
دسته بندی ها : ابزارهای داده کاوی, نرم افزار متلب آکادمی داده کاوی

داده کاوی را میتوان علم کشف اطلاعات با استفاده از الگوریتم‌ها و تجزیه و تحلیل داده‌های بزرگ دانست. کاربرد داده کاوی امروزه در همه زمینه ها می باشد از جمله صنعت بیمه، صنعت بانکداری، بازاریابی و فروش که می توان نام برد . نرم افزار متلب یکی از نرم افزارهایی است که در امر انجام پروژه داده کاوی استفاده می‌شود . انجام پروژه داده کاوی با متلب در زمینه های مختلفی قابل انجام است ، برای مثال انجام پایان نامه داده کاوی با متلب امروزه در دانشجویان مهندسی بسیار فراگیر است .

برای انجام پروژه داده کاوی با متلب تماس بگیرید

تاریخچه

 آقای کلو مولر که در دانشگاه نیومکزیکو ریاست بخش علوم کامپیوتری را بر عهده داشت در اواخر دهه ۱۹۷۰ شروع به توسعه برنامه‌ای به نام متلب کرد، دلیل طراحی برنامه متلب این بود که به دانش آموزان خود اجازه دسترسی به linpack eispack را به بدون نیاز یادگیری fortran بدهد. این موضوع برای سایر دانشگاه‌ها نیز جالب توجه شد و به زودی در سراسر دانشگاه‌ها گسترش پیدا کرد. پس از شهرت برنامه متلب، آقای جک لیتل در دیدار با آقای مولر در سال ۱۹۸۳ با نرم افزار متلب آشنا شد؛ او با ذهن باز و ذکاوت قابل توجه اش قابلیت تجاری سازی برنامه متلب را با مولر در میان گذاشت و به او پیشنهاد همکاری در این زمینه را داد. در سال ۱۹۸۴ شرکت مت ورکس تأسیس شد، دفتر مرکزی این شرکت در شهر natick ایالت ماساچوست آمریکاست آنها در سال ۱۹۸۴ برنامه متلب را منتشر کردند. این نرم‌افزار ابتدا توسط مهندسین و محققین مورد استفاده قرار می‌گرفت اما پس از آن در عرصه‌های دیگر نیز مورد استقبال عموم قرار گرفت.

اما این برنامه در زمینه انجام پروژه داده کاوی دارای انتقادات متعددی از سوی متخصصین این حوزه است که در زیر به چندین مورد آن می‌پردازیم.انجام پروژه داده کاوی با متلب matlab
حل مسائل ریاضی تخصص متلب است
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 در واقع اصلی‌ترین هدف نرم افزار متلب حل مسائل ریاضی است و قاعدتاً در حل مسائل ریاضی در حوزه‌های مهندسی می‌توان گفت این نرم افزار واقعاً بی رقیب است اما در سایر موارد مانند آمار ، داده کاوی اقتصاد و غیره به طور مشخص توسعه نیافته و و مورد قبول متخصصان این حوزه نمی‌باشد.

متلب یک نرم افزار تجاری است

 متلب یک نرم افزار رایگان بوده و تحت برندی تجاری می‌باشد که این مورد علاوه بر اینکه دارای هزینه خرید برای متخصصین می باشد که غالبا خوشایند نیست .این برنامه متن باز نیست بنابراین متخصصان قابلیت توسعه نرم افزار را ندارند و متخصصان داده کاوی عموما از این نرم افزار بر انجام پروژه داده کاوی استفاده نمی‌کنند.

 عدم یکپارچه سازی متلب با سایر نرم افزارهای داده کاوی

از آنجایی که نرم افزار متلب تجاری بوده بنابراین قابلیت یکپارچه سازی با سایر نرم افزارهای داده کاوی را ندارد. معمولاً نرم افزارهای دیگر داده کاوی با استفاده از پلاگین ها و افزونه‌های قابلیت اتصال به نرم افزارهای دیگر داده کاوی را دارند و این از مزیت‌های بزرگ نرم افزارهای داده کاوی متن باز می‌باشد.انجام پروژه های داده کاوی با متلب matlab
 تفاوت پایتون با متلب

 همانطور که میدانیم پایتون یک برنامه متن باز می‌باشد و برنامه نویسان به کدهای آن به راحتی دسترسی دارند و از آن سو برنامه متلب برنامه تجاری پولی می‌باشد که نسبت به نرم افزارهای پولی نیز قیمت بالایی دارد.

 از آنجا که پایتون یک نرم افزار تجاری است ،راهنمای جامع و کاملی برای آن از سوی شرکت ارائه دهنده تولید شده است ولی در مورد برنامه پایتون از آنجایی که یک برنامه متن باز می‌باشد به صورت کلی و پراکنده در اینترنت پیدا می‌شود امروزه از پایتون استفاده های متعددی می‌شود به خاطره کاربری آسان و فوق العاده و امکانات بی نظیرش
 تفاوت متلب با نرم افزار R
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 همانطور که می دانیم نرم افزار رایگان و متن باز می‌باشد در نرم افزار R اگر بخواهیم برای مثال رده مدل رده بندی خود را عوض کنیم به راحتی تابع مربوطه را با تابع قبلی عوض می کنیم و آن تابع را روی داده‌ها اعمال می کنیم اما در برنامه متلب اینگونه نیست در برنامه متلب باید ابتدا داده‌ها را فرمت بندی کرده و تابع‌های دیگر را فراخوانی کنیم. نرم افزار R  دارای تعداد بی شماری کتابخانه در خصوص یادگیری ماشین دارد که همچنان در حال توسعه است .

 
تفاوت داده کاوی با آمار
دسته بندی ها : داده کاوی آکادمی داده کاوی

علم داده کاوی با آنالیز های متداول آماری بسیار متفاوت است ، ما در این مقاله تفاوت داده کاوی با آمار را مفصل مورد بررسی قرار داده ایم . و در زیر نمونه ای از تفاوت ها را در انجام پروژه داده کاوی و آمار به تفصیل توضیح خواهیم داد.
در داده کاوی

    ما به فرضیه احتیاجی نداریم علم داده کاوی الگوریتم هایی دارد که به طور اتوماتیک روابط را ایجاد می کند.
     علم داده کاوی به داده های صحیح و درست نیازی ندارد.
     نتایجی که از داده‌کاوی به دست می آید پیچیده است و برگردان آن به صورت مطلبی قابل فهم برای مدیران نیازمند متخصص است.

در آنالیز آماری

      در تمامی موارد آمار شناسان با یک فرضیه شروع می کنند .
    آنها برای آنالیز آماری از داده های عددی استفاده می کنند آنها رابطه های ایجاد می کنند که در نهایت به فرضیه مرتبط باشد.
     آمار شناسان داده های نابجا و نادرست را در طول آنالیز مشخص کرده و در نهایت نتایج کار خود را تفسیر و برای مدیران بیان می کنند

مثال کلاه برداری در بیمه
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 برای آنکه بتوانیم تفاوت میان داده کاوی و آنالیزهای آماری را بهتر درک کنیم می‌توانیم در مورد شناخت کلاهبرداری های شرکت بیمه این دو را با یکدیگر مقایسه کنیم .
روش داده کاوی

 یک داده کاو پس از طی مراحلی که در داده کاوی وجود دارد به جمع آوری داده ها می پردازد و سپس داده ها را یکپارچه سازی می کند و در نهایت عملیات داده کاوی را انجام میدهد علم داده کاوی در میان داده ها تمامی الگوهای غیر عادی را که از حالت عادی و نرمال آن انحراف دارد و ممکن است منجر به کلاهبرداری شود را شناسایی کرده و و آن را به صورت نتیجه تحلیل ارائه میکند.

 داده کاونتایجی را که از داده کاوی به دست آورده را بررسی کرده و با توجه به آن مراحل بعدی  که باید راجع به آنها تحقیق کند مشخص شده و در نهایت مدلهایی به دست می آید که می تواند امکان کلاهبرداری مشتریان را پیش بینی کند .
 روش آنالیز آماری

همانطور که گفتیم در آمار ما نخست به یک فرضیه نیاز داریم  آمارشناس نخست متوجه الگوی رفتاری می‌شود که سبب کلاهبرداری شده ، بر اساس این فرضیه یک سوال مطرح می‌کند تا این موضوع را مورد بررسی قرار دهد اگر نتیجه حاصله مناسب نبود آمارشناس فرضیه را اصلاح می کند یا یک فرضیه دیگری انتخاب می کند و همانطور که کاملاً مشخص است این روش نه تنها وقت گیر است بلکه بسیار به قدرت تجزیه و تحلیل یک آمارشناس بستگی دارد و بدتر از آن که الگوهایی که آمارشناس نتوانست پیش بینی کند و آنها را دریابد منجر به عدم کشف در الگوهای کلاهبرداری خواهد شد.تفاوت داده کاوی با آمار
خلاصه مقاله تفاوت داده کاوی با آمار

در تفاوت داده کاوی با آمار نتیجه گیری می شود علم داده کاوی علمی بسیار کاربردی است و ابدا در مسائل این چنینی قابل قیاس با آمار نیست زیرا که علم داده کاوی  از میان انبوه داده‌ها الگوهای آن را شناسایی می کند و نتایج کشفیات خود را به مفصل ارائه می دهد امروزه داده کاوی در بیمه ، پزشکی ، بانکداری و دیگر موارد کاربرد فراوانی دارد . اما در کشور ما ایران هنوز که هنوزه شناختی که باید نسبت به علم داده کاوی باشد ایجاد نشده است و یکی از رویاهای ما در آکادمی داده کاوی آموزش و نشر علم زیبای داده کاوی است امیدوارم روزی برسد ما از این علم استفاده بسیار مفیدی کرده و باعث پیشرفت و آبادانی هر چه بیشتر کشور عزیزمان ایران شویم
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

تعریف داده کاوی
داده کاوی یک فرآیند محاسباتی است که در واقع الگو یا الگوهایی را در مجموعه از داده های عظیم کشف میکند . در تمامی تعریف های مرتبط به داده کاوی کلمه کشف کردن را میتوان پیدا کرد . داده کاوی شاخه ای از علوم کامپیوتر است که در واقع ترکیبی از تکنیکهای آماری ، علوم اطلاعات ، یادگیری ماشینی و نظریه پایگاه داده است .
تاریخچه داده کاوی

اصطلاح Data Fishing  یا Data Dredging  به معنی صید داده بوجود آمد . این اصطلاح به این معنی است که درون حجم عظیمی از داده ها بدون در نظر گرفتن هیچگونه پیش فرضی ، هر گونه ارتباطی را مورد بررسی قرار دهیم. در سال ۱۹۸۹ اصطلاح کشف دانش در پایگاه داده مطرح شد و در سال ۱۹۹۰ اصطلاح داده کاوی بوجود آمد و در همین سال با استفاده از داده کاوی ، خرده فروش ها و بازارهای مالی به تجزیه تحلیل داده ها و پیش بینی نوسانات در نرخ بهره و افزایش مشتری پرداختند .
تفاوت داده کاوی با آمار

تحلیل های آماری در کل بنظر بی شباهت به تحلیل های داده کاوی نیستند . اما حالب ترین تفاوت این دو با هم در این است که در آمار پیش فرض هایی وجود دارد و آمار گر با تحلیل خود به اثبات یا رد آن فرضیه میپردازد اما در داده کاوی گویی داده کاو خود نیز نمیداند دقیقا دنبال چه چیزی هست ! او به دنبال ارتباط های پنهان و کشف نشده است . داده کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ، فراگیری ماشین داده می باشد.
چه چیزی اساسا باعث پیدایش داده کاوی شد ؟

میتوان گفت اصلی ترین دلیل و توجه به این دانش این بود که حجم وسیعی از داده ها موجود بود و شدیدا این نیاز بوجود آمده بود که باید از این داده ها اطلاعات و دانش مفیدی استخراج کرد و از آن برای کنترل ، تحلیل و پیش بینی استفاده کرد بنابراین دلایل کلی را  میتوان در سه مورد نوشت : حجم داده‌ها (Data) با سرعت زیادی در حال رشد است. اطلاعات (Information) ما در مورد این داده‌ها کم است. دانش (Knowledge) ما نسبت به این اطلاعات صفر است. اما پاسخ تمامی این مشکلات تنها و تنها داده کاوی است . با داده کاوی میتوان حجم عظیم داده ها را اصطلاحا کاوید و دانش را از دل آن بیرون کشید . ویژگی های اصلی داده کاوی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

کشف اتوماتیک الگوها در انجام پروژه های داده کاوی
پیشبینی احتمالی نتایج و خروجی ها
تولید اطلاعات اجرایی و مفید
متمرکز بر داده های بزرگ
مزایای داده کاوی
ایجاد روابط بصورت اتوماتیک
استفاده از داده های متنوع
دینامیک بودن
عدم نیاز به داده های صحیح
ساخت مدل های واقعی
آنالیز کردن داده های واقعی
دوری از اشکالات احتمالی نمونه گیریچه چیزی اساسا باعث پیدایش داده کاوی شد ؟
اجزای اصلی سیستم داده کاوی

پایگاه داده: مجموعه‌ای از پایگاه داده ها، انباره داده، صفحه گسترده، یا دیگر انواع مخازن اطلاعات، پاکسازی داده‌ها و تکنیک‌های یکپارچه سازی روی این داده‌ها انجام می‌شود. سرویس دهنده پایگاه داده: که مسئول بازیابی داده‌های مرتبط براساس نوع درخواست داده کاوی کاربر می‌باشد.

پایگاه دانش: این پایگاه از دانش زمینه تشکیل شده تا به جستجو کمک کند یا برای ارزیابی الگوهای یافته شده از آن استفاده می‌شود.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

موتور داده کاوی: این موتور جزء اصلی سیستم داده کاوی است و به طور ایده آل شامل مجموعه‌ای از پیمانه‌ها نظیر توصیف، تداعی، کلاس بندی، آنالیز خوشه‌ها و آنالیز تکامل و انحراف است.

پیمانه ارزیابی الگو: این جزء معیارهای جذابیت را به کار می‌بندد و با پیمانه داده کاوی تعامل می‌کند، بدین صورت که تمرکز آن بر جستجو بین الگوهای جذاب می‌باشد، و از یک حد آستانه جذابیت استفاده می‌کند تا الگوهای کشف شده را ارزیابی کند.

واسط گرافیکی کاربر: این پیمانه بین کاربر و سیستم داده کاوی ارتباط برقرار می‌کند، به کاربر اجازه می‌دهد تا با سیستم داده کاوی از طریق پرس و جو ارتباط برقرار کند. این جزء به کاربر اجازه می‌دهد تا شمای پایگاه داده یا انباره داده را مرور کرده، الگوهای یافته شده را ارزیابی کرده و الگوها را در فرم‌های بصری گوناگون، بازنمایی کند.
کاربردهای داده کاوی

علم داده کاوی جزو ده علم برتری است که تحولی در عصر تکنولوژی ایجاد نموده است . در هر فضایی که داده ای تولید میشود میتوان گفت داده کاوی میتواند کاربرد داشته باشد . از جمله امور تجاری و مالی، امور پزشکی، زیست پزشکی، تجزیه و تحلیلهای مربوط به DNA، ورزش و سرگرمی، کشف ناهنجاریها و اسناد جعلی، ارتباطات از راه دور، کتابداری و اطلاع‌رسانی … امروزه استفاده از داده کاوی در شرکتها به امری حیاتی تبدیل شده است . تمامی شرکتهایی که پارامتر مشتریان در کانون توجه است مانند فروشگاه‌ها، شرکتهای مالی، ارتباطاتی، بازاریابی و غیره استفاده از داده کاوی برای کشف اطلاعات ضروری است . این اطلاعات حاصل از داده کاوی به شرکتها کمک میکند تا ارتباطهای عوامل داخلی قیمت، محل قرارگیری محصولات و مهارت کارمندان را با عوامل خارجی از جمله: وضعیت اقتصادی، رقابت در بازار و محل جغرافیایی مشتریان کشف نمایند. انجام پروژه های داده کاوی پیش‌بینی وضع آینده بازار، گرایش مشتریان و شناخت سلیقه‌های عمومی آنها را برای شرکتها ممکن می‌سازد .  بگذارید چند مثال در زمینه های مختلف بزنیم و هر کدام را مقداری توضیحی بدهیم .
در زمینه صنعت

یکی از مثالهای معروف استفاده از داده کاوی در صنعت متعلق به شرکت فولادسازی پوهانگ است . که با استفاده از الگوریتمهای داده کاوی حدود ۱۵ درصد میزان مصرف انرژی را کاهش دادند که نتیجه این کاهش ۳/۱ میلیون دلار صرفه جویی بوده واین نتیجه قطعا باعث کاهش قیمت محصولات در نتیجه افزایش فروش و رضایتمندی بیشتر مشتریان شده است .
در هتل‌داری
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

در صنعت هتلداری استفاده از داده کاوی میتواند فرق برنده و بازنده را مشخص کند . یکی از هتلهای مشهوری که در لاس وگاس است ؛ برای افزایش رضایتمندی مسافران از الگوریتمهای داده کاوی بهره برد . این هتل بصورت پرسشنامه داده هایی جمع نمود و توانست عواملی که باعث میشود مسافران دوباره به هتل بازگردند را پیدا کرده و با طبقه‌بندی مسافران، مسافران وفادار به هتل را پیدا کنند.
در مدیریت ریسک

در بانکی از بامکهای کانادا مسئله مهم تقلب در حسابها و چگونگی و میزان برگشت وامهای داده شده توسط بانک با استفاده از الگوریتم های داده کاوی را حل نمودند . حوزه‌های داده‌کاوی در سه حوزه مستقل به‌کار می‌رود و در آنها ریشه دوانده است:  ۱٫ آمار کلاسیک و الگوهای آماری  ۲٫ هوش مصنوعی  ۳٫ یادگیری خودکار و شبکه‌های عصبی
مراحل داده کاوی

مرحله اول: تشکیل انبار داده. با توجه به عنوان، این مرحله برای تشکیل محیطی پیوسته و یک پارچه جهت انجام مراحل بعدی و داده کاوی در آن، انجام می گیرد. در حالت کلی انبار داده مجموعه پیوسته و طبقه بندی شده است که دائما در حال تغییر بوده و دینامیک است که برای کاوش آماده می شود.

مر حله دوم: انتخاب داده ها. در این مرحله برای کم کردن هزینه های عملیات داده کاوی، داده هایی از پایگاه داده انتخاب می شوند. که مورد مطالعه هستند و هدف داده کاوی دادن نتایجی در مورد آن هاست.

مرحله سوم: تبدیل داده ها. مشخص است برای انجام عملیات داده کاوی لزوما باید تبدیلات خاصی روی داده ها انجام گیرد ممکن است این تبدیلات خیلی راحت و مختصر مثل تبدیل byte به integer باشد یا خیلی پیچیده و زمان بر و با هزینه های بالا مثل تعریف صفات جدید و یا تبدیل و استخراج داده ها از مقادیر رشته ای و … باشد.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

مرحله چهارم: کاوش در داده ها. در این مرحله است که داده کاوی انجام می شود. در این مرحله با استفاده از تکنیک های داده کاوی داده ها مورد کاوش قرار گرفته، دانش نهفته در آن ها استخراج شده و الگو سازی صورت می گیرد.

مرحله پنجم: تفسیر نتیجه در این مرحله نتایج و الگوهای ارائه شده توسط ابزار داده کاوی مورد بررسی قرار گرفته و نتایج مفید معین می شود. طرز کار ابزار داده کاوی این گونه است که ابزار به دنبال اثبات این است که وجود چیزی به معنای وجود چیز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگیرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخلی به مخاطبش ارائه دهد.
CRISP-DM (انجام پروژه داده کاوی)

یکی از متداول‌ترین فرآیندها برای انجام پروژه داده کاوی ، CRISP-DM (Cross-Industry Standard Process for Data Mining)  نام دارد. این استاندارد اولین بار در میانه دهه ۱۹۹۰ میلادی توسط گروهی از شرکت‌های اروپایی به‌عنوان روشی برای انجام پروژه داده کاوی ارائه شد. شکل-۱ فرآیند یک پروژه داده‌کاوی را تحت این استاندارد نشان می‌دهد. این فرآیند شش مرحله‌ای از درک نیازهای اصلی کسب‌وکار شروع می‌شود و به ارائه راهکاری برای آن نیاز ختم می‌شود. اگرچه مراحل این فرآیند به دنبال یکدیگر می‌آیند اما در عمل رفت‌وبرگشت‌های زیادی بین مراحل مختلف این فرآیند وجود دارد. کسانی که درگیر پروژه‌های داده‌کاوی بوده‌اند، به‌خوبی می‌دانند که کار کردن با داده نیازمند سعی و خطا و آزمایش کردن است.   اگر متن های قدیمی و کلاسیک داده کاوی را مطالعه کرده باشید، در آن چهار وظیفه ی اساسی برای داده کاوی برشمرده شده استروش کریسپ

    دسته بندی (Classification)
    خوشه بندی (Clustering)
    تحلیل قواعد انجمنی (Association Rules)
    مصور سازی (Visualization)
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

که البته کمابیش نقش های دیگری نیز به ان اضافه می کنند ولی در کل همین است که همین است. خب این یک تقسیم بندی. در تقسیم بندی دیگر، تمام الگوریتم های داده کاوی و یادگیری ماشین به سه دسته کلی:

    یادگیری با ناظر (Supervised Learning)
    یادگیری بدون ناظر (Unsupervised Learning)
    یادگیری نیمه ناظر (Semi-Supervised Learning)

هر کدام از این تقسیم بندی ها الگوریتم ها و دنیای خودش را دارد ولی به طور کلی، یادگیری با ناظر با استفاده از برچسب یا label داده ها، برچسب داده های مشاهده نشده را تشخیص می دهد ولی در یادگیری بدون ناظر معمولا برچسب داده ها موجود نیست. یادگیری نیمه ناظر هم چیزی بین این دوتاست که معمولا حالت استاد-شاگردی در آن شبیه سازی می شود و استاد تنها در بعضی مواقع خاص تقلب هایی به شاگردش که الگوریتم باشد، می رساند. هر کدام از این سه حالت کلی، دنیای خاص خودشان را دارند. به طور مثال خود یادگیری باناظر در یک دسته بندی به زیربخش های زیر می تواند تفکیک شود: ( بر مبنای کتاب Machine Learning With R)

یادگیری تنبل (Lazy Learning): که با استفاده از ذخیره سازی داده ها، دسته بندی را انجام می دهند. مثال بارزش الگوریتم نزدیک ترین همسایگی (KNN) است.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

یادگیری احتمالی (Probabilistic Learning): با استفاده از تکنیک ها و روش های آماری نظیر تئوری بیزین، کار دسته بندی را انجام می دهند.

یادگیری تقسیم و غلبه (Divide and Conquer Learning): با استفاده از استراتژی معروف انگلیس در سال های دور و شاید الان، یعنی تقسیم و غلبه، دسته بندی صورت می گیرد. مثال معروفش درخت تصمیم است.

پیش بینی مقدار عددی (Regression Methods): در اینجا برچسب خود مقدار متغیر پاسخ است که با استفاده از الگوریتم های مختلف، پیش بینی می شود. مثال معروفش همان رگرسیون خطی است.

روش های جعبه سیاهی (Black-box Methods): که نحوه ی عملکرد دقیق در میانه های راه اجرای الگوریتم ها قابل تفکیک نیست که عمدتا ناشی از پیچیدگی ذات متغیرها و تعداد زیاد آنهاست. اصلی ترین روش شبکه عصبی و خانواده ی پرجمعیت آن است.در یادگیری ماشین و داده کاوی هیچ وحی منزل ای وجود ندارد لذا این تقسیم بندی یک تقسیم بندی پیشنهادی است. بنابراین با این فرض می توان حوزه ی کلی یادگیری بدون ناظر را نیز به زیربخش های زیر تقسیم کرد: ( بر مبنای کتاب Data Mining Concepts and Techniques)

    خوشه بندی افرازی (Partitioning Methods)
    خوشه بندی سلسه مراتبی (Hierarchical Methods)
    خوشه بندی چگالی محور (Density-Based Methods)
    خوشه بندی شبکه ای (Grid-Based Methods)

نرم افزارهای داده کاوینرم افزارهای داده کاوی

انجام پروژه داده کاوی با نرم افزار RapidMiner: این نرم‌افزار که به گفته سازندگان آن تلاش بر این کرده است که به صورت یکپارچه عملیاتِ مختلفِ حوزه‌ی علوم‌داده را تجمیع کند و به دانشمندانِ علوم داده اجازه دهد به سرعت مدل‌های مورد نیاز برای عملیات داده‌کاوی را شناسایی کنند.

انجام پروژه داده کاوی با نرم افزار Weka : نرم‌افزار وکا(weka) مجموعه‌ای از الگوریتم‌های مختلف جهت عملیات داده‌کاوی را در اختیار متخصصان و دانشمندانِ علوم داده می‌گذارد. کار با این نرم‌افزار بسیار ساده است و در اینجا کتابی جهت آموزش نرم افزار weka توسط خود سایت سازنده قرار داده شده است.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

انجام پروژه داده کاوی با نرم افزار Orange یکی از نرم‌افزارهای بسیار ساده و لذت بخش جهت انواع عملیات داده‌کاوی نرم افزاری Orange است. این نرم افزار به خاطرِ سادگی و واسطِ کاربریِ ساده‌ی آن می‌تواند موردِ استفاده‌ی بسیاری از متخصصانِ حوزه‌ی علوم‌داده باشد. حتی دوستانی که به تازگی به دنبالِ یادگیریِ علوم داده هستند، می‌توانند از این نرم افزار استفاده کنند.

انجام پروژه داده کاوی با نرم افزار Neural Designer مخصوص طراحی شبکه های عصبی اگر با شبکه‌های عصبی آشنا باشید می‌دانید که طراحیِ این گونه شبکه‌ها معمولاً کارِ وقت‌گیری است و نیاز به دقتِ بالایی دارد. با استفاده از نرم افزار Neural Designer به راحتی می‌توانید شبکه‌های عصبیِ مخصوصِ خود را طراحی کنید و مدل‌های مختلفِ داده را توسط آن ها آزمایش کنید.

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.