انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

تشخیص و پیش‌بینی بیماری‌ها

ر این سلسله مقالات به کاربرد داده‌کاوی در تحلیل، تشخیص و پیش‌بینی بیماری‌های مختلف پرداخته می‌شود. بدین ترتیب که با استفاده از الگوریتم‌ها و روش‌های داده‌کاوی در کنار اطلاعات بیماران مختلف راهی برای تحلیل، تشخیص و پیش‌بینی بیماری‌های مختلف ارائه


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com


می‌شود. درواقع داده خام اطلاعات بیماران و روش‌های نیز روش‌های استفاده‌شده در علوم داده‌کاوی است که منجر به تولید دانشی مفید برای علوم پزشکی می‌گردد. مطالعه این مقالات می‌تواند برای اشخاصی که درزمینهٔ داده‌کاوی پزشکی و سلامت فعالیت می‌کنند راهگشا بوده و مفید واقع شود. بنا بر ادعای برخی علم پزشکی یک علم مبتنی بر آمار است و بسیاری از راه‌حل‌های ارائه شده برای بیماران از طریق روش‌ها و راه‌های تحلیل آماری حاصل می‌شود. این ادعا و واقعیت‌های مرتبط در این رشته مقالات که با عنوان استفاده از داده‌کاوی برای تحلیل بیماری‌ها در موارد مختلف تولید خواهد شد بررسی می‌شود. آکادمی داده امیدوار است در این رشته مقالات، پژوهشگران عزیز را با مفاهیم این حوزه و کارهای انجام‌شده آشنا نماید. 

چه چیزی داده کاوی نیست؟
داده کاوی چیست؟
آموزش ابزارِ داده کاوی رپیدماینر

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com


​معرفی منابع برای یادگیری داده کاوی

در مقاله‌ای با عنوان "تشخیص بیماری ام اس با استفاده از الگوریتم‌ها داده‌کاوی" دو پژوهشگر دانشگاه امیرکبیر سعی کرده‌اند مدلی برای تشخیص بیماری ام اس ارائه دهند. در این تحقیق بیماری ام اس موردتوجه قرارگرفته است. بیماری ام اس یک بیماری فلج‌کننده‌ی مغز و نخاع درواقع دستگاه عصبی مرکزی است. در بیماری ام اس، سیستم ایمنی بدن به بافت عصبی حمله کرده و موجب اختلال در ارتباط بین مغز و دیگر مناطق بدن می‌شود. درنهایت، این بیماری منجر به تخریب و یا آسیب دائمی به اعصاب می‌شود  که اثرات جبران‌ناپذیری به بدن بیمار وارد می‌کند. تشخیص این بیماری در مراحل ابتدایی می‌تواند در مسیر درمان این بیماری بسیار کارگشا باشد. این تحقیق نیز بر این بنانهاده شده است که بتواند با استفاده از الگوریتم داده‌کاوی این بیماری را پیش‌بینی نماید.
در این تحقیق مجموعه داده مورداستفاده شامل اطلاعات 144 بیمار مبتلابه بیماری ام اس است. این مجموعه داده شامل 12 ویژگی می‌باشد. محققین از دو الگوریتم معروف یادگیری ماشین یعنی الگوریتم‌های ماشین بردار پشتیبان و الگوریتم نایوبیز برای ایجاد مدل طبقه‌بندی بهره برده‌اند. بر اساس نتایج به‌دست‌آمده دقت طبقه‌بندی 77 درصدی توسط الگوریتم ماشین بردار پشتیبان به‌دست‌آمده است. در بیماری ام اس حتی چند ساعت تشخیص زودتر می‌تواند اثرات مهمی در فرآیند درمان داشته باشد. بدین ترتیب در این تحقیق


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

سعی شده است روشی برای پیش‌بینی ارائه گردد. این تحقیق توسط عاطفه صادقیان و عباس احمدی انجام‌شده است. شایسته است برای تحقیقات بیشتر مجموعه داده این پژوهش توسط این محققین در اختیار همه قرار داده شود.

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.
در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد.
 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
ما جریان کاری برای یک برنامه ای را ارائه می دهیم که با پیدا کردن الگو های مربوط به تقلب در پایگاه داده ای بزرگ به حل مشکلات حیاتی پولشویی  کمک می کند . سهم اصلی کار این الگوریتم این است که به جای استفاده از روش های سنتی نظارت بر داده ها برای تشخیص تقلب از الگوریتم الگوی تطبیق استفاده می کند و روش ما توضیح داد که چرا روش ما از روش سنتی روسن تر و کاربردی تر است . در حوزه تشخیص تقلب ما معتقدیم که این روش می تواند منطق کلیدی و یک راه حل واقعی برای کشف تقلب و توسعه در آینده است. ما اهمیت و بزرگ بودن مشکل را معرفی کردیم و توضیح دادیم که چگونه این الگوریتم می تواند در این زمینه مفید باشد با توجه به آینده کار بر روی سیستم، ما معتقدیم که سیستم میتواند مقیاس پذیر ساخته و پر اساس معیارهای پیشنهادی بهبود یابد که به شکل بهتری برای مشکلی که در دست داریم استفاده شود به عنوان فرآیند کشف دانش ، یک تعامل بین کاربر و سیستم داده کاوی است که اغلب تعیین ماهیت اطلاعات دشوارتر است،


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

 (2005 ,.S . Bandyopadhyay et al) . بنابراین برای بدست آوردن دانش مناسب و قابل استفاده از مجموعه پایگاه داده ی داده شده ضروری است که کاربر قادر به این باشد که تمرکز خود را بر روی جستجوی هایشان هوشمندانه تر کنن

وم روانشناسی یکی از علوم پرطرفدار در حوزه علوم انسانی است. روان شناسی علمی است که رفتار و فرآیندهای ذهنی موجودات زنده بخصوص انسان را مورد تجزیه و تحلیل قرار می دهد. روان شناسی علم گسترده ای است که شاخه های متنوعی مانند روان شناسی رفتاری، شناختی، فرهنگی، فردی، رشد، تکاملی، مثبت گرا، اجتماعی و کاربردهای گسترده ای دارد.
این گستردگی علم روان شناسی باعث تولید داده های فراوانی در این حوزه شده است. این داده های خام می تواند برای داده کاوی فرصت مهمی باشد، تا با استفاده از  ابزارهای داده کاوی از آنها دانشی تولید شود تا روان کاوان بتوانند به نتایج کامل تری برای درمان بیماران برسند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

چه چیزی داده کاوی نیست؟

داده کاوی چیست؟
پیش بینی رفتارهای بشری بر اساس داده های رفتاری او قابل انجام است و حوزه مطالعاتی گسترده ای با نام پیش بینی رفتار ایجاد شده است. در این حوزه با تحلیل رفتارهای گذشته یک فرد درباره رفتارهای آتی او قضاوت و پیش بینی می شود.برای مثال با تحلیل توییت های یک فرد در شبکه اجتماعی توییتر می توان درباره شرایط روحی او قضاوت کرد.  یک فرد دارای افسردگی شدید ، اقدام به تولید توییت هایی می کند که دارای نشانه هایی از این افسردگی است. در سال های اخیر تحقیقات بسیاری برای پیش بینی خودکشی از طریق پستهای شبکه های اجتماعی انجام شده است که یکی از کاربردهای مهم داده کاوی در روان شناسی است.
آموزش ابزارِ داده کاوی رپیدماینر
​معرفی منابع برای یادگیری داده کاوی
کاربردهای داده کاوی در روانشناسی دارای فرصت های بسیار برای محققین است. به دلیل گستردگی علم روانشناسی می توان تصور کرد که کاربرد داده کاوی نیز می تواند گسترده باشد. به خصوص با آمدن شبکه های اجتماعی و استفاده گسترده از آن، داده کاوی اطلاعات تولید شده در شبکه های اجتماعی نیز مورد توجه بوده است. به طور مثال پیش بینی شخصیت یک فرد. آیا می توان با رصد تولیدات محتوایی یک فرد در شبکه های اجتماعی درباره شخصیت او قضاوت کرد؟ بر اساس تحقیقات انجام شده پاسخ این سوال آری است. هر تیپ شخصیتی رفتار متمایزی در شبکه های اجتماعی از خود نشان می دهند. و این موضوع باعث شده است تحقیقات بسیاری در حوزه داده کاوی برای پیش بینی شخصیت افراد انجام شود. این حوزه مطالعاتی در واقع تحقیقات مشترکی است که توسط محققین داده کاوی و روانشناسی به صورت مشتریک انجام می شود.


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com


برای تحلیل داده ها و استفاده از الگوریتم های داده کاوی برای این کار نیاز به محققین داده کاوی است. در کنار آن برای تحلیل و بررسی نتایج به دست آمده نیز روانشناسان و محققین حوزه روان شناسی می بایست حضور داشته باشند. اغلب تحقیقات این حوزه مطالعاتی توسط تیمی از هر دو گروه انجام شده است.



09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

علاوه بر شخصیت با استفاده از بررسی داده های شبکه های اجتماعی می توان در مورد علاقه مندی های افراد نیز قضاوت کرد. به طور مثال شخصی که از 3200 اخیر اون بیش از دو هزار توییت در مورد مسائل سیاسی روز است به راحتی می توان درباره علاقه مندی های سیاسی او صحبت کرد. امروزه بسیاری از تحقیقات روانشناسی با استفاده از داده کاوی بر پایه اطلاعات منتشر شده در شبکه های اجتماعی انجام می پذیرد.
در وب سایت دیتاهارت مجموعه داده مناسب برای داده کاوی روانشناسی عرضه شده است. در این مجموعه داده درباره بیماری افسردگی بحث شده است.  در واقع از دهها ویژگی برای پیدا کردن احتمال وقوع یا عدم وقوع افسردگی استفاده شده است. در این مجموعه داده سعی شده است بر اساس ویژگی هایی مانند جنسیت، سن، وضعیت تاهل، وضع مالی، شغل، ورزش، موسیقی و ایمان فرد درباره احتمال وقوع افسردگی در او صحبت شود.
کادمی داده  که به زودی پنجمین سال فعالیت خود را جشن می گیرد سالهاست به دنبال ایجاد محتوای مفید برای علاقه مندان علوم داده‌کاوی، متن کاوی و علوم مرتبط با علم داده، مدیریت دانش، هوش تجاری و مباحث مرتبط است.  آکادمی داده  امیدوار است با این اقدامات بتواند اثری هر چند اندک در افزایش آگاهی علاقه مندان به این حوزه ها داشته باشد. در این سری مقالات  آکادمی داده  تلاش دارد مقالات جالب، جدید، پر محتوا و اثرگزار را در علوم داده‌کاوی، متن کاوی، مدیریت دانش، هوش تجاری و مباحث مرتبط ارایه نماید. در این سری مقالات ابتدا مقدمه و سپس نتیجه گیری مقالات ارایه شده است و سپس‌ فایل پی دی اف مقاله برای دانلود رایگان علاقه مندان توسط  آکادمی داده تهیه شده و قابل دانلود است.
چکیده
امروزه با پیشرفت فناوری، مجموعه داده های بزرگ دارای ویژگی های زیاد و پیچیدگی محاسباتی بالا به وجود آمده اند. از این رو، انتخاب زیرمجموعه ویژگی با کمترین ویژگی، سرعت بیشتر و کارایی بالا امر بسیار مهمی می باشد. الگوریتم های رایج انتخاب ویژگی با بررسی نکردن روابط میان ویژگیها، کاهش دقت را به وجود می آورند. لذا، محققان برای بررسی روابط میان ویژگی ها و رسیدن به دقت بیشتر، روان انتخاب ویژگی متنی را تئوری بازی ها را ارائه داده اند که در داده ها با تعداد زیاد ویژگی، پیچیدگی محاسباتی بیشتری دارند لذا افزایش سرعت انتخاب، ویژگی مبنی بر بازی های همکارانه در کنار دقت بالا می تراند برای انتخاب زیر مجموعه ویژگی بهینه برای داده های بزرگ استفاده شود. در این مقاله، الگوریتم FSCG ارائه شده است که ابتدا با محاسبه F-Score ویژگیها مرتب شده و سپس برای هر ویژگی ارزش شپلی- شوبیک محاسبه می شود. لذا F-Score با تشخیص ویژگی های بین دو کلاس، نقطه ضعف ارزش شپلی-شوبیک که بار محاسباتی بالا به خاطر تعداد زیاد انتخاب ویژگی های جفت با ائتلاف های بین ویژگی ها است را | می پوشاند و ارزش شپلی شوبیک با مشخص کردن سهم هر ویژگی در یک همکاری نقطه ضعف F- Score را پیدا می کند. این الگوریتم روی تعدادی از مجموعه داده های UCI پیاده سازی و ارزیابی ویژگی های انتخابی برای مجموعه داده ها با استفاده از دسته بند ماشین بردار پشتیبان (SVM) انجام شده است. تعداد ویژگی های انتخاب شده، دقت و زمان اجرای روش FSCG با روش های بدون کاهش ویژگی و روش Shaply Value Embedded Genetic Algorithm) SVEGA) مقایسه شده است. نتایج نشان می دهد که روش FSCG بر روی داده ها با تعداد ویژگی های زیاد با انتخاب زیر مجموعه ویژگی بهینه، علاوه بر دقت، بار محاسباتی کمتر و سرعت بیشتر را ارائه داده است.
نتیجه گیری
با توجه به اینکه روز به روز به ابعاد داده ها افزوده می شود. مسئله انتخاب ویژگی به یک موضوع بسیار مهم برای محققان تبدیل شده است. انتخاب ویژگی برای کاهش تعداد ویژگی هایی که دارای ویژگی های زیادی هستند، به کار برده می شود. مسئله انتخاب ویژگی، یکی از مسائلی است که در بسیاری از کاربردها به خصوص طبقه بندی در مبحث یادگیری ماشین و همچنین شناسایی آماری الگو اهمیت فراوانی دارد، زیرا در این کاربر تنها تعداد زیادی ویژگی وجود دارد که بسیاری از آن ها یا بلااستفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند. حذف نکردن این ویژگی ها مشکلی از لحاظ اطلاعاتی ایجاد نمی کنند ولی بار محاسباتی را برای کاربرد مورد نظر بالا می برده و علاوه بر این باعث می شود که اطلاعات غیر مفید زیادی را به همراه داده های مقید ذخیره کنیم. برای مسئله انتخاب ویژگی، راه حل ها و الگوریتم های متعددی ارائه شده است که ممکن است برخی از ویژگی های مهم را افزونگی حساب کرده و آن را از بین ببرند شناسایی زیر مجموعه ویژگی بهینه نقش بسیار مهمی در کارایی مسائل طبقه بندی، ایفا می کنند.
در این مقاله، برای رفع مشکلات روش های انتخاب ویژگی معمول و رسیدن به صحت بیشتر در کنار سرعت بالا و بار محاسباتی که در داده - های با حجم بالا، روش انتخاب ویژگی بهبود یافته مبتنی بر نظریه ی بازی های همکارانه به نام FSC پیشنهاد شده است. این روش ترکیب روش F - Scare و محاسبه ارزش شپلی-شوبیک می باشد. FSCG ابتدا با استفاده از روش F - Score ویژگی های بین کلاس ها را تشخیص داده و سپس سهم هر ویژگی را با محاسبه ارزش شپلی-شوبیک محاسبه می کند. به منظور محاسبه میزان دقت، از طبقه بند SVM بر روی هفت مجموعه داده پزشکی از UCI استفاده شده است. نتایج نشان می دهند که روش پیشنهادی با کاهش ویژگی، توانسته زیر مجموعه ویژگی های مناسبی را انتخاب نماید که موجب افزایش دقت طبقه بند شده است همچنین در داده های بزرگ بالا علاوه بر افزایش دقت، بار محاسباتی کمتر و سرعت بیشتر را ارائه دهد.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.