مراحل داده کاوی
دسته بندی ها : داده کاوی آکادمی داده کاوی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
علم داده کاوی کشف گنج اطلاعات از میان انبوه دادههای عظیم است ، دقیقاً مانند کشف طلا از میان صخره ها و سنگ های بزرگ ما در این مقاله مراحل داده کاوی را مورد بررسی قرار میدهیم قبل از شروع جامعه هر مرحله ابتدا بگذارید تمامی مراحل انجام پروژه داده کاوی را به صورت کوتاه معرفی کنیم :
مرحله اول: تشکیل انبار داده
مرحله دوم: انتخاب داده ها
مرحله سوم: تبدیل داده ها
مرحله چهارم: در داده ها
مرحله پنجم: تفسیر نتیجهمراحل داده کاوی
مرحله اول انبار داده ها
تعریف Ralhp Kimball از انبار داده ها :
در واقع یک DW نسخه ای است از داده های تراکنشی چه به صورت کاملا اختصاصی برای گزارش گیری پرس و جوها سازماندهی شده است. اما بر این تعریف دو ایراد می توان گرفت نخست در یک DW گاهی داده های غیر تراکنشی رفیق می شود اما معمولا 90 الی 95 درصد داده ها تراکنشی است . در ثانی خروجی اصلی سیستم های دیدنی در واقع لیست های فهرست دار queries در حجم کم و یا گزارش های اداری در حجم زیاد است .
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
تعریف دوم
اگر تعریف ما از داده حقیقت قابل مشاهده یا قابل نصب باشد و تعریف ما از اطلاع مجموعه سازماندهی شده از حقیقت ها یا داده های با ارتباط و با هدف باشند و تعریف موسسه و عملیاتی در واقع محیطی باشد که برای داده ها و برنامههای لازم برای ادامه حیات فعالیت های یک سازمان صورت میگرد . و آخرین تعریف ما مربوط به انبار داده اطلاعی است که تعریف آن به این شرح است که انبار داده مجموعه ای از داده ها و برنامه ها برای تحلیل و تصمیم گیری، جدا از سیستم عملیاتی باشد آنگاه می توانیم بگوییم یک انبار داده DW در واقع دارای معماری جداگانه ای برای نگهداری داده های حساس تاریخی است که این داده ها از انبار داده های عملیاتی به دست آمده است و به صورت قابل درکی برای عملیات تحلیل سازمانی استفاده می شود.
پیشینه
بعد از رشد قابل ملاحظه ای در استفاده از TPS ها به عنوان سیستم های پردازش تراکنش ای در بخشهای عملیاتی سازمان نیاز به سیستم های اطلاعاتی که بتوانند عملیاتی به صورت گزارش گیری در رده گزارش های مدیریتی را سازماندهی کنند ، شدیدا نیاز می شد . از آنجایی که با وجود آمدن جزایر فناوری یعنی سیستم هایی که به صورت جدا از هم به فعالیت می پرداختند امکان تهیه گزارشی ترکیبی از تمام این ها به نوعی غیر ممکن می نمود بنابراین با وجود این مشکلات حرکت به سمت سیستمهای اطلاعات مدیریت مخصوصاً سیستم های گزارش گیری مدیریتی آغاز شد اما متاسفانه این سیستم ها به شدت به TPS ها نیاز داشتند و داده های آنها یک مرجع بود و تغییر در یکی باعث تغییر در کل سیستم می شد بنابراین مدل فکری جدیدی به نام انبار داده ها به وجود آمد.
دلایلی که باعث شد از DW استفاده شود
کاهش زمان پردازش با استفاده از منابع IO مجزایی
برای گزارش گیری و انجام پرس و جو
استفاده از مدل های داده ای و یا تکنولوژی های سرور برای ارتقاء سرعت عملیاتی گزارش گیری و پرس جو
ایجاد وسیله ای برای سرعت بخشیدن به عملیات گزارش گیری
امکان تصحیح کردن داده ها بدون تغییر دادن سیستمهای پردازش تراکنش ها
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
روش کار به چه صورت است ؟
در dw فرایندی بهنام ETL داریم که در این فرآیند داده ها از سیستم های پردازش تراکنش استخراج می شود E در واقع تغییر فرمت هایی است که در آن صورت می گیرد و T قالب داده ای جدید و مناسب برای گزارش گیری است و L مرحله ای است که در آن از طریق داده کاوی و مکانیزمی مانندOLAP پرس و جو ها را ایجاد می کنیم و گزارشات را تهیه میکنیم.مراحل داده کاوی آکادمی داده کاوی
مرحله دوم انتخاب داده ها
برای آنکه هزینه های عملیات داده کاوی را کاهش دهیم نیاز است داده هایی را که از پایگاه داده انتخاب کنیم کوچکتر شوند . در واقع باید تولید یک مجموعه کوچکتر از دادههای اولیه بصورتی باشد که داده کاوی روی آن با داده کاوی روی داده های اولیه نتایج مشابهی را به دست دهد . این از طریق حذف خصیصه های غیر مرتبط با نوع عملیات داده کاوی مورد نظر انجام می گید .سه روش کلی برای انتخاب خصایص مرتبط با دیتا ماینینگ وجود دارد
انتخاب پیشرونده: در هر مرحله ما خصیصه ای را که بیشترین ارتباط را دارد برمی گزینیم.
انتخاب عقب رونده: در هر مرحله ای خصیصه ای را که کمترین ارتباط را دارد انتخاب می کنیم و آن را حذف می کنیم .
روش ترکیبی: ترکیب انتخاب پیشرونده و انتخاب عقب رونده است.
مرحله سوم انتخاب داده ها
سیستم های اطلاعاتی و برنامه های کاربردی یک سازمان در طول زمان با توجه به نیازهای موجود معمولا یا تولید و یا تغییر شکل می دهند . در نتیجه یکسان سازی آنها یک امر کاملا حیاتی می باشد . یکسان سازی داده ها ، برقراری ارتباط بین فیلدها و شکل سازی داده ها در این مرحله صورت می پذیرد. گاهی این تبدیلها آسان و سریع انجام میگیرد گاهی بسیار پیچیده و زمانبر است.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
کیفیت اطلاعات چیزی نیست که به راحتی قابل دریافت باشد، بلکه میتوان کیفیت اطلاعات را از صحت و نتایج آن به دست آورد و این اطلاعات با این فاکتور در طول زمان قابل سنجش است، بنابراین با ایجاد شاخص های مناسب برای اطلاعات مورد نیاز کیفیت اطلاعات را در طول زمان مورد بررسی قرار می دهیم. در واقع کیفیت اطلاعات مجموعه ای از نیازهای اطلاعاتی است که برای برطرف کردن یک نیاز اطلاعاتی یا همان انجام کاری که مورد نیاز است مورد استفاده قرار میگیرد .مراحل داده کاوی
کاوش داده ها
معمولا این مرحله با نوشتن مقادیر زیادی گزارش و تحقیق استعلام از آنها اشتباه گرفته می شود . کاوش داده از طریق تجهیزات مخصوصی که عملیات کاوش را بر اساس مدل های تجزیه و تحلیل انجام می دهد . بررسی داده ها با انگیزه کشف نکات ارزشمند و دریافت اطلاعات مفید در حجم قابل توجهی داده که در طول زمان در کار و تجارت به دست آمده است را کاوش داده می گوییم و این امر تفاوت های اساسی با آنالیز های متداول آماری دارد و منبع معمول کاوش داده همان انبار داده است .
تحلیل و تفسیر نتیجه
تفسیر نتیجه در این مرحله نتایج و الگوهای ارائه شده توسط ابزار داده کاوی مورد بررسی قرار گرفته و نتایج مفید معین می شود. طرز کار ابزار داده کاوی این گونه است که ابزار به دنبال اثبات این است که وجود چیزی به معنای وجود چیز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگیرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخلی به مخاطبش ارائه دهد.
نجام پروژه داده کاوی با رپیدماینر
دسته بندی ها : داده کاوی, نرم افزار رپیدماینر آکادمی داده کاوی
مقدمه
انجام پروژه های داده کاوی با ابزارهای مختلفی قابل انجام است یکی از مهمترین و پرطرفدارترین این ابزارها نرم افزار رپیدماینر rapidminer است . انجام پایان نامه داده کاوی با رپیدماینر یکی از پرطرفدارترین پایان نامه هاست . از طریق این نرم افزار تمامی مراحل داده کاوی از جمله پیش پردازش، انتخاب ویژگی، ایجاد مدل و تصویر سازی نتایج قابل انجام است از آن جهت با استفاده از این نرم افزار تمامی پروژه های تجاری، علمی و تحقیقاتی قابل انجام است. رپیدماینر به صورت کاملی از الگوریتم ها و روش های داده کاوی پشتیبانی می کند . از جمله الگوریتم های مهمی که در انجام پروژه داده کاوی با رپیدماینر ارائه شده است میتوان به موارد زیر اشاره کرد:
انواع الگوریتم های شبکه عصبی
الگوریتم های خوشه بندی
الگوریتم نایو بیز
انواع الگوریتم های رگرسیون
انواع الگوریتم های درخت تصمیم
و انواع متنوع الگوریتم های داده کاوی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.comکاوی با داشتن برترین متخصصها می تواند در زمینه های که در زیر اشاره می شود به شما کمک کند:
مشاوره انجام پایان نامه داده کاوی با نرم افزار رپیدماینر (rapudminer)
آموزش نرم افزار رپیدماینر با فیلم های آموزشی و تماس مستقیم با متخصص
پیاده سازی مقاله بیس با نرم افزار رپیدماینر
ارائه موضوع جدید و نو در زمینه داده کاوی و پیاده سازی با رپیدماینر
استخراج مقاله از پایان نامه داده کاوی
سفارش انجام پروژه رپیدماینر
انجام پروژه رپیدماینر - انجام پروژه داده کاوی با رپیدماینر rapidminer
معرفی نرم افزار رپید ماینر RapidMiner
نرم افزار رپیدماینر، نرم افزاری توانمند در مباحث داده کاوی، یادگیری ماشینی، تحلیل و پیش بینی و تحلیل کسب و کار میباشد. امروزه این برنامه کاربردهای زیادی در کسب و کار و امور تجاری ،و هم در امور تحقیقاتی، آموزشی، یادگیری و … دارد. این برنامه تمامی مراحل مورد نیاز را از آماده سازی اطلاعات اولیه گرفته تا بصری کردن نتایج، ارزیابی و اعتبار سنجی و بهینه سازی خروجی را در یک محیط یکپارچه و واحد انجام می دهد که این برای یک محقق عالی است. هسته اصلی این پلتفرم نرم افزاری به صورت متن باز و رایگان است که باعث شده محصولات رایگان و تجاری زیادی بر اساس آن نوشته شده است.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
این محصول در سالهای ابتدایی عرضه یعنی سال ۲۰۰۱ با نام (YALE (Yet Another Learning Environment شناخته میشد. کم کم با افزایش قابلیتها در سالهای بعد نهایتا در سال ۲۰۰۷ به نام کنونی آن یعنی RapidMiner تغییر نام پیدا کرد. این نرم افزار به جهت سادگی کارکرد آن در سالهای اخیر توجه بسیاری از محققین و دانشجویان را به خود جلب کرده است و از طرفی مدل توسعه متن باز این محصول نیز باعث شده است تا برنامه نویسان تمایل بیشتری به توسعه آن داشته باشند. این نرم افزار از الگوریتمهای مختلفی برای آماده سازی و مدلسازی اطلاعات استفاده میکند این قابلیت فوق العاده باعث شده است که تا پروژه های دانشجویی با رپیدماینر یا انجام پایان نامه با رپیدماینر بسیار فراگیر شود . یا لااقل برای قسمتهای زیادی از کارشان از این محصول قدرتمند استفاده کنند. محیط کاربری بسیار خوب و دلچسب و آسانی دارد. لازم به ذکر است این نرم افزار به عنوان پرکاربردترین نرم افزار داده کاوی در سال ۲۰۱۴ شناخته شده است.
نقاط قدرتمند نرمافزار رپیدماینر
امکان تصحیح و خطایابی بسیار سریع در نرم افزار
ظاهر کاربرپسند
وجود آموزشهای ویدیویی مناسب در اینترنت
ارائه گزارش و رونوشت از مراحل اجرای الگوریتم
نمای گرافیکی خوب و زیبا
قابلیت تطابق با فایلهای خروجی بسیاری از نرمافزارها مانند Excel
مستندات شامل راهنمای بسیاری از عملگرها در نرمافزار
امکان اجرای همزمان الگوریتمهای یادگیری متفاوت در نرمافزار و مقایسه آنها با یکدیگر در ابزار در نظر گرفته شدهاست
امکانات ویژه نرم افزار رپیدماینر (rapidminer)
از آنجا که این نرم افزار با استفاده از زبان جاوا، پیاده سازی و توسعه یافته ، امکان کار در سیستمهای عامل مختلف از جمله ویندوز، لینوکس و سیستمهای مکینتاش برای این نرمافزار وجود دارد
امکانات متنکاوی نیز در این نرمافزار پیشبینی شدهاست
کلیه الگوریتمهای یادگیری مدل در نرمافزار دادهکاوی WEKA پس از به هنگامسازی RapidMiner به نرمافزار اضافه خواهند شد
برخی از نمونه پروژه های انجام شده در رپیدماینر
پیش بینی بار مصرفی برق با درخت تصمیم
استخراج قوانین از الگوی تصویر با FP-GROWTH
طبقه بندی تراکنش های دستگاه خودپرداز ATM با استفاده از شبکه عصبی
انجام پروژه RAPIDMINER کشف تقلب
انجام پروژه داده کاوی و پیاده سازی مقالات داده کاوی با موضوعات کشف فیشینگ و کشف تقلب در تراکنش های مالی
شناسایی مشتریان با اعتبار بانک و موسسات مالی
هوش تجاری مشتریان سایتهای تجاری ، کسب و کار اینترنتیazsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
انجام پروژه تشخیص خرابی
انجام پروژه RAPIDMINER رضایت مندی مشتریان
انجام پروژه رپیدماینر با موضوعات رضایتمندی مشتریان ، CRM،ECRM
آموزش انجام پایان نامه داده کاوی رضایتمندی مشتری ، شناسایی مشتریان وفادار
تشخیص عیب و خطا در سیستم
تشخیص بیماری
انجام پروژه رپیدماینر - انجام پروژه داده کاوی با رپیدماینر rapidminer
الگوریتم ها و روش های نرم افزار رپیدماینر
انجام پروژه های داده کاوی (Data Mining) و مشاور انجام پایان نامه یا آموزش انجام پایان نامه در زمینه های رده بندی (Classification)، خوشه بندی (Clustering)، پیش بینی (Prediction)، انتخاب ویژگی (Feature Selection) و قواعد انجمنی (Association Rules) با استفاده از روش ها و الگوریتم های مختلفی نظیر
شبکه عصبی مصنوعی (Ann)
شبکه های عصبی مصنوعی (RBF)
درخت تصمیم–هرس درخت تصمیم–درخت تصمیم با شاخص جینی و آنتروپی
بگینگ و بوستینگ
الگوریتم ژنتیک , ازدحام ذرات
الگوریتم های فراابتکاری
ماشین بردار پشتیبان
ماشین بردار پشتیبان با بهینه ساز ازدحام ذرات
تشخیص داده پرت با کانزدیکترین همسایه(Knn)
تشخیص داده پرت محلی
انواع روش های نمونه برداری و بیش نمونه گیری
روش های حل مشکل رده نامتوازن
سیستم استنباط بیزین
قواعد همسایگی با fp-growth,apriory
تحلیل نتایج با رسم نمودار Roc
انواع مختلف روش های انتخاب ویژگی:شاخص ریلیف، ازدحام ذرات،شاخص جینی و …
هزینه انجام پروژه داده کاوی
دسته بندی ها : ابزارهای داده کاوی, پایتون, داده کاوی, نرم افزار R, نرم افزار رپیدماینر, نرم افزار کلمنتاین, نرم افزار متلب, نرم افزار وکا آکادمی داده کاوی
خلاصه
در این مقاله در مورد هزینه انجام پروژه داده کاوی و انواع انجام پروژههای داده کاوی توسط متخصصان این حوزه توضیح داده خواهد.
نحوه محاسبه هزینه انجام پروژه داده کاوی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
هزینه انجام پروژههای داده کاوی بسته به فاکتورهای متفاوت هزینههای متفاوتی دارد. یکی از مواردی که در قیمت گذاری پروژه لحاظ میشود پیچیدگی پروژه است که با میزان وقتی که متخصص در انجام پروژه داده کاوی صرف میکند مرتبط است و در قیمت گذاری مؤثر است.
در انجام پروژه دادهها باید مشخص شوند برخی مواقع صاحب پروژه اصلاً داده ندارد یا داده مناسب ندارد که متخصصان آکادمی داده کاوی، داده مناسب را انتخاب میکنند. تعداد الگوریتم و نوع نرم افزار و زمان انجام پروژه از موارد دیگری است که در قیمت گذاری پروژه تاثییر گذار است.
در انجام برخی از پروژهها مانند آموزش پایان نامه علاوه بر الزام نوآوری و رعایت ساختار دقیق و آموزش مستمر صاحب پروژه با ارسال ویدیوها و ویسها و توضیحاتی که از طریق تلفن صورت میگیرد تا صاحب پروژه کاملاً در انجام پایان نامه داده کاوی آموزش ببیند. طبیعتاً زمان و دقت این نوع پروژهها زمان و انرژی بیشتری میگیرد که در قیمت گذاری پروژه مؤثر است.هزینه انجام پروژه داده کاوی
انجام پروژه داده کاوی با نرم افزارهای متفاوت
نوع نرم افزار نیز در قیمت گذاری گاها متفاوت است. اگر پروژهای نیازی به کد زدن داشته باشد برای مثال از زبان برنامه نویسی پایتون استفاده میشود که نسبت به انجام پروژه داده کاوی با رپیدماینر به علت صرف هزینه زمانی بیشتر هزینه بالاتری دارد.
پروژه داده کاوی آماده
آکادمی داده کاوی با داشتن متخصصان بسیار متبحر دارای تعداد زیادی پروژه آماده داده کاوی میباشد. این پروژهها با دادههای استاندارد در حوزه داده کاوی مثل بیمهها، بانکها، تشخیص بیماری و … که بسته به فهرست مطالب و نوع الگوریتم و تعداد الگوریتم و گامها دارای قیمتهای متفاوتی هستند. از جمله دادههای آماده را میتوان بطور کلی بصورت زیر فهرست کرد:
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
پروژه آماده داده کاوی با رپیدماینر
پروژه آماده داده کاوی با پایتون
پروژه آماده داده کاوی با متلب
پروژه آماده داده کاوی با زبان برنامه نویسی R
پروژه آماده داده کاوی با وکا
پروژه آماده داده کاوی با spss modeler
پروژهای ک تحویل داده خواهد شد یک فایل داکیومنت خواهد بود ک معمولاً با روش کریسپ انجام میشود. فایلی که تحویل درخواست کننده میشود، شامل فایل داده، فایل اجرایی نرم افزار و راهنمای اجرا در نرم افزار میباشد که شامل موارد زیر است:
مراحل کار
مراحل اجرا در نرم فزار
تشریح داده
رسم نمودارهای داده
مراحل داده کاوی
دسته بندی ها : داده کاوی آکادمی داده کاوی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
علم داده کاوی کشف گنج اطلاعات از میان انبوه دادههای عظیم است ، دقیقاً مانند کشف طلا از میان صخره ها و سنگ های بزرگ ما در این مقاله مراحل داده کاوی را مورد بررسی قرار میدهیم قبل از شروع جامعه هر مرحله ابتدا بگذارید تمامی مراحل انجام پروژه داده کاوی را به صورت کوتاه معرفی کنیم :
مرحله اول: تشکیل انبار داده
مرحله دوم: انتخاب داده ها
مرحله سوم: تبدیل داده ها
مرحله چهارم: در داده ها
مرحله پنجم: تفسیر نتیجهمراحل داده کاوی
مرحله اول انبار داده ها
تعریف Ralhp Kimball از انبار داده ها :
در واقع یک DW نسخه ای است از داده های تراکنشی چه به صورت کاملا اختصاصی برای گزارش گیری پرس و جوها سازماندهی شده است. اما بر این تعریف دو ایراد می توان گرفت نخست در یک DW گاهی داده های غیر تراکنشی رفیق می شود اما معمولا 90 الی 95 درصد داده ها تراکنشی است . در ثانی خروجی اصلی سیستم های دیدنی در واقع لیست های فهرست دار queries در حجم کم و یا گزارش های اداری در حجم زیاد است .
تعریف دوم
اگر تعریف ما از داده حقیقت قابل مشاهده یا قابل نصب باشد و تعریف ما از اطلاع مجموعه سازماندهی شده از حقیقت ها یا داده های با ارتباط و با هدف باشند و تعریف موسسه و عملیاتی در واقع محیطی باشد که برای داده ها و برنامههای لازم برای ادامه حیات فعالیت های یک سازمان صورت میگرد . و آخرین تعریف ما مربوط به انبار داده اطلاعی است که تعریف آن به این شرح است که انبار داده مجموعه ای از داده ها و برنامه ها برای تحلیل و تصمیم گیری، جدا از سیستم عملیاتی باشد آنگاه می توانیم بگوییم یک انبار داده DW در واقع دارای معماری جداگانه ای برای نگهداری داده های حساس تاریخی است که این داده ها از انبار داده های عملیاتی به دست آمده است و به صورت قابل درکی برای عملیات تحلیل سازمانی استفاده می شود.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
پیشینه
بعد از رشد قابل ملاحظه ای در استفاده از TPS ها به عنوان سیستم های پردازش تراکنش ای در بخشهای عملیاتی سازمان نیاز به سیستم های اطلاعاتی که بتوانند عملیاتی به صورت گزارش گیری در رده گزارش های مدیریتی را سازماندهی کنند ، شدیدا نیاز می شد . از آنجایی که با وجود آمدن جزایر فناوری یعنی سیستم هایی که به صورت جدا از هم به فعالیت می پرداختند امکان تهیه گزارشی ترکیبی از تمام این ها به نوعی غیر ممکن می نمود بنابراین با وجود این مشکلات حرکت به سمت سیستمهای اطلاعات مدیریت مخصوصاً سیستم های گزارش گیری مدیریتی آغاز شد اما متاسفانه این سیستم ها به شدت به TPS ها نیاز داشتند و داده های آنها یک مرجع بود و تغییر در یکی باعث تغییر در کل سیستم می شد بنابراین مدل فکری جدیدی به نام انبار داده ها به وجود آمد.
دلایلی که باعث شد از DW استفاده شود
کاهش زمان پردازش با استفاده از منابع IO مجزایی
برای گزارش گیری و انجام پرس و جو
استفاده از مدل های داده ای و یا تکنولوژی های سرور برای ارتقاء سرعت عملیاتی گزارش گیری و پرس جو
ایجاد وسیله ای برای سرعت بخشیدن به عملیات گزارش گیری
امکان تصحیح کردن داده ها بدون تغییر دادن سیستمهای پردازش تراکنش ها
روش کار به چه صورت است ؟
در dw فرایندی بهنام ETL داریم که در این فرآیند داده ها از سیستم های پردازش تراکنش استخراج می شود E در واقع تغییر فرمت هایی است که در آن صورت می گیرد و T قالب داده ای جدید و مناسب برای گزارش گیری است و L مرحله ای است که در آن از طریق داده کاوی و مکانیزمی مانندOLAP پرس و جو ها را ایجاد می کنیم و گزارشات را تهیه میکنیم.مراحل داده کاوی آکادمی داده کاوی
مرحله دوم انتخاب داده ها
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
برای آنکه هزینه های عملیات داده کاوی را کاهش دهیم نیاز است داده هایی را که از پایگاه داده انتخاب کنیم کوچکتر شوند . در واقع باید تولید یک مجموعه کوچکتر از دادههای اولیه بصورتی باشد که داده کاوی روی آن با داده کاوی روی داده های اولیه نتایج مشابهی را به دست دهد . این از طریق حذف خصیصه های غیر مرتبط با نوع عملیات داده کاوی مورد نظر انجام می گید .سه روش کلی برای انتخاب خصایص مرتبط با دیتا ماینینگ وجود دارد
انتخاب پیشرونده: در هر مرحله ما خصیصه ای را که بیشترین ارتباط را دارد برمی گزینیم.
انتخاب عقب رونده: در هر مرحله ای خصیصه ای را که کمترین ارتباط را دارد انتخاب می کنیم و آن را حذف می کنیم .
روش ترکیبی: ترکیب انتخاب پیشرونده و انتخاب عقب رونده است.
مرحله سوم انتخاب داده ها
سیستم های اطلاعاتی و برنامه های کاربردی یک سازمان در طول زمان با توجه به نیازهای موجود معمولا یا تولید و یا تغییر شکل می دهند . در نتیجه یکسان سازی آنها یک امر کاملا حیاتی می باشد . یکسان سازی داده ها ، برقراری ارتباط بین فیلدها و شکل سازی داده ها در این مرحله صورت می پذیرد. گاهی این تبدیلها آسان و سریع انجام میگیرد گاهی بسیار پیچیده و زمانبر است.
کیفیت اطلاعات چیزی نیست که به راحتی قابل دریافت باشد، بلکه میتوان کیفیت اطلاعات را از صحت و نتایج آن به دست آورد و این اطلاعات با این فاکتور در طول زمان قابل سنجش است، بنابراین با ایجاد شاخص های مناسب برای اطلاعات مورد نیاز کیفیت اطلاعات را در طول زمان مورد بررسی قرار می دهیم. در واقع کیفیت اطلاعات مجموعه ای از نیازهای اطلاعاتی است که برای برطرف کردن یک نیاز اطلاعاتی یا همان انجام کاری که مورد نیاز است مورد استفاده قرار میگیرد .مراحل داده کاوی
کاوش داده ها
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
معمولا این مرحله با نوشتن مقادیر زیادی گزارش و تحقیق استعلام از آنها اشتباه گرفته می شود . کاوش داده از طریق تجهیزات مخصوصی که عملیات کاوش را بر اساس مدل های تجزیه و تحلیل انجام می دهد . بررسی داده ها با انگیزه کشف نکات ارزشمند و دریافت اطلاعات مفید در حجم قابل توجهی داده که در طول زمان در کار و تجارت به دست آمده است را کاوش داده می گوییم و این امر تفاوت های اساسی با آنالیز های متداول آماری دارد و منبع معمول کاوش داده همان انبار داده است .
تحلیل و تفسیر نتیجه
تفسیر نتیجه در این مرحله نتایج و الگوهای ارائه شده توسط ابزار داده کاوی مورد بررسی قرار گرفته و نتایج مفید معین می شود. طرز کار ابزار داده کاوی این گونه است که ابزار به دنبال اثبات این است که وجود چیزی به معنای وجود چیز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگیرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخلی به مخاطبش ارائه دهد.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com