انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

انجام پروژه های داده کاوی

انجام پروژه های داده کاوی بدر زمینه های مخار weka clementine12 spss modeler14.2 rapidminer ت کارشناسی و کارشناسی ارشد 09367292276 09367292276 azsoftir@gmail.com

- ایجاد و تقویت اعتماد میان کاربران یا بین کاربران و موجودیت‌ها

تفاده از رسانه‌های اجتماعی باعث تولید داده‌های اجتماعی بیشماری شده‌ است. رسانه‌های اجتماعی پایگاهی را برای کاربران ایجاد می‌کنند تا اطلاعات خود را در آن با دیگران به اشتراک بگذارند. کاوش این نوع داده‌ها موجب استخراج الگوهای کاربردی خواهد شد که برای کسب و کارها، کاربرها و مصرف کننده‌ها بسیار مفید خواهد بود. برای مثال تکنیک‌های داده کاوی می‌توانند در موارد زیر در خصوص رسانه‌های اجتماعی ب


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com


ه کار برده شوند:

- شناسایی افراد موثر در محیط‌های وبلاگی

- یافتن گروه‌های پنهان یا آشکار در شبکه‌های اجتماعی

- تشخیص احساسات کاربر در برنامه‌ریزی پیش‌گستر

- توسعه‌ سیستم‌های پیشنهاددهنده از خرید محصولات خاص تا ایجاد دوستان جدید

- فهم تکامل تدریجی شبکه و تعویض رابطه بین موجودیت‌ها

- محافظت از محرمانگی و امنیت اطلاعات کاربر

- ایجاد و تقویت اعتماد میان کاربران یا بین کاربران و موجودیت‌ها

طبق تعریف Kaplan و Haenlein رسانه‌های اجتماعی به عنوان گروهی از کاربردهای اینترنتی تعریف می‌شود که بر پایه وب 2 به صورت فنی و ایدئولوژیک ساخته‌ شده‌اند و اجازه‌ی ایجاد و تغییر محتوا را دارند. رسانه اجتماعی مجموعه‌ای از سایت‌های مختلف می‌باشد که شامل رسانه‌های سنتی مانند روزنامه، رادیو و تلویزیون و رسانه‌های غیر سنتی مانند فیسبوک، توییتر و غیره می‌باشد. رشد رسانه‌های اجتماعی تحت چالش‌های زیر صورت گرفته است و جواب این سوالات در داده‌های رسانه‌های اجتماعی پنهان می‌باشد.

1. چطور یک کاربر می‌تواند درک شود؟

2. یک کاربر از چه نوع اطلاعاتی باید استفاده کند؟

3. تجربیات یک کاربر چگونه می‌تواند بهبود یابد؟

داده‌های مربوط به رسانه‌های اجتماعی دارای ویژگی‌هایی می‌باشند که نیازمند تکنیک‌ها و الگوریتم‌های جدید برای کاوش آن‌ها می‌باشد. داده‌هایی که عموما به صورت گسترده توسط کاربران در سایت‌های رسانه‌های اجتماعی ایجاد می‌شوند، بسیار زیاد و دارای نویز می‌باشند. این داده‌ها همچنین بدون ساختار و پویا هستند. همچنین به دلیل عدم وجود مرکزیتی که همه‌ی داده‌های سایت‌های رسانه‌های اجتماعی را نگهداری کند، این داده‌ها در همه جا پخش شده‌اند.

با توجه به توضیحاتی که در بالا ذکر شد، زمینه‌های احتمالی که محققان می‌توانند به کاوش رسانه‌های اجتماعی در آن بپردازند در ادامه ذکر شده‌اند:

1. تجزیه و تحلیل جامعه (Community Analysis): یک جامعه توسط افرادی شکل می‌گیرد که در یک گروه روابط متقابل بیشتری را به نسبت افراد خارج از یک گروه دارند. این جوامع می‌توانند توسط ارتباط‌شان در رسانه‌های اجتماعی شناخته شوند زیرا رسانه‌های اجتماعی این اجازه را به افراد می‌دهند تا در شبکه‌های اجتماعی آنلاین روابطشان را گسترش دهند. از آن‌جا که این شبکه ها بسیار پویا هستند، جوامع می‌توانند در این شبکه‌های پویا توسعه و حتی منحل گردند. با توجه به تحقیقاتی که در این زمینه انجام گرفته شده است نشان می‌دهد که هر چه تعداد دوستان یک کاربر در یک گروه بیشتر باشد، احتمال بیشتری وجود دارد که کاربر در آن گروه عضو شود.




2

. تحلیل احس09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.comاسات و نظرکاوی (Sentiment Analysis and Opinion Mining): تجزیه و تحلیل احساسات کاری بسیار دشوار می‌باشد چرا که زبان‌هایی که به منظور ایجاد محتوا به کار برده ‌می‌شوند بسیار مبهم می‌باشند. اصلی‌ترین گام‌های این فرآیند عبارتند از: 1) یافتن اسناد مربوط، 2) یافتن بخش‌های مربوط، 3) یافتن احساسات کلی، 4) کمی‌ کردن احساسات، 5) یکپارچه‌سازی تمام الگوهای به دست آمده برای ایجاد یک الگوی احساسی کلی. همچنین اجزاء اصلی یک عقیده و نظر متشکل است از: 1) مسئله‌ای که آن نظر بر روی آن اعمال شده است، 2) نظری که بر روی یک مسئله بیان شده است، 3) کسی که نظر را ارائه داده است. این تجزیه و تحلیل می‌تواند در سه سطح اسناد، جمله و ویژگی اعمال شود.

3. توصیه‌های اجتماعی (Social Recommendation): یک سیستم توصیه اجتماعی از اطلاعات شبکه‌های اجتماعی یک کاربر در کنار ابزار سنتی سیستم‌های توصیه کننده استفاده می‌کند و از این نظریه تبعیت می‌کند که افرادی که از نظر اجتماعی بایکدیگر در ارتباط می‌باشند با احتمال بیشتری علایق مشابه یا یکسان با یکدیگر خواهند داشت. از نمونه‌های این سیستم می‌توان به توصیه کتاب به لیست دوستان یک کاربر در سایت آمازون یا پیشنهاد دوستی در فیسبوک و یا توییتر اشاره کرد.

4. مدل‌سازی نفوذی (Influence Modeling): شناخت یک شبکه اجتماعی از نظر اینکه دارای شباهت‌های یکسان با سایر شبکه‌های اجتماعی است و یا نفوذپذیر می‌باشد، امری بسیار مهم می‌باشد. بیشتر شبکه‌های اجتماعی ترکیبی از هر دو این ویژگی‌ها می‌باشند. هدف اصلی در پیدا کردن شبکه نفوذپذیر، یافتن کاربرانی است که بیشترین تأثیر را روی کاربران دیگر خواهند گذاشت. برای مثال در تحقیقاتی که توسط Agarwal در سال‌های 2008 و 2012 انجام شده است، مدلی برای تشخیص بلاگ‌نویسان تاثیرگذار در یک اجتماع ارائه شده است. آن‌ها متذکر شدند که همه‌ی بلاگ نویسان صرفا بلاگ‌های تأثیرگذار نمی‌نویسند. اطلاعات بیشتر در این حوزه در مقاله‌ دیگری که توسط Agarwal and Liu در سال 2009 نوشته شده است، قابل دسترسی است.

5. پخش اطلاعات و منشا آن (Information Diffusion and Provenance): دو مسئله مهم در شبکه‌های اجتماعی عبارت اند از: 1) اطلاعات چگونه در یک شبکه رسانه اجتماعی پخش می‌شوند و چه فاکتورهایی در پخش این اطلاعات موثر هستند؟ 2) کدام منابع محتملی این اطلاعات را به شبکه‌های اجتماعی می‌دهند؟ قسمت دوم همواره به عنوان یک مسئله مهم باقیمانده است و محققان اذعان داشته‌اند که یافتن جواب این مسئله به تشخیص حقیقت از شایعه در شبکه‌های اجتماعی منجر خواهد شد.

6. محرمانگی، امنیت و اعتماد (Privacy, Security, and Trust): انواع حملاتی که یک شبکه اجتماعی ممکن است با آن‌ها مواجه شود عبارت است از:

  • stalking

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com


  • cyberbullying
  • Malvertizing
  • phishing
  • social spamming
  • scamming
  • clickjacking

اعتماد اجتماعی نیز بستگی به فاکتورهایی دارد که مدل‌سازی آن‌ها در سیستم‌های محاسباتی به آسانی انجام نخواهد گرفت و تعریف‌های بسیاری از "اعتماد" صورت گرفته است. Moturu and Liu در تحقیقی سیستم امتیازدهی مستقیمی را به منظور اندازه‌گیری قابلیت اعتماد سلامت کاربر بر طبق مندرجاتی که در یک رسانه اجتماعی داشته است، ارائه داده است.

مثال‌های گویا از کاوش رسانه‌های اجتماعی

مثال‌های گویا از کاوش رسانه‌های اجتماعی 1) تعیین آسیب‌پذیری کاربر روی سایت‌های شبکه‌های اجتماعی: صفات موجود برای هر کاربر در شبکه‌های اجتماعی می‌تواند به دو دسته‌ مجزا تقسیم شود: 1) صفات فردی و 2) صفات اجتماعی. صفات فردی متغیرهایی می‌باشند که شامل اطلاعات شخصی افراد مانند جنسیت، تاریخ تولد، شماره تلفن، آدرس خانه و غیره هستند. صفات اجتماعی متغیرهایی می‌باشند که شامل اطلاعاتی در خصوص دوستان کاربر می‌باشند. برای مثال اطلاعات دوستانی که توسط پروفایل کاربر قابل شناسایی می‌باشند، عکس‌هایی که کاربر در آن تگ شده است و تعاملات کاربر و نوشته‌های روی دیوار (به طور مثال دیوار نویسی در شبکه اجتماعی فیسبوک) نمونه‌هایی از این صفات می‌باشند. در تحقیقات اخیر انجام گرفته توسط Gundecha از داده‌های فیسبوک به منظور ارزیابی آشکارسازی صفاتی که منجر به کشف رفتارهای عمومی کاربران خواهد شد، استفاده شده است. به عنوان مثال کاربران فیسبوک عموما شماره تلفن خود را در معرض عموم قرار نمی‌دهند. در نتیجه کاربرانی که شماره تلفن خود را برای عموم آشکار می‌کنند، میل باطنی بیشتری به آسیب‌پذیری دارند. زیرا این افراد اطلاعات حساس‌تری از خود را در اختیار دیگران قرار داده اند. بخش زیادی از کاربران شبکه‌های اجتماعی از نتایج اقدامات خود نسبت به حفظ امنیت اطلاعات دوستان خود آگاه نمی‌باشند و در نتیجه حفاظت از صفات فردی کاربر به نوعی باعث حفظ صفات اجتماعی نیز خواهد بود. در این تحقیق یک مکانیزم جدید جهت حفاظت از کاربر در برابر آسیب پذیری ارائه شده است. Gundecha نشان داده است که اندازه‌گیری میزان آسیب‌پذیری کاربران بر اساس فاکتورهای زیر قابل انجام می‌باشد:

1. تنظیمات محرمانه کاربر که موجب آشکارسازی اطلاعات شخصی او خواهد بود.

2. رفتار کاربر در شبکه‌های اجتماعی که می‌تواند موجب افشاء اطلاعات خصوصی دوستانش شود.

3. رفتار کاربر در شبکه‌های اجتماعی که می‌تواند موجب افشاء اطلاعات شخصی خود شود.

بنابراین 3 فاکتور Gundecha مدلی را جهت کاهش آسیب‌پذیری کاربر ارائه داده است. آن‌ها یک فرآیند 4 مرحله‌ای را جهت تخمین آسیب‌پذیری کاربر مشخص کرده‌اند:

1. تخمین ریسک محرمانگی با توجه به صفات فردی(شاخص I)

2. تخمین ریسک محرمانگی با توجه به صفات اجتماعی (شاخص C)

3. تخمین آشکارسازی یک کاربر با توجه به شاخص I و C (شاخص P)

4. تخمین آسیب‌پذیری کاربر بر اساس شاخص P کاربر و یکی از دوستان او (شاخص V)

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

نتیجه‌گیری

رسانه‌های اجتماعی به عنوان یکی از انواع اصلی Big Data روز به روز در حال گسترش می‌باشد، برای مثال کاربرد اصلی این نوع داده‌هادر کمپین‌های سیاسی، برنامه‌های کاریابی، ارتقا کسب و کار و شبکه و خدمات مشتری و ... می‌باشد. کاوش رسانه‌های اجتماعی همچنین در روند تحلیل و پیش‌بینی‌های فروش نیز کاربرد موثری دارد. داده‌های مربوط به رسانه‌های اجتماعی روز به روز در حال گسترش می‌باشد و در نتیجه الگوریتم‌ها و تکنیک‌های جدید برای کاوش این داده‌ها در آینده نزدیک حس می‌شود که منجر به توسعه تحقیات و کشف رفتار و الگوهای تعاملی افراد در شبکه‌های آنلاین یا آفلاین خواهد شد.

برگرفته شده از مقاله Mining Social Media: A Brief Introduction نوشته Pritam Gundecha و Huan Liu

منابع:

 

  • N. Agarwal, H. Liu, L. Tang, and P. S. Yu. Identifying the influential bloggers in a community. Proceedings of the International Conference on Web Search and Web Data Mining. Association for Computing Machinery, New York, 2008.
  • N. Agarwal, H. Liu, L. Tang, and P. S. Yu. Modeling blog09367292276
    09367292276
    azsoftir@gmail.com
    azsoftir.com
    09367292276
    09367292276
    azsoftir@gmail.com
نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.