تفاده از رسانههای اجتماعی باعث تولید دادههای اجتماعی بیشماری شده است. رسانههای اجتماعی پایگاهی را برای کاربران ایجاد میکنند تا اطلاعات خود را در آن با دیگران به اشتراک بگذارند. کاوش این نوع دادهها موجب استخراج الگوهای کاربردی خواهد شد که برای کسب و کارها، کاربرها و مصرف کنندهها بسیار مفید خواهد بود. برای مثال تکنیکهای داده کاوی میتوانند در موارد زیر در خصوص رسانههای اجتماعی ب
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
ه کار برده شوند:
- شناسایی افراد موثر در محیطهای وبلاگی
- یافتن گروههای پنهان یا آشکار در شبکههای اجتماعی
- تشخیص احساسات کاربر در برنامهریزی پیشگستر
- توسعه سیستمهای پیشنهاددهنده از خرید محصولات خاص تا ایجاد دوستان جدید
- فهم تکامل تدریجی شبکه و تعویض رابطه بین موجودیتها
- محافظت از محرمانگی و امنیت اطلاعات کاربر
- ایجاد و تقویت اعتماد میان کاربران یا بین کاربران و موجودیتها
طبق تعریف Kaplan و Haenlein رسانههای اجتماعی به عنوان گروهی از کاربردهای اینترنتی تعریف میشود که بر پایه وب 2 به صورت فنی و ایدئولوژیک ساخته شدهاند و اجازهی ایجاد و تغییر محتوا را دارند. رسانه اجتماعی مجموعهای از سایتهای مختلف میباشد که شامل رسانههای سنتی مانند روزنامه، رادیو و تلویزیون و رسانههای غیر سنتی مانند فیسبوک، توییتر و غیره میباشد. رشد رسانههای اجتماعی تحت چالشهای زیر صورت گرفته است و جواب این سوالات در دادههای رسانههای اجتماعی پنهان میباشد.
1. چطور یک کاربر میتواند درک شود؟
2. یک کاربر از چه نوع اطلاعاتی باید استفاده کند؟
3. تجربیات یک کاربر چگونه میتواند بهبود یابد؟
دادههای مربوط به رسانههای اجتماعی دارای ویژگیهایی میباشند که نیازمند تکنیکها و الگوریتمهای جدید برای کاوش آنها میباشد. دادههایی که عموما به صورت گسترده توسط کاربران در سایتهای رسانههای اجتماعی ایجاد میشوند، بسیار زیاد و دارای نویز میباشند. این دادهها همچنین بدون ساختار و پویا هستند. همچنین به دلیل عدم وجود مرکزیتی که همهی دادههای سایتهای رسانههای اجتماعی را نگهداری کند، این دادهها در همه جا پخش شدهاند.
با توجه به توضیحاتی که در بالا ذکر شد، زمینههای احتمالی که محققان میتوانند به کاوش رسانههای اجتماعی در آن بپردازند در ادامه ذکر شدهاند:
1. تجزیه و تحلیل جامعه (Community Analysis): یک جامعه توسط افرادی شکل میگیرد که در یک گروه روابط متقابل بیشتری را به نسبت افراد خارج از یک گروه دارند. این جوامع میتوانند توسط ارتباطشان در رسانههای اجتماعی شناخته شوند زیرا رسانههای اجتماعی این اجازه را به افراد میدهند تا در شبکههای اجتماعی آنلاین روابطشان را گسترش دهند. از آنجا که این شبکه ها بسیار پویا هستند، جوامع میتوانند در این شبکههای پویا توسعه و حتی منحل گردند. با توجه به تحقیقاتی که در این زمینه انجام گرفته شده است نشان میدهد که هر چه تعداد دوستان یک کاربر در یک گروه بیشتر باشد، احتمال بیشتری وجود دارد که کاربر در آن گروه عضو شود.
2
.
تحلیل احس09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.comاسات و نظرکاوی (Sentiment Analysis and Opinion Mining): تجزیه و
تحلیل احساسات کاری بسیار دشوار میباشد چرا که زبانهایی که به منظور
ایجاد محتوا به کار برده میشوند بسیار مبهم میباشند. اصلیترین گامهای
این فرآیند عبارتند از: 1) یافتن اسناد مربوط، 2) یافتن بخشهای مربوط، 3)
یافتن احساسات کلی، 4) کمی کردن احساسات، 5) یکپارچهسازی تمام الگوهای به
دست آمده برای ایجاد یک الگوی احساسی کلی. همچنین اجزاء اصلی یک عقیده و
نظر متشکل است از: 1) مسئلهای که آن نظر بر روی آن اعمال شده است، 2) نظری
که بر روی یک مسئله بیان شده است، 3) کسی که نظر را ارائه داده است. این
تجزیه و تحلیل میتواند در سه سطح اسناد، جمله و ویژگی اعمال شود.
3. توصیههای اجتماعی (Social Recommendation): یک سیستم توصیه اجتماعی از اطلاعات شبکههای اجتماعی یک کاربر در کنار ابزار سنتی سیستمهای توصیه کننده استفاده میکند و از این نظریه تبعیت میکند که افرادی که از نظر اجتماعی بایکدیگر در ارتباط میباشند با احتمال بیشتری علایق مشابه یا یکسان با یکدیگر خواهند داشت. از نمونههای این سیستم میتوان به توصیه کتاب به لیست دوستان یک کاربر در سایت آمازون یا پیشنهاد دوستی در فیسبوک و یا توییتر اشاره کرد.
4. مدلسازی نفوذی (Influence Modeling): شناخت یک شبکه اجتماعی از نظر اینکه دارای شباهتهای یکسان با سایر شبکههای اجتماعی است و یا نفوذپذیر میباشد، امری بسیار مهم میباشد. بیشتر شبکههای اجتماعی ترکیبی از هر دو این ویژگیها میباشند. هدف اصلی در پیدا کردن شبکه نفوذپذیر، یافتن کاربرانی است که بیشترین تأثیر را روی کاربران دیگر خواهند گذاشت. برای مثال در تحقیقاتی که توسط Agarwal در سالهای 2008 و 2012 انجام شده است، مدلی برای تشخیص بلاگنویسان تاثیرگذار در یک اجتماع ارائه شده است. آنها متذکر شدند که همهی بلاگ نویسان صرفا بلاگهای تأثیرگذار نمینویسند. اطلاعات بیشتر در این حوزه در مقاله دیگری که توسط Agarwal and Liu در سال 2009 نوشته شده است، قابل دسترسی است.
5. پخش اطلاعات و منشا آن (Information Diffusion and Provenance): دو مسئله مهم در شبکههای اجتماعی عبارت اند از: 1) اطلاعات چگونه در یک شبکه رسانه اجتماعی پخش میشوند و چه فاکتورهایی در پخش این اطلاعات موثر هستند؟ 2) کدام منابع محتملی این اطلاعات را به شبکههای اجتماعی میدهند؟ قسمت دوم همواره به عنوان یک مسئله مهم باقیمانده است و محققان اذعان داشتهاند که یافتن جواب این مسئله به تشخیص حقیقت از شایعه در شبکههای اجتماعی منجر خواهد شد.
6. محرمانگی، امنیت و اعتماد (Privacy, Security, and Trust): انواع حملاتی که یک شبکه اجتماعی ممکن است با آنها مواجه شود عبارت است از:
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
اعتماد اجتماعی نیز بستگی به فاکتورهایی دارد که مدلسازی آنها در سیستمهای محاسباتی به آسانی انجام نخواهد گرفت و تعریفهای بسیاری از "اعتماد" صورت گرفته است. Moturu and Liu در تحقیقی سیستم امتیازدهی مستقیمی را به منظور اندازهگیری قابلیت اعتماد سلامت کاربر بر طبق مندرجاتی که در یک رسانه اجتماعی داشته است، ارائه داده است.
مثالهای گویا از کاوش رسانههای اجتماعی 1) تعیین آسیبپذیری کاربر روی سایتهای شبکههای اجتماعی: صفات موجود برای هر کاربر در شبکههای اجتماعی میتواند به دو دسته مجزا تقسیم شود: 1) صفات فردی و 2) صفات اجتماعی. صفات فردی متغیرهایی میباشند که شامل اطلاعات شخصی افراد مانند جنسیت، تاریخ تولد، شماره تلفن، آدرس خانه و غیره هستند. صفات اجتماعی متغیرهایی میباشند که شامل اطلاعاتی در خصوص دوستان کاربر میباشند. برای مثال اطلاعات دوستانی که توسط پروفایل کاربر قابل شناسایی میباشند، عکسهایی که کاربر در آن تگ شده است و تعاملات کاربر و نوشتههای روی دیوار (به طور مثال دیوار نویسی در شبکه اجتماعی فیسبوک) نمونههایی از این صفات میباشند. در تحقیقات اخیر انجام گرفته توسط Gundecha از دادههای فیسبوک به منظور ارزیابی آشکارسازی صفاتی که منجر به کشف رفتارهای عمومی کاربران خواهد شد، استفاده شده است. به عنوان مثال کاربران فیسبوک عموما شماره تلفن خود را در معرض عموم قرار نمیدهند. در نتیجه کاربرانی که شماره تلفن خود را برای عموم آشکار میکنند، میل باطنی بیشتری به آسیبپذیری دارند. زیرا این افراد اطلاعات حساستری از خود را در اختیار دیگران قرار داده اند. بخش زیادی از کاربران شبکههای اجتماعی از نتایج اقدامات خود نسبت به حفظ امنیت اطلاعات دوستان خود آگاه نمیباشند و در نتیجه حفاظت از صفات فردی کاربر به نوعی باعث حفظ صفات اجتماعی نیز خواهد بود. در این تحقیق یک مکانیزم جدید جهت حفاظت از کاربر در برابر آسیب پذیری ارائه شده است. Gundecha نشان داده است که اندازهگیری میزان آسیبپذیری کاربران بر اساس فاکتورهای زیر قابل انجام میباشد:
1. تنظیمات محرمانه کاربر که موجب آشکارسازی اطلاعات شخصی او خواهد بود.
2. رفتار کاربر در شبکههای اجتماعی که میتواند موجب افشاء اطلاعات خصوصی دوستانش شود.
3. رفتار کاربر در شبکههای اجتماعی که میتواند موجب افشاء اطلاعات شخصی خود شود.
بنابراین 3 فاکتور Gundecha مدلی را جهت کاهش آسیبپذیری کاربر ارائه داده است. آنها یک فرآیند 4 مرحلهای را جهت تخمین آسیبپذیری کاربر مشخص کردهاند:
1. تخمین ریسک محرمانگی با توجه به صفات فردی(شاخص I)
2. تخمین ریسک محرمانگی با توجه به صفات اجتماعی (شاخص C)
3. تخمین آشکارسازی یک کاربر با توجه به شاخص I و C (شاخص P)
4. تخمین آسیبپذیری کاربر بر اساس شاخص P کاربر و یکی از دوستان او (شاخص V)
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
نتیجهگیری
رسانههای اجتماعی به عنوان یکی از انواع اصلی Big Data روز به روز در حال گسترش میباشد، برای مثال کاربرد اصلی این نوع دادههادر کمپینهای سیاسی، برنامههای کاریابی، ارتقا کسب و کار و شبکه و خدمات مشتری و ... میباشد. کاوش رسانههای اجتماعی همچنین در روند تحلیل و پیشبینیهای فروش نیز کاربرد موثری دارد. دادههای مربوط به رسانههای اجتماعی روز به روز در حال گسترش میباشد و در نتیجه الگوریتمها و تکنیکهای جدید برای کاوش این دادهها در آینده نزدیک حس میشود که منجر به توسعه تحقیات و کشف رفتار و الگوهای تعاملی افراد در شبکههای آنلاین یا آفلاین خواهد شد.
برگرفته شده از مقاله Mining Social Media: A Brief Introduction نوشته Pritam Gundecha و Huan Liu
منابع: