پروژه های پژوهشی و تحقیقاتی دانشگاه ها با موضوع شناسایی تشکلهای پنهان بر اساس لینک و … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
بعضی از این روشها فقط بر اساس ساختار لینک ارزیابی را انجام می دهند اما بعضی دیگر با وجود محتوا نیز قادر به ارزیابی الگوریتم هستند.
به طور کلی بخش بسیار کوچکی از مطالعات و تحقیقات در مبحث شناسایی تشکلها به آزمایشات کارایی و درست بودن الگوریتمهای پیشنهادی اختصاص داده شده است. دلیل این امر که خود یک نقص بزرگ در مطالعه این بخش از شبکه های اجتماع است، کمبود معیارهای ارزیابی مطمئن میباشد. یعنی به دلیل کمبود معیارهای ارزیابی قابل اطمینان بسیاری از محققان صحت الگوریتمهای خود را بر روی داده های بسیار کوچکی آزمایش می کنند که ساختار تشکل موجود در آنها به راحتی با چشم قابل شناسایی است. نتیجه استفاده از این معیارها و داده های کوچک، زیاد شدن الگوریتمهای شناسایی تشکلها در شبکه های اجتماعی به علت عدم مقایسه درست است.
در این پایان نامه جهت ارزیابی الگوریتم پیشنهادی خود از معیار Modularity جهت بررسی فاز مبتنی بر لینک و معیار های Perplexity و Normalized Mutual Iinformation جهت بررسی کلی الگوریتم پیشنهادی CDBLC استفاده کردهایم که در ادامه به شرح این معیارها پرداختهایم.
معیار Modularity
اگر یک شبکه با تعدادی گره منفرد و لینکهای اتصالی که نشان دهنده یک درجه خاصی از تعامل بین گره ها می باشد نمایش داده شود، جوامع به عنوان گروهی از گرههای متراکم به هم پیوسته که با بقیهی شبکه به صورت پراکنده[۱۷۴] متصل هستند تعریف میشوند. از این رو، مشخص کردن تعریف جوامع در شبکه ضروری است چرا که جوامع ممکن است خواص کاملا متفاوتی از جمله درجه گره[۱۷۵]، ضریب خوشهبندی[۱۷۶]، معیار مابین بودن[۱۷۷]، تمایل به مرکزیت[۱۷۸] و غیره در مقایسه با شبکه نرمال داشته باشد[۳۹]. ماژولاریتی از جمله معیارهای اندازه گیری است که در زمان حداکثر بودن، منجر به ظهور تشکلها در یک چنین شبکه داده شدهای می شود.
زمانی که جواب حقیقی[۱۷۹] برای مجموعه دادهی موجود در دسترس نباشد کارایی الگوریتمهای مبتنی بر لینک با این معیار ارزیابی می شود. معیار Modularity در سال ۲۰۰۴ توسط Newman و Grivan برای سنجیدن بخش[۱۸۰]های تشکلها معرفی شد[۲۵].
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
. اگرچه این معیار دارای مشکلاتی است و زمانی که شبکه ها بسیار تنک باشند غیر قابل اعتماد است [۵۱ in alvari] اما بههر حال از محبوبیت و معروفیت زیادی برخوردار است.
برای بخشهای تشکل معیار Modularity به صورت زیر تعریف می شود:
(۴-۱)
که مبین تمام گرهها در شبکه اجتماعی است و نشاندهنده گرهها در در امین تشکل میباشد. همچنین طبق تعریف آمده در [۳۴] داریم:
(۴-۲)
.ماژولاریتی نشان میدهد یک شبکه چقدر شبیه ساختار تشکلهای پیشنهادی ساخته میشود نسبت به اینکه بخواهد با پردازش تصادفی ساخته شود. بنابراین بالاتر بودن این معیار نشاندهنده ساختار تشکلی هست که بهتر شبکه اجتماعی مشاهده شده را بیان میکند.
معیار Normalized Mutual Information
زمانی که جواب حقیقی[۱۸۱] برای مجموعه دادهی موجود در دسترس باشد، کارایی الگوریتم توسط بین اعضای واقعی تشکلها و آنهایی که توسط الگوریتم داده شده اند محاسبه می شود. به طور خاصتر، اگر ساختار تشکل درست و واقعی توسط بیان شود و ساختار ارائه شده توسط الگوریتم به صورت نشان داده شود بین این دو به صورت زیر تعریف می شود:
(۴-۳)
نیز به صورت زیر تعریف می شود:
(۴-۴)
در اینجا و آنتروپی بخشهای و هستند. مقدار MI بین صفر و یک است و مقدار بیشتر MI نشاندهنده این است که نتیجه اعلام شده توسط الگوریتم یعنی به جواب واقعی نزدیکتر است. این معیار معمولا در شاخه های بازیابی اطلاعات کاربرد فراوانی دارد. [۴۰][۴۱][۱۸][۴۲]
معیار Perplexity
یک معیار سنجش کیفیت خوشهبندی که به طبقه بندی[۱۸۲] پیشین[۱۸۳] داده ها احتیاج ندارد، احتمال[۱۸۴] داده کنار گذاشته شده[۱۸۵] تحت مدل آموزشی[۱۸۶] است. به عبارت دیگر این معیار توانایی مدل را در تولید داده دیده نشده پیش بینی می کند. معمولا مقدار این احتمالات لگاریتمی مقادیر منفی بسیار بزرگی هستند. این معیار معمولا در پردازش زبان استفاده می شود. معیار Perplexity به صورت شهودی به این ترتیب تفسیر می شود: ” سایز واژگان[۱۸۷] با توزیع کلمات یکنواخت[۱۸۸] که یک مدل برای تولید یک مولفه[۱۸۹] از داده های تست احتیاج دارد”[۴۳] مدلی که بهتر بتواند رشته کلماتی که پشت سر هم میآیند را پیش بینی کند به احتمالات کمتری برای قرار دادن یک کلمه جدید در یک متن احتیاج دارد، بنابراین مقدار کمتر perplexity، بیان کننده خطای کمتر در ارائه کلمههای موجود در اسناد آزمایشی تحت عناوین آموزشی است. به عبارت دیگر، مقدار کمتر Perplexity نشان دهنده Likelihood بیشتر مدل و بنابراین قدرت تولید کنندگی بیشتر مدل است[۴۴].
برای تشکل با رشته کلمات و تعداد مؤلفهی معیار Perplexity به صورت زیر تعریف می شود:
فرم در حال بارگذاری ...
[سه شنبه 1401-04-14] [ 04:10:00 ب.ظ ]
|