تبلیغات
تحقیق دانشجویی - تحقیق داده‌کاوی و عامل‌ها و سیستم‌های چند عامله

تحقیق دانشجویی

تحقیق داده‌کاوی، عامل‌ها و سیستم‌های چند عامله   شامل 41 صفحه به صورت فایل ورد و قابل ویرایش می باشد که یکی از تحقیق های جامع و کامل در مورد   داده‌کاوی و عامل‌ها و سیستم‌های چند عامله  می باشد و دارای منابع معتبر می باشد

مقدمه

در این مقاله، به سه بخش اصلی با عناوین داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی می­پردازیم و در نهایت به بررسی کارهای انجام شده در این حوزه خواهیم پرداخت.

۲-۲- داده­کاوی

داده کاوی، یک تکنولوژی نوظهور است، که از ابزارها و تکنیک‌های مدل‌سازی و تجزیه و تحلیل آماری، الگوریتم‌های ریاضی، و متدهای یادگیری ماشین برای کشف الگوهای معتبر و ناشناخته در مجموعه داده‌های حجیم استفاده می‌کند. هرچند این تکنولوژی دوران نوباوگی خود را طی می‌کند، اما شرکت‌ها و سازمان‌های بسیاری از جمله خرده‌فروشی‌ها، بانک‌ها، مراکز درمانی، کارخانجات تولیدی، ارتباطات راه دور، و مؤسسات دولتی از ابزارها و تکنیک‌های داده‌کاوی برای تحلیل داده‌هایشان و کشف اطلاعات و دانش مفید از آن‌ها استفاده می‌کنند.[۱, ۲] داده‌کاوی اطلاعاتی را از پایگاه داده‌ها استخراج می‌کند که از طریق کوئری‌ها و گزارش‌گیری‌ها قابل دست‌یابی نیستند.

رشد انفجاری داده‌های ذخیره شده در پایگاه داده‌ها، نیاز به تکنولوژی‌های جدید که بتوانند حجم عظیم داده‌ها را هوشمندانه به دانش مفید تبدیل کنند، را پدید آورده است.[۳] داده­کاوی به معنای یافتن نیمه خودکار الگوهای پنهان در مجموعه داده­های[۱] موجود می‌باشد.[۴] این تکنولوژی با دیگر تکنیک‌های تحلیل داده، که سیستم، مقادیر اولیه را می‌گیرد و خود، الگوهایی را تولید می‌کند، متفاوت است. داده‌کاوی توسط ابزارهای الگوریتمیک، الگوها، تغییرات، آنومالی‌ها، قوانین، و ساختارهای مهم آماری، و رویدادها را از مجموعه داده‌های عظیم استخراج می‌کند.[۵] می‌توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بین داده­های فعلی و پیش­بینی موارد نامعلوم و یا مشاهده نشده عمل می­کند. برای انجام عملیات کاوش لازم است قبلاً روی داده­های موجود پیش پردازش‌هایی انجام گیرد. عمل پیش پردازش اطلاعات خود از دو بخش کاهش اطلاعات، و خلاصه­سازی و کلی­سازی داده­ها تشکیل شده است. کاهش اطلاعات عبارت است از تولید یک مجموعه کوچک‌تر، از داده­های اولیه، که تحت عملیات داده­کاوی نتایج تقریباً یکسانی با نتایج داده­کاوی روی اطلاعات اولیه به دست دهد.[۴] پس از انجام عمل کاهش اطلاعات و حذف خصایص غیر مرتبط نوبت به خلاصه­سازی و کلی­سازی داده­ها می‌رسد. داده­های موجود در بانک‌های اطلاعاتی معمولاً حاوی اطلاعات در سطوح پایینی هستند، بنابراین خلاصه­سازی مجموعه بزرگی از داده­ها و ارائه آن به صورت یک مفهوم کلی اهمیت بسیار زیادی دارد. کلی­سازی اطلاعات، فرآیندی است که تعداد زیادی از رکوردهای یک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می‌نماید. تکنیک‌‌های داده­کاوی به چند دسته تقسیم می­شوند که سه دسته اصلی عبارتند از خوشه­بندی[۲]، طبقه­بندی[۳] و کشف قواعد انجمنی[۴]. در ادامه هر یک از این روش‌ها را به طور کلی معرفی می­نماییم.

۲-۱- خوشه ­بندی

فرآیند خوشه­بندی سعی دارد که یک مجموعه داده را به چندین خوشه­ تقسیم نماید بطوریکه داده‌های قرار گرفته در یک خوشه با یکدیگر شبیه بوده و با داده­های خوشه­های دیگر متفاوت باشند. در حال حاضر روش‌های متعددی برای خوشه­بندی داده­ها وجود دارد که بر اساس نوع داده­ها، شکل خوشه­ها، فاصله داده­ها و غیره عمل خوشه­بندی را انجام می­دهند. مهم‌ترین روش‌های خوشه­بندی در زیر معرفی شده­اند:

۲-۲-۱-۱- روش‌های خوشه‌بندی مبتنی بر تقسیم‌بندی

این روش‌ها، داده­های موجود در یک مجموعه داده را به k خوشه تقسیم می­کنند، بطوریکه هر خوشه دو خصوصیت زیر را داراست:

هر خوشه یا گروه حداقل شامل یک داده می­باشد.

هر داده موجود در مجموعه داده دقیقاً به یک گروه یا خوشه تعلق دارد.

معیار اصلی در چنین مجموعه داده­هایی میزان شباهت داده­های قرار گرفته در هر خوشه می­باشد. در حالیکه داده‌های قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند. مقدار k که به عنوان پارامتر استفاده می­گردد، هم می­تواند به صورت پویا تعیین گردد و هم اینکه قبل از شروع الگوریتم خوشه­بندی مقدار آن مشخص گردد.

۲-۲-۱-۲- روش‌های سلسله مراتبی[۵]

روش‌های سلسله مراتبی به دو دسته کلی روش‌های پایین به بالا[۶] و روش‌های بالا به پایین[۷] تقسیم می‌گردند. روش‌های سلسله مراتبی پایین به بالا به این صورت عمل می­کنند که در شروع هر کدام از داده­ها را در یک خوشه جداگانه قرار می­دهد و در طول اجرا سعی می­کند تا خوشه­هایی نزدیک به یکدیگر را با هم ادغام نماید. این عمل ادغام تا زمانی که یا تنها یک خوشه داشته باشیم و یا اینکه شرط خاتمه برقرار گردد، ادامه می­یابد. روش‌های بالا به پایین دقیقاً به طریق عکس عمل می­کنند، به این طریق که ابتدا تمام داده­ها را در یک خوشه­ قرار می­دهد و در هر تکرار از الگوریتم، هر خوشه به خوشه­های کوچک‌تر شکسته می­شود و این کار تا زمانی ادامه می­یابد که یا هر کدام از خوشه­ها تنها شامل یک داده باشند و یا شرط خاتمه الگوریتم برقرار گردد. شرط خاتمه معمولاً تعداد کلاستر یا خوشه می­باشد.

۲-۲-۱-۳- روش‌های مبتنی بر چگالی[۸]

اکثر روش‌های خوشه­بندی که به این روش عمل می­کنند معمولاً از تابع فاصله به عنوان تابع معیار خود بهره می­برند. استفاده از چنین معیاری باعث می­گردد که الگوریتم خوشه­بندی تنها قادر به ایجاد خوشه­هایی با اشکال منظم باشد. در صورتیکه خوشه­های واقعی در داده­ها دارای اشکال غیر منظمی باشند، این الگوریتم­ها در خوشه­بندی آن‌ها با مشکل مواجه می­گردند. برای حل این‌گونه مشکلات یکسری از روش‌ها برای خوشه­بندی پیشنهاد گردیده­اند که عمل خوشه­بندی را بر مبنای چگالی داده­ ها انجام می‌دهند. ایده‌ی اصلی در این روش‌ها بر این اساس است که تا زمانی که داده­های قرار گرفته در همسایگی خوشه‌ها از حد معینی بیشتر باشند، آن‌ها رشد می­کنند و بزرگ می­شوند. چنین روش‌هایی قادرند خوشه­هایی با شکل‌های نامنظم نیز ایجاد نمایند.

البته دسته‌های دیگری از روش‌های خوشه­بندی مانند روش‌های مبتنی بر گرید، روش‌های مبتنی بر مدل و غیره وجود دارند که می­توانید آن‌ها را در [۴] مطالعه نمایید.

۲-۲-۲- طبقه ­بندی

فرایند طبقه­بندی در واقع نوعی یادگیری با ناظر می­باشد که در طی دو مرحله انجام می­گردد. در مرحله اول مجموعه­ای از داده­ها که در آن هر داده شامل تعدادی خصوصیت دارای مقدار و یک خصوصیت بنام خصوصیت کلاس می­باشد، برای ایجاد یک مدل داده بکار می­روند که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات آن مجموعه داده­ها است. مرحله دوم فرآیند طبقه­بندی، اعمال یا بکارگیری مدل ایجاد شده، بر روی داده‌هایی است که شامل تمام خصوصیات داده­هایی که برای ایجاد مدل بکار گرفته­ شده­اند، می­باشند، بجز خصوصیت کلاس، و هدف از عمل طبقه­بندی نیز تخمین مقدار این خصوصیت می­باشد.

الگوریتم­ها و روش‌های مختلفی برای طبقه­بندی تاکنون پیشنهاد شده­اند که برای مثال می­توان از روش‌های طبقه­بندی با استفاده از درخت تصمیم، طبقه­بندی بیزین، [۹]SVM، طبقه­بندی با استفاده از شبکه‌های عصبی، طبقه­بندی مبتنی بر قواعد و غیره نام برد.[۶] در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتم­ها و روش‌های طبقه­بندی شویم و تنها روش طبقه­بندی مبتنی بر قواعد را معرفی خواهیم نمود. در صورت نیاز به مطالعه بیشتر می­توانید به مرجع [۴] مراجعه نمایید.

۲-۲-۲-۱- طبقه ­بندی مبتنی بر قواعد

در این قسمت قصد داریم نگاهی به بحث طبقه­بندی مبتنی بر قواعد داشته باشیم. در این روش، مدل ایجاد شده از روی داده­ها به صورت مجموعه­ای از قواعد می­باشد. می­توان گفت که هر قاعده به صورت یک قاعده IF P THEN C می­باشد که در آن P مجموعه­ای از شرایط بوده و C نیز مشخص کننده برچسب یک کلاس یا طبقه­ خاص می­باشد. یک قاعده بدست آمده از مجموعه داده­های آموزشی با استفاده از دو معیار coverage و accuracy می­تواند ارزیابی گردد.


جهت دانلود متن کامل تحقیق داده‌کاوی و عامل‌ها و سیستم‌های چند عامله کلیک نمایید

نظرات() 
 
لبخندناراحتچشمک
نیشخندبغلسوال
قلبخجالتزبان
ماچتعجبعصبانی
عینکشیطانگریه
خندهقهقههخداحافظ
سبزقهرهورا
دستگلتفکر
نظرات پس از تایید نشان داده خواهند شد.

آمار وبلاگ

  • کل بازدید :
  • بازدید امروز :
  • بازدید دیروز :
  • بازدید این ماه :
  • بازدید ماه قبل :
  • تعداد نویسندگان :
  • تعداد کل پست ها :
  • آخرین بازدید :
  • آخرین بروز رسانی :