loading...
سرویس سایت سایت رزبلاگ بزرگترین سرویس ارائه خدمات سایت نویسی حرفه ای در ایران

انجام پروژه های داده کاوی

newdatamining

انجام پایان نامه کارشناسی ارشدWeka

مقدمه

  تا به امروز نرم افزارهای تجاری و آموزشی فراوانی برای داده کاوی در حوزه های مختلف داده ها به دنیای علم و فناوری عرضه شده اند. هریک از آنها با توجه به نوع اصلی داده هایی که مورد کاوش قرار میدهند، روی الگوریتمهای خاصی متمرکز شده اند. مقایسه دقیق و علمی این ابزارها باید از جنبه های متفاوت و متعددی مانند تنوع انواع و فرمت داده های ورودی، حجم ممکن برای پردازش داده ها، الگـوریتمهای پیاده سـازی شده، روشهای ارزیابی نتایج، روشهای مصـور سـازی، روشهای پیش پردازش داده ها، واسطهای کاربر پسند، پلت‌فرمهای سازگار برای اجرا،قیمت و در دسترس بودن نرم افزار صورت گیرد. از آن میان، نرم افزار Weka با داشتن امکانات بسیار گسترده،امکان مقایسه خروجی روشهای مختلف با هم، راهنمای خوب، واسط گرافیگی کارا، سازگاری با سایر برنامه های ویندوزی، و از همه مهمتر وجود کتابی بسیار جامع و مرتبط با آن [Data Mining, witten et Al. 2005 ] ، معرفی میشود.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

1- معرفی نرم افزار Weka

میزکارWeka ، مجموع‌های از الگوریتمهای روز یادگیری ماشینی و ابزارهای پیش پردازش داده‌ها میباشد. این نرم‌افزار به گونه‌ای طراحی شده است که میتوان به سرعت، روشهای موجود را به صورت انعطافپذیری روی مجموعه‌های جدید داده، آزمایش نمود. این نرم‌افزار، پشتیبانی‌های ارزشمندی را برای کل فرآیند داده کاوی های تجربی فراهم میکند. این پشتیبانی‌ها، آماده سازی داده‌های ورودی، ارزیابی آماری چارچوبهای یادگیری و نمایش گرافیکی داده‌های ورودی و نتایج یادگیری را در بر میگیرند. همچنین، هماهنگ با دامنه وسیع الگوریتمهای یادگیری، این نرم‌افزار شامل ابزارهای متنوع پیش پردازش داده‌هاست. این جعبه ابزار متنوع و جامع، از طریق یک واسط متداول در دسترس است، به نحوی که کاربر میتواند روشهای متفاوت را در آن با یکدیگر مقایسه کند و روشهایی را که برای مسایل مدنظر مناسبتر هستند، تشخیص دهد.

این سیستم به زبان جاوا نوشته شده و بر اساس لیسانس عمومی و فراگیر GNU انتشار یافته است.Weka تقریباً روی هر پلت فرمی اجرا میشود و نیز تحت سیستم عاملهای لینوکس، ویندوز، و مکینتاش، و حتی روی یک منشی دیجیتالی شخصی، آزمایش شده است.

این نرم افزار، یک واسط همگون برای بسیاری از الگوریتمهای یادگیری متفاوت، فراهم کرده است که از طریق آن روشهای پیش پردازش، پس از پردازش و ارزیابی نتایج طرح های یادگیری روی همه مجموعه های داده موجود، قابل اعمال است.

نرم افزار Weka ، پیاده سازی الگوریتمهای مختلف یادگیری را فراهم میکند و به آسانی میتوان آنها را به مجموعه های داده خود اعمال کرد.

  همچنین، این نرم افزار شامل مجموعه متنوعی از ابزارهای تبدیل مجموعه‌های داده ها، همانند الگوریتمهای گسسته سازی میباشد. در این محیط میتوان یک مجموعه داده را پیش پردازش کرد، آن را به یک طرح یادگیری وارد نمود، و دسته‌بندی حاصله و کارآیی‌اش را مورد تحلیل قرار داد.( همه این کارها، بدون نیاز به نوشتن هیچ قطعه برنامه‌ای میسر است.)

  این محیط، شامل روشهایی برای همه مسایل استاندارد داده کاوی مانند رگرسیون، رده‌بندی، خوشه‌بندی، کاوش قواعد انجمنی و انتخاب ویژگی میباشد. با در نظر گرفتن اینکه، داده‌ها بخش مکمل کار هستند، بسیاری از ابزارهای پیش پردازش داده‌ها و مصورسازی آنها فراهم گشته است. همه الگوریتم ها، ورودیهای خود را به صورت یک جدول رابطهای به فرمت ARFF دریافت میکنند. این فرمت داده‌ها، میتواند از یک فایل خوانده شده یا به وسیله یک درخواست از پایگاه دادهای تولید گردد.

یکی از راههای به کارگیری Weka ، اعمال یک روش یادگیری به یک مجموعه داده و تحلیل خروجی آن برای شناخت چیزهای بیشتری راجع به آن اطلاعات میباشد. راه دیگر استفاده از مدل یادگیری شده برای تولید پیشبینی‌هایی در مورد نمونه‌های جدید است. سومین راه، اعمال یادگیرنده‌های مختلف و مقایسه کارآیی آنها به منظور انتخاب یکی از آنها برای تخمین میباشد. روشهای یادگیری Classifier نامیده میشوند و در واسط تعاملی Weka ، میتوان هر یک از آنها را از منو انتخاب نمود. بسیاری از classifier ها پارامترهای قابل تنظیم دارند که میتوان از طریق صفحه ویژگی‌ها یا object editor به آنها دسترسی داشت. یک واحد ارزیابی مشترک، برای اندازه‌گیری کارآیی همه classifier به کار میرود.

پیاده سازیهای چارچوبهای یادگیری واقعی، منابع بسیار ارزشمندی هستند که Weka فراهم می کند. ابزارهایی که برای پیش پردازش داده‌ها استفاده میشوند Filter نامیده میشوند. همانند classifier ها، میتوان filter ها را از منوی مربوطه انتخاب کرده و آنها را با نیازمندیهای خود، سازگار نمود. در ادامه، به روش به کارگیری فیلترها اشاره میشود.

  علاوه بر موارد فوق، Weka شامل پیاده سازی الگوریتمهایی برای یادگیری قواعد انجمنی، خوشه‌بندی داده‌ها در جایی که هیچ دست‌های تعریف نشده است، و انتخاب ویژگیهای مرتبط در داده‌ها میباشد.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

2- روش استفاده از Weka

جهت درک بهتر مطالب این بخش، یک پایگاه داده با فرمت (comma-separated format ) .csv به نام bank-data.csv به عنوان مثال در نظر گرفته میشود. این بانک اطلاعاتی شامل اطلاعاتی در مورد 600 فرد مختلف است که فیلدهای تشکیل دهنده آن به شرح زیر هستند:

09367292276
09367292276
azsoftir@gmail.com

بازدید : 66 تاریخ : شنبه 14 مرداد 1396 زمان : 17:19 نویسنده : مطلب پروژه نظرات (0)

در این چند سال دوستان زیادی  از گروه تقاضای راهنمایی در خصوص چگونگی آشنایی و شروع یادگیری علم داده کاوی را کرده اند. در این مقاله سعی کردیم نکاتی مهم را در خصوص این علم به شما متذکر شویم. با رعایت این نکات در عرض کمترین زمان (6 ماه الی 1 سال) می توانید به توانایی های خوبی در علم داده کاوی برسید.


1)    زبان انگلیسی را به صورت پیشرفته یاد بگیرید.

 اکثر توصیه هایی که در اینجا برای شما کرده ایم نیاز به تسلط کافی شما در زبان انگلیسی دارد. متاسفانه منابع فارسی در خصوص داده کاوی و یادگیری ماشین بسیار محدود و نا کافی هستند پس شما نیاز دارید تا به منابع مرجع متوسل شوید. برای این کار کافی است لغت شناسی خود را در محدوده داده کاوی افزایش دهید و این کار فقط با مطالعه 15 الی 20 مقاله انگلیسی قابل انجام است.


2)    همین حالا بهترین دوره آموزشی داده کاوی را پیدا کنید و در آن شرکت کنید.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

وقت را تلف نکنید. همین حالا با یک جستجوی ساده در اینترنت می توانید در دوره های داده کاوی که در کشور برگزار می شود مانند دوره های گروه داده کاوی ایران شرکت کنید. شما می توانید در دوره های رایگان خارجی نیز شرکت کنید. به طور مثال دوره های آنلاینی که دانشگاه استنفورد برگزار می کند بی شک یکی از بهترین این دوره ها هستند که به طور رایگان برگزار می شوند. از اینجا می توانید به این سایت بروید و در دوره های آینده آن به رایگان شرکت کنید.
مطمئن هستم که شگفت زده خواهید شد اگر دو لینک زیر را ببینید. در دو لینک زیر فایل تصویری از دو دوره برگزار شده درباره داده کاوی و یادگیری ماشین در سایت coursera (تاسیس شده توسط اساتید دانشگاه استنفورد) وجود دارد شما می توانید به صورت آنلاین آموزش خود را از همین لحظه شروع کنید.
لینک تصویری دوره اول
لینک تصویری دوره دوم

3)    یکی از کتاب های مرجع داده کاوی را حتما مطالعه کنید.
کتاب های مرجع می توانند خیلی چاره ساز باشند. اگر اطلاعات خوبی در خصوص داده کاوی و یادگیری ماشین جمع آوری کرده اید حال وقت آن است که به کتب مرجع مراجعه کنید. به طور کلی مباحثی که باید بیاموزید شامل موارد زیر است. البته توجه داشته باشید که این تمامی موضوعات است و شاید نیاز نباشد برخی از آنها را به طور کامل در قدم اول یاد بگیرید.

    یادگیری ماشین
        رده بندی و پیش بینی
        رگرسیون
        سری های زمانی
        قواعد وابستگی
        خوشه بندی
        کشف قواعد متوالی
        کشف نقاط دور افتاده
    جبر خطی
    تحلیل آماری (در محدوده کاربردهای داده کاوی)
    بهینه سازی و الگوریتم های ابتکاری
    بازیابی اطلاعات و پایگاه‌داده
    الگوریتم‌ها و ساختار داده
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

لیست برخی از کتب داده کاوی مرجع که می توانند شما را بسیار کمک کنند در ادامه ذکر شده اند.

    کتاب Han و Kamber که در سایت داده کاوی ایران موجود است را می توانید از اینجا دانلود کنید.
    کتاب آقای Tan که توسط بسیاری از اساتید داخلی تدریس می گردد را می توانید از اینجا دانلود کنید.


4)    نرم افزارهای داده کاوی را یاد بگیرید.
به طور پیش فرض آشنایی با کاربری نرم افزارهای Excel و Access از مجموعه آفیس بسیار برای اجرای هر پروژه داده کاوی می‌تواند مفید باشد. از طرفی در بین نرم افزارهای مطرح دنیا در بین داده کاوان نرم افزارهای متن باز RapidMiner و Weka مورد توجه بسیار زیادی هستند پس حتما این دو نرم افزار را از لینک های زیر دانلود کرده و سپس شروع به یادگیری انها بکنید.

لینک دانلود نرم افزار Weka

لینک دانلود نرم افزار RapidMiner (پس از ثبت نام می توانید نرم افزار را دانلود نمایید)

البته برای شروع نرم افزاری مانند Clementine یا نسخه جدید آن یعنی IBM Modeller مفید است ولی فقط برای شروع کار. با کمی جستجو در اینترنت می توانید برخی منابع فارسی که دو نرم افزار RapidMiner و Weka را به صورت مقدماتی آموزش داده اند را پیدا کنید. این دو نرم افزار برای اجرای پروژه های کارشناسی، کارشناسی ارشد و دکتری می توانند مناسب ترین ها باشند.

لینک آموزش نرم افزار Weka (به زبان فارسی)
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

اگر می خواهید متخصص شوید حتما به دنبال نرم افزارهای پیشرفته تر مانند نرم افزار متن باز R و Python بروید با کمک این نرم افزارها شما می توانید هر کاری که می خواهید بر روی داده های خود انجام دهید. نرم افزار Matlab نیز به نوبه خود مزایایی دارد اما پیشنهاد می کنم دنبال آن نروید. برای اطلاع بیشتر از اینکه چرا نباید از این نرم افزار استفاده کنید مقاله چرا نرم افزار متلب (Matlab) برای داده کاوی مناسب نیست؟ را مطالعه کنید.
لینک دانلود نرم افزار R

لینک کتاب آموزش نرم افزار R به زبان فارسی (ترجمه توسط تیم آقای دکتر مهدی نصیری)

لینک دیگر کتاب آموزشی نرم افزار R دکتر سعید نودوشنی لینک اول لینک دوم

 ضمنا گروه داده کاوی ایران قصد دارد در یک دوره زمانی شش ماهه آموزش های آنلاین صوتی و تصویری را در خصوص نرم افزارهای داده کاوی آغاز نماید.

5)    در جلسات و همایش های تخصصی شرکت کنید.
در ایران نیز مانند سایر کشورها سمینارها، همایش‌ها و کنفرانس های اگرچه محدودی برگزار می گردد که می توانید در آنها شرکت کنید. اگرچه سطح علمی آنها به پای کنفرانس های معتبر بین المللی نمی رسد اما این همایش ها می توانند برای پیدا کردن افراد یا گروه هایی که مانند شما به این علم علاقه دارند، به شما کمک کند.

  فلسفه اصلی وجود کنفرانس ها آشنایی افراد متخصص با یکدیگر و همچنین بررسی نظریه های جدید در علم داده کاوی است. همانطور که با کمی جستجو خواهید فهمید که مقاله کشف دانش در پایگاه داده که سر آغاز داده کاوی است، اولین بار در یک کنفرانس توسط استاد Fayyad ارائه شده است.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

6)    داده های آنلاین را دستکاری کنید.
یکی از کارهای بسیار مفید پس از اینکه کمی با روش های داده کاوی آشنا شدید و همچنین نرم افزارهای معروف را یادگرفتید، دستکاری داده ها است. یکی از بهترین سایت هایی که می توانید از آن داده دانلود کنید سایت دانشگاه کالیفرنیا است که مجموعه داده های زیادی در آن وجود دارد. با کمی جستجو در بین مقالات علمی معتبر منتشر شده در ژورنال های بین المللی خواهید دید که محققان بسیاری هستند که بر روی این مجموعه داده ها در حال تحقیق هستند و هر روز مقالات جدیدی را حتی بر روی داده هایی که چندین سال پیش به اشتراک گذاشته شده اند، منتشر می کنند.
لینک سایت دانشگاه کالیفرنیا
لینک لیست تمامی سایت هایی که مجموعه داده رایگان به اشتراک گذاشته اند

 
ابتدا یکی از این مقالات را که از داده های آنلاین استفاده کرده‌اند را پیدا کنید و سپس سعی کنید تمامی کارهایی که محققان بر روی این مجموعه داده انجام داده‌اند را شبیه سازی کنید و دوباره بر روی مجموعه داده ها اعمال کنید. پس از اینکه توانستید نتیجه چند مقاله را شبیه سازی کنید. در مرحله بعدی سعی کنید با آموزه های خود دقت مدل های ساخته شده در مقاله مرجع را افزایش دهید.


7)    در مسابقات آنلاین داده کاوی شرکت کنید.
یکی دیگر از فعالیت هایی که می تواند توان تحلیلی شما را افزایش دهد و آموزه های شما را بسنجد، شرکت در مسابقات آنلاین با مجموعه داده های حقیقی است. شما می توانید به صورت رایگان در مسابقات شرکت کنید، در فروم های مسابقه با سایر رقبای خود همفکری کنید، نتیجه مدلسازی خود را ثبت کنید و دقت مدل پیشنهادی خود را با سایرین مقایسه کنید. برای توضیحات بیشتر به مقاله مسابقه آنلاین داده کاوی رجوع کنید.


8)    در محیط کاری خود به دنبال داده و حل مسئله باشید.
مطمئنا شما در محیط کاری خود داده هایی را دارید پس چه بهتر که از همان آنها برای شروع به کار و آموزش استفاده کنید. این داده ها ممکن است دارای اشتباهات بسیاری باشند و یا اینکه به خوبی یکپارچه نشده باشند. در هر صورت کار بر روی این داده ها می تواند توانایی شما را در اجرای پروژه های واقعی افزایش دهد. پس داده ها را به هر ترتیبی که هست استخراج کنید و به دنبال حل مسئله ای با استفاده از آنها یا استخراج دانش مفید از آنها باشید تا خودتان را به طور جدی محک بزنید.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


9)    با دیگران در اینترنت در ارتباط باشید.

به سایت های معتبر داخلی و خارجی سر بزنید و با اخبار و نظرات کارشناسان این حوزه آشنا شوید. یکی از سایت های معتبر خارجی سایت kdnuggets می باشد که توسط یکی از بزرگان داده کاوی یعنی آقای Gregory Piatetsky-Shapiro اداره می شود. همچنین سایت آقای دکتر مهدی نصیری نیز بسیار به روز بوده و از این سایت هم می توانید مطالب بسیار مفیدی را به زبان فارسی استخراج نمایید.
لینک سایت kdnuggets
لینک سایت داده کاوی


10)    در صورت نیاز از منابع فارسی استفاده کنید.
در نهایت می توانید از برخی منابع فارسی نیز استفاده کنید. در طی سال اخیر یعنی 1392 کتاب های نسبتا مناسبی ترجمه شده است که از تمامی این کتاب ها اکثرا ترجمه و خلاصه کتاب های مرجع و معروف گفته شده در بخش فوق می باشند. در زیر نیز یک کتاب ترجمه شده خوب در خصوص روش اجرای پروژه های داده کاوی به زبان فارسی قرار دارد.

لینک کتاب روش اجرای پروژه های داده کاوی به زبان فارسی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

بازدید : 62 تاریخ : شنبه 14 مرداد 1396 زمان : 17:18 نویسنده : مطلب پروژه نظرات (0)

انجام پروژه های داده کاوی با نرم افزار weka

آموزش نرم افزار کلمنتاین Clementine
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

آموزش نرم افزار IBM SPSS Modeler

انجام پروژه های داده کاوی با نرم افزارClementine

انجام پروژه های داده کاوی با نرم افزار  IBM SPSS Modeler

        فرآیند داده کاوی CRISP-DM
        آشنایی با قابلیت های SPSS Modeler
        فرآیند داده کاوی در SPSS Modeler
    شناسایی و آماده سازی مقدماتی داده ها
        فراخوانی داده ها در محیط SPSS Modeler
        بررسی مفاهیم Storage و Type و اهمیت آنها
        یکپارچه سازی داده ها (Merge and Append)

        بررسی شاخص های کیفی داده ها (Data Audit)

 

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

        مطالعه توصیفی و استنباطی داده ها در SPSS Modeler
    مدل های پیش بینی کننده
        طبقه بندی با انواع درخت های تصمیم در SPSS Modeler
        استفاده از درخت های رگرسیونی به منظور پیش بینی
        ساخت مدل های پیش بینی کننده با شبکه های عصبی مصنوعی
        ارزیابی مقدماتی مدلهای پیش بینی کننده

انجام پروژه های داده کاوی با نرم افزار RapidMiner

انجام پروژه های داده کاوی با نرم افزار weka
مشاوره در زمینه پروژه های داده کاوی
انجام پروژه های داده کاوی با نرم افزار weka RapidMiner

مشاوره در زمینه پروژه های داده کاوی

در مقاطع کارشناسی و کارشناسی ارشد
با نرم افزار Weka- Clementine

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com

بازدید : 106 تاریخ : شنبه 14 مرداد 1396 زمان : 17:17 نویسنده : مطلب پروژه نظرات (0)

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

این نرم‌افزار یک ابزار داده‌کاوی متن باز است که با زبان جاوا نوشته شده‌است و از سال 2001 تا به حال، توسعه داده شده‌است. در این نرم‌افزار سعی تیم توسعه‌دهنده، بر آن بوده‌است که تا حد امکان تمامی الگوریتم‌های رایج داده‌کاوی و هم‌چنین یادگیری ماشین پوشش داده شوند. به گونه‌ای که حتی این امکان برای نرم‌افزار فراهم شده‌است تا بتوان سایر ابزار‌های متن باز داده‌کاوی را نیز به آن الحاق نمود. رابط گرافیکی شکیل و کاربر‌پسند نرم‌افزار نیز آن را یک سر و گردن بالاتر از سایر ابزار‌های رقیب قرار می‌دهد. از نقاط قوت نرم‌افزار می‌توان به موارد زیر اشاره کرد.

- ارائه گزارش و رونوشت از مراحل اجرای الگوریتم.
- ظاهر پرداخته و آراسته.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

- نمای گرافیکی خوب
- قابلیت تطابق با فایل‌های خروجی بسیاری از نرم‌افزار‌ها مانند Excel.
- امکان تصحیح و خطایابی بسیار سریع.
-وجود آموزش‌های ویدیویی مناسب که برای این نرم‌افزار تهیه شده و در وب قرار داده شده‌است.
- مستندات شامل راهنمای بسیاری از عملگر‌ها در نرم‌افزار.
- امکان اجرای هم‌زمان الگوریتم‌های یادگیری متفاوت در نرم‌افزار و مقایسه آن‌ها با یک‌دیگر در ابزار در نظر گرفته شده‌است.
امکانات ویژه در این ابزار:


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

- به دلیل پیاده سازی و توسعه این

نرم‌افزار با استفاده از زبان جاوا، امکان کار در سیستم‌های عامل‌ مختلف از جمله ویندوز، لینوکس و سیستم‌های مکینتاش برای این نرم‌افزار وجود دارد.

- امکانات متن‌کاوی نیز در این نرم‌افزار پیش‌بینی شده‌است.
- کلیه الگوریتم‌های یادگیری مدل در نرم‌افزار داده‌کاوی WEKA پس از به هنگام‌سازی RapidMiner به نرم‌افزار اضافه خواهند شد.
- لازم به ذکر است این نرم افزار به عنوان پرکاربردترین نرم افزار داده کاوی در سال 2014 شناخته شده است.


09367292276
09367292276
azsoftir@gmail.com

بازدید : 69 تاریخ : شنبه 14 مرداد 1396 زمان : 17:17 نویسنده : مطلب پروژه نظرات (0)

خدمات و پشتیبانی مستمر
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

تیم ما بر اهمیت زمان در پروژه های شما واقف است و با تیم متخصص و دایمی خود با ارایه خدمات حتی در روزهای تعطیل آماده ارایه خدمات به کاربران خود می باشد.

همچنین این امکان برای شما وجود دارد که با توجه به تغییرات در کسب و کار خود بتوانید اپلیکیشن های خود را متناسب با نیاز روز و تکنولوژی های جدید بروز رسانی نمایید و در وقت و هزینه خود صرفه جویی نمایید.
طراحی منعطف و کاربر پسند

مهم نیست برنامه های مارا روی یک گوشی کوچک نصب کنید یا روی یک تبلت  بزرگ، برنامه های ما طوری بهینه سازی شده اند که برروی طیف وسیعی از دستگاه ها به صورت مناسب اجرا شوند و ایجاد کننده ی یک حس خوب و کاربر پسند برای مخاطبین باشند.

ما در طراحی محیط کاربری از جدید ترین مفاهیم طراحی دنیا استفاده  می کنیم تا تجربه کار با یک اپلیکیشن پارسی با استانداردهای جهانی را برای شما فراهم نماییم.
 ساخت اپلیکیشن اندروید در رشت لاهیجان انزلی لنگرود گیلان مازندران آمل بابل بهشهر تنکابن چالوس رامسر

با توجه به گسترش روز افزون تلفن های همراه و بخصوص تلفن های مجهز به سیستم عامل اندروید ، هم اکنون وقت آن رسیده است که فروشگاه ها ، دانشگاه ها ، شرکت ها ، مراکز تفریحی و تمامی واحد های تجاری سراسر کشور  شعبه ای نیز در تلفن های هوشمند ایجاد کنند.
طبق آمار موجود در کشورمان یک برنامه مفید و کاربردی می تواند حداقل بیش از 40 هزار دانلود در سراسر کشور کسب کند که این تعداد قابل توجه می تواند هر تجارتی را پیروز میدان رقابت کند. از طرف دیگر وجود درگاه های پرداختی مخصوص موبایل مانند درگاه بانک سامان و بانک ملت ، راه انتقال وجه و پرداخت نقدی کاربران را باز و آسان کرده است.
انواع اپلیکیشن های توسعه اندیشه نوین
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
اپ خبری و متصل به RSS
مخصوص اطلاع رسانی و خبر
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

این نوع اپ برای وب سایت هایی خبری یا وب سایت هایی که دارای مطالبی هستند که به هر نحوی تمایل دارند آن مطالب را از طریق یک اپ قدرتمند اطلاع رسانی کنند مناسب می باشد.
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
  
     معرفی شرکت یا محصول
     دریافت اطلاعات از سایت

    معرفی شرکت یا محصول بصورت اپ آفلاین یا آنلاین با قابلیت بروزرسانی از طریق کنترل پنل تحت وب. مناسب شرکت های جهت جایگزینی کاتالوگ و سی دی مالتی مدیا.
 
 
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
اپ رستوران
منو و سفارش
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

۲ نوع اپ رستوران وجود دارد هر دونوع را ارائه می کند. اپ رستوران جهت دریافت سفارش در خود رستوران و اپ رستوران برای دریافت سفارش بصورت اینترنتی و یا اس ام اس.
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
 
    اپ سمینار و کنفرانس
    برای برگزاری سمینار و کنفرانس

  اپ سمینار و کنفرانس با قابلیت های فوق العاده حرفه ای از جمله: ثبت نام٫ محل برگزاری٫ زمان بندی ٫ سخنرانان و ...
 
 
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
فروشگاه اینترنتی
اپ فروشگاهی

اپ فروشگاهی زفره مدیا برای معرفی٫ جستجو و فروش یک محصول بسیار مناسب می باشد. خرید محصولات بسیار سهل و آسان صورت می گیرد و همه اتفاقات در خود اپ رخ می دهد.
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

   اپ بر اساس موقعیت کاربر

   Location Base 
   اپ لوکیشن بیس یا موقعیتی بر یک اصل عمل می کند و آن عملکرد اپ بر اساس GPS و موقعیت کنونی کاربر در نقاط مختلف است. مثال اپی که برای یافتن موقعیت خودرو مورد استفاده قرار گیرد.
 
 
 
 
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
اپ با ایده شما و انحصاری
اپ اختصاصی
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

اپ بر اساس نیاز شما و بر اساس ایده شما بصورت کاملا اختصاصی طراحی و برنامه نویسی می شود. این نوع مناسب افرادی است که بدنبال ساخت اپ خارج از دسته بندی های ذکر شده بوده اند.
برنامه نویسی آندروید رشت گیلان لاهیجان انزلی رودسر ساخت برنامه اندروید طراحی برنامه اندروید برنامه نویسی اندروید برنامه اندروید برنامه نویسی موبایل
 
  اپ بانک اطلاعاتی
  مانند دیکشنری و یا بانک اطلاعات خودرو
  اپ بانک اطلاعاتی به کاربر امکان دریافت و به اشتراک گذاری اطلاعات را میدهد. اپ بانک اطلاعاتی امکاناتی چون جستجو٫ لیست علاقه مندی و یا اتصال به اینترنت برای دریافت و پردازش    اطلاعات را دارا می باشد.
 
 
 
 

شرکت توسه اندیشه نوین با داشتن متخصصان مجرب در زمینه طراحی و ساخت نرم افزار اندروید ، تمامی نیاز های شما را در زمینه برنامه نویسی و تولید برنامه اندروید ، برطرف خواهد کرد.

سرویس های قابل ارائه :
How to block a number on Android

1- طراحی گرافیک ظاهری نرم افزار بصورت کاملا حرفه ای و پویا
2- طراحی سیستم های امنیتی مبتنی بر آندروید برای نرم افزار هایی همچون موبایل بانک

3- برنامه نویسی سرویس های مورد نیاز مبتنی بر آندروید بصورت OOP
4- برنامه نویسی نرم افزار های کار با دوربین ، سنسور گوشی ، کار با اینترنت و ...
5- برنامه نویسی برای تمامی مدل های گوشی آندروید و انواع تبلت ها
6- کار با بانک اطلاعاتی داخلی آندروید SQL Lite
7- طراحی و ساخت بازی آندروید
8- وب اپلیکیشن‌ها و موبایل وب
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

9- برنامه های موبایل مبتنی بر موقعیت
10- تجارت الکترونیک بر روی موبایل
11- یکپارچه‌سازی پایگاه‌‌های داده تحت سرور با موبایل
12- سیستم‌های اتوماسیون روی موبایل
13- یکپارچه‌سازی با شبکه‌های اجتماعی موجود
14 - ارائه‌ی سرویس‌های مدیا به صورت استریمینگ (رادیو اینترنتی و...)
15 - طراحی و برنامه نویسی فروشگاه اندرویدی به همراه پرداخت آنلاین

بازدید : 57 تاریخ : شنبه 14 مرداد 1396 زمان : 17:16 نویسنده : مطلب پروژه نظرات (0)

امروزه در اکثر سازمان ها، داده‌ها به سرعت در حال جمع آوری و ذخیره شدن هستند به طوری که شرکت ها در اﻃﻼﻋﺎت ﻏﺮق ﺷﺪه اﻧﺪ در ﺣﺎﻟﯿﮑﻪ ﺗﺸﻨﻪ داﻧﺶ ﻫﺴﺘﻨﺪ، اما استفاده از این داده ها در اغلب موارد کار راحتی نیست و نمی توان به صورت یکپارچه از این حجم داده ها استفاده نمود، از این رو با استفاده از ترکیب علم آمار و کامپیوتر و بکارگیری تکنیک های یادگیری ماشین، می توان از این داده ها به بهترین نحو از این داده ها استفاده کرد. در واقع داده کاوی عبارت است از:

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

\"استخراج اطلاعات و دانش و کشف الگوهای پنهان مفید برای سازمان از مجموعه داده‌های بزرگ\"

گروه ما با استفاده از تجارب فنی و دانش متخصصین خود آماده ارائه خدمات داده کاوی برای هوشمند سازی تجارت شما به بهترین شکل انجام می دهد.

داده‌کاوی به معنای کشف دانش درون داده‌هاست! کشف دانش درون داده‌ها آنهم در عصر اطلاعات یکی از هیجان‌انگیزترین و کلیدی‌ترین مفاهیمی است که روز به روز اهمیت بیشتری می‌گیرد. داده‌کاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از داده‌ها به منظور کشف الگوها و قوانین معنی‌دار گفته می‌شود.
چه موقع و کجا داده‌کاوی نیاز است؟

طیف وسیعی از رشته های دانشگاهی از مهندسی تا پزشکی و علوم انسانی، برای حل مسائل و استخراج نتایج تحقیقات خود به تکنیک های داده کاوی نیاز دارند.
در سال های اخیر و با توجه به گسترش علم داده کاوی، پروژه های متعددی در دانشگاه ها و در مقاطع کارشناسی ارشد و دکترا از تکنیک های داده کاوی بهره می برند و یا بصورت تخصصی بر روی تکنیک های داده کاوی تحقیق می کنند.
گروه داده کاوی توسعه اندیشه نوین با توجه به تجربه و دانش چند ساله ی خود در مشاوره و اجرای پروژه های داده کاوی، هم اکنون آماده اجرای پروژه های داده کاوی در سازمان ها و شرکت ها است.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

    مسئله ای پیچیده و ناساخت یافته و یا نیمه ساخت یافته
    داده‌های مرتبط وجود داشته باشند و به آنها دسترسی داشت.
    داده ها در یکجا مجتمع شده و انباره داده ها ایجاد شود.
    توانایی کامپیوترها امکان استفاده از نرم افزارهای مرتبط با داده کاوی را به ما بدهند.
    مدیران نیاز به استفاده از دانش استخراج شده از داده ها را حس کرده باشند.

در واقع هـــــدف از داده کاوی ایجاد مدل هایی برای تصمیم گیری است تا هوش تجاری سازمان را افزایش دهد و بقای و سود سازمان در ارتباط با مشتریان بلقوه بیشتری افزایش یابد.

    حجم داده‌ها (Data) با سرعت زیادی در حال رشد است.
    اطلاعات (Information) ما در مورد این داده‌ها کم است.
    دانش (Knowledge) ما نسبت به این اطلاعات صفر است.

 
مقایسه علم آمار با داده کاوی

آمار شاخه ای از علم ریاضی است که به جمع آوری توضیح و تفسیر داده ها می پردازد. این مبحث به گونه ای است که روزانه کاربرد زیادی دارد. در مقایسه این علم با data mining قدمت بیشتری دارد و جزء روشهای کلاسیک داده کاوی محسوب می شود.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

وجه اشتراک تکنیکهای آماری و data mining بیشتر در تخمین و پیش بینی است. البته از آزمون های آماری در ارزیابی نتایج داده کاوی نیزاستفاده می شود. در کل اگر تخمین و پیش بینی جزء وظایف data mining در نظر گرفته شوند، تحلیل های آماری، data mining را بیش از یک قرن اجرا کرده است. به عقیده بعضی DM ابتدا از آمار و تحلیل های آماری تحلیل شروع شد.

می توان تحلیل های آماری از قبیل فاصله اطمینان، رگرسیون و... را مقدمه و پیش زمینه DM دانست که بتدریج در زمینه های دیگر و متدهای دیگر رشد و توسعه پیدا کرد. پس در واقع متدهای آماری جزء روشهای کلاسیک و قدیمی DM محسوب می شوند. در جایی اینگونه بحث می شود که با تعریف دقیق ، آمار یا تکنیک های آماری جزء داده کاوی (data mining) نیستند.

این روش ها خیلی قبل تر از data mining استفاده می شدند. با این وجود، تکنیک های آماری توسط داده ها بکار برده می شوند و برای کشف موضوعات و ساختن مدل های پیشگویانه مورد استفاده قرار می گیرند.

 
داده­ کاوی چگونه کار می­ کند؟

هنگامی که فناوری اطلاعات در سطح وسیع، سیستم ­های تحلیلی و تراکنشی را جداگانه دگرگون می­ کند، داده کاوی ارتباط بین این ­دو را فراهم می ­آورد. نرم ­افزار داده­ کاوی، ارتباطات و الگوهای موجود در داده­ های تراکنشی ذخیره شده بر اساس درخواست ­های کاربر Open-ended را تحلیل می­ کند. انواع مختلف نرم ­افزارهای تحلیلی موجود هستند: آماری، یادگیری ماشینی، و شبکه ­های عصبی. در کل، به دنبال هر 4 نوع از روابط می­ گردیم:

کلاس ها: داده­ های ذخیره شده برای پیدا کردن داده در گروه ­های از پیش تعیین شده به کار می ­روند. برای مثال، یک رستوران زنجیره ­ای، می ­تواند داده­ های خرید مشتریان را به منظور تعیین زمان دیدار مشتریان از مغازه و آنچه که سفارش می ­دهند، بکاود. این اطلاعات، می ­تواند برای افزایش تعداد مشتریان توسط افزودن \"ویژه های روزانه\" به کار رود.
خوشه ­ها: داده ­ها بر اساس روابط منطقی بین آن­ها یا ترجیحات مشتری گروه ­بندی می ­شوند. برای مثال، داده­ ها می ­توانند برای شناسایی بخش ­های بازار و یا اشتراکات قوی مشتریان، داده کاوی شوند.
وابستگی ­ها: داده­ کاوی به منظور شناسایی وابستگی­ ها انجام می ­شود. آبجو-پوشک، مثالی از این نوع داده­ کاوی است.
الگوهای زنجیره ­ای: داده­ کاوی به منظور پیش ­بینی الگوهای رفتاری و روندها صورت می­ گیرد. برای مثال، یک فروشنده، می ­تواند احتمال خرید کوله ­پشتی را بر اساس خرید مشتریان از کیسه­ های خواب و کفش­ های کوهنوردی پیش ­بینی کند.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 
خدمات ما

با توجه به بررسی ها و پس از آن که چارچوب پروژه داده کاوی تدوین شد،در پروژه وجود موارد زیر به صراحت مشخص می شود.

    دلیل استفاده از تکنیک های داده کاوی و آماری مربوطه
    برنامه اولیه برای بهبود با توجه به نتایج تجزیه و تحلیل
    نتایج مشخص از داده ها به صورتی که تدوین برنامه های راهبردی بعدی از نتایج امکان پذیر باشد
    خدمات داده کاوی و بررسی تجزیه و تحلیل داده های
    انجام پروژه و پایانامه های داده کاوی و تجزیه تحلیل داده ها
    انجام پروژه های داده کاوی با نرم افزارهای  R , Rapidminer  weka, SPSS    (رپیدماینر ، وکا و .... )


09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

کاربردهای داده کاوی

کاربردهایی که برای داده کاوی وجود دارند، بسیار بسیار گسترده اند و ما در این نوشتار، فقط امکان معرفی تعداد محدودی از آن ها را داریم. به عنوان مثال های بیشتر، می توان به کاربردهای داده کاوی در زمینه های زیر اشاره کرد:

        سیستم های مدیریتی، مثلا مدیریت ارتباط با مشتریان یا CRM
        نرم افزارهای امنیتی، مثلا نرم افزاری مانیتورینگ شبکه و ویروس کش ها
        سیستم های بانکی، مثلا تخصیص اعتبار به مشتریان و طبقه بندی آن ها
        مالی و اقتصادی، مثلا پیش بینی قیمت یک یا چند سهام یا شاخص
        برنامه ریزی و مکان یابی، مثلا چینش داخلی فروشگاه های بزرگ و یا تخصیص امکانات شهری
        علوم پزشکی، مثلا پیش بینی خطرات احتمالی ناشی از یک عمل جراحی خاص
        علوم اجتماعی و سیاسی، مثلا پیش بینی یا تحلیل نتایج انتخابات
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بازدید : 104 تاریخ : شنبه 14 مرداد 1396 زمان : 17:16 نویسنده : مطلب پروژه نظرات (0)

انجام پروژه های داده کاوی (Data Mining) در زمینه های رده بندی (Classification)، خوشه بندی (Clustering)، پیش بینی (Prediction)، انتخاب ویژگی (Feature Selection) و قواعد انجمنی (Association Rules) با استفاده از روش ها و الگوریتم های مختلفی نظیر:
1 -Ann)شبکه عصبی مصنوعی)

2 - شبکه های عصبی مصنوعی (RBF)

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

3 - درخت تصمیم--هرس درخت تصمیم--درخت تصمیم با شاخص جینی و آنتروپی
4 - بگینگ و بوستینگ
5 - ماشین بردار پشتیبان
6-ماشین بردار پشتیبان با بهینه ساز ازدحام ذرات
8 - سیستم استنباط بیزین
10-الگوریتم ژنتیک , ازدحام ذرات
11-الگوریتم های فراابتکاری
12-قواعد همسایگی با fp-growth,apriory
13-تحلیل نتایج با رسم نمودار Roc
14-انواع مختلف روش های انتخاب ویژگی:شاخص ریلیف، ازدحام ذرات،شاخص جینی و ...
15-انواع روش های نمونه برداری و بیش نمونه گیری
16-روش های حل مشکل رده نامتوازن
17-تشخیص داده پرت با کانزدیکترین همسایه)Knn
18-تشخیص داده پرت محلی
انجام پروژه های رپیدماینر در کوتاهترین زمان ممکن با کمترین قیمت با مشاوره وآموزش اجرای پروژه
انجام پروژه های داده کاوی با مشاوره و آموزش اجرا جهت ارایه پروژه

در صورت ارایه پروژه فیلم آموزشی کار با نرم افزار و اجرای پروژه تحویل داده خواهد شد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بازدید : 81 تاریخ : شنبه 14 مرداد 1396 زمان : 17:15 نویسنده : مطلب پروژه نظرات (0)

با استفاده از نرم افزار قدرتمند SPSS MODELER کلیه پروژه های مربوط به داده کاوی پذیرفته می شود.
توسط: کارشناس ارشد عمران - راه و ترابری تدریس خصوصی داده کاوی توسط دانشجوی دکتری هوش مصنوعی دانشگاه تهران
با نرم افزار های مختلف کلمنتاین، مطلب، وکا، رپید ماینر و ....
خوشه بندی فازی
منطق فازی
الگوریتم فرا ابتکاری
خوشه بندی
دسته بندی
clustering

classification

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

feature extraction
طبقه بندی داده ها با svm som ...
آموزش و پیاده سازی مقالات

انجام پروژه های داده کاوی با نرم افزار وکا Weka
نرم‌افزار Weka در دانشگاه Waikato واقع در نیوزلند توسعه یافته است و اسم آن از عبارت"Waikato Environment for knowledge Analysis" استخراج گشته است. همچنین Weka ، نام پرندهای با طبیعت جستجوگر است که پرواز نمیکند و در نیوزلند، یافت میشود.

این سیستم به زبان جاوا نوشته شده و بر اساس لیسانس عمومی و فراگیر GNU انتشار یافته است.Weka تقریباً روی هر پلت فرمی اجرا میشود و نیز تحت سیستم عاملهای لینوکس، ویندوز، و مکینتاش، و حتی روی یک منشی دیجیتالی شخصی، آزمایش شده است.

نرم افزار Weka ، پیاده سازی الگوریتمهای مختلف یادگیری را فراهم میکند و به آسانی میتوان آنها را به مجموعه های داده خود اعمال کرد.

نحوه تدریس با توجه به خواست و نیاز دانشجویان محترم خواهد بود. بدین معنی که در صورت نیاز به تدریس مبحث یا مباحث خاصی در درس کنترل فازی، تنها همان مبحث یا مباحث با توجه خواسته دانشجویان ارائه می گردد؛ و یا تدریس صرفا از روی جزوه دانشگاه دانشجویان انجام می‌پذیرد. همچنین اگر در مورد مباحث مطرح شده در هر جلسه سوال یا اشکالی وجود داشته باشد، دانشجویان می‌توانند سوالات خود را به صورت تلفنی با اینجانب مطرح کنند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

محل تشکیل کلاس‌ها می تواند در منزل خود افراد باشد و یا به صورت توافقی محل کلاس تعیین می‌گردد.

هزینه کلاس به صورت کاملا توافقی خواهد بود و برای اطلاع از هزینه و یا هر سوال دیگر، می‌توانید با شماره تلفن زیر تماس بگیرید.

09367292276
09367292276
azsoftir@gmail.com

بازدید : 107 تاریخ : شنبه 14 مرداد 1396 زمان : 17:14 نویسنده : مطلب پروژه نظرات (0)

انجام پروژه های داده کاوی با نرم افزار وکا weka
انجام پروژه های داده کاوی با نرم افزار وکا weka

انجام پروژه های داده کاوی با نرم افزار کلمنتاین clementine12

انجام پروژه های داده کاوی با نرم افزار رپیدماینر rapidminer

 
انجام پروژه های داده کاوی با نرم افزار وکا weka

 

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


این پروژه بروی دیتاست مربوط به کاربران که شامل 6040 رکورد کاربر است. عملیات خوشه بندی با استفاده از الگوریتم k-means انجام می دهد. روش کار بدین صورت است که ابتدا داده های مربوط به کاربران را به نرم افزار داده کاوی وکا وارد نموده، سپس داده ها را جهت افزایش دقت خوشه بندی نرمال سازی می کنیم. پس از نرمال سازی داده ها الگوریتم k-means بروی داده های نرمال شده اعمال می گردد و خروجی را در قالب یک فایل اکسل با اضافه نمودن برچسپ خوشه(Cluster) تولید می کند. ویژگی های مربوط به کاربران عبارتند از :

    کد کاربر
    جنسیت
    شغل
    کد پستی


    تحویل فایل های تهیه شده با وکا
    ارائه دیتاست خام کاربران با پسوند های .txt , .csv , .xlsx , xls
    امکان دانلود دیتاست کاربران خوشه بندی شده




[شناسایی تراکنش های موفق و ناموفق در دستگاههای خودپرداز با استفاده از الگوریتم زنبور عسل مصنوعی در Matlab]
شناسایی تراکنش های موفق و نامو ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


   
[شناسایی تراکنش های موفق و ناموفق در دستگاههای خودپرداز با استفاده از الگوریتم شبکه عصبی MLP در Rapidminer]
شناسایی تراکنش های موفق و نامو ...

   
[شناسایی تراکنش های موفق و ناموفق در دستگاههای خودپرداز با استفاده از الگوریتم شبکه عصبی MLP در Matlab]
شناسایی تراکنش های موفق و نامو ...

   
[پیش بینی بار مصرفی برق با ترکیب الگوریتم ARIME در نرم افزار SPSS]
پیش بینی بار مصرفی برق با ترکی ...

   
[پروژه خوشه بندی بروی متون مربوط به بیماری ها با استفاده از k-means – C#]
پروژه خوشه بندی بروی متون مربو ...

   
[پیش بینی بار مصرفی برق بروی داده های خوشه بندی شده با الگوریتم ARIME در نرم افزار SPSS]
پیش بینی بار مصرفی برق بروی دا ...

[شبیه سازی Spell Checker با استفاده از روشهای متن کاوی]
شبیه سازی Spell Checker با است ...

   
[پیاده سازی شناسایی بیماری دیابت نوع 2 با الگوریتم SVM با زبان متلب – matlab]
پیاده سازی شناسایی بیماری دیاب ...

   

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

[پروژه خوشه بندی بار مصرفی با وکا با استفاده از k-means - Weka]
پروژه خوشه بندی بار مصرفی با و ...

   
[پیاده سازی کشف تقلب در سیستم بانکداری الکترونیک با رپیدماینر – شبیه سازی مقاله isi سال 2014]
پیاده سازی کشف تقلب در سیستم ب ...

   
[پروژه خوشه بندی کاربران با وکا با استفاده از k-means - Weka]
پروژه خوشه بندی کاربران با وکا ...

   
پروژه های مرتبط :
پروژه خوشه بندی کاربران با وکا با ا ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


   
پیاده سازی کشف تقلب در سیستم بانکدا ...

   
پروژه خوشه بندی بار مصرفی با وکا ب ...

   
پیاده سازی شناسایی بیماری دیابت نوع ...

   
شبیه سازی Spell Checker با استفاده ...

       
شناسایی تراکنش های موفق و ناموفق در ...

   
شناسایی تراکنش های موفق و ناموفق در ...

   
شناسایی تراکنش های موفق و ناموفق در ...

   
پیش بینی بار مصرفی برق با ترکیب الگ ...

   
پروژه خوشه بندی بروی متون مربوط به ...

       

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 

بازدید : 152 تاریخ : شنبه 14 مرداد 1396 زمان : 17:13 نویسنده : مطلب پروژه نظرات (0)

لطفاً جهت دریافت نمونه کار تماس بگیرید:
- مشاوره و مطالعات آماری در تمامی رشته ها و شاخه ها؛ شامل جمع آوری داده ها، تحلیل و پردازش اطلاعات از طریق نرم افزارهای پیشرفته آماری و ارائه نتایج در قالب گزارشات.
- آنالیز آماری فصل 4 پایان نامه با نرم افزارهای پیشرفته از جمله: spss، lisrel، AHP، Mintab، Amos، EQS ، SPLS (اسمارت پلاس)، شبکه عصبی، شبکه عصبی فازی در Matlab
- پروپوزال نویسی
- طراحی پرسشنامه
- تدوین مقاله
- مشاوره در زمینه روش شناسی تحقیق ( متدولوژی )
- مشاوره و مطالعات سری های زمانی
- انجام پروژه های داده کاوی با روشهای طبقه بندی، خوشه بندی، پیش بینی، وابستگی مؤلفه ها، شبکه عصبی و سایر الگوریتم ها با نرم افزارهای مرتبط: MATLAB، SPSS، WEKA، CLEMENTINE

بازدید : 193 تاریخ : شنبه 14 مرداد 1396 زمان : 17:13 نویسنده : مطلب پروژه نظرات (0)

نجام پروژه های تحقیقاتی و تجزیه تحلیل داده های پایان نامه (فصل 4 پایان نامه) برای رشته های علوم انسانی، علوم اجتماعی، مدیریت ، فنی مهندسی، پزشکی، روانشناسی، جامعه شناسی، اقتصاد، حسابداری، صنایع، فناوری اطلاعات، کامپیوتر و دیگر رشته ها در حوزه های ذیل:

 

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

آموزش نرم افزارهای Enterprise Dynamics, Showflow ، Vensim تجزیه و تحلیل آماری پایان نامه، تحقیقات میدانی و پرسشنامه ای با استفاده از نرم افزار SPSS و Lisrel ارائه تحلیل های اقتصاد سنجی، تحلیل های سری زمانی و داده های پانل Panel Data با استفاده از نرم افزار EViews و Microfit بررسی و تحلیل کارایی و بهره وری از طریق تحلیل پوششی داده ها DEA ب طراحی سیستمهای استنتاج فازی (منطق فازی) Fuzzy Logic، عصبی طراحی سیستمهای خبره Expert Systems تحت shell با استفاده از نرم افزارهای VP - مدل سازی بوسیله شبکه های عصبی مصنوعی ANN و الگوریتم ژنتیک GA SS، Weka، Clementine، FIS MATLAB ،ANFIS، VP - expert ارائه مشاوره در خصوص

 

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

فصول پایان نامه جهت تکمیل تحقیق و آگاهی از چگونگی تحلیل داده ها و نتایج حاصله برای ارائه کار به استاد راهنما و راهنمایی برای آمادگی در جلسه دفاع پایان نامه کیفیت پشتیبانی و خدمات پس از فروش، پیگیری اصلاحات و آرامش در پایان نامه را با ما تجربه کنید. هزینه پستی ارسال پرسشنامه ، به شما پرداخت خواهد شد. دانشجویان دانشگاه آزاد اسلامی و غیر انتفاعی از تخفیف ویژه برخوردار می باشند. ارائه تخفیف در صورت معرفی به دوستان راهنمایی جهت تسریع در اتمام پایان نامه - - - - -

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com

بازدید : 140 تاریخ : شنبه 14 مرداد 1396 زمان : 17:12 نویسنده : مطلب پروژه نظرات (0)

بررسی الگوریتم های انجام پایان نامه یادگیری ماشین به کمک نرم افزار WEKA

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


چکیده:

انجام پایان نامه داده کاوی، تبدیل حجم بالای داده به الگوهای و قوانین قابل فهم است. هدف داده کاوی، ساخت مدلی مفهومی است که درک و تفسیر داده های حاضر را فراهم نموده و حتی امکان پیش بینی داده های آینده را نیز در اختیار ما قرار می دهد.  داده کاوی و Big Data مباحث مهمی هستند که امروزه مورد توجه بحث بسیاری از محققان است. نرم افزار WEKA مجموعه ای از الگوریتم های یادگیری ماشین در فرآیند انجام پایان نامه ارشد داده کاوی است. این الگوریتم ها می توانند به صورت مستقیم به مجموعه داده اعمال شده و یا از طریق زبان برنامه نویسی جاوا اجرا شوند. WEKA شامل مجموعه ابزار های پیش پردازش داده، طبقه بندی، رگرسیون، خوشه بندی، قوانین ارتباطی و مشاهده داده است که قابلیت اعمال بر روی مجموعه داده های بزرگ را نیز داراست. به دلیل وجود واسط گرافیکی مناسب، این نرم افزار جایگاه ویژه ای در تحقیقات مرتبط با داده کاوی پیدا نموده است.

هرزنامه که معمولا تبلیغاتی هستند، ویژگی‌های مشابهی دارند. مثلا آنهایی که محصولی را تبلیغ می‌کنند از قیمت آن حرف می‌زنند و یا می‌گویند که فرصت‌تان چقدر استثنایی است. حتی رنگارنگ بودن بخش‌های نوشته می‌تواند نشان از بی‌ارزش بودن آن باشد. از آنجایی که این نشانه‌های قطعی نیستند و ما هم در ایمیل‌هایی که برای هم می‌فرستیم ممکن است مثلا از قیمت حرف بزنیم، نمی‌توانیم با چند قانون ساده هرزنامه‌ها را جدا کنیم. این‌جور مواقع سعی می‌کنیم از روی مجموعه هرزنامه‌های موجود یاد بگیریم که هرزنامه‌ها چه ویژگی‌هایی دارند.
مقدمه

با افزایش حجم اطلاعات در همه ی زمینه ها ٬ وابستگی مردم جهان به خدمات و اطلاعات موجود در وب سایتها افزایش یافته است. برای مثال ٬ پیام های الکترونیکی که به عنوان سریعترین و اقتصادی ترین راه برقراری ارتباط بین افراد هستند.
متاسفانه در میان این خدمات کاربران با یکسری پیام ها ی ناخواسته ای که حتی به علایق و حیطه ی کاری آنان مرتبط نیستند و حاوی مطالب پوچ ٬ غیر اخلاقی یا حتی مخرب هستن مواجه می شوند که از اهداف این هرزنامه نویسان انجام کارهای مخرب ٬ سرقت های رایانه ای و سوء استفاده از اطلاعات محرمانه ی افراد فریب خورده می توان یاد کرد.
کارهای مرتبط

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


- انواع الگوریتم های تشخیص و توقیف هرزنامه:

امروزه الگوریتم های زیادی جهت تشخیص انواع هرزنامه ها وجود دارد. در این قسمت معرفی اجمالی بر چند روش که تا کنون به کار برده شده است خواهم پرداخت.

    تشخیص بر اساس محتوا و کلمات:

این روش ساده ترین و رایج ترین راه برای شناسایی هرزنامه ها می باشد. اگر محتوای نامه های الکترونیکی و یا محتوای اجزای تشکیل دهنده ی وب سایت مانند عنوان ٬ فرا تگ ٬ لینک های موجود در صفحه و URL شامل کلمات خاصی باشند ٬ به عنوان هرزنامه شناسایی می شوند. هرزنامه نویسان اغلب از عبارات خاص و جذاب برای جلب توجه کاربران در نامه ی الکترونیکی یا وب سایت استفاده می کنند . کلماتی مانند free, Buy-Now, cheap, Satisfy-Me, Sex, Winner و..به همین دلیل هرزنامه نویسان کلمات مورد استفاده ی خود را دایم به شیوه های مختلف تغییر می دهند این تغییر مکرر باعث کاهش دقت می شود. برای رفع این مشکل به پایگاه داده بزرگتری جهت پوشش کلمات گوناگون نیاز داریم که جستجو و پردازش در این پایگاه داده باعث افزایش پیچیدگی زمانی می شود . از طرفی احتمال از دست رفتن نامه های الکترونیکی و یا وب سایت های واقعی و قانونی به علت استفاده ی مشروع از این کلمات نیز بالا می رود.

    تشخیص بر اساس رفتار هرزنامه:

در ارسال نامه های الکترونیکی بعضی از اطلاعات فیلدهای سرایند توسط فرستنده پر می شود و برخی دیگر به صورت خودکار توسط MTA تکمیل می شوند.
MTA بر اساس اطلاعات سرایند نامه ی الکترونیکی را به گیرنده تحویل می دهد و سپس این عمل تحویل را در فایل syslog ثبت می نماید.
اطلاعات syslog به صورت خودکار فقط توسط MTA پر می شوند و فرستنده اجازه ی هیچ گونه تغییر در آن ها را ندارند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


هرزنامه نویسان برای فریب دادن ضد هرزنامه ها از اطلاعات غیر معتبر و نامربوط در فایل سرایند نامه ی الکترونیکی استفاده می کنند بدین سببب
در این روش اطلاعات فیلدها مانند: From, To, Date, Deliver-to, Received, Reteurn-Path بررسی می شوند و در صورت غیر معتبر یا نامربط بودن هر کدام از اطلاعات فیلدهای فایل سرایند درجه ی هرزنامه بودن نامه الکترونیکی را بالا می برد.

منظور از غیر معتبر بودن این است که هرزنامه نویس در فیلدهای مورد نظر اطلاعات نادرست وارد کند مثلا قسمت From را با آدرس نامشخص که به صورت تصادفی تولید شده است یا با آدرس های جعلی پر کند.

اطلاعات فیلدهای فایل سرایند را به تنهایی از نظر اعتبار و صحت و قالب بندی می سنجند و نیز این اطلاعات را با اطلاعات فیلدهای همتایشان در فایل syslog از نظر سازگاری داشتن با هم مقایسه می کنند.منظور از همتا بودن این است که آن از دسته از فیلدهایی که از نظر جنس اطلاعات یکسان باشند با هم مقایسه می شوند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


مقایسه و تعیین صحت این فایل ها بر اساساس قوانینی تعریف شده است ؛ که این قوانین تا حدی همه ی حالاتی که برای سنجش فیلد ها نیازمند است را تحت پوشش می دهد.و به ۲ بخش تقسیم شده اند: یک بخش برای سنجش فیلدهای هر کدام از فایل ها(سرایند و syslog) و بخش دیگر برای مقایسه هر فیلد از فایل سرایند با فایل sysylog ٬ این قوانین مواردی مانند تهی ٬ جعلی ٬ تصادفی و در قالب درست بودن فیلدهای ادرس و قالب ٬ زمان(اداری یا غیر اداری) فیلد تاریخ(Date) را شامل می شوند همچنین فیلدهایی که قرار است دو به دو با هم مقایسه شوند از نظر اینکه آیا دو فیلد در یک قالب درست آدرس یا زمان هستند؟مثلا اطلاعات فیلد FROM از فایل سرایند با اطلاعات فیلد FROM از فایل syslog در یک نامه الکترونیکی باید یکسان باشند.

    روش پیشنهادی:

روش مورد استفاده در این بخش شامل مراحل زیر می باشد:

۱)حذف کلمات بی ارزش

۲)ریشه یابی کلمات

۳)استخراج ویژگی ها

۴)کاهش ویژگی ها

۵)ساخت مدل

۱- حذف کلمات بی ارزش:

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


در ابتدا به منظور آزمایش روش پیشنهادی از پایگاه های اطلاعاتی استاندارد در زمینه تشخیص هرزنامه (enorm) استفاده می کنیم که شامل نامه های الکترونیک عادی و هرزنامه می باشد. داده های مورد بررسی ما داده های مورد استفاده در مقاله های معتبر علمی می باشد که در چند سال اخیر چاپ شده است. ما در ابتدا سعی بر آن داریم تا با انجام روش های متفاوت کلمات بی ارزش (and,the,or,in,…) را از متن نامه ها حذف کنیم.

۲- ریشه یابی کلمات:

بعد از حذف کلمات بی ارزش کلمات باقی مانده را ریشه یابی می کنیم و هدف این است که کلماتی که ریشه یکسانی دارند را یکسان در نظر بگیریم برای این منظور ما از الگوریتم های stemming استفاده می کنیم.

۳- استخراج ویژگی:

در مرحله بعد می خواهیم ویژگی های موجود در متن را پیدا کنیم و برداری از ویژگی ها را تشکیل می دهیم. این بردار به این صورت ساخته می شود که بعد آن برابر با تعداد ویژگی های استخراج شده می باشد و اگر نامه الکترونیکی مربوطه ویژگی مورد نظر را داشته باشد مقدار آن ویژگی برابر با مقدار پشتیبان و در غیر این صورت مقدار ۰ را برای آن ویژگی در بردار قرار می دهیم.

برای این منظور از الگوهای تکراری در کل متن استفاده می کنیم. الگوهای تکراری به گونه ایی یافت می شود که تعداد تکرار در کل نامه های الکترونیکی از یک درصد تعیین شده بیشتر باشد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


الگوی تکراری:

الگوی <SB<sb1,sb2,…,sbm در دنباله S نمونه ای از الگوی <P<e1,e2,…,en می باشد اگر و تنها اگر عبارت QRE زیر برقرار باشد:

عبارت e1 ; [-e1,e2,…,en];e2;…; [-e1,e2,…,en];en. : QRE

یک نمونه را با ۳ تایی (sidx , istart , iend) نمایش داده می شود که در آن sidx نشان دهنده شماره دنباله S در پایگاه داده اطلاعاتی می باشد و istart اندیس شروع و iend اندیس پایان زیر رشته در S می باشد . در حالت پیش فرض٬ تمامی اندیس ها از ۱ شروع می شود.

۴- کاهش ویژگی ها:

یکی از مراحل مهم در فیلتر کردن هرزنامه که تاثیر بسیار زیادی در عملکرد و افزایش سرعت تشخیص دارد انتخاب بهترین ویژگی ها از میان ویژگی های استخراج شده می باشد. زیرا ویژگی ها که شامل کلمات یا عبارات موجود در اسناد می شوند شامل هزاران ویژگی و یا حتی بیشتر هستند که این اشکال در عملکرد الگوریتم های یادگیری تاثیر منفی دارد. بنابراین نیاز به مرحله کاهش ویژگی ها داریم به طوری که ویژگی هایی که تفاوت هرزنامه و ایمیل های عادی را به درستی بیان نمی کنند حذف گردند. بنا براین باید ویژگی های مرتبط که نسبت به بقیه ی ویژگی ها قدرت دسته بندی بیشتری دارند شناسایی شوند. بنابراین در این مرحله با اعمال الگوریتم انتخاب ویژگی بر روزی بردارها بهترین ویژگی ها را استخراج می کنیم و به این ترتیب بعد بردارها نیز کاهش میابد که باعث افزایش سرعت پردازش خواهد شد.

۵- ساخت مدل:

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


در این مرحله ما می خواهیم با استفاده از ویژگی های برگزیده شده از مرحله ی قبل و اعمال الگوریتم های متفاوت طبقه بندی در داده کاوی بر روی بردارهای بدست آمده مدلی تهیه کنیم بطوری که با استفاده از آن بتوان ایمیل های هرزنامه و ایمیل های عادی را تفکیک کرد.
با استفاده از تابع (rankBM25_DocumentAtAtime_WithHeap(q,k میل هایی را که مرتبط هستند را به ترتیب ویژگی هرزنامه بودنشان را بدست می اوریم.
آزمایش‌ها

۱- مجموعه داده و ویژگی های استخراج شده:

    لینک کد قرار داده شده بر روی github:

   

    در این برنامه یک فایل DOCUMENT.TXT به عنوان ورودی گرفته می شود که شامل ایمیل هاست و فایل balcklist_word.txt که شامل پایگاه داده کلمات هرزنامه است.

 

 

    نمونه فایل ورودی:

   

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


نکات قابل توجه برای run گرفتن از کد:

    فایلی که شامل ایمیل هاست در کد به نام DOCUMENT فراخوانی می شود و هر ایمیل داخل فایل با تگ باز شروع شده و با تگ بسته تمام می شود.

    خروجی شامل ایمیل هایی است که هرزنامه تشخیص داده شده اند و به ترتیب میزان ویژگی هرزنامه بودن هر ایمیل(ایمیل های اول ویژگی هرزنامه

بودن بیشتری را دارند) نشان داده شده است.

    برای اجرای برنامه ابتدا دو تابع ()write_start_unmergefile و ()main_dictionary را اجرا کرده تا فایل های مورد نیاز ساخته شده و سپس این

دو تابع را کامنت کرده و تابع ()input_query را اجرا کرده تا خروجی را مشاهده کنید.

۲- ارزیابی کارایی مدل:

در سیستم پیشنهادی برای سنجش کارایی مدل از معیارهای Accuracy و Precision و Recall و Fmeasure استفاده شده است در زیر

خلاصه ای از مهمترین فرمول ها و معیارهای ذکر شده است:
Accuracy     Precision     Recall     Fmeasure
TP+TN / TP+FP+TN+FN     TP / FP+TP     TP / FN+TP     2Recall.Precesion / Recall+Precesion

    معیار prescision نسبت تعداد پیام هایی است که به درستی دسته بندی شده اند و از دسته های هرزنامه هستند به تعداد کل پیام های شناسایی شده به عنوان هرزنامه.

    معیار recall نسبت تعداد کل پیام های شناسایی شده به عنوان هرزنامه به تعدا د کل پیام هایی است که واقعا جزء دسته هرزنامه ها می باشند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


    معیار accuracy نسبت تعداد هرزنامه ها و ایمیل های درست تشخیص داده شده به تعداد کل هرزنامه ها و ایمیل هایی که وجود دارند.

    معیار fmeasure ترکیبی از recall و precision است.

در ادامه , برای بررسی دقت عملکرد روش پیشنهادی , از معیارهای بالا بر روی یک نمونه پایگاه داده اطلاعاتی استفاده می شود:

    نتیجه ی کد به ازای نمونه فایل ورودی DOCUMENT.txt(لینک فایل ورودی در بالا ذکر شده است):

Accuracy     Precision     Recall     Fmeasure
0.5     0.6     0.4     0.5

- استفاده از الگوریتم next phrase :
در قسمت قبلی ؛ هرزنامه ها به ترتیبی نشان داده می شدند که تکرار کلمات stop word در ان ها بیشتر است ولی همان طور که می دانیم stop word شامل جمله نیز می باشد پس باید جمله ها را نیز در نظر بگیریم بدین منظور در یک دیتابیس جمله ها را ذخیره کرده و در سندهایی که به عنوان هرزنامه تشخیص داده شدند وجود این جمله ها را نیز در ان بررسی میکنیم و در صورت و جود ان ها و تعداد تکرارشان به میل مورد نظر امتیازی اضافه می شود البته در هنگام چک کردن این نکته را نیز در نظر داریم که ممکن یکسری جملات کلماتشان یکسان نباشد ولی مفهوم یکسانی داشته باشند بدین منظور هر جمله از stop word را با الگوریتم stemming ریشه گیری کرده و کلمات اضافه را نیز از ان ها حذف میکنیم تا به صورت جامع تری عمل مقایسه انجام شود.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


    کد بهینه شده با الگوریتم next phrase:

بازدید : 103 تاریخ : شنبه 14 مرداد 1396 زمان : 17:12 نویسنده : مطلب پروژه نظرات (0)

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

  تا به امروز نرم افزار های تجاری و آموزشی فراوانی برای داده کاوی در حوزه های مختلف داده ها به دنیای علم و فناوری عرضه شده­اند. هریک از آنها با توجه به نوع اصلی داده هایی که مورد کاوش قرار می­دهند، روی الگوریتمهای خاصی متمرکز شده­اند. مقایسه دقیق و علمی این ابزارها باید از جنبه های متفاوت و متعددی مانند تنوع انواع و فرمت داده های ورودی، حجم ممکن برای پردازش داده ها، الگوریتمها پیاده سازی شده، روشهای ارزیابی نتایج، روشهای مصور سازی [1] ، روشهای پیش پردازش [2] داده ها، واسطهای کاربر پسند [3] ، پلت فرم [4] های سازگار برای اجرا،‌ قیمت و در دسترس بودن نرم افزار صورت گیرد. از آن میان، ‌نرم افزار Weka با داشتن امکانات بسیار گسترده،‌ امکان مقایسه خروجی روشهای مختلف با هم، راهنمای خوب، واسط گرافیگی کارآ، سازگاری با سایر برنامه­های ویندوزی، و از همه مهمتر وجود کتابی بسیار جامع و مرتبط با آن [ Data Mining, witten et Al. 2005 ] ، معرفی می­شود.

  میزکار [5] Weka ، مجموعه­ای از الگوریتم­‏های روز یادگیری ماشینی و ابزارهای پیش پردازش داده­‏ها می‏­باشد. این نرم­افزار به گونه­ای طراحی شده است که می‏­توان به سرعت، روش­‏های موجود را به صورت انعطاف­پذیری روی مجموعه­‏های جدید داده، آزمایش نمود. این نرم­افزار، پشتیبانی‏‏های ارزشمندی را برای کل فرآیند داده کاوی ­‏های تجربی فراهم می‏­کند. این پشتیبانی‏ها، آماده سازی داده­‏های ورودی، ارزیابی آماری چارچوب­‏های یادگیری و نمایش گرافیکی داده­‏های ورودی و نتایج یادگیری را در بر می­گیرند. همچنین، هماهنگ با دامنه وسیع الگوریتم­‏های یادگیری، این نرم­افزار شامل ابزارهای متنوع پیش پردازش داده­هاست. این جعبه ابزار [6] متنوع و جامع، از طریق یک واسط متداول در دسترس است، به نحوی که کاربر می‏­تواند روش­‏های متفاوت را در آن با یکدیگر مقایسه کند و روش­‏هایی را که برای مسایل مدنظر مناسب­تر هستند، تشخیص دهد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  نرم­افزار Weka در دانشگاه Waikato واقع در نیوزلند توسعه یافته است و اسم آن از عبارت "Waikato Environment for knowledge Analysis" استخراج گشته است. همچنین Weka ، نام پرنده­ای با طبیعت جستجوگر است که پرواز نمی‏­کند و در نیوزلند، یافت می‏­شود. این سیستم به زبان جاوا نوشته شده و بر اساس لیسانس عمومی و فراگیر [7] GNU انتشار یافته است. Weka تقریباً روی هر پلت فرمی اجرا می‏­شود و نیز تحت سیستم عامل­‏های لینوکس، ویندوز، و مکینتاش، و حتی روی یک منشی دیجیتالی شخصی [8] ، آزمایش شده است.

  این نرم­افزار، یک واسط همگون برای بسیاری از الگوریتم­‏های یادگیری متفاوت، فراهم کرده است که از طریق آن روش­‏های پیش پردازش، پس از پردازش [9] و ارزیابی نتایج طرح های یادگیری روی همه مجموعه های داده­‏ موجود، قابل اعمال است.

  نرم افزار Weka ، پیاده سازی الگوریتم­‏های مختلف یادگیری را فراهم می‏­کند و به آسانی می‏­توان آنها را به مجموعه های داده خود اعمال کرد.

  همچنین، این نرم­افزار شامل مجموعه متنوعی از ابزارهای تبدیل مجموعه­‏های داده­‏ها، همانند الگوریتم­‏های گسسته سازی [10] می‏­باشد. در این محیط می‏­توان یک مجموعه داده را پیش پردازش کرد، آن را به یک طرح یادگیری وارد نمود، و دسته­بندی حاصله و کارآیی­اش را مورد تحلیل قرار داد. (همه این کارها، بدون نیاز به نوشتن هیچ قطعه برنامه­ای میسر است.)

  این محیط، شامل روش­‏هایی برای همه مسایل استاندارد داده کاوی مانند رگرسیون، رده‏بندی، خوشه­بندی، کاوش قواعد انجمنی و انتخاب ویژگی می‏­باشد. با در نظر گرفتن اینکه، داده­‏ها بخش مکمل کار هستند، بسیاری از ابزارهای پیش پردازش داده­‏ها و مصورسازی آنها فراهم گشته است. همه الگوریتم­‏ها، ورودی­‏های خود را به صورت یک جدول رابطه­ای [11] به فرمت ARFF دریافت می‏­کنند. این فرمت داده­‏ها، می‏­تواند از یک فایل خوانده شده یا به وسیله یک درخواست از پایگاه داده­ای تولید گردد.

  یکی از راه­‏های به کارگیری Weka ، اعمال یک روش یادگیری به یک مجموعه داده و تحلیل خروجی آن برای شناخت چیزهای بیشتری راجع به آن اطلاعات می‏­باشد. راه دیگر استفاده از مدل یادگیری شده برای تولید پیش‏بینی­‏هایی در مورد نمونه­‏های جدید است. سومین راه، اعمال یادگیرنده­‏های مختلف و مقایسه کارآیی آنها به منظور انتخاب یکی از آنها برای تخمین می‏­باشد. روش­‏های یادگیری Classifier نامیده می‏­شوند و در واسط تعاملی [12] Weka ، می‏­توان هر یک از آنها را از منو [13] انتخاب نمود. بسیاری از classifier ‏ها پارامترهای قابل تنظیم دارند که می‏­توان از طریق صفحه ویژگی‏‏ها یا object editor به آنها دسترسی داشت. یک واحد ارزیابی مشترک، برای اندازه‏گیری کارآیی همه classifier به کار می‏­رود.

  پیاده سازی­‏های چارچوب­‏های یادگیری واقعی، منابع بسیار ارزشمندی هستند که Weka فراهم می‏­کند. ابزارهایی که برای پیش پردازش داده­‏ها استفاده می‏­شوند. filter نامیده می‏­شوند. همانند classifier ‏ها، می‏­توان filter ‏ها را از منوی مربوطه انتخاب کرده و آنها را با نیازمندی­‏های خود، سازگار نمود. در ادامه، به روش به کارگیری فیلترها اشاره می‏­شود.

  علاوه بر موارد فوق، Weka شامل پیاده سازی الگوریتم­‏هایی برای یادگیری قواعد انجمنی، خوشه­بندی داده­‏ها در جایی که هیچ دسته­ای تعریف نشده است، و انتخاب ویژگی‏های مرتبط [14] در داده­‏ها می‏­شود.

  2- روش استفاده از Weka

  شکل 1،‌ راههای انتخاب واسط­های مختلف Weka را نشان می­دهد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  آسان­ترین راه استفاده از Weka ، از طریق واسطی گرافیکی است که Explorer خوانده می‏شود. این واسط گرافیکی، به وسیله انتخاب منوها و پر کردن فرم­‏های مربوطه، دسترسی به همه امکانات را فراهم کرده است. برای مثال، می‏­توان به سرعت یک مجموعه داده را از یک فایل ARFF خواند و درخت تصمیم‏گیری آن را تولید نمود. امادرخت­‏های تصمیم‏گیری یادگیرنده صرفاً ابتدای کار هستند. الگوریتم­‏های بسیار دیگری برای جستجو وجود دارند. واسط Explorer کمک می‏­کند تا الگوریتم­‏های دیگر نیز آزمایش شوند.

 

  AWT IMAGE

  شکل 1. Weka در وضعیت انتخاب واسط

  این واسط با در اختیار گذاشتن گزینه­‏ها به صورت منو، با وادار کردن کاربر به اجرای کارها با ترتیب صحیح، به وسیله خاکستری نمودن گزینه­‏ها تا زمان صحیح به کارگیری آنها، و با در اختیار گذاشتن گزینه­‏هایی به صورت فرم­‏های پرشدنی، کاربر را هدایت می‏­کند. راهنمای ابزار مفیدی، حین عبور ماوس از روی گزینه­‏ها، ظاهر شده و اعمال لازم مربوطه را شرح می‏­دهد. پیش­فرض­‏های معقول قرار داده شده، کاربر را قادر می‏­سازند تا با کمترین تلاشی، به نتیجه برسد. اما کاربر باید برای درک معنی نتایج حاصله، راجع به کارهایی که انجام می‏­دهد، بیندیشد.

  Weka دو واسط گرافیکی دیگر نیز دارد. واسط knowledge flow به کاربر امکان می‏­دهد تا چنیش­‏هایی برای پردازش داده­‏های در جریان، طراحی کند. یک عیب پایه­ای Explorer . نگهداری هر چیزی در حافظه اصلی آن است. (زمانی که یک مجموعه داده را باز می‏­کنیم، Explorer ، کل آن را، در حافظ باز می‏­کند) نشان می‏­دهد که Explorer ، صرفاً برای مسایل با اندازه­‏های کوچک تا متوسط، قابل اعمال است. با وجود بر این Weka شامل تعدادی الگوریتم­‏های افزایشی است که می‏­تواند برای پردازش مجموعه های داده بسیار بزرگ مورد استفاده قرار گیرد. واسط knowledge flow امکان می‏­دهد تا جعبه [15] ­‏های نمایانگر الگوریتم­‏های یادگیری و منابع داده­‏ها را به درون صفحه بکشیم و با اتصال آنها به یکدیگر، ترکیب و چینش دلخواه خود را بسازیم. این واسط اجازه می‏­دهد تا جریان داده­ای از مؤلفه­‏های به هم متصل که بیانگر منابع داده، ابزارهای پیش پردازش، روش­‏های ارزیابی و واحدهای مصوّر سازی هستند تعریف شود. اگر فیلترها و الگوریتم­های یادگیری، قابلیت یادگیری افزایشی را داشته باشند، داده­‏ها به صورت افزایشی بار شده و پردازش خواهند شد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  سومین واسط Weka ، که Experimenter خوانده می‏­شود، کمک می‏­کند تا به این سؤال عملی و پایه­ای کاربر حین استفاده از تکنیک­‏های رده‏بندی و رگرسیون، پاسخ دهد: "چه روش­‏ها و پارامترهایی برای مسأله داده شده، بهتر عمل می‏­کنند؟"

  عموماً راهی برای پاسخگویی مقدماتی به این سؤال وجود ندارد و یکی از دلایل توسعه Weka ، فراهم نمودن محیطی است که کاربران Weka را قادر به مقایسه تکنیک­‏های گوناگون یادگیری بنماید. این کار، می‏­تواند به صورت تعاملی در Explorer انجام شود. با این وجود، Experimenter با ساده کردن اجرای رده‏بندی کننده­‏ها و فیلترها با پارامترهای گوناگون روی تعدادی از مجموعه­‏های داده، جمع­آوری آمار کارآیی و انجام آزمایش­‏های معنا، پردازش را خودکار می‏­کند. کاربرهای پیشرفته، می‏­توانند از Experimenter برای توزیع بار محاسباتی بین چندین ماشین، استفاده کنند. در این روش، می‏­توان آزمایش­‏های آماری بزرگی را راه­اندازی نموده و آنها را برای اجرا، رها نمود.

  ورای این واسط­‏های تعاملی، عملکرد پایه­ای Weka قرار دارد. توابع پایه­ای Weka ، از طریق خط فرمان [16] ­‏های متنی قابل دسترسی هستند. زمانی که Weka ، فعال می‏­شود، امکان انتخاب بین چهار واسط کاربری وجود دارد: Explorer ، knowledge ، Experimenter و واسط خط فرمان.

  اکثر کاربران، حداقل در ابتدای کار Explorer را به عنوان واسط کاربری انتخاب می‏­کنند.

  3. قابلیتهای Weka

  مستندسازی در لحظه، که به صورت خودکار از کد اصلی تولید می‏­شود و دقیقاً ساختار آن را بیان می‏­کند، قابلیت مهمی است که حین استفاده از Weka وجوددارد.

  نحوه استفاده از این مستندات و چگونگی تعیین پایه­‏های ساختمانی اصلی Weka ، مشخص کردن بخش­‏هایی که از روش­‏های یادگیری با سرپرست استفاده می‏­کند، ابزاری برای پیش پردازش داده­‏ها بکار می‏­رود و اینکه چه روش­‏هایی برای سایر برنامه­‏های یادگیری وجود دارد، در ادامه تشریح خواهد شد. تنها به لیست کاملی از الگوریتم­‏های موجود اکتفا می‏­شود زیرا Weka به طور پیوسته تکمیل می‏­شود و به طور خودکار از کد اصلی تولید می‏­شود. مستندات در لحظه همیشه به هنگام شده می‏­باشد. اگر ادامه دادن به مراحل بعدی و دسترسی به کتابخانه از برنامه جاوا شخصی یا نوشتن و آزمایش کردن برنامه­‏های یادگیری شخصی مورد نیاز باشد، این ویژگی بسیار حیاتی خواهد بود.

  در اغلب برنامه­‏های کاربردی داده کاوی، جزء یادگیری ماشینی، بخش کوچکی از سیستم نرم­افزاری نسبتاً بزرگی را شامل می‏­شود. در صورتی که نوشتن برنامه کاربردی داده کاوی مد نظر باشد، می‏­توان با برنامه­نویسی اندکی به برنامه­‏های Weka از داخل کد شخصی دسترسی داشت. اگر پیدا کردن مهارت در الگوریتم­‏های یادگیری ماشینی مدنظر باشد، اجرای الگوریتم­‏های شخصی بدون درگیر جزییات دست و پا گیر شدن مثل خواندن اطلاعات از یک فایل، اجرای الگوریتم­‏های فیلترینگ یا تهیه کد برای ارزیابی نتایج یکی از خواسته­‏ها می‏­باشد. Weka دارای همه این مزیت­‏ها است. برای استفاده کامل از این ویژگی، باید با ساختارهای پایه­ای داده­‏ها آشنا شد.

  4. دریافت Weka

  نرم افزار Weka ، در آدرس http://www.cs.waikato.ac.nz/me/weka ، در دسترس است. از این طریق می‏­توان نصب کننده [17] متناسب با یک پلت فرم معین، یا یک فایل Java jar را که در صورت نصب بودن جاوا به راحتی قابل اجرا است، دانلود [18] نمود.

  5. مروری بر Explorer

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  واسط گرافیکی اصلی برای کاربران،‌ Explorer است که امکان دسترسی به همه امکانات Weka را از طریق انتخاب منوها و پر کردن فرمها فراهم می­آورد. شکل 2،‌ نمای Explorer ‌ را نشان می­دهد. در این واسط، شش پانل [19] مختلف وجود دارد که از طریق نوار [20] بالای صفحه قابل انتخاب هستند و با وظایف [21] داده کاوی پشتیبانی شده توسط Weka ‌ متناظر می­باشند.

 AWT IMAGE

  شکل 2. واسط گرافیکی Explorer

  دو گزینه از شش گزینه بالای پنجره Explorer در شکل های 3 و 4 به طور خلاصه تشریح شده است.

  به طور خلاصه، کارکرد تمام گزینه­‏ها به شرح ذیل است.

  Preprocess : انتخاب مجموعه داده و اصلاح [22] آن از راه­‏های گوناگون

  Classify : آموزش [23] برنامه­‏های یادگیری که رده‏بندی یا رگرسیون انجام می‏­دهند و ارزیابی آنها.

  Cluster : یادگیری خوشه­‏ها برای مجموعه های داده

  Associate : یادگیری قواعد انجمنی برای داده­‏ها و ارزیابی آنها

  Select attributes : انتخاب مرتبط­ترین جنبه [24] ها در مجموعه های داده

  Visualize : مشاهده نمودارهای مختلف دوبعدی داده­‏ها و تعامل با آنها

  AWT IMAGE

  شکل 3. خواندن فایل داده های آب و هوا

  Weka Exphorer امکان رده بندی دارد، چنانچه به کاربران اجازه می‏­دهد به صورت تعاملی اقدام به ساخت درخت تصمیم‏گیری کنند. Weka نمودار پراکندگی داده­‏ها را نسبت به دو ویژگی انتخاب شده، فراهم می‏­آورد. وقتی زوج ویژگی­ای که رده­‏ها را به خوبی جدا می‏­کند، پیدا شد، امکان ایجاد دو شاخه با کشیدن چند ضلعی اطراف نقاط داده­‏ها بر نمودار پراکندگی وجود دارد.

 

  AWT IMAGE

  شکل 4. نوار Classify

  هر نوار، دسترسی به دامنه کاملی از امکانات را فراهم می­کند. در پایین هر پانل، جعبه status و دکمه log قرار دارد. جعبه status پیغام­‏هایی است که نشان می‏­دهد چه عملیاتی در حال انجام داده شدن است. مثلاً اگر Explores مشغول خواندن یک فایل باشد، جعبه status آن را گزارش می‏­دهد. کلیک راست در هر جا داخل این جعبه یک منو کوچک با دو گزینه می‏­آورد، نمایش میزان حافظه در دسترس Weka و اجرای Java garbage collector ..

  لازم است توجه شود که garbage collector به طور ثابت به عنوان یک عمل پیش زمینه [25] در هر حال اجرا می‏­شود کلیک دکمه log ، گزارش عملکرد متنی کارهایی که Weka تاکنون در این بخش انجام داده است با برچسب زمانی ارایه می‏­کند.

  زمانیکه Weka در حال عملیات است، پرنده کوچکی که در پایین سمت راست پنجره است، بالا و پایین می‏­پرد. عدد پشت × نشان می‏­دهد که به طور همزمان چند عملیات در حال انجام است. اگر پرنده بایستد در حالیکه حرکت نمی‏­کند، او مریض است! اشتباه رخ داده است و باید Explorer از نو اجرا شود.

  1. خواندن و فیلتر کردن فایل­‏ها

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  در بالای پانل Preprocess در شکل 3، دکمه­‏هایی برای باز کردن فایل، URL ‏ها و پایگاه های داده­‏ وجود دارد. در ابتدا تنها فایل­‏های با پسوند arff . در browser فایل نمایش داده می‏­شود. برای دیدن سایر فایل­‏ها یاید گزینه [26] Format در جعبه انتخاب فایل تغییر داده شود.

  2. تبدیل فایل­‏ها به فرمت ARFF

  نرم افزار Weka دارای سه مبدل فرمت فایل [27] می‏­باشد، برای فایل­‏های صفحه گسترده [28] با پسوند CSV ، با فرمت فایل C4.5 با پسوند names . و data و برای نمونه­‏های سری با پسوند bsi .

  اگر Weka قادر به خواندن داده­‏ها نباشد، سعی می‏­کند آن را به صورت ARFF تفسیر کند. اگر نتواند جعبه نشان داده شده در شکل 5 (الف) ظاهر می‏­شود.

  AWT IMAGE

  (الف)

AWT IMAGE

(ب)

AWT IMAGE

(ج)

     شکل 5. ویرایشگر عمومی اشیاء (الف) ویرایشگر (ب) اطلاعات بیشتر (فشردن دگمه More ) (ج) انتخاب یک مبدل

  این، یک ویرایشگر عمومی [29] اشیاء است که در Weka برای انتخاب و تنظیم اشیا بکار می‏­رود. به عنوان مثال وقتی پارامتری برای Classifier تنظیم می‏­شود، جعبه­ای با نوع مشابه بکار برده می‏­شود. CSV Loader برای فایل­‏های با پسوند CSV . به طور پیش فرض انتخاب می‏­شود. دکمه More اطلاعات بیشتری در مورد آن می‏­دهد که در شکل 5 (ب) نشان داده شده است.

  همیشه مطالعه مستندات [30] ارزشمنداست! در این حالت نشان می‏­دهد که ردیف نخست صفحه گسترده، نام ویژگی را تعیین می‏­کند. برای استفاده از این مبدل باید بر Ok کلیک شود. برای مورد مختلف لازم است بر choose کلیک شود تا از لیست شکل 5 (ج) انتخاب انجام شود.

  گزینه اول، Arffloader است و فقط به دلیل ناموفق بودن به این نقطه می‏­رسیم. CSVLoader پیش فرض است و در صورت نیاز به فرض دیگر، choose کلیک می‏­شود. سومین گزینه، مربوط به فرمت C4.5 است که دو فایل برای مجموعه داده وجود دارد یکی اسم­‏ها و دیگـری داده­‏های واقعـی می‏­باشد. چهارمین برای نمونه­‏های سریالی [31] ، برای بازخوانی [32] مجموعه داده­ای است که به صورت شیئ سریالی شده جاوا ذخیره شده است. هر شیء در جاوا می‏­تواند در این شکل ذخیره و بازخوانی شود. به عنوان یک فرمت بومی جاوا [33] ، سریع­تر از فایل ARFF خوانده می‏­شود چرا که فایل ARFF باید تجزیه [34] و کنترل شود. وقتی یک مجموعه داده بزرگ مکررا بازخوانی می‏­شود، ذخیره آن در این شکل سودمند است.

  ویژگی‏های دیگر ویرایشگر عمومی اشیا در شکل 5 (الف)، save و open است که به ترتیب برای ذخیره اشیای تنظیم شده و بازکردن شیئی که پیش از این ذخیره شده است، به کار می­رود. اینها برای این نوع خاص شیئ مفید نیستند. لکن پانل­‏های دیگر ویرایشگر عمومی اشیاء، خواص قابل ویرایش زیادی دارند. به دلیل مشکلاتی که ممکن است حین تنظیم مجدد آنها رخ دهد، می‏­توان ترکیب اشیاء ایجاد شده را برای استفاده­‏های بعدی، ذخیره کرد.

  تنها منبع [35] مجموعه­‏های داده برای Weka ، فایل­‏های موجود روی کامپیوتر نیستند. می‏­توان یک URL را باز کرد تا Weka از پروتکل HTTP برای دانلود کردن یک فایل Arff از شبکه استفاده کند. همچنین می‏توان یک پایگاه داده­‏ها را باز نمود ( open DB ـ هر پایگاه داده­ای که درایور اتصال به مجموعه های داده به زبان جاوا JDBC را دارد.) و به وسیله دستور select زبان SQL ، نمونه­‏‏ها را بازیابی نمود. داده­‏ها می‏­توانند به کمک دگمه save به همه فرمت­‏های ذکر شده، ذخیره شوند. جدای از بحث بارگذاری و ذخیره مجموعه­‏های داده، پانل preprocess به کاربر اجازه فیلتر کردن داده­‏ها را می‏­دهد. فیلترها، اجزای مهم Weka هستند.

  3. بکارگیری فیلترها

  با کلیک دگمه choose (گوشه بالا و سمت چپ) در شکل 3 می‏­توان به لیستی از فیلترها دست یافت. می‏­توان از فیلترها برای حذف ویژگی‏های مورد نظری از یک مجموعه داده و انتخاب دستی ویژگی‏‏ها استفاده نمود. مشابه این نتیجه را می‏­توان به کمک انتخاب ویژگی‏های مورد نظر با تیک زدن آنها و فشار دادن کلیه Remove به دست آورد.

  4. الگوریتم­‏های یادگیری

  زمانی که یک الگوریتم یادگیری با استفاده از دگمه choose در پانل classify انتخاب می‏­شود، نسخه خط فرمانی رده بند در سطری نزدیک به دگمه ظاهر می‏­گردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص می‏­شوند. برای تغییر آنها می‏­توان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء، باز شود. جدول شکل 6، لیست اسامی رده بندهای Weka را نمایش می‏­دهد. این الگوریتم­‏ها به رده بندهای Bayesian ، trees ، functions rules ، lazy و دسته نهایی شامل روش­‏های متفرقه تقسیم شده­اند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

  4-1. Trees

  Decision stump که برای استفاده توسط روش­‏های boosting طراحی شده است، برای مجموعه­‏های داده عددی یا رده­ای، درخت تصمیم‏گیری یک سطحی می‏­سازد. این الگوریتم، با مقادیر از دست رفته، به صورت مقادیر مجزا برخورد کرده و شاخه سومی از درخت توسعه می‏­دهد.

  4-2. Rules

  Decision Table یک رده بند بر اساس اکثریت جدول تصمیم‏گیری می‏­سازد. این الگوریتم، با استفاده از جستجوی اولین بهترین، زیر دسته­‏های ویژگی‏‏ها را ارزیابی می‏­کند و می‏­تواند از اعتبارسنجی تقاطعی برای ارزیابی بهره ببرد (1995، Kohavi ).

  یک امکان این است که به جای استفاده از اکثریت جدول تصمیم‏گیری که بر اساس دسته ویژگی‏های مشابه عمل می‏­کند، از روش نزدیکترین همسایه برای تعیین رده هر یک از نمونه­‏ها که توسط مدخل [36] جدول تصمیم‏گیری پوشش داده نشده­اند، استفاده شود.

  Conjunctive Rule قاعده­ای را یاد می‏­گیرد که مقادیر رده­‏های عددی را رده­ای را پیش‏بینی می‏­کند. نمونه­‏های آزمایشی به مقادیر پیش فرض رده نمونه­‏های آموزشی، منسوب می‏­شوند. سپس تقویت اطلاعات (برای رده­‏های رسمی)، یا کاهش واریانس (برای رده­های عددی) مربوط به هر والد محاسبه شده و به روش هرس کردن با خطای کاهش یافته [37] ، قواعد هرس می‏­شوند.

  ZeroR برای رده­‏های اسمی، اکثریت داده­‏های مورد آزمایش و برای رده­‏های عددی، میانگین آنها را پیش‏بینی می‏­کند. این الگوریتم بسیار ساده است.

  M5Rules ، به کمک M5 از روی درخت­‏های مدل، قواعد رگرسیون استخراج می‏­کند.

  AWT IMAGE

  شکل 6.الف. الگوریتمهای رده بندی در Weka

 AWT IMAGE

    شکل 6.ب. الگوریتمهای رده بندی در Weka

 در این بخش به شرح مختصری برخی از این الگوریتمها و پارامترهایشان که قابلیت کار با ویژگی های عددی را دارند، پرداخته می‏­شود.

  4-3. Functions

  Simple Linear Regresion مدل رگرسیون خطی یک ویژگی مشخص را یاد می‏­گیرد. آنگاه مدل با کمترین خطای مربعات را انتخاب می‏­کند. در این الگوریتم، مقادیر از دست رفته و مقادیر غیرعددی مجاز نیستند [38] .

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  Linear Regression رگرسیون خطی استاندارد کمترین خطای مربعات را انجام می‏­دهد می‏تواند به طور اختیاری به انتخاب ویژگی بپردازد، این کار می‏­تواند به صورت حریصانه [39] با حذف عقب رونده [40] انجام شود، یا با ساختن یک مدل کامل از همه ویژگی‏‏ها و حذف یکی یکی جمله­‏ها با ترتیب نزولی ضرایب استاندارد شده آنها، تا رسیدن به شرط توقف مطلوب انجام گیرد.

  Least Med sq یک روش رگرسیون خطی مقاوم است که میانه [41] (به جای میانگین [42] ) مربعات انحراف از خط رگرسیون را کمینه می‏­کند. این روش به طور مکرر رگرسیون خطی استاندارد را به زیرمجموعه­‏هایی از نمونه­‏ها اعمال می‏­کند و نتایجی را بیرون می‏­دهد که کمترین خطای مربع میانه را دارند.

  SMO teg الگوریتم بهینه سازی حداقل ترتیبی را روی مسایل رگرسیون اعمال می‏­کند. ( Scholkopf, 1998 ، Smola )

  Pace Regression ، با استفاده از تکنیک رگرسیون pace ، مدل­‏های رگرسیون خطی تولید می‏­کند (2002 ، Wang و Witten ). رگرسیون pace ، زمانی که تعداد ویژگی‏‏ها خیلی زیاد است، به طور ویژه­ای در تعیین ویژگی‏‏هایی که باید صرف‏نظر شوند، خوب عمل می‏­کند. در واقع در صورت وجود نظم و ترتیب خاصی، ثابت می‏­شود که با بی­نهایت شدن تعداد ویژگی‏‏ها، الگوریتم بهینه عمل می‏­کند.

  RBF Network ، یک شبکه با تابع پایه­ای گوسی شعاعی را پیاده سازی می‏­کند. مراکز و عرض­‏های واحدهای مخفی به وسیله روش میانگین K [43] تعیین می‏­شود. سپس خروجی­‏های فراهم شده از لایه­‏های مخفی [44] ، با استفاده از رگرسیون منطقی در مورد رده­‏های اسمی و رگرسیون خطی در مورد رده­‏های عددی، با یکدیگر ترکیب می‏­شوند. فعال سازی­‏های توابع پایه پیش از ورود به مدل­‏های خطی، با جمع شدن با عدد یک، نرمالیزه می‏­شوند. در این الگوریتم می‏­توان، K تعداد خوشه­‏ها، بیشترین تعداد تکرارهای رگرسیون­‏های منطقی برای مسأله­‏های رده­‏های رسمی، حداقل انحراف معیار خوشه­‏ها، و مقدار بیشینه رگرسیون را تعیین نمود. اگر رده­‏ها رسمی باشد، میانگین K به طور جداگانه به هر رده اعمال می‏­شود تا K خوشه مورد نظر برای هر رده استخراج گردد.

  4-4. رده بندهای Lazy

  یادیگرنده­‏های lazy نمونه­‏های آموزشی را ذخیره می‏­کنند و تا زمان رده بندی هیچ کار واقعی انجام نمی‏­دهند.

  IB1 یک یادگیرنده ابتدایی بر پایه نمونه است که نزدیک­ترین نمونه­‏های آموزشی به نمونه­‏های آزمایشی داده شده را از نظر فاصله اقلیدسی پیدا کرده و نزدیکترین رده­ای مشابه رده همان نمونه­‏های آموزشی را تخمین می‏­زند.

  IBK یک رده بند با K همسایه نزدیک است که معیار فاصله ذکر شده را استفاده می‏­کند. تعداد نزدیکترین فاصله­‏ها (پیش فرض 1= K ) می‏­تواند به طور صریح در ویرایشگر شیء تعیف شود. پیش‏بینی­‏های متعلق به پیش از یک همسایه می‏­تواند بر اساس فاصله آنها تا نمونه­‏های آزمایشی، وزن­دار گردد.

  دو فرمول متفاوت برای تبدیل فاصله به وزن، پیاده سازی شده­اند. تعداد نمونه­های آموزشی که به وسیله رده بند نگهداری می‏­شود، می‏­تواند با تنظیم گزینه اندازه پنجره محدود گردد. زمانی که نمونه­‏های جدید اضافه می‏­شوند، نمونه­‏های قدیمی حذف شده تا تعداد کل نمونه­‏های آموزشی در اندازه تعیین شده باقی بماند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


  Kstar ، یک روش نزدیکترین همسایه است که از تابع فاصله­ای عمومی شده بر اساس تبدیلات استفاده می‏­کند.
LWL یک الگوریتم کلی برای یادگیری وزن دار شده به صورت محلی است. این الگوریتم با استفاده از یک روش بر پایه نمونه، وزن­‏ها را نسبت می‏­دهد و از روی نمونه­‏های وزن­دار شده، رده بند را می‏­سازد. رده بند در ویرایشگر شیء LWL انتخاب می‏­شود. Nave Bayes برای مسایل رده بندی و رگرسیون خطی برای مسایل رگرسیون، انتخاب­‏های خوبی هستند. می‏­توان در این الگوریتم، تعداد همسایه­‏های مورد استفاده را که پهنای باند هسته و شکل هسته مورد استفاده برای وزن دار کردن را (خطی، معکوس، یا گوسی) مشخص می‏­کند، تعیین نمود. نرمال سازی ویژگی‏‏ها به طور پیش فرض فعال است[ Data Mining, witten et Al. 2005 ].   نرم­افزار داده کاوی Weka

بازدید : 197 تاریخ : شنبه 14 مرداد 1396 زمان : 17:11 نویسنده : مطلب پروژه نظرات (0)

ه اطلاع می رساند شرکت داده پردازی آماری اطمینان شرق ، آمادگی خویش را برای انجام تجزیه و تحلیل داده های با حجم بسیار بالا یا داده کاوی با نرم افزار معروف وکا (WEKA) اعلام می کند.
سفارش انجام داده کاوی با سایر نرم افزارهای مربوط نیز پذیرفته می شود.
برای تماس با تحلیلگر داده کاوی این شرکت (سرکار خانم دهقان) با شماره زیر تماس بگیرید:

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


قابل ذکر است ما دارای نماد اعتماد دائم الکترونیک در ارائه خدمات تحلیلی آماری بوده و به صورت تخصصی به موضوع تجزیه و تحلیلهای آماری می پردازیم. سایت مذکور دارای درگاه اینترنتی بانک ملت برای پرداخت آسان هزینه تحلیل می باشد.
هزینه تحلیل را نیز هنگامی به ما پرداخت نمایید که از تایید آن توسط استاد خود یا ناظر پروژه آماری مطمئن شدید!!

قابل ذکر است این شرکت آماده انجام خدمات تجزیه و تحلیل آماری پایان نامه ها و مقالات، آزمون های اقتصاد سنجی و همچنین مدل سازی معادلات ساختاری با نرم افزار های آماری مانند spss، sas، eviews، R، lisrel، Amos، smart pls، expert choice و مانند آن می باشیم.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


درباره داده کاوی یا DATA MINING:
امروزه لحظه به لحظه به حجم داده ها در پایگاه داده ها اضافه شده و انبارهای ( توده های ) عظیمی از داده ها ایجاد شده است ، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده و داده کاوی را به مهم ترین فناوری برای بهره وری موثر ، صحیح و سریع ازداده های حجیم تبدیل نموده است که اهمیت آن رو به فزونی است.
داده کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ، فراگیری ماشین داده ، . . . می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.
کاربردهای عمومی داده کاوی بیشتر شامل تقسیم کردن داده ها در خوشه های مقتضی، کدگذاریهای مناسب، کاوش برای الگوها و طراحی کردن با استفاده از فنون آماری و الگوریتمهای ژنتیکی است.

نرم افزارهای انجام داده کاوی:
نرم افزارهای آماری عمومی مثل SPSS, SAS, STATISTICA با امکاناتی برای داده کاوی و بسته های نرم افزاری اختصاصی داده کاوی مثل WEKA ، برای داده کاوی مورد استفاده قرار می گیرند.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com

بازدید : 99 تاریخ : شنبه 14 مرداد 1396 زمان : 17:10 نویسنده : مطلب پروژه نظرات (0)

  بیماری افسردگی داده کاوی در تشخیص بیماری افسردگی با نرم افزار کلمنتاین با الگوریتم درخت تصمیم و شبکه عصبی
    بیماری افسردگی داده کاوی در تشخیص بیماری افسردگی با نرم افزار رپیدماینر با الگوریتم درخت تصمیم و نزدیکترین همسایه
    قارچ سمی داده کاوی در تشخیص قارچ های سمی با نرم افزار رپیدماینر با استفاده از الگوریتم درخت تصمیم و بیز ساده
    بازی شطرنج داده کاوی در بازی شطرنج با نرم افزار رپیدماینر با استفاده از الگوریتم درخت تصمیم و شبکه عصبی
    پیش بینی درآمد داده کاوی در پیش بینی درآمد افرادبا نرم افزار کلمنتاین با استفاده از درخت تصمیم و شبکه عصبی
    رای گیری در گنگره امریکا داده کاوی در رای گیری در گنگره امریکا با نرم افزار رپیدماینر با استفاده از الگوریتم درخت تصمیم و نزدیکترین همسایه
    شناسایی نوع خودرو کاربرد داده کاوی در شناسایی نوع خودرو با نرم افزار رپیدماینر با الگوریتم C4.5

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


Prev
Next
 
پروژه های موجود(28 مورد)
نمایش پروژه ها با جزئیات | نمایش لیستی همه پروژه ها
پیش بینی بار مصرفی برق با درخت تصمیم در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از درخت تصمیم انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش بینی با استفاده از روش درخت تصمیم صورت گرفته و در نهایت بار مصرفی مربوط به یک ساعت، یک روز یا یک هفته پیش بینی شده و در قالب یک فایل اکسل همراه با عد ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پیش بینی بار مصرفی برق با شبکه عصبی MLP در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از شبکه عصبی MLP انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش بینی با اس ...

پیش بینی بار مصرفی برق با ماشین بردار پشتیبان(SVM) در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از ماشین بردار پشتیبان(SVM) انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش ...

پیش بینی بار مصرفی برق با شبکه عصبی در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از شبکه عصبی انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش بینی با استفاده از روش شبکه عصبی صورت گرفته و در نهایت بار مصرفی مربوط به یک ساعت، یک روز یا یک هفته پیش بینی شده و در قالب یک فایل اکسل همراه با عدد ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پروژه خوشه بندی کاربران با رپید ماینر با استفاده از k-means - Rapid miner

این پروژه بروی دیتاست مربوط به کاربران که شامل 6040 رکورد کاربر است. عملیات خوشه بندی با استفاده از الگوریتم k-means انجام می دهد. روش کار بدین صورت است که ابتدا داده های مربوط به کاربران را به نرم افزار دا ...


این پروژه که با نرم افزار داده کاوی rapidminer انجام شده است، بسیار کاربردی و مورد استفاده در مقاطع مختلف می باشد. در پروژه کشف تقلب در سیستم بانکداری الکترونیک از یک دیتاست معتبر که مربوط به تراکنش های بان ...

طبقه بندی الگوی تصویر با الگوریتم درخت تصمیم در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات طبقه بندی الگوی تصویر  با استفاده از درخت تصمیم انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات طبقه بندی با استفاده از روش درخت تصمیم صورت گرفته و در نهایت الگوهای تصاویر  مربوطه طبقه بندی شده و در قالب یک فایل اکسل همراه با عدد طبقه بندی شده به خروجی ارسال م ...

استخراچ قوانین از الگوی تصویر با الگوریتم FP-GROWTH در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات استخراچ قوانین از الگوی تصویر  با استفاده از FP-GROWTH انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات استخراچ قوا ...

خوشه بندی الگوی تصویر با الگوریتم K-MEANS در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات خوشه بندی الگوی تصویر  با استفاده از K-MEANS انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات خوشه بندی با استفاده ا ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


طبقه بندی الگوی تصویر با الگوریتم KNN در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات طبقه بندی الگوی تصویر  با استفاده از KNN انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات طبقه بندی با استفاده از رو ...
 تومان
پروژه طبقه بندی دیتاست حیوانات UCI با استفاده از درخت تصمیم در رپیدماینر

این پروژه با استفاده ار نرم افزار داده کاوی رپیدماینر(rapidminer) تهیه شده است. همانطور که از عنوان پروژه مشخص است در این پروژه الگوریتم درخت تصمیم بروی داده های animals
 تومان
طبقه بندی الگوی تصویر دیتاست UCI با الگوریتم درخت تصمیم در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات طبقه بندی الگوی تصویر  با استفاده از درخت تصمیم انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات طبقه بندی با استفاده از روش درخت تصمیم صورت گرفته و در نهایت الگوهای تصاویر  مربوطه طبقه بندی شده و در قالب یک فایل اکسل همراه با عدد طبقه بندی شده ...

داکیومنت طبقه بندی پروتئین ها با استفاده از روش درخت تصمیم در نرم افزار رپیدماینر

در این پروژه که با نرم افزار داده کاوی رپید ماینر تهیه شده است، عملیات طبقه بندی را با استفاده از درخت تصمیم یا الگوریتم decision tree انجام داده و ضمن رسم درخت نتایج را نیز نمایش می دهد. روال کار بدین صورت ...

داکیومنت طبقه بندی پروتئین ها با استفاده از روش شبکه عصبی در نرم افزار رپیدماینر
    در این پروژه که با نرم افزار داده کاوی رپید ماینر تهیه شده است، عملیات طبقه بندی را با استفاده از شبکه عصبی یا الگوریتم شبکه عصبی انجام داده و ضمن رسم درخت نتایج را نیز نمایش می دهد. روال کار بدین صورت است که ابتدا با توجه به حجم داده های مربوط به پروتئینی که در اختیار داریم، 30% از داده ها را به عنوان داده های تومان
داکیومنت پیش بینی بارش باران با درخت تصمیم با استفاده از روش درخت تصمیم در رپیدماینر

در این پروژه که با نرم افزار داده کاوی رپید ماینر تهیه شده است, عملیات پیش بینی بارندگی را با استفاده از درخت تصمیم یا الگوریتم درخت تصمیم انجام داده و ضمن رسم درخت نتایج را نیز نمایش می دهد. روال کار بدین صورت است که ابتدا با توجه به حجم داده های مربوط به بارندگی که در اختیار داریم, 30% از داده ها را به عنوان داده های ...

داکیومنت پیش بینی بارش باران با استفاده از روش شبکه عصبی(neural network) در رپیدماینر - rapidminer

در این پروژه که با نرم افزار داده کاوی رپید ماینر تهیه شده است, عملیات پیش بینی بارندگی را با استفاده از شبکه عصبی(neural network)  یا الگوریتم شبکه عصبی(neural network

داکیومنت پیش بینی بارش باران با استفاده از روش کا نزدیکترین همسایه(KNN) در رپیدماینر

در این پروژه که با نرم افزار داده کاوی رپید ماینر تهیه شده است, عملیات پیش بینی بارندگی را با استفاده از کا نزدیکترین همسایه(KNN) یا الگوریتم کا نزدیکترین همسایه(KNN 27,800 تومان
داکیومنت پیش بینی بیماری دیابت با استفاده از درخت تصمیم با رپیدماینر- rapidminer

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


در این شبیه سازی که با نرم افزار داده کاوی رپیدماینر انجام شده است عملیات خود را بروی داده های مربوط به بیماری دیابت که از دیتاست های محبوب وب سایت UCI می باشد انجام می دهد. در این پروژه انواع الگوریتم های دس ...

داکیومنت پیش بینی بیماری دیابت با استفاده از کا نزدیکترین همسایه(KNN) با رپیدماینر- rapidminer

در این شبیه سازی که با نرم افزار داده کاوی رپیدماینر انجام شده است عملیات خود را بروی ...

داکیومنت پیش بینی بیماری دیابت با استفاده از نایوبیز(naive bayes) با رپیدماینر- rapidminer

در این شبیه سازی که با نرم افزار داده کاوی رپیدماینر انجام شده است عملیات خود را بروی داده های مربوط به بیماری دیابت که از دیتاست های محبوب وب سایت UCI می باشد انجام می دهد. در این پروژه انواع الگوریتم های دس ...

پروژه طبقه بندی تراکنش های دستگاه خودپرداز(ATM) با استفاده از درخت تصمیم در رپیدماینر - rapidminer

پس از جمع آوری اطلاعات مربوط به ATM، در نهایت در حدود 64 هزار نمونه از تراکنش های موفق و ناموفق مشتریان و مراجعه کنندگان به دستگاه خودپرداز جمع آوری گردیده است.


پروژه طبقه بندی تراکنش های دستگاه خودپرداز(ATM) با استفاده از k نزدیکترین همسایه(KNN) در رپیدماینر - rapidminer
    پس از جمع آوری اطلاعات مربوط به ATM، در نهایت در حدود 64 هزار نمونه از تراکنش های موفق و ...

پروژه طبقه بندی تراکنش های دستگاه خودپرداز(ATM) با استفاده از شبکه عصبی MLP در رپیدماینر - rapidminer

پس از جمع آوری اطلاعات مربوط به ATM، در نهایت در حدود 64 هزار نمونه از تراکنش های موفق و ناموفق مشتریان و مراجعه کنندگان به دستگاه خودپرداز جمع آوری گردیده است.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پروژه طبقه بندی تراکنش های دستگاه خودپرداز(ATM) با استفاده از نایوبیز(naive bayes) در رپیدماینر - rapidminer

پس از جمع آوری اطلاعات مربوط به ATM، در نهایت در حدود 64 هزار نمونه از تراکنش های موفق و ناموفق مشتریان و مراجعه کنندگان به دستگاه خودپرداز جمع آوری گردیده است.


پروژه طبقه بندی تراکنش های دستگاه خودپرداز(ATM) با استفاده از شبکه عصبی در رپیدماینر - rapidminer

پس از جمع آوری اطلاعات مربوط به ATM، در نهایت در حدود 64 هزار نمونه از تراکنش های موفق و ناموفق مشتریان و مراجعه کنندگان به دستگاه خودپرداز جمع آوری گردیده است.


داکیومنت آموزش مدل سازی داده ها در rapidminer

در این داکیومنت بصورت مرحله به مرحله و همچنین به صورت تصوری یک پروژه عملی مدل سازی شده است. این داکیومنت به مدل سازی داده های مربوط به تشخیص بیماریهای سرطانی با استفاده از الگوریتم های مدل سازی طبقه بندی d ...

تشخیص سرطان با استفاده از نمونه برداری طبقه بندی متوازن با rapidminer

این پروژه با استفاده از نرم افزار رپیدماینر یا rapidminer با توجه به یک سری داده که در قالب فایل اکسل و متنی موجود هست ، بیماری سرطان را با استفاده از نمونه برداری طبقه بندی متوازن تشخیص میدهد.

پیش بینی طبقات بیماری با استفاده از دیتا ست ژن ها با rapidminer

تصویر پروژه در ناب پروژه

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com

بازدید : 232 تاریخ : شنبه 14 مرداد 1396 زمان : 17:08 نویسنده : مطلب پروژه نظرات (0)

پباده سازی روشی مبتنی بر الگوریتم ژنتیک برای ارش دهی ویژگی ها جهت سیستم های بازیابی تصاویر را matlab (پردازش تصویر - ارشد)

در لینک دانلود فایل اجرایی پروژه، مقاله ای که با متلب پیاده سازی شده است را دانلود کنید.

این پروژه " روشی مبتنی بر الگوریتم ژنتیک برای ارش دهی ویژگی ها جهت سیستم های بازیابی تصاویر " را با مت ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پروژه مدار عملیات حسابی (VHDL)

در این پروژه که با استفاده از  تومان
داکیومنت آموزش مدل سازی داده ها در rapidminer

در این داکیومنت بصورت مرحله به مرحله و همچنین به صورت تصوری یک پروژه عملی مدل سازی شده است. این داکیومنت به مدل سازی داده های مربوط به تشخیص بیماریهای سرطانی با استفاده از الگوریتم های مدل سازی طبقه بندی d ...

پیش بینی بقای سرطان روده بزرگ بااستفاده از data mining در دیتاهای SEER با نرم افزار داده کاوی knime

دراین مقاله داده های مربوط به سرطان روده بزرگ که از SEERدر دسترس است را آنالیز میکنیم. هدف این مقاله توسعه دقت مدل های پیش بینی بقای سرطان روده بزرگ است. در مراحل preproccesingکه به دقت انجام می شود صفاتی در دو مرحله حذف می شوند ، در مرحله اول صفات به 58می رسند و در مرحله دوم به صفت13 ) رویsynthetic minority over-sampling technique( smote می رسند. و بعد از آن هم ...

تشخیص سرطان با استفاده از نمونه برداری طبقه بندی متوازن با rapidminer

این پروژه با استفاده از نرم افزار رپیدماینر یا rapidminer با توجه به یک سری داده که در قالب فایل اکسل و متنی موجود هست ، بیماری سرطان را با استفاده از نمونه برداری طبقه بندی متوازن تشخیص میدهد.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com



پروژه خوشه بندی کاربران با وکا با استفاده از k-means - Weka

این پروژه بروی دیتاست مربوط به کاربران که شامل 6040 رکورد کاربر است. عملیات خوشه بندی با استفاده از الگوریتم k-means انجام می دهد. روش کار بدین صورت است که ابتدا داده های مربوط به کاربران را به نرم افزار دا ...

پروژه خوشه بندی کاربران با رپید ماینر با استفاده از k-means - Rapid miner

این پروژه بروی دیتاست مربوط به کاربران که شامل 6040 رکورد کاربر است. عملیات خوشه بندی با استفاده از الگوریتم k-means انجام می دهد. روش کار بدین صورت است که ابتدا داده های مربوط به کاربران را به نرم افزار دا ...

پیش بینی بار مصرفی برق با شبکه عصبی در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از شبکه عصبی انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش بینی با استفاده از روش شبکه عصبی صورت گرفته و در نهایت بار مصرفی مربوط به یک ساعت، یک روز یا یک هفته پیش بینی شده و در قالب یک فایل اکسل همراه با عدد ...

پیش بینی بار مصرفی برق با ماشین بردار پشتیبان(SVM) در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از ماشین بردار پشتیبان(SVM) انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش ...

پیش بینی بار مصرفی برق با شبکه عصبی MLP در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از شبکه عصبی MLP انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش بینی با اس ...

پیش بینی بار مصرفی برق با درخت تصمیم در رپیدماینر - Rapid miner

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از درخت تصمیم انجام شده است. ورودی مسئله دیتاست بار مصرفی مربوط به یک سال بوده و عملیات پیش بینی با استفاده از روش درخت تصمیم صورت گرفته و در نهایت بار مصرفی مربوط به یک ساعت، یک روز یا یک هفته پیش بینی شده و در قالب یک فایل اکسل همراه با عد ...

پیاده سازی کشف تقلب در سیستم بانکداری الکترونیک با رپیدماینر – شبیه سازی مقاله isi سال 2014

این پروژه که با نرم افزار داده کاوی rapidminer انجام شده است، بسیار کاربردی و مورد استفاده در مقاطع مختلف می باشد. در پروژه کشف تقلب در سیستم بانکداری الکترونیک از یک دیتاست معتبر که مربوط به تراکنش های بان ...

پروژه خوشه بندی بار مصرفی با وکا با استفاده از k-means - Weka

این پروژه بروی دیتاست مربوط به بار مصرفی که شامل 365 روز از سال است. عملیات خوشه بندی با استفاده از الگوریتم k-means انجام می دهد. روش کار بدین صورت است که ابتدا داده های مربوط به بار مصرفی را به نرم افزار ...

پیاده سازی شناسایی بیماری دیابت نوع 2 با الگوریتم SVM با زبان متلب – matlab

این پروژه که با استفاده از زبان برنامه نویسی متلب 2013 نسخه a انجام شده است شناسایی بیماری دیابت نوع 2 با استفاده از الگوریتم ماشین بردار پشتیبان یا SVM

شبیه سازی Spell Checker با استفاده از روشهای متن کاوی

هدف اصلی این پروژه که با زبان برنامه نویسی سی شارپ تهیه شده است این است که یک دیتاست بزرگ حاوی جملات درست و غلط هم از لحاظ معنایی و هم از لحاظ املایی را دریافت میکند، کلیه کلمات اضافه، کلمات غلط و کلمات درست را شناسایی کرده و بررسی می کند که کدام کلمات غلط املایی و معنایی دارند و معادل درست آنها را پیش بینی کرده و پیشنهاد میکند. این عملیات ب ...

پیش بینی بار مصرفی برق بروی داده های خوشه بندی شده با الگوریتم ARIME در نرم افزار SPSS

در این پروژه که با نرم افزار SPSS آماری تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از الگوریتم ARIME

پروژه خوشه بندی بروی متون مربوط به بیماری ها با استفاده از k-means – C#

این پروژه به که با زبان برنامه نویسی سی شارپ تهیه شده است یک دیتاست مربوط به متون بیماری و مجموعه لغات مربوطه که بیش از 1 میلیون نمونه است را در قالب داده های آزمایشی و داده های آموزشی دریافت کرده و با استفاده از الگوریتم خوشه بندی k-means 32,500 تومان
پیاده سازی پروژه TextMining- تعیین وابستگی قیدی به اسم یا فعل با استفاده از الگوریتم نایو بیز – C#

هدف اصلی این پژوهش پیشبینی وابستگی قیدی به اسم یا فعل با استفاده از الگوریتم نایو بیز میباشد. در واقع کار اصلی که قرار است در این پروژه انجام شود این است که حرف اضافه و اسمی که در هر نمونه از داده ها وجود دارد به فعل بر میگردد یا اسم. این پروژه با استفاده از زبان برنامه نویسی سی شارپ مدل سازی شده است.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پیش بینی بار مصرفی برق با ترکیب الگوریتم ARIME در نرم افزار SPSS

در این پروژه که با نرم افزار SPSS آماری تهیه شده است، عملیات پیش بینی بار مصرفی برق با استفاده از الگوریتم ARIME

شناسایی تراکنش های موفق و ناموفق در دستگاههای خودپرداز با استفاده از الگوریتم شبکه عصبی MLP در Matlab

در این پروژه که با زبان برنامه نویسی متلب نوشته شده است با استفاده از الگوریتم MLP که یکی از مهمترین الگوریتم های شبکه عصبی است تراکنش های موفق و نا موفق مشتریان را شناسایی کرده و میزان دقت و خطا را بر می گرد ...

شناسایی تراکنش های موفق و ناموفق در دستگاههای خودپرداز با استفاده از الگوریتم شبکه عصبی MLP در Rapidminer

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


در این پروژه که با زبان برنامه نویسی رپیدماینر نوشته شده است با استفاده از الگوریتم MLP که یکی از مهمترین الگوریتم های شبکه عصبی است تراکنش های موفق و نا موفق مشتریان را شناسایی کرده و میزان دقت و خطا را بر م ...

شناسایی تراکنش های موفق و ناموفق در دستگاههای خودپرداز با استفاده از الگوریتم زنبور عسل مصنوعی در Matlab

در این پروژه که با زبان برنامه نویسی متلب نوشته شده است با استفاده از الگوریتم زنبور عسل مصنوعی که یکی از مهمترین الگوریتم های شبکه عصبی است تراکنش های موفق و نا موفق مشتریان را شناسایی کرده و میزان دقت و خطا را بر می گرداند.

طبقه بندی الگوی تصویر با الگوریتم KNN در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات طبقه بندی الگوی تصویر  با استفاده از KNN انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات طبقه بندی با استفاده از رو ...

خوشه بندی الگوی تصویر با الگوریتم K-MEANS در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات خوشه بندی الگوی تصویر  با استفاده از K-MEANS انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات خوشه بندی با استفاده ا ...

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


استخراچ قوانین از الگوی تصویر با الگوریتم FP-GROWTH در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات استخراچ قوانین از الگوی تصویر  با استفاده از FP-GROWTH انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات استخراچ قوا ...

طبقه بندی الگوی تصویر با الگوریتم درخت تصمیم در رپیدماینر - Rapid miner

در این پروژه که با نرم افزار رپید ماینر نسخه 5 تهیه شده است، عملیات طبقه بندی الگوی تصویر  با استفاده از درخت تصمیم انجام شده است. ورودی مسئله دیتاست الگوهای تصاویر  بوده و عملیات طبقه بندی با استفاده از روش درخت تصمیم صورت گرفته و در نهایت الگوهای تصاویر  مربوطه طبقه بندی شده و در قالب یک فایل اکسل همراه با عدد طبقه بندی شده به خروجی ارسال م ...

داکیومنت کامل در مورد نرم افزار داداکاوی SPSS Modeler 14.2
این پروژه شامل داکیومنت کاملی در خصوص نرم افزار SPSS Modeler 14.2 و در قالب فایل word,pdf,powerpoint جهت ارائه به استاد میباشد . این پروژه همچنین شامل یک فایل پاور پونت بسیار کاربردی و مطابق با استاندارد شیوه ارائه مطالب مباشد .
در این پروژه داکیومنت کاملی از امکانات موجود در نرم افزار spss modeler همراه با تصاویر , تاریخچه SPSS و IBM SPSS Modeler, IBM SPSS Modeler, نسخه های IBM SPSS Modeler, پلت فرم، سیستم عامل، سخت افزار و نرم افز ...

داکیومنت نر افزار داده کاوی در weka

پیش بینی طبقات بیماری با استفاده از دیتا ست ژن ها با rapidminer

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پیش بینی طبقات بیماری با استفاده از دیتا ست ژن ها با weka
پروژه پیش بینی طبقات بیماری با استفاده از دیتا ست ژن ها با weka شامل انواع مدل سازی بر اساس الگوریتم های j48 , naivebayes, decision tree, IB! , IB2 , IB3 میباشد. داکومنت و مدل های تولید شده نیز پس از خرید در اختیارتان قرار داده میشود .

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com

بازدید : 64 تاریخ : شنبه 14 مرداد 1396 زمان : 17:08 نویسنده : مطلب پروژه نظرات (0)

  آموزش نرم افزار کلمنتاین Clementine 12
آموزش نرم 14.2 افزارIBM SPSS Modeler
انجام پروژه های داده کاوی با نرم افزارClementine 12
انجام پروژه های داده کاوی با نرم افزار.2 14 IBM SPSS Modeler
انجام پروژه های داده کاوی با نرم افزار رپیدماینر rapidminer
انجام پروژه های داده کاوی با نرم افزار وکا weka

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


فرآیند داده کاوی CRISP-DM
آشنایی با قابلیت های SPSS Modeler14.2
فرآیند داده کاوی در SPSS Modeler14.2
شناسایی و آماده سازی مقدماتی داده ها
فراخوانی داده ها در محیط SPSS Modeler14.2
بررسی مفاهیم Storage و Type و اهمیت آنها
یکپارچه سازی داده ها (Merge and Append)
بررسی شاخص های کیفی داده ها (Data Audit)
مطالعه توصیفی و استنباطی داده ها در SPSS Modeler14.2
مدل های پیش بینی کننده
طبقه بندی با انواع درخت های تصمیم در SPSS Modeler14.2
استفاده از درخت های رگرسیونی به منظور پیش بینی
ساخت مدل های پیش بینی کننده با شبکه های عصبی مصنوعی
ارزیابی مقدماتی مدلهای پیش بینی کننده

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


پروژه آماده داده کاوی با نرم افزار - weka - clementine 12
پروژه آماده داده کاوی با نرم افزار - rapidminer - clementine 12
پروژه آماده داده کاوی با نرم افزار - clementine 12

انجام پروژه های داده کاوی با نرم افزار کلمنتاین Clementine12
در کوتاه ترین زمان با کمترین قیمت
بیش از 30 نوع دیتاست مختلف با انواع موضوعات متفاوت در سایت پروژه های 21
ت

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

:

انجام پروژه های داده کاوی با نرم افزار وکاweka
در کوتاه ترین زمان با کمترین قیمت
بیش از 30 نوع دیتاست مختلف با انواع موضوعات متفاوت در سایت پروژه های 21


انجام پروژه های داده کاوی با نرم افزار رپیدماینر rapidminer
در کوتاه ترین زمان با کمترین قیمت
بیش از 30 نوع دیتاست مختلف با انواع موضوعات متفاوت در سایت پروژه های 21

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


انجام پروژه های داده کاوی با نرم افزار SPSS Modeler14.2
در کوتاه ترین زمان با کمترین قیمت
بیش از 30 نوع دیتاست مختلف با انواع موضوعات متفاوت در سایت پروژه های 21

بازدید : 53 تاریخ : شنبه 14 مرداد 1396 زمان : 17:07 نویسنده : مطلب پروژه نظرات (0)

رآیند داده کاوی در Rapid Miner
کد دوره: RM-1301
دوره های تخصصی نرم افزار های داده کاوی

    فرآیند داده کاوی در IBM SPSS Modeler
    تحلیل آماری در IBM SPSS Statistics
    فرآیند داده کاوی در Weka

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


بنا بر تحقیقات انجام شده RapidMiner یکی از پرکاربرد ترین نرم افزارهای داده کاوی طی سال های اخیر بوده است. متن باز بودن و استفاده از کتابخانه های آن برای برنامه نویسان به همراه امکان استفاده از محیط گرافیکی آن بدون استفاده از دانش برنامه نویسی باعث گشته طیف متنوعی از کاربران به سراغ این ابزار متمایل گردند.

تنوع الگوریتم های آماده سازی و مدلسازی در این ابزار باعث شده تا بسیاری از پروژه های تحقیقاتی، آکادمیک و همچنین پروژه های اجرایی حداقل بخشی از روند پیاده سازی مدل ها را در این ابزار مورد آزمایش قرار دهند. مخاطبان این دوره دانشجویان و محققان واحدهای تحقیقاتی می باشند.

محتوای دوره

    مدت دوره: 16 ساعت
    مخاطب دوره:
    دانشجویان و محققان واحدهای تحقیقاتی
    پیش نیاز دوره:
    آشنایی مقدماتی با مفاهیم آمار کاربردی، فرآیند داده کاوی و الگوریتم های داده کاوی
    مدرس:
    احسان اژدری
    تحلیلگر ارشد داده کاوی
   

    آشنایی با محیط Rapid Miner
        کار با مخازن
        ساخت و کنترل فرایندها
        عملگرهای عمومی

    آماده سازی داده ها

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

        خواندن از منابع متنوع داده
        تعیین نقش و نوع متغیرها
        تبدیل و تولید متغیرها
        پاکسازی داده های پرت
        برآورد داده های ناموجود
        نمونه گیری
        ترکیب داده ها
        کاهش ابعاد
        انتخاب متغیر
    مدل سازی
        عملگرهای عمومی در مدلها
        مدلهای رگرسیونی
        درخت های تصمیم
        شبکه های عصبی مصنوعی
        استنتاج قانون
        مدل های SVM

        خوشه بندی با

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com

بازدید : 232 تاریخ : شنبه 14 مرداد 1396 زمان : 17:06 نویسنده : مطلب پروژه نظرات (0)

مقدماتی داده کاوی
متوسطه داده کاوی
آشنایی با داده کاوی
 داده کاوی و بانک و بیمه
داده کاوی و مدیریت ارتباط با مشتری
 داده کاوی و مدیریت دانش
   داده کاوی و صنایع تولیدی
    داده کاوی و خدمات شهری

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


کلاس های آموزش داده کاوی  ←

کلاس های آموزشی دایکه با تاکید بر چگونگی اجرای مفاهیم و دانش تئوریک در پروژه های کاربردی طراحی و برنامه ریزی شده است.

شرکت کنندگان در این دوره ها قادر خواهند بود پس از پایان این دوره ها فرآیند داده کاوی را بصورت نرم افزاری پیاده سازی کنند.

گروه داده کاوی دایکه با بیش از 9 سال سابقه مفید در زمینه آموزش، مشاوره و اجرای پروژه های داده کاوی، با ارائه دوره های کاربردی و انتقال تجربیات خود، هزینه ی پیاده سازی این دانش را در سازمان ها کاهش داده است.

    شرایط و قوانین ثبت نام
    دوره های تخصصی نرم افزار های داده کاوی
    دوره های پیش نیاز داده کاوی
    دوره های ویژه داده کاوی
    دوره های پیشرفته داده کاوی
    دوره های تخصصی برنامه نویسی داده کاوی

جزئیات بیشتر: کلاس های آموزش داده کاوی ›
آخرین دوره های آموزش داده کاوی   ←

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بازدید : 139 تاریخ : شنبه 14 مرداد 1396 زمان : 17:04 نویسنده : مطلب پروژه نظرات (0)

تنها، تحلیل عمیق از مشتریان و رفتار آنهاست که می تواند منجر به تعیین استراتژی های مناسب برای هر گروه از مشتریان گردد.

تحقیقات بازار با در نظر داشتن این نکته مهم به عنوان یک روش حل مساله موجب فروش بیشتر، ایجاد روابط متقابل با مشتری و تضمین سودآوری شرکت می شود.

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


در واقع تحقیقات بازار از لحاظ علمی به معنی فرایند طراحی، جمع آوری، تحلیل و ارائه سیستماتیک داده ها و یافته های مربوط به یک وضعیت خاص بازاریابی می باشد که شرکت با آن مواجه شده است.
ضمانت اجرایی لازم برای کیفیت یک تحقیق

خلاقیت در طرح مساله درست و تعیین روش حل آن، جمع آوری داده های مفید و صحیح از جامعه، به همراه قدرت تحلیل آماری داده ها از منظر کسب کار مربوطه، ضمانت اجرایی لازم برای کیفیت یک تحقیق را ایجاد می کند.

دایکه با تکیه بر نبوغ و خلاقیت تیم خود در کنار همکاری موثر با شرکت های مطرح بازاریابی و تجربه گرانبهای هفت سال تحلیل پیشرفته آماری و داده کاوی در حوزه های متنوعی از کسب و کار، آماده است تا ضعف تحلیل در پروژه های تحقیقات بازار را پوشش داده و گامی شایسته در ارتقای کیفیت پروژه های تحقیقات بازار در ایران بردارد.

بخش های گروه تحقیقات بازار دایکه

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


    بخش تحلیل
        تحلیل آماری (توصیفی و استنباطی) داده کاوی:
            پیش بینی
            آنالیز وابستگی
            خوشه بندی
        تحلیل Direct Marketing
    بخش نمونه گیری و طراحی پرسشنامه
        طراحی انواع پرسشنامه
        اجرای انواع نظرسنجی
        تعیین طرح نمونه گیری
        سنجش روایی و پایایی پرسشنامه

    بخش کیفی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

        گروه کانونی focus group
        جلسات طوفان ذهنی brainstorming
        مصاحبه های عمیق IDI
        خرید مخفیانه mystery shopping
    بخش کمی
        مصاحبه رو در رو face to face
        مصاحبه تلفنی TI،CATI
        مصاحبه آنلاین Online surveys
        پیمایش پانلی Panel surveys

خدمات تحقیقات بازار

    تحقیقات از نگاه بازار
        تعیین جایگاه برند، محصولات و خدمات
        اندازه گیری سهم بازار و بخش بندی بازار
        بررسی بازار خدمات و محصولات جدید
        پیش بینی میزان مصرف و تقاضا

    تحقیقات از نگاه مشتری

 

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

        دموگرافی و اینفوگرافی مشتریان
        سنجش رضایت مشتریان
        تحلیل رفتار و عادات مصرف کنندگان
        شناسایی مشتریان بالقوه و مشتریان وفادار
    تحقیقات از نگاه محصولات و خدمات
        تحلیل داده های فروش (بر اساس خریدار، منطقه جغرافیایی، نوع محصول، دوره های زمانی،...)
        ارزیابی ثمر بخشی تبلیغات بر میزان فروش و برند سازی
        بررسی کیفیت محصول(رنگ، فرم، بسته بندی و ...)
        هدف گذاری و موقعیت یابی محصول(STP)

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بازدید : 171 تاریخ : شنبه 14 مرداد 1396 زمان : 17:04 نویسنده : مطلب پروژه نظرات (0)

جرای پروژه های داده کاوی
    مشاوره داده کاوی
    آموزش داده کاوی
    تحقیقات بازار
پروژه ی داده کاوی به دو صورت تحقیقاتی-پایلوت و عملیاتی قابل پیاده سازی است.
پژه های عملیاتی با فرض اعمال شدن در فرایند تولید یک شرکت به اجرا در می آیند در حالی که پروژه های تحقیقاتی-پایلوت اینطور نیستند و تنها برای بررسی و کشف واقعیت های پنهان یک سازمان یا یک شرکت تعریف می شوند.

اجرای پروژه تحقیقاتی و پایلوت داده کاوی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

صورت معمول پروژه ی داده کاوی در دو فاز پایلوت و عملیاتی اجرا می شود که فاز پایلوت-تحقیقاتی پیش نیاز فاز عملیاتی به حساب می آید.
هدف از اجرای پروژه ی داده کاوی بصورت پایلوت، صرفاً درک بهتر از واقعیت های پنهان فرایند سازمانی یا فرایند تولید در یک شرکت است.
کشف واقعیت های یک فرآیند، پارامتر های تاثیرگذار در آن و یافتن مقاطع زمانی سودآور یا زیان آور آن فرایند در طول سال های گذشته، می تواند در تصمیم گیری و آینده ی آن سازمان/شرکت تاثیرات حیاتی داشته باشد.

اجرای پروژه عملیاتی داده کاوی

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

در انتهای فرایند داده کاوی در حل مشکلات یک شرکت یا سازمان، بحث توسعه ی نرم افزاری وجود دارد که به پیش بینی آینده ی آن شرکت/سازمان می پردازد و راهکار های مشخصی برای بهبود وضع موجود ارائه می کند.
این راهکارها بصورت مشخص به مجموعه مدیریت آن سازمان/شرکت پیشنهادات عملی ارائه می کند تا با اعمال تغییراتی در برخی پارامترهای سازمانی یا خط تولید، بهره وری آن مجموعه افزایش پیدا کند و به سودآوری بیشتر و کاهش ضررهای وضعیت موجود منجر شود.

بازدید : 163 تاریخ : شنبه 14 مرداد 1396 زمان : 17:03 نویسنده : مطلب پروژه نظرات (0)

 آموزش و انجام پروژه های داده کاوی با نرم افزارهای rappidminer وکا و کلمنتاین
انجام پروژه های داده کاوی با نرم افزار RapidMiner

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

آموزش نرم افزار کلمنتاین Clementine 12

آموزش نرم افزار کلمنتاین Clementine 12
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

آموزش  نرم افزار14 IBM SPSS Modeler

انجام پروژه های داده کاوی با نرم افزارClementine 12

انجام پروژه های داده کاوی با نرم افزار 14 IBM SPSS Modeler

        فرآیند داده کاوی CRISP-DM
        آشنایی با قابلیت های SPSS Modeler14.2
        فرآیند داده کاوی در SPSS Modeler14.2
    شناسایی و آماده سازی مقدماتی داده ها
        فراخوانی داده ها در محیط SPSS Modeler14.2
        بررسی مفاهیم Storage و Type و اهمیت آنها
        یکپارچه سازی داده ها (Merge and Append)
        بررسی شاخص های کیفی داده ها (Data Audit)
        مطالعه توصیفی و استنباطی داده ها در SPSS Modeler14.2
    مدل های پیش بینی کننده
        طبقه بندی با انواع درخت های تصمیم در SPSS Modeler14.2
        استفاده از درخت های رگرسیونی به منظور پیش بینی
        ساخت مدل های پیش بینی کننده با شبکه های عصبی مصنوعی
        ارزیابی مقدماتی مدلهای پیش بینی کننده

09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

دانلود نرم افزار داده کاوی رپیدماینر RapidMiner

بنابر تحقیقات انجام شده نرم افزار RapidMiner یکی از پرکاربرد ترین نرم افزارهای داده کاوی طی سال های اخیر بوده است. متن باز بودن و استفاده از کتابخانه های آن برای برنامه نویسان به همراه امکان استفاده از محیط گرافیکی آن بدون استفاده از دانش برنامه نویسی باعث گشته طیف متنوعی از کاربران به سراغ این ابزار متمایل گردند. تنوع الگوریتم های آماده سازی و مدلسازی در این ابزار باعث شده تا بسیاری از پروژه های تحقیقاتی، آکادمیک و همچنین پروژه های اجرایی حداقل بخشی از روند پیاده سازی مدل ها را در این ابزار مورد آزمایش قرار دهند.

برای دانلود نرم افزار داده کاوی رپیدماینر کلیک کنید .

آموزش نرم افزار داده کاوی وکا weka

آموزش نرم افزار داده کاوی وکا Weka

 

مقدمه

  تا به امروز نرم افزارهای تجاری و آموزشی فراوانی برای داده کاوی در حوزه های مختلف داده ها به دنیای علم و فناوری عرضه شده اند. هریک از آنها با توجه به نوع اصلی داده هایی که مورد کاوش قرار میدهند، روی الگوریتمهای خاصی متمرکز شده اند. مقایسه دقیق و علمی این ابزارها باید از جنبه های متفاوت و متعددی مانند تنوع انواع و فرمت داده های ورودی، حجم ممکن برای پردازش داده ها، الگـوریتمهای پیاده سـازی شده، روشهای ارزیابی نتایج، روشهای مصـور سـازی، روشهای پیش پردازش داده ها، واسطهای کاربر پسند، پلت‌فرمهای سازگار برای اجرا،قیمت و در دسترس بودن نرم افزار صورت گیرد. از آن میان، نرم افزار Weka با داشتن امکانات بسیار گسترده،امکان مقایسه خروجی روشهای مختلف با هم، راهنمای خوب، واسط گرافیگی کارا، سازگاری با سایر برنامه های ویندوزی، و از همه مهمتر وجود کتابی بسیار جامع و مرتبط با آن [Data Mining, witten et Al. 2005 ] ، معرفی میشود.

 

1- معرفی نرم افزار Weka

میزکارWeka ، مجموع‌های از الگوریتمهای روز یادگیری ماشینی و ابزارهای پیش پردازش داده‌ها میباشد. این نرم‌افزار به گونه‌ای طراحی شده است که میتوان به سرعت، روشهای موجود را به صورت انعطافپذیری روی مجموعه‌های جدید داده، آزمایش نمود. این نرم‌افزار، پشتیبانی‌های ارزشمندی را برای کل فرآیند داده کاوی های تجربی فراهم میکند. این پشتیبانی‌ها، آماده سازی داده‌های ورودی، ارزیابی آماری چارچوبهای یادگیری و نمایش گرافیکی داده‌های ورودی و نتایج یادگیری را در بر میگیرند. همچنین، هماهنگ با دامنه وسیع الگوریتمهای یادگیری، این نرم‌افزار شامل ابزارهای متنوع پیش پردازش داده‌هاست. این جعبه ابزار متنوع و جامع، از طریق یک واسط متداول در دسترس است، به نحوی که کاربر میتواند روشهای متفاوت را در آن با یکدیگر مقایسه کند و روشهایی را که برای مسایل مدنظر مناسبتر هستند، تشخیص دهد.

نرم‌افزار Weka در دانشگاه Waikato واقع در نیوزلند توسعه یافته است و اسم آن از عبارت"Waikato Environment for knowledge Analysis" استخراج گشته است. همچنین Weka ، نام پرندهای با طبیعت جستجوگر است که پرواز نمیکند و در نیوزلند، یافت میشود. (شکل زیر)

این سیستم به زبان جاوا نوشته شده و بر اساس لیسانس عمومی و فراگیر GNU انتشار یافته است.Weka تقریباً روی هر پلت فرمی اجرا میشود و نیز تحت سیستم عاملهای لینوکس، ویندوز، و مکینتاش، و حتی روی یک منشی دیجیتالی شخصی، آزمایش شده است.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

این نرم افزار، یک واسط همگون برای بسیاری از الگوریتمهای یادگیری متفاوت، فراهم کرده است که از طریق آن روشهای پیش پردازش، پس از پردازش و ارزیابی نتایج طرح های یادگیری روی همه مجموعه های داده موجود، قابل اعمال است.

نرم افزار Weka ، پیاده سازی الگوریتمهای مختلف یادگیری را فراهم میکند و به آسانی میتوان آنها را به مجموعه های داده خود اعمال کرد.

  همچنین، این نرم افزار شامل مجموعه متنوعی از ابزارهای تبدیل مجموعه‌های داده ها، همانند الگوریتمهای گسسته سازی میباشد. در این محیط میتوان یک مجموعه داده را پیش پردازش کرد، آن را به یک طرح یادگیری وارد نمود، و دسته‌بندی حاصله و کارآیی‌اش را مورد تحلیل قرار داد.( همه این کارها، بدون نیاز به نوشتن هیچ قطعه برنامه‌ای میسر است.)

  این محیط، شامل روشهایی برای همه مسایل استاندارد داده کاوی مانند رگرسیون، رده‌بندی، خوشه‌بندی، کاوش قواعد انجمنی و انتخاب ویژگی میباشد. با در نظر گرفتن اینکه، داده‌ها بخش مکمل کار هستند، بسیاری از ابزارهای پیش پردازش داده‌ها و مصورسازی آنها فراهم گشته است. همه الگوریتم ها، ورودیهای خود را به صورت یک جدول رابطهای به فرمت ARFF دریافت میکنند. این فرمت داده‌ها، میتواند از یک فایل خوانده شده یا به وسیله یک درخواست از پایگاه دادهای تولید گردد.

یکی از راههای به کارگیری Weka ، اعمال یک روش یادگیری به یک مجموعه داده و تحلیل خروجی آن برای شناخت چیزهای بیشتری راجع به آن اطلاعات میباشد. راه دیگر استفاده از مدل یادگیری شده برای تولید پیشبینی‌هایی در مورد نمونه‌های جدید است. سومین راه، اعمال یادگیرنده‌های مختلف و مقایسه کارآیی آنها به منظور انتخاب یکی از آنها برای تخمین میباشد. روشهای یادگیری Classifier نامیده میشوند و در واسط تعاملی Weka ، میتوان هر یک از آنها را از منو انتخاب نمود. بسیاری از classifier ها پارامترهای قابل تنظیم دارند که میتوان از طریق صفحه ویژگی‌ها یا object editor به آنها دسترسی داشت. یک واحد ارزیابی مشترک، برای اندازه‌گیری کارآیی همه classifier به کار میرود.

پیاده سازیهای چارچوبهای یادگیری واقعی، منابع بسیار ارزشمندی هستند که Weka فراهم می کند. ابزارهایی که برای پیش پردازش داده‌ها استفاده میشوند Filter نامیده میشوند. همانند classifier ها، میتوان filter ها را از منوی مربوطه انتخاب کرده و آنها را با نیازمندیهای خود، سازگار نمود. در ادامه، به روش به کارگیری فیلترها اشاره میشود.

  علاوه بر موارد فوق، Weka شامل پیاده سازی الگوریتمهایی برای یادگیری قواعد انجمنی، خوشه‌بندی داده‌ها در جایی که هیچ دست‌های تعریف نشده است، و انتخاب ویژگیهای مرتبط در داده‌ها میباشد.

 

 

2- روش استفاده از Weka

جهت درک بهتر مطالب این بخش، یک پایگاه داده با فرمت (comma-separated format ) .csv به نام bank-data.csv به عنوان مثال در نظر گرفته میشود. این بانک اطلاعاتی شامل اطلاعاتی در مورد 600 فرد مختلف است که فیلدهای تشکیل دهنده آن به شرح زیر هستند:

3- واسط های Weka

شکل 1،راههای انتخاب واسط‌های مختلف Weka را نشان میدهد. آسانترین راه استفاده از Weka از طریق واسطی گرافیکی است که Explorer خوانده میشود. این واسط گرافیکی، به وسیله انتخاب منوها و پر کردن فرمهای مربوطه، دسترسی به همه امکانات را فراهم کرده است. برای مثال، میتوان به سرعت یک مجموعه داده را از یک فایل ARFF خواند و درخت تصمیم‌گیری آن را تولید نمود. اما درختهای تصمیم‌گیری یادگیرنده صرفاً ابتدای کار هستند. الگوریتمهای بسیار دیگری برای جستجو وجود دارند. واسط Explorer کمک میکند تا الگوریتمهای دیگر نیز آزمایش شوند.

 

شکل 1. Weka در وضعیت انتخاب واسط

این واسط با در اختیار گذاشتن گزینه‌ها به صورت منو، با وادار کردن کاربر به اجرای کارها با ترتیب صحیح، به وسیله خاکستری نمودن گزینه‌ها تا زمان صحیح به کارگیری آنها، و با در اختیار گذاشتن گزینه‌هایی به صورت فرمهای پرشدنی، کاربر را هدایت میکند. راهنمای ابزار مفیدی، حین عبور ماوس از روی گزینه‌ها، ظاهر شده و اعمال لازم مربوطه را شرح میدهد. پیشفرض‌های معقول قرار داده شده، کاربر را قادر میسازند تا با کمترین تلاشی، به نتیجه برسد. اما کاربر باید برای درک معنی نتایج حاصله، راجع به کارهایی که انجام میدهد، بیندیشد.

 Wekaدو واسط گرافیکی دیگر نیز دارد. واسط knowledge flow به کاربر امکان میدهد تا چنیش‌هایی برای پردازش داده‌های در جریان، طراحی کند. یک عیب پایهای Explorer نگهداری هر چیزی در حافظه اصلی آن است. (زمانی که یک مجموعه داده را باز میکنیم، Explorer ، کل آن را، در حافظ باز میکند) نشان میدهد که Explorer ، صرفاً برای مسایل با اندازه‌های کوچک تا متوسط، قابل اعمال است. با وجود بر این Weka شامل تعدادی الگوریتمهای افزایشی است که میتواند برای پردازش مجموعه های داده بسیار بزرگ مورد استفاده قرار گیرد. واسط knowledge flow امکان میدهد تا جعبه‌های نمایانگر الگوریتمهای یادگیری و منابع داده‌ها را به درون صفحه بکشیم و با اتصال آنها به یکدیگر، ترکیب و چینش دلخواه خود را بسازیم. این واسط اجازه میدهد تا جریان دادهای از مؤلفه‌های به هم متصل که بیانگر منابع داده، ابزارهای پیش پردازش، روشهای ارزیابی و واحدهای مصوّر سازی هستند تعریف شود. اگر فیلترها و الگوریتمهای یادگیری، قابلیت یادگیری افزایشی را داشته باشند، داده‌ها به صورت افزایشی بار شده و پردازش خواهند شد.

  سومین واسط Weka ، که Experimenter خوانده میشود، کمک میکند تا به این سؤال عملی و پایهای کاربر حین استفاده از تکنیکهای رده‌بندی و رگرسیون، پاسخ دهد: «چه روشها و پارامترهایی برای مسأله داده شده، بهتر عمل میکنند؟ »

  عموماً راهی برای پاسخگویی مقدماتی به این سؤال وجود ندارد و یکی از دلایل توسعهWeka ، فراهم نمودن محیطی است که کاربران Weka را قادر به مقایسه تکنیکهای گوناگون یادگیری بنماید. این کار، میتواند به صورت تعاملی در Explorer انجام شود. با این وجود، Experimenter با ساده کردن اجرای رده‌بندی کننده‌ها و فیلترها با پارامترهای گوناگون روی تعدادی از مجموعه‌های داده، جمع‌آوری آمار کارآیی و انجام آزمایـشهای معنا، پردازش را خودکار میکند. کـاربرهای پیشرفته، میتوانند از Experimenter برای توزیع بار محاسباتی بین چندین ماشین، استفاده کنند. در این روش، میتوان آزمایشهای آماری بزرگی را راه‌اندازی نموده و آنها را برای اجرا، رها نمود.

  ورای این واسطهای تعاملی، عملکرد پایهای Weka قرار دارد. توابع پایهای Weka ، از طریق خط فرمانهای متنی قابل دسترسی هستند. زمانی که Weka ، فعال میشود، امکان انتخاب بین چهار واسط کاربری وجود داردExplorer ، knowledge ،Experimenter و واسط خط فرمان. اکثر کاربران، حداقل در ابتدای کار Explorer را به عنوان واسط کاربری انتخاب میکنند.

 

3-1 واسط Explorer
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

واسط گرافیکی اصلی برای کاربران، Explorer است که امکان دسترسی به همه امکانات Weka را از طریق انتخاب منوها و پر کردن فرمها فراهم میآورد. شکل 2،نمای Explorer را نشان میدهد. در این واسط، شش پانل مختلف وجود دارد که از طریق نوار بالای صفحه قابل انتخاب هستند و با وظایف داده کاوی پشتیبانی شده توسط Weka متناظر میباشند.

شکل 2. واسط گرافیکیExplorer

به طور خلاصه، کارکرد تمام گزینه ها به شرح ذیل است

    Preprocess: انتخاب مجموعه داده و اصلاح آن از راههای گوناگون
     Classify: آموزش برنامه‌های یادگیری که رده‌بندی یا رگرسیون انجام میدهند و ارزیابی آنها
     Cluster: یادگیری خوشه‌ها برای مجموعه های داده
     Associate: یادگیری قواعد انجمنی برای داده‌ها و ارزیابی آنها
     Select attributes: انتخاب مرتبط‌ترین جنبه ها در مجموعه های داده
     Visualize: مشاهده نمودارهای مختلف دوبعدی داده‌ها و تعامل با آنها

در بخشهای بعدی به تشریح گزینه‌های مذکور و بیان جزئیات کار با هرکدام خواهم پرداخت.

Weka Explorer امکان رده بندی دارد، چنانچه به کاربران اجازه میدهد به صورت تعاملی اقدام به ساخت درخت تصمیم‌گیری کنند. Wekaنمودار پراکندگی داده‌ها را نسبت به دو ویژگی انتخاب شده، فراهم میآورد. وقتی زوج ویژگی‌ای که رده‌ها را به خوبی جدا میکند، پیدا شد، امکان ایجاد دو شاخه با کشیدن چند ضلعی اطراف نقاط داده‌ها بر نمودار پراکندگی وجود دارد.

هر نوار، دسترسی به دامنه کاملی از امکانات را فراهم میکند. در پایین هر پانل، جعبه status و دکمه log قرار دارد. جعبه status پیغامهایی است که نشان میدهد چه عملیاتی در حال انجام داده شدن است. مثلاً اگر Explores مشغول خواندن یک فایل باشد، جعبه status آن را گزارش میدهد. کلیک راست در هر جا داخل این جعبه یک منو کوچک با دو گزینه میآورد، نمایش میزان حافظه در دسترس Weka و اجرای Java garbage collector .

لازم است توجه شود که garbage collector به طور ثابت به عنوان یک عمل پیش زمینه در هر حال اجرا میشود کلیک دکمه log ، گزارش عملکرد متنی کارهایی که Weka تاکنون در این بخش انجام داده است با برچسب زمانی ارایه میکند.

زمانیکه Weka در حال عملیات است، پرنده کوچکی که در پایین سمت راست پنجره است، بالا و پایین میپرد. عدد پشت × نشان میدهد که به طور همزمان چند عملیات در حال انجام است. اگر پرنده بایستد در حالیکه حرکت نمیکند، او مریض است! اشتباه رخ داده است و باید Explorer از نو اجرا شود.

 

3-1-1 Preprocess

الف- خواندن و فیلتر کردن فایلها

  در بالای پانل Preprocess در شکل 2، دکمه‌هایی برای باز کردن فایل، URL ها و پایگاه های داده وجود دارد. با کلیک بر روی دکمه open File، در ابتدا تنها فایلهای با پسوند arff در browser فایل نمایش داده میشود. برای دیدن سایر فایلها یاید گزینه Format در جعبه انتخاب فایل تغییر داده شود.

شکل 3. باز کردن فایل

در بخشهای بعدی به تشریح گزینه‌های مذکور و بیان جزئیات کار با هرکدام خواهم پرداخت.

Weka Explorer امکان رده بندی دارد، چنانچه به کاربران اجازه میدهد به صورت تعاملی اقدام به ساخت درخت تصمیم‌گیری کنند. Wekaنمودار پراکندگی داده‌ها را نسبت به دو ویژگی انتخاب شده، فراهم میآورد. وقتی زوج ویژگی‌ای که رده‌ها را به خوبی جدا میکند، پیدا شد، امکان ایجاد دو شاخه با کشیدن چند ضلعی اطراف نقاط داده‌ها بر نمودار پراکندگی وجود دارد.

هر نوار، دسترسی به دامنه کاملی از امکانات را فراهم میکند. در پایین هر پانل، جعبه status و دکمه log قرار دارد. جعبه status پیغامهایی است که نشان میدهد چه عملیاتی در حال انجام داده شدن است. مثلاً اگر Explores مشغول خواندن یک فایل باشد، جعبه status آن را گزارش میدهد. کلیک راست در هر جا داخل این جعبه یک منو کوچک با دو گزینه میآورد، نمایش میزان حافظه در دسترس Weka و اجرای Java garbage collector .

لازم است توجه شود که garbage collector به طور ثابت به عنوان یک عمل پیش زمینه در هر حال اجرا میشود کلیک دکمه log ، گزارش عملکرد متنی کارهایی که Weka تاکنون در این بخش انجام داده است با برچسب زمانی ارایه میکند.

زمانیکه Weka در حال عملیات است، پرنده کوچکی که در پایین سمت راست پنجره است، بالا و پایین میپرد. عدد پشت × نشان میدهد که به طور همزمان چند عملیات در حال انجام است. اگر پرنده بایستد در حالیکه حرکت نمیکند، او مریض است! اشتباه رخ داده است و باید Explorer از نو اجرا شود.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 

3-1-1 Preprocess

الف- خواندن و فیلتر کردن فایلها

  در بالای پانل Preprocess در شکل 2، دکمه‌هایی برای باز کردن فایل، URL ها و پایگاه های داده وجود دارد. با کلیک بر روی دکمه open File، در ابتدا تنها فایلهای با پسوند arff در browser فایل نمایش داده میشود. برای دیدن سایر فایلها یاید گزینه Format در جعبه انتخاب فایل تغییر داده شود.

شکل 3. باز کردن فایل

 

ب- تبدیل فایلها به فرمت ARFF

نرم افزار Weka دارای سه مبدل فرمت فایل میباشد، برای فایلهای صفحه گسترده با پسوند CSV ، فرمت فایل C4.5 با پسوند .namesو data و برای نمونه های سری با پسوند.bsi .

اگر Weka قادر به خواندن داده ها نباشد، سعی میکند آن را به صورت ARFF تفسیر کند. اگر نتواند پیغام نشان داده شده در شکل 4 (الف) ظاهر میشود. با انتخاب گزینه Use Convertor، پیغام شکل 4 (ب) ظاهر میشود

شکل4 (الف) پیغام خطا

 

شکل4 (ب) ویرایشگر

  این، یک ویرایشگر عمومی اشیاء است که در Weka برای انتخاب و تنظیم اشیا بکار میرود. به عنوان مثال وقتی پارامتری برای Classifier تنظیم میشود، جعبه ای با نوع مشابه بکار برده میشود. CSV Loader برای فایلهای با پسوند .CSVبه طور پیش فرض انتخاب میشود. دکمه More اطلاعات بیشتری در مورد آن میدهد که در شکل 4 (ج) نشان داده شده است.

همیشه مطالعه مستندات ارزشمنداست، در این حالت نشان میدهد که ردیف نخست صفحه گسترده، نام ویژگی را تعیین میکند. برای استفاده از این مبدل باید بر Ok کلیک شود. برای مورد مختلف لازم است بر choose کلیک شود تا از لیست شکل 4 (د) انتخاب انجام شود.

  گزینه اول، Arffloader است و فقط به دلیل ناموفق بودن به این نقطه میرسیم.CSVLoader پیش فرض است و در صورت نیاز به فرض دیگر، choose کلیک میشود. دومین گزینه، مربوط به فرمت C4.5 است که دو فایل برای مجموعه داده وجود دارد یکی اسمها و دیگـری داده های واقعـی میباشد. چهارمین برای نمونه های سریالی، برای بازخوانی مجموعه داد‌ه‌ای است که به صورت شیئ سریالی شده جاوا ذخیره شده است. هر شیء در جاوا میتواند در این شکل ذخیره و بازخوانی شود. به عنوان یک فرمت بومی جاوا، سریعتر از فایل ARFF خوانده میشود چرا که فایل ARFF باید تجزیه و کنترل شود. وقتی یک مجموعه داده بزرگ مکررا بازخوانی میشود، ذخیره آن در این شکل سودمند است.

  ویژگیهای دیگر ویرایشگر عمومی اشیا در شکل 4 (ب)، save و open است که به ترتیب برای ذخیره اشیای تنظیم شده و بازکردن شیئی که پیش از این ذخیره شده است، به کار میرود. اینها برای این نوع خاص شیئ مفید نیستند. لکن پانلهای دیگر ویرایشگر عمومی اشیاء، خواص قابل ویرایش زیادی دارند. به دلیل مشکلاتی که ممکن است حین تنظیم مجدد آنها رخ دهد، میتوان ترکیب اشیاء ایجاد شده را برای استفاده‌های بعدی، ذخیره کرد.

  تنها منبع مجموعه‌های داده برایWeka ، فایلهای موجود روی کامپیوتر نیستند. میتوان یک URL را باز کرد تا Weka از پروتکل HTTP برای دانلود کردن یک فایل Arff از شبکه استفاده کند. همچنین میتوان یک پایگاه داده‌ها را باز نمود ( open DB ـ هر پایگاه دادهای که درایور اتصال به مجموعه های داده به زبان جاوا JDBC را دارد.) و به وسیله دستور select زبان SQL ، نمونه‌ها را بازیابی نمود. داده‌ها میتوانند به کمک دگمه save به همه فرمتهای ذکر شده، ذخیره شوند. جدای از بحث بارگذاری و ذخیره مجموعه‌های داده، پانل preprocess به کاربر اجازه فیلتر کردن داده‌ها را میدهد. فیلترها، اجزای مهم Weka هستند.

بعد از اینکه فایل بارگذاری شد، Weka فیلدها را تشخیص میدهد و حین بررسی آنها، اطلاعات آماری پایهای را برای هر کدام از صفات محاسبه میکند. همان طور که در شکل 5 نشان داده شده است، لیست صفات تشخیص داده شده، در سمت چپ، پایین و اطلاعات پایگاه داده مربوطه در بالای آن نشان داده میشود.

 

شکل5. بانک اطلاعاتیbank-data.csv

با کلیک برروی هر کدام از صفات، میتوان اطلاعات آماری اصلی آن را در سمت راست مشاهده نمود. به عنوان مثال شکل 6 از انتخاب فیلد age نتیجه شده است.

نمودار ترسیم شده در سمت راست، پایین، بر اساس دو فیلد است. فیلد دوم به صورت پیشفرض، آخرین فیلد در پایگاه داده است که میتوان آن را به دلخواه تغییر داد.

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


شکل6. اطلاعات آماری فیلد age

 

ج- به کارگیری فیلترها

با کلیک دگمهchoose (گوشه بالا و سمت چپ) در شکل 3 میتوان به لیستی از فیلترها دست یافت. میتوان از فیلترها برای حذف ویژگیهای مورد نظر از یک مجموعه داده و یا انتخاب دستی ویژگیها استفاده نمود. مشابه این نتیجه را میتوان به کمک انتخاب ویژگیهای مورد نظر با تیک زدن آنها و فشار دادن کلیه Remove به دست آورد.

شکل 7 مراحل لازم برای حذف فیلد id از بانک اطلاعاتی، با استفاده از روش اول را نشان میدهد.

 

شکل 6 (الف). انتخاب فیلتر Remove

 

 

شکل 6 (ب). وارد کردن شماره فیلد مورد نظر

 

شکل 6 (ج).انتخاب گزینه Apply و حذف فیلد id

یکی دیگر ازفیلترهای موجود، Discretize است که با استفاده از آن میتوان مقادیریک صفت پیوسته را به تعداد دلخواه بازه گسسته تبدیل کرد. شکل7 مراحل لازم برای شکستن مقادیر صفت age به 3 بازه را نشان میدهد.

 

شکل7 (الف). انتخاب فیلتر Discretize

 

شکل7 (ب). وارد کردن شماره فیلد مورد نظر و انجام تنظیمات

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


شکل 7 (ج).انتخاب گزینه Apply

3-1-2 Classify

الف- الگوریتمهای رده‌بندی

Weka الگوریتمهای classification و prediction بسیار متنوعی را پیاده‌سازی میکند. الگوریتمهای رده‌بندی، به رده‌بندهای Bayesian، functions،lazy ،meta ، misc، trees و rules تقسیم شده‌اند. جدول شکل 8، لیست اسامی رده بندهای Weka را نمایش میدهد.

 

  شکل 8 (الف). الگوریتمهای رده بندی در Weka

 

شکل 8 (ب). الگوریتمهای رده بندی در Weka

دراین قسمت برخی از اسامی رده‌بندیهای Weka معرفی میشوند.

     Trees

    ü Decision stumpکه برای استفاده توسط روشهای boosting طراحی شده است، برای مجموعه‌های داده عددی یا رده‌ای، درخت تصمیم‌گیری یک سطحی میسازد. این الگوریتم، با مقادیر از دست رفته، به صورت مقادیر مجزا برخورد کرده و شاخه سومی از درخت توسعه میدهد

     Rules
        ü Decision Tableیک رده‌بندی بر اساس اکثریت جدول تصمیم‌گیری میسازد. این الگوریتم، با استفاده از جستجوی اولین بهترین، زیر دسته‌های ویژگیها را ارزیابی میکند و میتواند از اعتبارسنجی تقاطعی برای ارزیابی بهره برد. (Kohavi 1995 )
        یک امکان این است که به جای استفاده از اکثریت جدول تصمیم‌گیری که بر اساس دسته ویژگیهای مشابه عمل میکند، از روش نزدیکترین همسایه برای تعیین رده هر یک از نمونه‌ها که توسط مدخل (Entry) جدول تصمیمگیری پوشش داده نشده‌اند، استفاده شود.
        ü   Conjunctive Ruleقاعده‌ای را یاد میگیرد که مقادیر رده‌های عددی را پیشبینی میکند. نمونه‌های آزمایشی به مقادیر پیش فرض رده نمونه‌های آموزشی، منسوب میشوند. سپس تقویت اطلاعات (برای ردههای رسمی)، یا کاهش واریانس (برای ردههای عددی) مربوط به هر والد محاسبه شده و به روش هرس کردن با خطای کاهش یافته (Reduced-error pruning) ، قواعد هرس میشوند.
        ü  ZeroRبرای رده‌های اسمی، اکثریت داده‌های مورد آزمایش و برای رده‌های عددی، میانگین آنها را پیشبینی میکند. این الگوریتم بسیار ساده است.
        ü M5Rulesبه کمک M5 از روی درختهای مدل، قواعد رگرسیون استخراج میکند.
        
        در این بخش به شرح مختصری برخی از این الگوریتم‌ها و پارامترهایشان که قابلیت کار با ویژگی های عددی را دارند، پرداخته میشود.

     Functions
        ü   Simple Linear Regressionمدل رگرسیون خطی یک ویژگی مشخص را یاد میگیرد، آنگاه مدل با کمترین خطای مربعات را انتخاب میکند. در این الگوریتم، مقادیر از دست رفته و مقادیر غیرعددی مجاز نیستند.
        ü Linear Regressionرگرسیون خطی استاندارد با کمترین خطای مربعات را انجام میدهد و میتواند به طور اختیاری به انتخاب ویژگی بپردازد، این کار میتواند به صورت حریصانه، با حذف عقب رونده (Backward elimination) انجام شود، یا با ساختن یک مدل کامل از همه ویژگیها و حذف یکی یکی جمله‌ها با ترتیب نزولی ضرایب استاندارد شده آنها، تا رسیدن به شرط توقف مطلوب انجام گیرد.
        ü   Least Med sq یک روش رگرسیون خطی مقاوم است که به جای میانگین مربعات انحراف از خط رگرسیون، میانه را کمینه میکند. این روش به طور مکرر رگرسیون خطی استاندارد را به زیرمجموعه‌هایی از نمونه‌ها اعمال میکند و نتایجی را بیرون میدهد که کمترین خطای مربع میانه را دارند.
        ü   SMOreg الگوریتم بهینه سازی حداقل ترتیبی را روی مسایل رگرسیون اعمال میکند.
        ü   Pace Regression ، با استفاده از تکنیک رگرسیون pace ، مدلهای رگرسیون خطی تولید میکند. رگرسیونpace ، زمانی که تعداد ویژگیها خیلی زیاد است، به طور ویژهای در تعیین ویژگیهایی که باید صرفنظر شوند، خوب عمل میکند. در واقع در صورت وجود نظم و ترتیب خاصی، ثابت میشود که با بینهایت شدن تعداد ویژگیها، این الگوریتم بهـینه عمل میکند.
        ü RBF Network یک شبکه با تابع پایهای گوسی شعاعی را پیاده سازی میکند. مراکز و عرضهای واحدهای مخفی به وسیله روش میانگین (K-means)K تعیین میشود. سپس خروجیهای فراهم شده از لایه‌های مخفی (Hidden layer) ، با استفاده از رگرسیون منطقی در مورد رده‌های اسمی و رگرسیون خطی در مورد رده‌های عددی، با یکدیگر ترکیب میشوند. فعال سازیهای توابع پایه پیش از ورود به مدلهای خطی، با جمع شدن با عدد یک، نرمالیزه میشوند. در این الگوریتم میتوان K، تعداد خوشه‌ها، بیشترین تعداد تکرارهای رگرسیونهای منطقی برای مسأله‌های رده‌های رسمی، حداقل انحراف معیار خوشه‌ها، و مقدار بیشینه رگرسیون را تعیین نمود. اگر رده‌ها رسمی باشد، میانگین K به طور جداگانه به هر رده اعمال میشود تا K خوشه مورد نظر برای هر رده استخراج گردد.

      رده بندهای Lazy

  یادیگرنده‌های lazy نمونه‌های آموزشی را ذخیره میکنند و تا زمان رده بندی هیچ کار واقعی انجام نمیدهند.

    ü   IB1یک یادگیرنده ابتدایی بر پایه نمونه است که نزدیکترین نمونه‌های آموزشی به نمونه‌های آزمایشی داده شده را از نظر فاصله اقلیدسی پیدا کرده و نزدیکترین رده‌ای مشابه رده همان نمونه‌های آموزشی را تخمین میزند.
    ü   IBKیک رده بند با K همسایه نزدیک است که معیار فاصله ذکر شده را استفاده میکند. تعداد نزدیکترین فاصله‌ها (پیش فرض k=1 )، میتواند به طور صریح در ویرایشگر شیء تعریف شود. پیشبینی‌های متعلق به پیش از یک همسایه میتواند بر اساس فاصله آنها تا نمونه‌های آزمایشی، وزندار گردد.
    دو فرمول متفاوت برای تبدیل فاصله به وزن، پیاده سازی شده‌اند. تعداد نمونه‌های آموزشی که به وسیله رده بند نگهداری میشـود، میتواند با تنظـیم گزیـنه اندازه پنجره محدود گردد. زمانی که نـمونه‌های جدید اضافه میشوند، نمونه‌های قدیمی حذف شده تا تعداد کل نمونه‌های آموزشی در اندازه تعیین شده باقی بماند.
    ü Kstar یک روش نزدیکترین همسایه است که از تابع فاصلهای عمومی شده بر اساس تبدیلات استفاده میکند.
    ü LWL یک الگوریتم کلی برای یادگیری وزن دار شده به صورت محلی است. این الگوریتم با استفاده از یک روش بر پایه نمونه، وزنها را نسبت میدهد و از روی نمونه‌های وزندار شده، رده‌بند را میسازد. رده‌بند Nave Bayes، در ویرایشگر شیء LWL انتخاب میشود. برای مسایل رده بندی و رگرسیون خطی برای مسایل رگرسیون، انتخابهای خوبی هستند. میتوان در این الگوریتم، تعداد همسایه‌های مورد استفاده را که پهنای باند هسته و شکل هسته مورد استفاده برای وزن دار کردن را (خطی، معکوس، یا گوسی) مشخص میکند، تعیین نمود. نرمال سازی ویژگیها به طور پیش فرض فعال است.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

الف- نحوه کار با پانل classify

تا اینجا به صورت تئوری الگوریتمهای رده‌بندی را معرفی کردیم. درادامه با یک مثال عملی نحوه کار با classifier ها را نشان میدهیم.

در این قسمت، بانک اطلاعاتی bank-data-final به عنوان فایل نمونه در نظر گرفته میشود. بعد از باز کردن فایل مورد نظر و با کلیک بر روی پانل classify، پنجرهای مطابق شکل 9 باز میشود.

 

شکل 9 . انتخاب پانل classify

با کلیک دگمه choose در پانل classifyمیتوان الگوریتم رده‌بندی مورد نظر را انتخاب نمود (شکل 10). دراین مثال، الگوریتم J48 را انتخاب میکنیم. زمانی که یک الگوریتم رده‌بندی انتخاب میشود، نسخه خط فرمانی (Command line) رده بند در سطری نزدیک به دگمه ظاهر میگردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص میشوند. برای تغییر آنها میتوان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء باز شود (شکل11). در این مثال همان مقادیر پیشفرض را میپذیریم.

 

شکل 10. انتخاب الگوریتم ردهبندی

 

شکل 11. تنظیم پارامترهای الگوریتم رده بندی

باکلیک بر روی دکمه start مدل مورد نظر تولید میشود (شکل12).

 

شکل 12. مدل حاصل از اجرای الگوریتم رده بندی

با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ میتوان نتیجه را در پنجرهای جداگانه، و یا شکل گرافیکی درخت حاصل از رده بندی را مشاهده نمود. (شکل 13) توجه کنید که در شکل 13(ب) باراست کلیک برروی یک قسمت خالی ازصفحه میتوان نحوه نمایش درخت را به دلخواه تنظیم کرد.

 

شکل 13(الف)

 
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

شکل 13(ب). درخت حاصل از رده بندی

3-1-3 Cluster

فایل نمونه مورد استفاده در این قسمت bank-data.csv است که در مرحله preprocess فیلد id را از آن حذف میکنیم (شکل14).

 

شکل 14. بارگذاری فایل نمونه

میشود. بعد از باز کردن فایل مورد نظر و با کلیک بر روی پانل cluster پنجرهای مطابق شکل 15 باز میشود.

 

شکل 15 . انتخاب پانل cluster

Weka الگوریتمهای خوشه‌بندی (clustering) متنوعی را پیاده‌سازی میکند. با کلیک دگمه choose در پانل cluster میتوان الگوریتم خوشه‌بندی مورد نظر را انتخاب نمود (شکل 16). دراین مثال، الگوریتم SimpleKMeans را انتخاب میکنیم. زمانی که یک الگوریتم خوشه‌بندی انتخاب میشود، نسخه خط فرمانی الگوریتم خوشه‌بندی در سطری نزدیک به دگمه ظاهر میگردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص میشوند. برای تغییر آنها میتوان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء باز شود (شکل17). در این مثال تعداد کلاسترها را 6 تا تنظیم میکنیم.

 

شکل 16. انتخاب الگوریتم خوشه‌بندی

 

شکل 17. تنظیم پارامترهای الگوریتم خوشه‌بندی

باکلیک بر روی دکمه start مدل مورد نظر تولید میشود (شکل18).

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


شکل 18. مدل حاصل از اجرای الگوریتم خوشه‌بندی

با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ-پایین و انتخاب گزینه‌ی "View in separate window "میتوان نتیجه را در پنجرهای جداگانه مشاهده نمود (شکل 19). همانطور که میبینید، اطلاعات آماری مربوط به هرکلاستر، از جمله مرکز ثقل هر کلاستر، تعداد و درصد اعضای هر کلاستردر این پنجره قابل مشاهده است.

 

شکل 19. نتیجه حاصل از اجرای الگوریتم خوشه‌بندی

روش دیگر برای کسب اطلاعات در مورد هرکلاستر، مصورسازی است. با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ و انتخاب گزینهی " Visualize cluster assignments" پنجرهای مطابق شکل20(الف) باز میشود. انتخابهای مختلف برای هرکدام از سه بعد نمودارحاصل (محور X، محور Y، رنگ) نمودارهای مختلفی را نتیجه میدهد که میتوان از آنها اطلاعات مورد نظر را بدست آورد.به عنوان مثال در شکل20(ب)، محور Xها نماینده شماره کلاستر، محور Yها نماینده شماره نمونه در بانک اطلاعاتی، و رنگها نماینده جنسیت هستند (قرمز: مرد، آبی: زن). همانطورکه مشاهده میشود کلاستر2 بیشتر توسط زنان احاطه شده است و کلاستر4 توسط مردان.

 

شکل20 (الف)

شکل20 (ب) مصورسازی نتیجه حاصل از clustering

علاوه بر این ممکن است علاقه‌مند باشیم که بدانیم هر نمونه در بانک اطلاعاتی، به کدام کلاستر اختصاص داده شده است. برای این منظور در پنجره شکل 20(ب)، گزینه save را انتخاب میکنیم و فایل مورد نظر را با نام " bank-data-Kmeans" ذخیره میکنیم. فایل حاصل رامیتوان از طریق یک نرم‌افزار پردازش متن مثل Notepad یا word باز کرد. بخش ابتدایی این فایل در شکل21 نشان داده شده است. همانطورکه مشـاهده میکنید، Weka ویژگی جدیدی به نام Cluster را به مجموعه ویژگیهای موجود اضافه کرده است.

 

شکل21. نتیجه اختصاص نمونه‌ها به کلاسترها

3-1-4 Associate

در این قسمت میتوان قوانین Association حاکم بربانک اطلاعاتی را با استفاده از الگوریتم‌های مختلف بدست آورد.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

فایل نمونه مورد استفاده در این بخش bank-data-final.arff است که در مرحله preprocess فیلد id از آن حذف شده و مقادیرصفات age و income به صورت گسسته در آمده است (شکل22).

 

شکل 22. بارگذاری فایل نمونه

بعد از باز کردن فایل مورد نظر و با کلیـک بر روی پانل Associate پنجره‌ای مطـابق شکـل23 باز میشود.

شکل 23 . انتخاب پانل Associate

 

Weka الگوریتمهای association متفاوتی را پیاده‌سازی میکند. با کلیک دگمه choose در پانل Associate میتوان الگوریتم association مورد نظر را انتخاب نمود (شکل 24). دراین مثال، الگوریتم Apriori را انتخاب میکنیم. زمانی که یک الگوریتم انتخاب میشود، نسخه خط فرمانی آن الگوریتم در سطری نزدیک به دگمه ظاهر میگردد. این خط فرمان شامل پارامترهای الگوریتم است که با خط تیره مشخص میشوند. برای تغییر آنها میتوان روی آن خط کلیک نمود تا ویرایشگر مناسب شیء باز شود (شکل25). در این مثال همان پارامترهای پیشفرض را میپذیریم.

شکل 24. انتخاب الگوریتم association

 

شکل 25. تنظیم پارامترهای الگوریتم association
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

با کلیک بر روی گزینه More در شکل25، میتوان توضیحات لازم را درمورد هر کدام از پارامترها بدست آورد. شکل26 این توضیحات را نشان میدهد.

 

شکل 26. توضیحات بیشتردر مورد پارامترهای الگوریتم Apriori

بعد از تنظیم پارامترهای مورد نظر، با کلیک بر روی گزینه start، قوانین بدست آمده که بر اساس metric Type مرتب شده‌اند در صفحه اصلی نمایش داده میشوند.(شکل27)

شکل 27. نتیجه اجرای الگوریتم Apriori

با راست کلیک بر روی مجموعه جواب در پانل Result list در سمت چپ و انتخاب گزینه‌ی مورد نظر، میتوان نتایج بدست آمده را در پنجره‌ای جداگانه نمایش داد و یا قوانین بدست آمده را به فرمت دلخواه (.csv, .arff, .txt) ذخیره کرد. شکل28 گزینه‌های موجود را نشان میدهد.

 

 

 

شکل 28. ذخیره قوانین بدست آمده

 
Rapidminer
دانلود نرم افزار قدرتمند داده کاوی RapidMiner

 

 09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


دانلود نرم افزار رپیدماینر

انجام پروژه های داده کاوی با نرم افزار Clementine12
انجام پروژه های داده کاوی با نرم افزار Clementine12

 

 
کارگاه تخصصی فرایند داده کاوی با نرم افزار Clementine 12

یک دوره کارگاه تخصصی فرایند داده کاوی همراه با نرم افزار Clementine 12

 

محتوای دوره :
داده کاوی چیست ؟

انگیزه کاوش داده ها در چیست

کاربرد داده کاوی در چیست

و قابلیت های آن(Clementine 12) آشنایی با محیط کلمنتاین

( Clementine 12) ورود داده ها با فرمت های مختلف به محیط کاری کلمنتاین

چگونگی ایجاد درک اولیه از داده ها و آماده سازی آن

استفاده از آمارهای توصیفی و گرافهای متنوع

چگونگی تشخیص و برخورد با داده های گمشده

خوشه بندی

قواعد تلازمی

 دسته بندی و پیش بینی - درخت تصمیم ، شبکه های عصبی ...
 
تحلیل و تفسیر داده ها

و . . .
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

 

بازدید : 70 تاریخ : شنبه 14 مرداد 1396 زمان : 16:57 نویسنده : مطلب پروژه نظرات (0)

آمار سایت
  • کل مطالب : 523
  • کل نظرات : 0
  • افراد آنلاین : 3
  • تعداد اعضا : 0
  • آی پی امروز : 32
  • آی پی دیروز : 22
  • بازدید امروز : 67
  • باردید دیروز : 34
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 612
  • بازدید ماه : 3,158
  • بازدید سال : 29,151
  • بازدید کلی : 85,528
  • مطالب