آموزش مهارت های کاربردی

جلب اعتماد گربه (تکراری)

تکنیک‌های محتوای سئو شده

نشانه‌های رابطه فراتر از دوستی

پیشگیری از آسیب‌های رابطه

مقابله با محتوای تکراری

درآمد از محتوای ویدیویی

خلق محتوای جذاب وب‌سایت

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

جستجو

موضوعات

فیدهای XML

RSS چیست؟

پیوندهای وبلاگ

پایان نامه رایگان درمورد قاعده احسان، عبدالفتاح، سقوط ضمان

مهندسی کامپیوتر روشی انتخابی برای راه رفتن از بغل در روبات انسان ...

– روبات های زنجیردار

– روبات های پا دار

روبات های دوپا (انسان نما)
روبات های سه پا
روبات های چهارپا
یک مطلب دیگر :

رشته روانشناسی درباره : پیشینه نظری – فرزندپروری

موضوعات: بدون موضوع لینک ثابت

[جمعه 1399-08-09] [ 03:30:00 ب.ظ ]

ارسال نظر »

هوش مصنوعی شناسایی نفوذگران با کمک مفهوم شبکه اجتماعی

2-2-3. روش پاسخگویی…………………………….. 17

2-3. جریان شبکه…………………………….. 20

2-3-1. تعریف جریان شبکه……………………………. 20

2-4. انواع حملات……………………………….. 22

3- پیشینه تحقیق…………………………….. 28

3-1. مقدمه………………………… 28

3-2. روش مبتنی بر جریان در برابر روش مبتنی بر محتوا……………. 28

3-2-1. داده جریان شبکه……………………………. 29

3-2-2. روش های مبتنی بر بسته……………………………. 30

3-2-3. روش های مبتنی بر جریان…………………………….. 30

3-2-4. کرم ها…………………………… 31

3-2-5. محدود کننده سرویس………………………………. 34

3-2-6. پویش………………………………. 36

3-2-7. Botnet……………………………

4- روش پیشنهادی…………………………….. 43

4-1. مقدمه……………………………43

4-2. مجموعه داده ……………………….43

4-3. معیارهای شباهت……………………………… 45

4-3-1. معیارهای مبتنی بر گراف……………………………… 45

یک مطلب دیگر :

پایان نامه پایان نامه در مورد تحصیل اقرار از طریق روش های علمی فنی

4-3-1-1. ضریب خوشه بندی محلی…………………………….. 45

4-3-1-2. ضریب خوشه بندی وزن دار محلی……………… 46

4-3-2. معیارهای مبتنی بر گره…………………………… 48

4-3-2-1. میانگین شباهت محلی…………………………….. 48

4-3-2-2. نسبت درجه گره…………………………… 49

4-3-2-3. معیار Zscore…………………………….

4-4. شناسایی نفوذگران…………………………….. 51

5- آزمایشات و نتایج…………………………….. 53

5-1. مقدمه…………………………. 53

5-2. شبیه سازی گراف شبکه……………………………. 53

5-3. ساخت گراف یک سویه…………………………….56

5-4. مقایسه معیارهای شباهت……………………………… 57

5-5. نتایج………………………………………….. 58

فهرست منابع…………………………….. 60

موضوعات: بدون موضوع لینک ثابت

[ 03:29:00 ب.ظ ]

ارسال نظر »

هوش مصنوعی و رباتیک طراحی سیستم نظارت چهره راننده جهت تشخیص ...

2-2- آشکارسازی چهره………………….. 13

2-2-1- روش‏های مبتنی بر مدل رنگ…………………….. 13

2-2-2- روش‏های مبتنی بر ویژگی‏های شبه هار…………………… 14

2-2-3- روش‏های مبتنی بر شبکه عصبی……………………. 14

2-3- آشکارسازی چشم…………………… 15

2-3-1- روش‏های مبتنی بر نورپردازی و تصویربرداری در طیف مادون قرمز……. 15

2-3-2- روش‏های مبتنی بر دوسطحی کردن تصویر…………………… 18

2-3-3- روش‏های مبتنی بر پروجکشن……………………. 19

2-3-4- روش‏های مبتنی بر یادگیری……………………. 20

2-4- آشکارسازی سایر اجزای چهره………………….. 21

2-4-1- آشکارسازی دهان (لب) …………………..21

2-4-2- آشکارسازی بینی……………………. 21

2-5- ردیابی چهره و اجزای آن…………………… 22

2-5-1- تخمین حرکت…………………….. 23

2-5-2- تطابق……………………. 23

2-6- استخراج ویژگی‏های مربوط به کاهش هوشیاری……………………. 24

2-6-1- ویژگی‏های ناحیه چشم…………………… 24

2-6-2- ویژگی‏های دهان…………………… 30

2-6-3- ویژگی‏های سر……………………30

2-7- تشخیص خستگی و عدم تمرکز حواس…………………….. 31

2-7-1- روش‏های مبتنی بر حد آستانه…………………… 31

2-7-2- روش‏های مبتنی بر دانش…………………….. 32

2-7-3- روش‏های مبتنی بر آمار و احتمال…………………… 33

2-8- سیستم‏های نظارت چهره راننده در خودروهای تجاری……………………. 34

3- سیستم پیشنهادی……………………. 35

3-1- پیکربندی کلی سیستم پیشنهادی……………………. 35

3-1-1- نورپردازی و تصویربرداری……………………. 36

3-1-2- سخت‏افزار و پردازنده …………………..37

3-1-3- نرم‏افزار هوشمند…………………… 37

3-2- آشکارسازی چهره………………….. 38

3-2-1- ویژگی‏های شبه هار…………………… 39

3-2-2- انتخاب و تعیین اهمیت ویژگی‏ها برای تشکیل یک طبقه‏ بندی ‏کننده قوی…….. 41

3-2-3- درخت تصمیم آبشاری تقویت‏ شده………………….. 42

3-3- ردیابی چهره………………….. 44

3-3-1- پنجره جستجو…………………… 45

3-3-2- معیار تطابق……………………. 46

3-4- استخراج ویژگی‏های مربوط به کاهش هوشیاری……………………. 47

3-4-1- ویژگی‏های ناحیه چشم…………………… 47

3-4-2- ویژگی‏های ناحیه چهره و سر…………………… 55

یک مطلب دیگر :

پایان نامه درباره تولید ملی/:بازار اسباب بازي چین

3-5- تشخیص کاهش هوشیاری……………………. 58

3-5-1- سیستم خبره فازی……………………. 58

3-5-2- تولید خروجی نهایی……………………. 64

4- نتایج آزمایش‏ها و ارزیابی سیستم…………………… 69

4-1- نحوه آزمایش سیستم…………………… 69

4-2- معیار‏های ارزیابی……………………. 72

4-3- آشکارسازی چهره………………….. 73

4-4- ردیابی چهره …………………..75

4-5- استخراج ویژگی‏های ناحیه چشم…………………… 77

4-6- استخراج ویژگی‏های ناحیه سر و چهره …………………..82

4-7- تشخیص کاهش هوشیاری……………………. 86

4-8- ارزیابی کلی سیستم و الگوریتم‏ها………………….. 93

4-8-1- بررسی سرعت پردازش سیستم پیشنهادی……………………. 93

4-8-2- بررسی پیچیدگی محاسباتی الگوریتم‏ها………………….. 94

5- نتیجه‏گیری و پیشنهادات…………………….. 95

6- مراجع……………………99

چکیده:

هر ساله تصادفات رانندگی زیادی به دلیل خواب‏آلودگی و عدم تمرکز حواس راننده در سراسر دنیا رخ می‏دهد که خسارت‏های جانی و مالی فراوانی به همراه دارند. یکی از روش‏های تشخیص خستگی و عدم تمرکز حواس، استفاده از سیستم‏های نظارت چهره راننده است. سیستم‏های نظارت چهره راننده با دریافت تصاویر از دوربین و پردازش آنها، نشانه‏های خواب‏آلودگی و عدم تمرکز حواس را از چشم، سر و چهره استخراج می‏کنند. در این پایان‏نامه یک سیستم نظارت چهره راننده طراحی شده است که با استخراج نشانه‏های خستگی و عدم تمرکز حواس از ناحیه چشم و چهره، کاهش هوشیاری راننده را تخمین می‏زند. در این سیستم چهار ویژگی شامل درصد بسته بودن چشم (PERCLOS)، نرخ پلک زدن، کاهش فاصله بین پلک‏ها و میزان چرخش سر استخراج می‏شود. سه ویژگی اول مربوط به نشانه‏های بروز خستگی و عدم تمرکز حواس در ناحیه چشم و ویژگی آخر مربوط به نشانه‏های کاهش هوشیاری در ناحیه چهره و سر می‏باشد. ویژگی‏های ناحیه چشم بر اساس تغییرات پروجکشن افقی ناحیه چشم و ویژگی‏های ناحیه چهره بر اساس بررسی قالب چهره استخراج می‏گردد. سپس این ویژگی‏ها توسط یک سیستم خبره فازی مورد پردازش قرار می‏گیرد تا میزان خستگی و عدم تمرکز حواس راننده تخمین ‏زده شود. تصویربرداری سیستم پیشنهادی در طیف مرئی و با دوربین سطح خاکستری انجام شده است. نتایج آزمایش‏ها بر روی فیلم‏های تهیه شده در محیط واقعی و آزمایشگاهی نشان می‏دهد که روش پیشنهادی دقت بسیار خوبی در استخراج ویژگی و تشخیص کاهش هوشیاری راننده دارد. از لحاظ سرعت اجرای الگوریتم، سرعت سیستم پیشنهادی حدود 5 فریم در ثانیه می‏باشد که می‏توان آن را سیستم بلادرنگ محسوب کرد.

پیشگفتار:

افزایش تعداد خودروها در جهان و در نتیجه آن افزایش آمار خسارات و تلفات ناشی از تصادفات، باعث شد تا محققین به دنبال کشف علل اصلی تصادفات رانندگی باشند. یکی از مهمترین این علل، خستگی و عدم تمرکز حواس راننده می‏باشد که علت اصلی حدود 20% از تصادفات محسوب می‏شود. با توجه به نقش موثر خستگی و عدم تمرکز حواس راننده در بروز تصادفات، راهکارهایی برای مقابله با این عامل معرفی شد. یکی از راهکارهای اصلی و جدید برای تشخیص خستگی و عدم تمرکز حواس راننده و اعلام هشدار در مواقع ضروری، سیستم‏های نظارت چهره راننده است. پیشنهاد تولید سیستم‏های نظارت چهره راننده اولین بار در اواخر قرن 20 میلادی مطرح شد، اما عمده تحقیقات در این زمینه مربوط به بعد از سال 2000 میلادی می‏باشد.

تاکنون طراحی و تولید چنین سیستم‏هایی در ایران به طور جدی مورد بررسی قرار نگرفته است. سیستم ارائه شده در این پایان‏نامه به عنوان اولین سیستم نظارت چهره راننده در ایران می‏باشد که قادر است میزان خستگی و عدم تمرکز حواس راننده را با استفاده از پردازش تصاویر چهره راننده تخمین بزند. هرچند تحقیقات بیشتری برای تولید یک سیستم نظارت چهره راننده با هدف کاربرد در خودروهای تجاری مورد نیاز است، اما این پایان‏نامه می‏تواند شروع بسیار خوبی برای آغاز تحقیقات در این زمینه باشد.

سعی شده نوشتار پایان‏نامه به نحوی روشن و ساده بیانگر روش پیشنهادی باشد، با این وجود خواننده گرامی می‏تواند در صورت داشتن سوال، بیان نظرات یا ارائه انتقاد از طریق پست الکترونیک hoseyn@sigari.ir یا hoseyn_sigari@engineer.com با اینجانب مکاتبه نماید.

1- مقدمه

1-1- تعریف سیستم های نظارت چهره راننده

موضوعات: بدون موضوع لینک ثابت

[ 03:28:00 ب.ظ ]

ارسال نظر »

هوش مصنوعی طراحی و پیاده سازی رفع کننده تناقض در یک سیستم ...

2-8- رفع ناسازگاری با استفاده از روند سلسله مراتبی تحلیلی و بهبود آن…….. 25

فصل سوم. سیستمهای تصمیم همیار هوشمند…………………………. 31

3-1- مقدمه……………………….. 32

3-2- ویژگیهای سیستمهای تصمیم همیار هوشمند.……………………….. 33

3-3- معرفی چند سیستم تصمیم همیار هوشمند با ساختارهای متفاوت…………….. 36

3-3-1- استفاده از الگوریتمهای تکاملی در ساختار IDSS ……………………….

3-3-2- استفاده از عامل هوشمند در ساختار IDSS ……………………….

3-3-3- استفاده از روشهای داده کاوی و شبکه های عصبی مصنوعی در ساختار IDSS ……………….

3-3-4- استفاده از یک روش تصمیم گیری مبتنی بر منطق فازی در ساختار IDSS ……………………….

3-3-5- استفاده از استنتاج مبتنی بر مورد در ساختار IDSS ……………………….

3-3-6- استفاده از مولفه های مبتنی بر قانون در ساختار IDSS ……………………….

فصل چهارم. بازیهای کامپیوتری استراتژیک بلادرنگ و سیستمهای هوشمند مرتبط با آنها….. 57

4-1- مقدمه.ذ 58

4-2- ویژگیهای بازیهای استراتژیک بلادرنگ.ذ… 59

4-3- مروری بر سیستمهای هوشمند مرتبط با بازیهای استراتژیک بلادرنگ………. 63

فصل پنجم. سیستم پیشنهادی…………………………. 71

5-1- مقدمه……………………….. 72

5-2- معرفی سیستم پیشنهادی..………………………. 73

5-3- مولفه های اصلی سیستم پیشنهادی………………………... 74

5-4- روش رفع ناسازگاری بکار برده شده در سیستم پیشنهادی……….. 77

فصل ششم. ارزیابی و نتایج…………………………. 80

فصل هفتم. نتیجه گیری و کارهای آینده……………………….. 89

فهرست منابع……………………………. 92

چکیده:

رفع ناسازگاری یک رویهی مهم در بسیاری از سیستمهای هوشمند از جمله سیستمهای مبتنی برقانون میباشد. این رویه، ترتیب اجرای قوانین را در شرایطی که بیش از یک قانون برای اجرا وجود دارد، تعیین مینماید. برای رفع ناسازگاری، روشهای مختلفی وجود دارد. در این پژوهش، به منظور رفع ناسازگاری در یک سیستم مبتنی بر

یک مطلب دیگر :

پایان نامه درمورد حقوق مدنی و سیاسی، اسناد بین‌الملل

قانون، از پیگیری نقطه نظرات مختلف در مسیرهای استنتاج مجزا، استفاده شده است. این سیستم، یک سیستم تصمیم همیار هوشمند است که در هنگام وقوع ناسازگاری، با در نظر گرفتن خطوط استنتاج جداگانه برای هر یک از قوانین ناسازگار، امکان آگاهی از تمامی انتخابهای ممکن را برای تصمیمگیرنده فراهم میسازد.

به طورکلی، سیستمهای تصمیم همیار هوشمند با وارد نمودن تکنیکهای مختلف هوش مصنوعی در ساختار سیستمهای تصمیمهمیار، این سیستمها را به منظور حمایت بیشتر و ارتقاء تصمیمگیری، بهبود بخشیدهاند.

سیستم تصمیمهمیار هوشمندی که در این پژوهش ارائه شده، به منظور یاریرساندن به یک بازیکن در یک بازی استراتژیک بلادرنگ پیادهسازی شده است. ایجاد برنامههای کامپیوتری در رابطه با بازیهای استراتژیک بلادرنگ، یک زمینه جدید در حیطهی بازی در هوش مصنوعی به حساب میآید. این برنامهها محدود به ایجاد حریفان هوشمند به منظور سرگرم نمودن بازیکنهای انسانی نمیباشد و امرزوه شبیهسازهایی با کارایی بالا جهت تمرین افراد نظامی، از خواستههای مطرح بوده و تحقیقات هوش مصنوعی در زمینه این نوع از بازی ها، علاوه بر تولیدکنندگان تجاری بازیها، از حمایتهای وسیع برخی از موسسات دفاعی نیز برخوردار میباشد.

نتایج بدست آمده از ارزیابی سیستم ارائه شده در این پژوهش، حاکی از آن است که بازیکن به کمک این دستیار هوشمند میتواند عملکرد بهتری نسبت به سایر بازیکنان داشته باشد.

فصل اول: مقدمه

1-1- مقدمه

مسائل بسیاری وجود دارند که محدود به یک راهحل منحصر به فرد نمیباشند. علاوه براین، برخی از مسائل ممکن است تعداد نامحدودی مسیرهای پاسخ مشابه، داشته باشند. یک ناسازگاری^[1] هنگامی روی میدهد که تصمیمهای گوناگونی، متناظر با مسیرهای پاسخ متمایز، فراهم باشد.

به طور کلی در سیستمی که دارای مجموعههای نسبتاً بزرگی از قوانین و حقایق باشد، درج یک حقیقت میتواند منجر به صحیح شدن ارزش چندین قانون و در نتیجه فعال شدن آنها گردد. هر ترتیبی از اجرای این قوانین، میتواند نتایج متفاوتی را به دنبال داشته باشد که در این صورت این مجموعه از قوانین، مجموعهی قوانین ناسازگار نامیده میشوند. یک استراتژی رفع ناسازگاری ترتیبی را برای اجرای این مجموعه از قوانین تعیین مینماید.

سیستمهای هوشمند از قبیل سیستمهای مبتنی بر قانون، ابزارهای برنامهریزی، و ساختارهای وابسته به دانش، از استراتژیهای متفاوتی برای رفع ناسازگاری استفاده میکنند] 2[.

در این پژوهش در ابتدا در رابطه با این شیوههای متفاوت توضیحاتی ارائه میگردد و پس از آن ایدهایی که به منظور رفع ناسازگاری در سیستم پیشنهادی بکار برده شده، شرح داده میشود. سیستم پیشنهادی یک سیستم تصمیمهمیار هوشمند است که به منظور یاری رساندن به یک بازیکن در یک بازی استراتژیک بلادرنگ طراحی و پیادهسازی شده و شرح ساختار و ویژگیهای آن در فصول آتی آمده است. همچنین در این پایاننامه در ارتباط با سیستمهای تصمیمهمیار هوشمند و ساختارهای مختلفی که محققان برای پیادهسازی این سیستمها در نظر گرفتهاند، نیز مطالبی ارائه شده است.

موضوعات: بدون موضوع لینک ثابت

[ 03:27:00 ب.ظ ]

ارسال نظر »

مهندسی کامپیوتر جستجوی الگوهای نوظهور با ویژگی های جریانی

2-3-1 روش مبتنی بر مرز ………………………………………………………………………………………… 17

2-3-2 روش مبتنی بر محدودیت ………………………………………………………………………………. 17

2-3-3 الگوریتم استخراج درخت الگوی تقابل CP-tree …………………………………………….

2-3-4 روش استخراج با کمک دیاگرام دودویی صفر ZBDD Miner …………………………

2-3-5 روش استخراج الگوهای نوظهور متمایز DP-Miner ……………………………………….

2-4 روش های کلاسه بندی مبتنی بر الگوهای نوظهور ………………………………………………………… 20

2-4-1 روش کلاسه بندی مبتنی بر اساس مجموع الگوهای نوظهور CAEP ………………………………..

2-4-2 الگوریتم کلاسه بندی بر پایه تئوری اطلاعات iCAEP ……………………………………………………

2-4-3 روش کلاسه بندی بر پایه الگوهای نوظهور جهشی JEPs-classifier …………………………….

2-4-4 روش کلاسه بندی بر پایه الگوهای نوظهور جهشی قوی ………………………………………………… 21

2-4-5 روش تصمیم گیری مبتنی بر نمونه DeEPs ………………………………………………………………….

2-4-6 روش کلاسه بندی توسط مجموعه راست نمایی PCL …………………………………………………….

فصل سوم ………………………………………………………………………………………………………………….. 23

3- دانش اولیه ………………………………………………………………………………………………………………. 24

3-1 الگوهای نوظهور …………………………………………………………………………………………………… 24

3-2 درخت الگوی مکرر دینامیک DFP-tree ………………………………………………………………

فصل چهارم ……………………………………………………………………………………………………………….. 33

4- راهکارهای ارائه شده برای استخراج الگوهای نوظهور قوی مبتنی بر ویژگی های جریانی ………. 34

4-1 مقدمه ………………………………………………………………………………………………………………….. 34

4-2- درخت الگوی مکرر دینامیک نامرتب Unordered Dynamic FP-tree …………………………

4-3 درخت الگوی مکرر دینامیک مرتب Ordered Dynamic FP-tree ……………………………….

4-4 روش استخراج الگوها SEP-Miner …………………………………………………………………….

فصل پنجم …………………………………………………………………………………………………………………… 62

5- آزمایشات تجربی ………………………………………………………………………………………………………. 63

5-1 مقدمه ………………………………………………………………………………………………………………….. 63

5-2 کلاسه بندها ………………………………………………………………………………………………………… 63

5-2-1 کلاسه بند درخت تصمیم C4.5 ……………………………………………………………………

5-2-2 کلاسه بند SVM …………………………………………………………………………………………

5-2-3 کلاسه بند بیزین ساده ……………………………………………………………………………….. 65

5-2-4 کلاسه بند نزدیکترین همسایه ……………………………………………………………………. 66

5-2-5 الگوریتم AdaBoost………………………………………………………………………………….

5-3 تست های آماری ………………………………………………………………………………………… 68

5-3-1 تست آماری جفت شده t-tets …………………………………………………………………………

5-3-2 تست آماری Wilcoxon ………………………………………………………………………………..

5-3-3 تست آماری فردمن ………………………………………………………………………………………. 69

5-4 تنظیمات تجربی ………………………………………………………………………………………………….. 71

5-5 مقایسه دقت پیش بینی ……………………………………………………………………………………….. 73

5-6 مقایسه تعداد الگوها ……………………………………………………………………………………………. 81

5-7 مقایسه زمان اجرا ………………………………………………………………………………………………… 83

5-8 تحلیل اثر ترتیب در ساخت درخت الگوی مکرر دینامیک ……………………………………… 86

5-9 چگونگی تعیین کردن حداقل آستانه فراوانی نسبی ………………………………………………. 88

5-10 تحلیل حساسیت روی حداقل آستانه های نرخ رشد ………………………………………………. 89

5-11 مقایسه کارایی DFP-SEPSF بدون دانستن کل فضای ویژگی ها …………………………. 90

5-12 خلاصه نتایج تجربی ……………………………………………………………………………………. 94

فصل ششم ……………………………………………………………………………………………………………. 96

6- نتیجه گیری و کارهای آینده …………………………………………………………………………………. 97

اختصارات ……………………………………………………………………………………………………………. 99

واژه نامه فارسی به انگلیسی ………………………………………………………………………………….. 100

واژه نامه انگلیسی به فارسی ………………………………………………………………………………… 108

فهرست منابع …………………………………………………………………………………………………. 116

چکیده:

استخراج الگوهای مفید از مجموعه داده ها، یکی از موضوعات چالش برانگیز در داده کاوی است. از طرفی در داده ها با ابعاد بالا، استخراج مجموعه کوچکی از الگوهای نوظهور با قابلیت پیش بینی قوی، از مسائل مهم در ایجاد یک کلاسه بند بر پایه الگوهای نوظهور است. در دنیای واقعی، ویژگی ها همیشه بطور کامل در دسترس نیستند؛ بر این اساس، مسئله سخت تر می شود وقتی که مجموعه ویژگی ها قبل از شروع فرآیند یادگیری ناشناخته باشد. ویژگی های جریانی عنوان ویژگی هایی است که بصورت برخط تولید می شوند و در همان زمان تولید پردازش می شوند. در این طرح، ویژگی ها یکی یکی به مرور زمان پدیدار می شوند بجای اینکه تمام ویژگی ها قبل از فرآیند یادگیری آماده باشند.

در این مطالعه، ما ساختار دینامیک از درخت الگوی مکرر پیشنهاد می دهیم تا درخت به محض ورود ویژگی های جدید ساخته شود و استخراج الگوهای نوظهور بصورت برخط صورت گیرد. DFP-SEPSF، یک روش موثر پایین به بالا ارائه می دهد تا یک درخت الگوی مکرر دینامیک نامرتب UDFP-tree و یک درخت الگوی مکرر دینامیک مرتب ODFP-tree بسازد. اولین روش ترتیب آیتم ها را در نظر نمی گیرد، در حالیکه دومین روش ترتیب آیتم ها را اعمال می کند.

بعلاوه، چارچوب پیشنهادی الگوهای نوظهور قوی را استخراج می کند تا یک کلاسه بند قوی و سریع ایجاد کند که می تواند با نویز مقابله کند.

روش پیشنهادی فضای جستجوی الگوهای نوظهور را بطور قابل توجهی کاهش می دهد و الگوهای نوظهور با قدرت تمایز قوی را با کمک حذف الگوهای بی فایده استخراج

می کند.

روش ارائه شده الگوهای نوظهور را برای هر کلاس بصورت همزمان کشف می کند و بعلاوه، فرآیند تولید درخت های الگوی مکرر را بصورت کارایی در راستای کاهش محاسبات، هدایت می کند.

ارزیابی تجربیات ما بر روی محدوده وسیعی از داده ها، اثربخشی روش پیشنهادی را در مقایسه با دیگر روش های شناخته شده از نظر دقت پیش بینی، تعداد الگوهای استخراجی و زمان اجرا نشان می دهد.

فصل اول: مقدمه

1-1- مقدمه

کلاسه بندی[1] یکی از وظایف اساسی در داده کاوی[2] است که بطور وسیعی در زمینه یادگیری ماشین[3]، شبکه های عصبی[4] و تشخیص الگو[5] مورد مطالعه واقع شده است. ورودی، مجموعه ای از نمونه های آموزشی[6] است که شامل چندین ویژگی[7] است. ویژگی ها با توجه به دامنه مقادیرشان به دو دسته ویژگی های گسسته[8] و ویژگی های پیوسته[9] قابل تفکیک هستند. در حالت کلی، یک کلاسه بند[10]، توصیف مختصر و معنادار (مدل[11]) برای هر برچسب کلاس[12] در رابطه با ویژگی ها تولید می کند. سپس، مدل برای پیش بینی برچسب کلاس نمونه های ناشناخته[13] بکار می رود. کلاسه بندی همچنین بعنوان یادگیری با ناظر[14] نیز شناخته می شود که در آن هر نمونه آموزشی دارای برچسب کلاس است. در حالی که، یادگیری بدون ناظر[15] یا خوشه بندی[16] جستجو می کند و گروه های همگن از اشیا را بر اساس مقادیر ویژگی هایشان دسته بندی می کند؛ در واقع، نمونه ها دارای برچسب کلاس نیستند. کلاسه بندی در محدوده وسیعی از کاربردها از جمله آزمایشات علمی[17]، تشخیص دارو[18]، پیش بینی آب و هوا[19]، تایید اعتبار[20]، تقسیم بندی مشتری[21]، بازاریابی هدف[22] و تشخیص تقلب[23] بطور موفقیت آمیزی بکار می رود.

کلاسه بندی بر پایه الگوها[24]، یک متدلوژی جدید محسوب می شود. کشف الگوهایی که نشاندهنده تمایز بین کلاس های مختلف هستند، یکی از موضوعات مهم در داده کاوی محسوب می شود. در این تحقیق، ما کلاسه بندی را بر اساس الگوهایی به نام الگوهای نوظهور[25] (Emerging Patterns) که تمایز بین کلاس ها را بصورت بارزی نشان می دهند، از مجموعه داده ها[26] استخراج می کنیم و سپس، بر اساس آنها، کلاسه بندی را انجام می دهیم.

2-1- مفهوم الگوهای نوظهور

مفهوم الگوهای نوظهور برای استخراج دانش از پایگاه داده ها توسط Dong و Li پیشنهاد شده است تا تغییرات قابل توجه بین کلاس ها را به تصویر بکشند [1]. یک الگوی نوظهور، ترکیب عطفی بین ویژگی هایی است که میزان احتمال حضور آن در یک کلاس نسبت به دیگر کلاس ها بطور قابل توجهی تغییر می کند [1،2]. این الگوها مفید هستند به این دلیل که قادر هستند تا وجه تمایز بین کلاس ها را بیان کنند. در صورتی که میزان فراوانی[27] هر الگو که در یک کلاس نسبت به دیگر کلاس ها قابل توجه باشد، نشاندهنده آن است که این الگو، بطور خاص به این کلاس اختصاص دارد و از طرفی این نوع الگوها برای پایگاه داده هایی که بحث محدودیت زمانی برای استخراج دانش از آنها مطرح است، اهمیت ویژه ای می یابند.

استخراج الگوهای نوظهور بدین صورت مطرح می شود: « پیدا کردن آیتم هایی که نرخ رشد[28] آن (که بصورت نسبت احتمال آن آیتم بین کلاس های مختلف تعریف می شود) از مقدار آستانه ای بیشتر باشد.» این مقدار آستانه باید بگونه ای انتخاب شود که الگوهای استخراجی ، تفاوت و تمایز بین کلاس های مختلف را نشان دهند. این الگوها در واقع مجموعه ای از آیتم ها هستند که بیان کننده ترکیب عطفی بین مقادیر ویژگی ها هستند [2].

نوعاً، تعداد الگوهای استخراجی بسیار زیاد است اما فقط شمار کمی از این الگوها برای تحلیل داده ها و کلاسه بندی مطلوب و مفید هستند. از آن جایی که مقدار زیادی از

یک مطلب دیگر :

اخلاقی، فضیلت، فضایل، نظریه‌ی، ویژگی‌های، زگزبسکی

این الگوها بی ربط[29] و تکراری[30] هستند، دانش جدیدی را فراهم نمی کنند و لذا تاثیر نامطلوبی بر روی دقت کلاسه بند دارند که موجب کاهش دقت پیش بینی[31] می شوند. برای افزایش کارایی[32] و دقت، بایستی روالی را توسعه داد که الگوهای وابسته و غیر مفید حذف شوند تا شمار این الگوها کاهش یابد.

یک الگوی نوظهور با احتمال بالا در کلاس خودش و احتمال پایین در کلاس مقابلش می تواند برای تعیین یک نمونه تست بکار رود. قدرت این الگو توسط معیارهایی مثل فراوانی نسبی[33] و نرخ رشد ( نسبت احتمال الگو در یک کلاس نسبت به دیگر کلاس ها) آن بیان می شود.

در بسیاری از زمینه های کاربردی مانند کشف دانش از داده های ژنی[34] ، پردازش تصویر[35]، کشف نفوذ[36] ، کشف برون هشته[37]، کشف کلاهبرداری[38] ، داده های نامتوازن[39] ، جریان داده ها[40] ، بیوانفورماتیک[41] ، سیستم های پیشنهاد دهنده[42] ، نیاز است که تغییر ناگهانی در داده ها تشخیص داده شود. الگوهای نوظهور تغییرات ناگهانی و تفاوت های قابل توجه را از داده ها استخراج می کنند. الگوهای نوظهور، در زمینه پردازش تصویر برای قطعه بندی بدین گونه عمل می کند که سعی می کند در پیکسل هایی که تغییر ناگهانی شدت[43] بوجود می آید را بعنوان یک قطعه جدید معرفی کند. در زمینه کشف نفوذ و کلاهبرداری، رفتار داده ها پیگیری می شود، زمانی که رفتار داده ها بصورت ناگهانی تغییر کند، بعنوان نفوذ تشخیص داده می شود. در سیستم های پیشنهاد دهنده، سیستم به دنبال رفتارهای خاص و مختص هر کاربر است تا با کشف ویژگی های خاص هر کاربر، به او محصولات مطابق با علایق و استعدادهای او را پیشنهاد دهد. لذا الگوهای نوظهور در این راستا نقش بسزایی دارند.

3-1- مفهوم ویژگی های جریانی[44]

در داده های جریانی[45]، نمونه ها به مرور زمان دریافت می شوند در حالیکه تعداد ویژگی ها ثابت می باشد. اما در ویژگی های جریانی، تعداد داده های یادگیری ثابت می باشد ولی ویژگی ها بصورت دینامیک تولید می شوند و الگوریتم یادگیری به مرور زمان ویژگی ها را دریافت می دارد [31، 32]. در ویژگی های جریانی روال بدین صورت است ویژگی های توسط روش های تولید ویژگی مانند روش های یادگیری رابطه ای آماری[46] و تعاملات بین ویژگی ها[47]، تولید می شوند. مشکلاتی که در پی تولید ویژگی ها توسط این روش ها بروز می کند بدین شرح است که: 1) میلیون ها و یا حتی بیلیون ها ویژگی تولید می شوند که بدلیل محدودیت های حافظه امکان نگهداری این حجم از ویژگی وجود دارد و از طرفی زمان بسیار زیادی بایستی صرف شود تا فرآیند یادگیری شروع شود. 2) ویژگی ها توسط کوئری های موجود در SQL تولید می شوند که اجرای این کوئری ها محدود به زمان پروسسور[48] است تقریبا پروسسور هر صدهزار کوئری را در 24 ساعت اجرا می کند. از طرفی بسیاری از ویژگی ها تولیدی بی ربط و تکراری هستند[49]. این موضوع نشان می دهد که شمار کمی از این ویژگی های تولیدی در عمل در فرآیند یادگیری موثر است و لذا تولید ویژگی ها هزینه بر است [32]. بر این اساس برای فائق آمدن بر این مشکلات، مفهوم ویژگی های جریانی شکل گرفت و تلاش شد تا با تولید دینامیک ویژگی ها و بررسی این ویژگی ها در زمان تولید و تاثیر آن بر روال یادگیری فرآیند تولید ویژگی ها را هدایت کنند.

برای برخورد با چالش های مطرح شده، بایستی فرآیند یادگیری قابلیت پاسخگویی به ویژگی های جریانی را داشته باشد. در واقع، روال یادگیری بایستی بصورت افزایشی با دریافت هر ویژگی قابل بروزرسانی شدن داشته باشد بدون اینکه به اولین مرحله یادگیری بازگردد. لذا در راستای استخراج الگوهای قوی بایستی در ابتدا ویژگی ها بررسی شوند و ویژگی هایی که بی ربط هستند را حذف کرد، سپس از روی ویژگی های مفید و قوی ، الگوها را استخراج کرد.

[1] Classification

[2] Data mining

[3] Machine learning

[4] Neural networks

[5] Pattern recognition

[6] Training instances

[7] Features

[8] Nominal

[9] Numerical

[10] Classifier

[11] Model

[12] Class label

[13] Unknown

[14] Supervised learning

[15] Unsupervised learning

[16] Clustering

[17] Scientific experiments

[18] Medical diagnosis

[19] Weather prediction

[20] Credit approval

[21] Customer segmentation

[22] Target marketing

[23] Fraud detection

[24] Patterns

[25] Emerging patterns

[26] Datasets

موضوعات: بدون موضوع لینک ثابت

[ 03:26:00 ب.ظ ]

ارسال نظر »