کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل



 

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کاملکلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

لطفا صفحه را ببندید

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

کلیه مطالب این سایت فاقد اعتبار و از رده خارج است. تعطیل کامل

Purchase guide distance from tehran to armenia


جستجو



 



2-5-2 رده‌بندی در متون گذشته……………………………………………………………………………..31

2-6سیستم‌هایپیشنهاددهنده………………………………………………………………………………….35

2-6-1انواع سیستم‌های پیشنهاددهنده………………………………………………………………….35

2-6-2سیستم‌های پیشنهاد دهنده موسیقی……………………………………………………………37

2-7 نتیجه……………………………………………………………………………………………………….38

فصل سوم:روش پیشنهادی

3-1مقدمه…………………………………………………………………………………………………………..40

3-2 تولید مجموعه داده از موسیقی ایرانی…………………………………………………………..41

3-2-1 جمع‌آوری داده‌ها و فرا داده‌ها و پیش پردازش…………………………………………………….41

3-2-2 استخراج ویژگی‌ها………………………………………………………………………………………….42

پایان نامه و مقاله

 

3-2-3 ویژگی‌های مجموعه داده‌ها……………………………………………………………………………43

3-3 ویژگی Area Method Of Moment of MFCC……….………………………………..

3-3-1عملگر Area Method Of Moment…….……………………………………………..

3-3-2روش محاسبه Area Method Of Moment of MFCC……………………………..

3-4معرفیمعیار شباهت پروفایل جدید…………………………………………………………………………49

3-4-1 معیار شباهت پروفایل…………………………………………………………………………………….50

3-5برنامه کاربردی پیشنهاددهنده موسیقی……………………………………………………………………52

3-5-1 پیشنهاد دهی بر اساس شباهت موسیقی……………………………………………………..55

3-5-2 پیشنهاد دهی بر اساس شباهت پروفایل……………………………………………………….56

3-6نتیجه…………………………………………………………………………………………………….57

یک مطلب دیگر :

 
 

فصل چهارم: ارزیابی

4-1مقدمه……………………………………………………………………………………………………………….59

4-2ارزیابی برتریمجموعه داده تولید شده……………………………………………………………….59

4-3ارزیابیویژگیArea Method Of Moment of MFCC…………………………………………………..

4-3-1رده‌بندی سبک………………………………………………………………………………………………61

4-3-2رده‌بندی دستگاه‌های موسیقی سنتی…………………………………………………………..66

4-3-3پیشنهاددهی با استفاده از ویژگی Area Method Of Moment of MFCC……………………..

4-4ارزیابی معیارشباهتپروفایل……………………………………………………………………………….69

4-5نتیجه…………………………………………………………………………………………………69

فصل پنجم:نتیجه گیری و کارهای آینده

5-1مقدمه…………………………………………………………………………………………………………71

5-2دستاوردهای تحقیق………………………………………………………………………………………72

5-3محدودیت­های تحقیق……………………………………………………………………………………..73

5-4کارهای آینده……………………………………………………………………………………………73

موضوعات: بدون موضوع  لینک ثابت
[جمعه 1399-08-09] [ 12:41:00 ب.ظ ]




2-5-3- دوره انقلاب مشتری (بهبود مستمر تا سفارشی‌سازی انبوه): ………………………….20

2-6- ا نواع فناوری CRM……………………………………………………………………………………………..

2-6-1-CRM عملیاتی: ……………………………………………………………………………………………….20

2-6-2- CRM تحلیلی: ………………………………………………………………………………………………..22

2-6-3-CRM مشارکتی: ……………………………………………………………………………………………..24

2-7- ضرورت به كارگیری CRM……………………………………………………………………………………..

2-8- چالش‌های اجرایی CRM ……………………………………………………………………………………..

2-9- مزایای استفاده از CRM ……………………………………………………………………………………..

2-10- دلایل حرکت سازمانها به سوی سرمایه گذاری بر مدیریت ارتباط با مشتری ……………26

2-11- بررسی علت شكست CRM ها …………………………………………………………………………….27

2-12- تصورات غلط در زمینه CRM……………………………………………………………………………..

2-13- محدودیت سیستمهای CRM ……………………………………………………………………………..

2-14- ریسك‌هایCRM ……………………………………………………………………………………………..

2-15- روش های کلیدی موفقیت CRM در سازمان‌ها …………………………………………………..31

2-16- شرایط استقرار موفق نرم افزار CRM در یك سازمان …………………………………………..32

2-16-1- پیش نیازهای تكنیكی …………………………………………………………………………………..32

پایان نامه و مقاله

 

2-16-2- پیش نیازهای فرهنگی …………………………………………………………………………………..32

2-17- پنج اصل برای موفقیت CRM……………………………………………………………………………

2-18- اهداف CRM …………………………………………………………………………………………………

2-19- نتایج فصل …………………………………………………………………………………………………….36

فصل سوم: مروری بر تحقیقات انجام شده و بررسی چهارچوبهای موجود در زمینه مدیریت ارتباط با مشتری

3-1- مقدمه ………………………………………………………………………………………………………..38

3-2- مطرح ترین شركتهای ارائه دهنده نرم افزارهای CRM و بررسی چهارچوبهای ارائه شده توسط برخی از آنها….40

3-2-1- شرکت Sap: ………………………………………………………………………………………………..

3-2-2- شرکت Oracle : ………………………………………………………………………………………..

3-2-3- شرکت Onyx : …………………………………………………………………………………………

3-2-4- شرکت Seibel : ………………………………………………………………………………………..

3-2-5- شرکت Winer : ………………………………………………………………………………………

3-2-6- شرکتAmdocs : …………………………………………………………………………………..

3-2-7- شركت Microsoft : ……………………………………………………………………………….

3-3- نتایج فصل …………………………………………………………………………………………………52

فصل چهارم: روش تحقیق، بررسی وضعیت امور مشتركین دیتای شركت مخابرات استان یزد و ارائه مدل جهت پیاده سازی مدیریت ارتباط با مشتری

4-1- مقدمه …………………………………………………………………………………………………………54

4-2- هدف و دامنه پژوهش: …………………………………………………………………………………55

4-3- روشهای گردآوری داده ها:………………………………………………………………………………56

4-4- جامعه آماری: ……………………………………………………………………………………………..56

یک مطلب دیگر :

 
 

4-5- شركت مخابرات استان یزد و لزوم پیاده سازی مدیریت ارتباط با مشتری در آن …..57

4-5-1- خط مشی کیفیت شرکت مخابرات استان یزد: ……………………………………………….58

4-5-2- مدیریت ارتباط با مشتری در شركت مخابرات استان یزد ………………………………58

4-5-3- وضعیت فعلی شركت در زمینه ارتباط با مشتری : ………………………………………….60

4-5-4- وضعیت فعلی امور مشتركین دیتای استان یزد ………………………………………………61

4-6- ارائه مدل پیشنهادی جهت پیاده سازی CRM: …………………………………………………..

4-6-1- تکنولوژی: ………………………………………………………………………………………………..62

4-6-2- فرایندها: ………………………………………………………………………………………………….64

4-6-3- عوامل انسانی …………………………………………………………………………………………..65

4-7- مدل مفهومی مدیریت ارتباط با مشتری …………………………………………………………..68

4-8- نتایج فصل ………………………………………………………………………………………………..68

فصل پنجم: اعتبار سنجی مدل با استفاده از مطالعه موردی، شبیه سازی مدل در اداره دیتای شركت مخابرات استان یزد و نظر خبرگان

5-1- مقدمه ………………………………………………………………………………………………………70

5-2- تكنولوژی ………………………………………………………………………………………………..70

5-3- فرآیندها: …………………………………………………………………………………………………72

5-3-1- بازاریابی …………………………………………………………………………………………….72

5-3-2- فروش: ……………………………………………………………………………………………….75

5-3-3- خدمات ……………………………………………………………………………………………… 77

5-4- عوامل انسانی………………………………………………………………………………………… 78

5-4-1- مشتریان……………………………………………………………………………………………… 78

5-4-2- كاركنان …………………………………………………………………………………………….. 80

5-5- نتایج نظر سنجی و ارائه مدل نهایی ………………………………………………………….81

5-6- تعیین اعتبار مدل با استفاده از نظر خبرگان ………………………………………………..86

5-7- نتایج فصل …………………………………………………………………………………………….90

فصل ششم: نتیجه گیری و پیشنهادات

6-1- نتیجه‌گیری ………………………………………………………………………………………….. 92

6-2- پیشنهادات برای تحقیقات آتی: …………………………………………………………….93

فهرست منابع و مآخذ

منابع فارسی ………………………………………………………………………………………………. 94

منابع انگلیسی………………………………………………………………………………………………96

پیوست

پیوست 1: پرسشنامه تعیین اعتبار مدل ارائه شده جهت مدیریت ارتباط با مشتری در شركت مخابرات……….99

موضوعات: بدون موضوع  لینک ثابت
 [ 12:40:00 ب.ظ ]




دانشکده فنی­ومهندسی

 

پایان­ نامه دوره کارشناسی ارشد مهندسی­ فناوری ­اطلاعات (IT)

 

عنوان:

 

استفاده از داده ­کاوی برای ارائه چارچوبی جهت کشف الگوهای پزشکی و ایجاد یک سیستم تشخیص، تصمیم و تجویز

 

مطالعه موردی: بیمارستان تخصصی کودکان حضرت فاطمه معصومه (س)

 

استاد راهنما:

 

دکتر بهروز مینایی بیدگلی

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

فهرست مطالب:

فصل1: مقدمه…………………………………………………………………………………………………………….1

1-1. موضوع تحقیق…………………………………………………………………………………………..2

1-2. اهمیت و ضرورت تحقیق…………………………………………………………………………….3

1-3. قلمرو تحقیق……………………………………………………………………………………………..4

1-4. فرضیه­های تحقیق………………………………………………………………………………………4

1-5. سوالات تحقیق………………………………………………………………………………………….5

1-6. اهداف و کاربردهای تحقیق…………………………………………………………………………5

1-7. نوآوری در تحقیق……………………………………………………………………………………..6

1-7-1. موضوع و داده­های استفاده شده در تحقیق……………………………………………..6

1-7-2. براساس مطالعه ادبیات و نحوه ارائه مطالب……………………………………………..6

1-8.. محدودیت­های تحقیق………………………………………………………………………………..6

1-9. ساختار پایان­نامه…………………………………………………………………………………………7

فصل2: ادبیات تحقیق………………………………………………………………………………………….8

2-1. مقدمه………………………………………………………………………………………………………9

2-2. داده­کاوی…………………………………………………………………………………………………9

2-2-1. مفهوم داده­ کاوی……………………………………………………………………………….9

2-2-2. مراحل داده ­کاوی…………………………………………………………………………….10

2-2-3. پیش­پردازش…………………………………………………………………………………..10

2-2-3-1. پاک­سازی داده………………………………………………………………………11

2-2-3-2. یکپارچه­ سازی داده………………………………………………………………….11

2-2-3-3. تبدیل داده……………………………………………………………………………..11

2-2-3-4. کاهش داده……………………………………………………………………………12

2-2-3-5. تصویرکردن برای کاهش بعد……………………………………………………12

2-2-4. داده ­کاوی………………………………………………………………………………………13

2-2-5. پس­پردازش……………………………………………………………………………………14

2-2-6. کاربردهای داده­ کاوی………………………………………………………………………14

2-3. داده­ کاوی در پزشکی……………………………………………………………………………….14

2-4. بیماری تنفسی………………………………………………………………………………………….16

2-4-1. عفونت دستگاه تنفسی فوقانی…………………………………………………………….17

2-4-2. پنومونی…………………………………………………………………………………………17

2-4-3. بیماری مزمن انسدادی ریه…………………………………………………………………18

2-5. الگوریتم­های رده­بندی………………………………………………………………………………18

2-5-1. درخت تصمیم………………………………………………………………………………..19

2-5-1-1. CHAID…………………………………………………………………………….

2-5-1-2. ID3……………………………………………………………………………………

2-5-1-3. C5.0…………………………………………………………………………………..

2-5-2. ماشین بردار پشتیبان………………………………………………………………………….21

2-5-3. شبکه­ عصبی………………………………………………………………………………..24

2-5-4. Bagging…………………………………………………………………………………….

2-5-5. AdaBoost…………………………………………………………………………………

2-6. پیشینه تحقیقات در بیماری­های تنفسی……………………………………………………….30

فصل3: داده ­های نامتوازن…………………………………………………………………………………..32

3-1. مقدمه…………………………………………………………………………………………………….33

3-2. روش­های یادگیری در داده­های نامتوازن………………………………………………………33

3-2-1. نمونه­برداری……………………………………………………………………………………33

3-2-1-1. بیش­نمونه­برداری تصادفی…………………………………………………………34

3-2-1-2. زیرنمونه­برداری تصادفی…………………………………………………………..34

3-2-1-3. نمونه­برداری آگاهانه……………………………………………………………….34

3-2-1-3-1. EasyEnsemble…………………………………………………………………..

3-2-1-3-2. ModifiedBagging…………………………………………………………….

3-2-1-4. ترکیب نمونه ­برداری و تولید داده……………………………………………….37

3-2-2. روش­های حساس به هزینه…………………………………………………………………39

3-3. معیارهای ارزیابی رده­بند در داده­ های نامتوازن………………………………………..41

3-4. معیارهای ارزیابی رده­بند در داده­ های نامتوازن و چند رده­ای……………………..44

3-4-1. میانگین­ گیری میکرو………………………………………………………………………..46

3-4-2. میانگین­ گیری ماکرو…………………………………………………………………………46

فصل4: پیش­ پردازش داده ­ها……………………………………………………………………………47

4-1. مقدمه…………………………………………………………………………………………………….48

4-2. جمع­آوری داده­ها…………………………………………………………………………………….48

4-3. ویژگی­های داده­ها……………………………………………………………………………………48

4-4. نحوه توزیع داده­ها براساس ویژگی­ها…………………………………………………………..51

4-4-1. نوع بیماری تنفسی……………………………………………………………………………51

4-4-2. سن……………………………………………………………………………………………….52

4-5. پیش­پردازش­های انجام شده……………………………………………………………………….53

4-5-1. حذف ویژگی­های اضافی………………………………………………………………….53

4-5-2. حذف یا اصلاح رکورد…………………………………………………………………….53

4-5-3. یکپارچه­سازی داده………………………………………………………………………….54

4-5-4. تبدیل مقادیر ویژگی………………………………………………………………………..55

4-5-4-1. تفسیر آزمایش­های انجام شده روی بیماران………………………………….55

4-5-4-2. WBC (White Blood Cell)……………………………………………………………

4-5-4-3. چه چیزهایی باعث کاهش WBC می­شود؟………………………………..56

4-5-4-4. چه چیزهایی باعث افزایش WBC می­شود؟………………………………..56

4-5-4-5. جدول گسسته ­سازی WBC……………………………………………………..

4-5-4-6. RBC(Red Blood Cell)………………………………………………………..

4-5-4-7. چه چیزهایی باعث کاهش RBC می­شود؟…………………………………57

4-5-4-8. چه چیزهایی باعث افزایش RBC می­شود؟…………………………………58

4-5-4-9. جدول گسسته­ سازی RBC………………………………………………………58

پایان نامه و مقاله

 

4-5-4-10. Hb (Hemoglobin)………………………………………………………………..

4-5-4-11. چه چیزهایی باعث کاهش هموگلوبین می­شود؟………………………….59

4-5-4-12. چه چیزهایی باعث افزایش هموگلوبین می­شود؟…………………………59

4-5-4-13. جدول گسسته­ سازی هموگلوبین………………………………………………59

4-5-4-14. HCT (Hematocrit)……………………………………………………………..

4-5-4-15. چه چیزهایی باعث کاهش HCT می­شود؟……………………………….60

4-5-4-16. چه چیزهایی باعث افزایش HCT می­شود؟……………………………….60

4-5-4-17. جدول گسسته­ سازی HCT……………………………………………………

4-5-4-18. Plt یا پلاکت­ها……………………………………………………………………60

4-5-4-19. چه چیزهایی پلاکت را کاهش می­دهد؟……………………………………61

4-5-4-20. چه چیزهایی پلاکت را افزایش می­دهد؟……………………………………61

4-5-4-21. جدول گسسته­سازی پلاکت……………………………………………………61

4-5-4-22. اجزای دیگر آزمایش خون……………………………………………………..61

4-5-4-23. جدول گسسته­سازی MCV، MCH و MCHC…………………………………..

4-5-4-24. CRP (C-Reactive Protein)………………………………………………….

4-5-4-25. در چه شرایطی CRP افزایش پیدا می­کند؟……………………………….63

4-5-4-26. در چه شرایطی CRP کاهش پیدا می­کند؟……………………………….63

4-5-4-27. جدول گسسته­ سازی CRP…………………………………………………….

4-5-4-28. ESR (Erythrocyte Sedimentation Rate)………………………………

4-5-4-29. جدول گسسته­ سازی ESR…………………………………………………….

4-5-4-30. جدول گسسته­ سازی BS (Blood Suger)………………………………….

4-5-5. ویژگی داده­ها پس از پیش­پردازش نهایی……………………………………….64

4-6 نمونه ­برداری…………………………………………………………………………………….67

فصل5: نتایج و یافته­ های تحقیق…………………………………………………………………69

5-1. مقدمه……………………………………………………………………………………………….70

5-2. رده­بندی……………………………………………………………………………………..70

5-2-1. مقایسه­ی الگوریتم­های پایه………………………………………………………………..70

5-2-2. مقایسه­ی روش­های یادگیری در داده­ های نامتوازن…………………………………74

یک مطلب دیگر :

 
 

فصل6: نتیجه­ گیری و پیشنهادات…………………………………………………………………..79

6-1. مقدمه…………………………………………………………………………………………………….80

6-2. نتیجه­گیری……………………………………………………………………………………………..80

6-3. پیشنهادها………………………………………………………………………………………………..82

6-3-1. مجموعه­ داده……………………………………………………………………………….82

6-3-2. داده­ کاوی………………………………………………………………………………………82

مراجع…………………………………………………………………………………………………………….83

پیوست الف: واژه­ نامه انگلیسی به فارسی……………………………………………………… 92

چکیده:

بیماری تنفسی که عموما در ارتباط با بیماری ریوی است، شامل گروهی از بیماری­ها هستند که از طریق درگیر کردن بخش یا قسمت­هایی از دستگاه تنفس باعث اختلال در عملکرد ریه­ها می­گردند. ریه­ها مهم­ترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافت­های مختلف بدن و دفع دی­اکسیدکربن نقش دارند. بیماری­های ریوی در هر سال بسیاری از افراد جامعه را مبتلا می­کنند که باعث کاهش سطح عملکرد فرد در فعالیت­های روزمره می­گردند. بیماری­های دستگاه تنفسی در انگلستان شایع­ترین عامل مراجعه به پزشکان عمومی است. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماری­های ریوی می­توانند عفونت دستگاه تنفسی فوقانی، پنومونی و یا بیماری مزمن انسدادی ریه باشند. بیماری­های ریوی یکی از عوامل مهم مرگ­و­میر افراد در سراسر جهان هستند. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماری­ها در همان ابتدای روزهای بستری است. تکنیک­های داده­کاوی می­توانند دانش نهفته در پایگاه­های داده را استخراج و در پیش­گیری، تشخیص و معالجه­ی این بیماری­ها به پزشک و بیمار کمک کنند. در این تحقیق، با مقایسه­ی سیستم­های رده­بندی متفاوت و مقایسه­ی روش­های یادگیری داده­های نامتوازن با الگوریتم پایه، در نهایت، سیستم رده­بندی ارائه شده که می­تواند در تشخیص انواع بیماری­های تنفسی به پزشکان کمک کند. سرانجام، به شناسایی عوامل موثر در بروز بیماری­های تنفسی پرداخته شده است.

فصل اول: مقدمه

1-1- موضوع تحقیق

بیماری تنفسی[1] که عموما در ارتباط با بیماری ریوی[2] است، شامل گروهی از بیماری­ها هستند که از طریق درگیر کردن بخش یا قسمت­هایی از دستگاه تنفس[3] باعث اختلال در عملکرد ریه[4]­ها می­گردند. ریه­ها مهم­ترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافت­های مختلف بدن و دفع دی­اکسیدکربن نقش دارند. بیماری­های ریوی در هر سال بسیاری از افراد جامعه را مبتلا می­کنند که باعث کاهش سطح عملکرد فرد در فعالیت­های روزمره می­گردند. بیماری­های دستگاه تنفسی در انگلستان شایع­ترین عامل مراجعه به پزشکان عمومی است[1]. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماری­های ریوی می­توانند عفونت دستگاه تنفسی فوقانی[5]، پنومونی[6] و یا بیماری مزمن انسدادی ریه[7] باشند.

بیماری­های مزمن تنفسی از 10 مورد بیماری­های تهدید کننده حیات در جهان هستند[8]. مطابق آمار سازمان بهداشت جهانی[9]، صدها میلیون نفر از جمعیت جهان از بیماری­های مزمن تنفسی رنج می­برند. پیش­بینی می­شود تا سال 2030 میلادی به سومین عامل مرگ­و­میر در جهان بعد از بیماری­های قلبی­و­عروقی و سرطان­ها تبدیل گردد[1]. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماری در همان ابتدای روزهای بستری است.

تکنیک­های داده­کاوی[10] علاوه بر این­که می­توانند در تشخیص سریع این بیماری­ها موثر باشند، می­توانند از طریق شناسایی عوامل موثر در بروز انواع بیماری­های تنفسی، به پیش­گیری از این بیماری­ها کمک کنند و به­ این ترتیب باعث ارتقای سلامت جامعه شده و از تحمیل هزینه­های سنگین ناشی از تشخیص نادرست، بر بیماران جلوگیری کنند.

1-2. اهمیت و ضرورت تحقیق

بیماری­های مزمن تنفسی از 10 مورد بیماری­های تهدید کننده حیات در جهان هستند و پیش­بینی می­شود تا سال 2030 میلادی به سومین عامل مرگ­و­میر در جهان بعد از بیماری­های قلبی­و­عروقی و سرطان­ها تبدیل گردد. گرچه، گسترش تکنولوژی­های پزشکی در دهه گذشته، موجب کاهش میزان مرگ­ومیر ناشی از این بیماری شده است و به­دلیل تشخیص زودهنگام و درمان بهینه، میزان بهبودی افزایش یافته است. اما میزان بهبودی بیماران در این نوع بیماری­ها بستگی به نوع بیماری و وسعت آسیب وارده به دستگاه تنفسی دارد[11]. تشخیص زودهنگام نیز به یک روش تشخیص صحیح و قابل اعتماد نیاز دارد که به پزشکان اجازه می­دهد که عفونت دستگاه تنفسی فوقانی، پنومونی و بیماری مزمن انسدادی ریه را از هم شناسایی کنند. بنابراین یافتن یک متد تشخیص صحیح و موثر و همچنین عوامل خطر در بروز این بیماری، بسیار بااهمیت است.

مشکلی که در این بیماری وجود دارد این است که در ابتدا ممکن است یک سرماخوردگی یا آنفولانزای ساده به­نظر آید. گاهی حتی به مدت زمان طولانی بیمار از این بیماری رنج می­برد. بدیهی است که در این مدت بیماری پیشرفت کرده و این تاخیر در تشخیص نوع بیماری، روند درمان را با مشکل مواجه خواهد کرد تا جایی که حتی ممکن است به مرگ بیمار منجر شود. بنابراین نیاز است تا از روش­های پیشرفته­تری برای تشخیص زودهنگام این نوع بیماری­های تنفسی استفاده شود. روش­های رایج برای تشخیص زودهنگام بیماری­های تنفسی عبارتند از: تست­های آزمایشگاهی، رادیوگرافی[12] قفسه سینه، اسکن هسته­ای ریه، ام­آر­آی[13]، آسپیراسیون سوزنی[14] از طریق دیواره قفسه سینه. این روش­ها علاوه بر هزینه­ی بالایی که بر بیمار تحمیل می­کنند، ممکن است مضراتی را برای بیمار در پی داشته باشند. به عنوان مثال: ام­آر­آی پرهزینه و کار با آن مشکل است. موجب مشکلات برای بیماران که دارای اجسام فلزی در بدن خود می­باشند، می­شود. در ضمن بیمار در حین انجام ام­آرآی باید بی­حرکت بوده و حرکات غیرقابل پیش­گیری، مانند تنفس ضربان قلب اغلب تصویر را مخدوش می­سازد. همچنین برای بیمارانی که مشکلات تنفسی و کسانی که از محیط­های بسته می­ترسند، عبور از تونل تنگ دستگاه ام­آی­آر توصیه نمی­شود.

این در حالی است که امروزه استفاده از سیستم­های رده­بندی[15]، می­توانند به کاهش خطایی که ممکن است توسط کارشناسان کم­تجربه اتفاق بیفتد، کمک کنند و همچنین امکان بررسی داده­های پزشکی را در زمان کوتاه­تر و با جزئیات بیش­تر فراهم می­کنند. تکنیک­های داده­ کاوی می­توانند دانش نهفته در پایگاه های داده را استخراج و در پیش­­گیری، تشخیص و معالجه­ی این بیماری به پزشک و بیمار کمک کنند.

1-3. قلمرو تحقیق

موضوعات: بدون موضوع  لینک ثابت
 [ 12:39:00 ب.ظ ]




2‌.1‌.7‌   موارد مشکوک به پولشویی در بانک‌ها و مؤسسات اعتباری…….. 14

2‌.1‌.8‌   ضرورت بهره گیری از راه حل‌‌های ضد پولشویی……………………. 17

2‌.1‌.9‌   روش‌‌های مبارزه با پولشویی……………………. 18

2‌.1‌.10‌ وظایف و اصول الزامی برای بانک‌ها و مؤسسات اعتباری در مبارزه با پول‌شویی……. 23

2‌.1‌.11‌ انواع گزارش‌‌های مفید جهت شناسایی موارد مشکوک…………………….. 29

2‌.2‌   داده‌کاوی……………………. 31

2‌.2‌.1‌   تاریخچه داده‌کاوی……………………. 31

2‌.2‌.2‌   چارچوبی کلی برای الگوریتم‌های داده‌کاوی……………………. 33

2‌.2‌.3‌   کاربرد داده‌کاوی در کشف تقلبات مالی……………………. 35

2‌.2‌.4‌   پرکاربردترین روش‌‌های داده‌کاوی برای کشف تقلب‌‌های مالی…………….. 40

2‌.2‌.5‌   رویکرد داده‌کاوی در حل مسائل پولشویی……………………. 42

2‌.2‌.6‌   برخی تحقیقات مرتبط…………………… 46

2‌.3‌   جمع بندی……………………. 49

3فصل سوم ارائه طرح سیستم ضد پولشویی با داده‌کاوی…….. 52

3دیباچه…………………… 53

3‌.1‌   روش‌شناسی تحقیق……………………. 53

3‌.1‌.1‌   روش تحقیق……………………. 53

3‌.2‌   شیوه‌ها و ابزارهای جمع‌آوری داده‌ها………………….. 54

3‌.2‌.1‌   بررسی داده‌‌های قابل دریافت…………………….. 54

3‌.2‌.2‌   بررسی سایر اطلاعات موجود در بانك…………………….. 55

3‌.2‌.3‌   بررسی محدودیت‌‌های بانك در ارائه اطلاعات……………………. 55

3‌.2‌.4‌   بررسی محدودیت‌های بانك اطلاعاتی……………………. 55

3‌.2‌.5‌   مشخص شدن داده‌‌های مورد نیاز برای فاز‌های مختلف پروژه …….. 56

پایان نامه و مقاله

 

3‌.2‌.6   ‌ارائه فرمت دریافت اطلاعات از بانك اطلاعاتی …………………… 56

3‌.2‌.7   حجم ، زمان و مکان مورد نیاز جهت ارائه اطلاعات …………………… 56

3‌.2‌.8‌   آمایش داده‌‌ها………………….. 56

3‌.3   جامعه نظری و روش نمونه‌گیری……………………. 57

3‌.4‌   مفروضات تحقیق……………………. 58

3‌.5‌   شیوه تجزیه و تحلیل داده‌ها …………………..58

3‌.5‌.1‌   مرور پیشینه تحقیق……………………. 59

3‌.5‌.2‌   نظرخواهی از خبرگان……………………. 60

3‌.5‌.3‌   بررسی اسناد و مدارک آرشیوی……………………. 66

3‌.5‌.4‌   طراحی مدل ضد پولشویی بر اساس داده‌کاوی……………………. 68

3‌.5‌.5‌   جمع بندی……………………. 74

4فصل چهارم اجرای تحقیق…………………….. 75

4دیباچه………………….. 76

4‌.1‌   جزئیات پیاده‌سازی مدل……………………. 76

4‌.1‌.1‌   آمایش داده‌‌ها………………….. 76

4‌.1‌.2‌   دسته بندی اطلاعات براساس شاخص‌های خطی و جدا نمودن بخش مشکوک……. 77

4‌.1‌.3‌   فیلترینگ و جداسازی اطلاعات مناسب…………………….. 80

4‌.1‌.4‌   خوشه بندی……………………. 83

4‌.1‌.5‌   اجرای الگوریتم نظارت‌شده………………….. 92

4‌.1‌.6‌   جمع‌آوری نتایج……………………. 93

یک مطلب دیگر :

 
 

4‌.2‌   تست و ارزیابی……………………. 94

4‌.2‌.1‌   نحوه تست…………………….. 94

4‌.2‌.2‌   محاسبه معیار‌های دقت، بازآوری، یکتائی و صحت…………………….. 95

4‌.3‌   نتیجه گیری……………………. 96

5فصل پنجم جمع‌بندی و نتیجه‌گیری……………………. 98

5دیباچه…………………… 99

5‌.1‌   نتیجه گیری……………………. 99

5‌.2‌   محدودیت‌های پژوهش……………………… 100

5‌.3‌   پیشنهاد برای پژوهش‌‌های آینده …………………..101

6منابع و مراجع……………………. 102

چکیده:

پولشویی به عنوان یک فرایند مجرمانه مالی، اقدامی است که در آن منشأ و منبع وجوهی که به صورت غیر قانونی به‌دست آمده از طریق رشته ‍‍‍‌‌های نقل و انتقالات و معاملات به گونه‌ای پنهان می‌شود که همان وجوه به صورت قانونی نمود پیدا کرده و وارد فعالیت‌‌ها و مجاری قانونی می‌گردد. داده‌کاوی به عنوان فرایندی خودکار برای استخراج اطلاعات و الگو‌های جالب توجه، بارز، ضمنی، از قبل ناشناخته و بالقوه مفید از انبار داده‌‌های حجیم، شناخته می‌شود. هنگامی که الگوریتم‌‌ها و تکنیک‌‌های داده‌کاوی روی چنین تراکنش‌‌هائی اعمال می‌شوند، الگو‌های پنهان از جریان وجوه را کشف می‌کنند. بررسی داده‌‌ها و اعلام نظر روی آن‌ها از دو روش کلی تبعیت می‌نماید اول استفاده از شاخص‌ها با استفاده از روش‌های خطی و آماری و دوم استفاده از الگوریتم‌‌های داده‌کاوی که آن هم به دو صورت نظارت‌شده و بدون ناظر تقسیم شده و در این پروژه از هر دو روش استفاده شده است. خروجی‌‌های این پروژه شامل مستندات علمی، روش‌های داده محور برای شناسایی پولشویی، ارائه یك مدل برای پیاده‌سازی چارچوب ضد پولشویی در بانك و در نهایت بهره‌گیری از فناوری‌‌های نرم افزاری و پیاده سازی کل جریان پروژه می‌باشد. پس از اجرا، نتایج به دو صورت ارائه به متخصصان فنی و همچنین محاسبه معیار‌های عملکرد متداول در داده‌کاوی ارزیابی می‌گردد. در مراحلی از پروژه که نیاز به بررسی و آشنایی با سوابق تحقیقات در زمینۀ پولشویی و یا الگوریتم‌های مرتبط با آن باشد از روش تحقیق میدانی و کتابخانه‌ای استفاده می‌شود. از سوی دیگر رویکرد تحقیق نیز به صورت پیمایشی بوده که در آن با هدف مطالعۀ ماهیت و ویژگی‌های مشتریان بانك فرآیند تحقیق و مطالعه طی شده است. در مجموع باید گفت که از مدلی کمی در این تحقیق استفاده شده که مبتنی بر پردازش داده‌‌ها از نوع دادۀ واقعی، بوده است.

فصل اول: کلیات تحقیق

1-1- تعریف مسأله و بیان سؤال های اصلی تحقیق

تعاریف متعددی برای پولشویی عنوان شده است که از جمله می توان به موارد ذیل اشاره کرد[15]:

– بنا به تعریفی پولشویی یعنی شسته شدن و تبدیل پول کثیف به پول تمیز به نوعی که پس از خروج از این چرخه قانونی جلوه کند؛ به عبارت دیگر پولشویی عبارت است از هر نوع عمل برای مخفی کردن یا تغییر هویت نامشروع حاصل از فعالیت‌‌های مجرمانه به گونه ای که وانمود شود این عواید از منابع قانونی حاصل شده است.

– مجموعه اقداماتی است که از سوی فرد یا افرادی با به کارگیری ابزار‌های قانونی و با هدف عدم امکان قابلیت ردیابی گردش عواید حاصل از جرم به منظور مخفی کردن منشأ و منبع واقعی پول حاصل از اعمال مجرمانه و نامشروع صورت میگیرد تا پول آلوده و نامشروع در ظاهر پاک و قانونی جلوه نماید.

از این تعاریف چنین بر می آید که عملیات پولشویی به فرآِیند تطهیر پول کثیف گفته می شود. پول کثیف به پولی گفته می‌شود که از راه‌های خلاف و غیرقانونی بدست آمده باشد. از آنجا که بانک‌ها یکی از بهترین موسساتی هستند که می توانند به پولشویان در فرآیند تطهیر پول کثیف کمك کرده و مسیر دسترسی به منشا پول را گمراه و یا پاک نمایند در تمام کشور‌ها یکی از مهمترین موسساتی که مرجع سو استفاده پولشویان قرار می گیرند بانک‌ها هستند[44].

موضوعات: بدون موضوع  لینک ثابت
 [ 12:37:00 ب.ظ ]




2-1-۲-۲. فاکتورهای امتیاز دهنده …………………………………………………………………………… 24

2-1-۳-۲-۱. مشابهت نحوی…………………………………………………………………………………. 24

2-1-۳-۲-۱. مشابهت معنایی……………………………………………………………………………….. 25

2-1-۳-۲-۱. بارز بودن…………………………………………………………………………………………… 25

2-1-۳. روش‏های یادگیری ماشین…………………………………………………………………………………….. 27

2-1-۳-۱. ویژگی‏ها………………………………………………………………………………………………………. 28

2-1-۳-۲. مدل‏های جفت اشاره………………………………………………………………………………….. 28

2-1-۳-۲-۱. رده بندی جفت عبارت‏های اسمی………………………………………………….. 32

2-1-۳-۲-۱-1. درخت تصمیم………………………………………………………………………… 33

2-1-۳-۲-۲.افراز……………………………………………………………………………………………………… 35

2-1-۳-۲-۲-۱.درختِ بل………………………………………………………………………………….. 36

2-1-۳-۲-۲-۲. افراز گراف……………………………………………………………………………….. 38

2-1-۳-۳. روش‏های مبتنی بر پیکره……………………………………………………………………………… 40

2-1-۳-۴. روش‏های جایگزین…………………………………………………………………………………………. 44

2-1-۳-۴-۱. روش هم‏آموزی…………………………………………………………………………………….. 44

2-1-۳-۴-۲. مدل احتمالاتی مرتبه اول…………………………………………………………………… 46

2-1-۳-۴-۳. رتبه‏بندی………………………………………………………………………………………………. 47

2-1-۳-۴-۴. فیلدهای تصادفی شرطی……………………………………………………………………… 49

2-1-۳-۴-۵. خوشه ‏بندی………………………………………………………………………………………….. 51

2-1-۴. جمع‏بندی………………………………………………………………………………………………………. 56

فصل 2: بخش دوم…………………………………………………………………………………….. 57

2-2-۱. پیکره نشانه گذاری شده توسط اطلاعات هم‏مرجع…………………………………………………. 58

2-2-۲. پیکره بیژن‏خان………………………………………………………………………………………………….. 59

2-2-۳. پیکره لوتوس…………………………………………………………………………………………………….. 60

2-2-۴.شیوه‏ های نشانه ‏گذاری پیکره لوتوس…………………………………………………………….. 62

2-2-۴-۱. نشانه‏گذاری انواع موجودیت‏ها………………………………………………………………………….. 62

2-2-۴-۱-۱. موجودیت شخص……………………………………………………………………………………… 64

2-2-۴-۱-۲. موجودیت سازمان……………………………………………………………………………………… 64

2-2-۴-۱-۳. موجودیت مکان…………………………………………………………………………………………. 66

2-2-۴-۱-۴. موجودیت سیاسی……………………………………………………………………………………… 66

2-2-۴-۲.کلاس هر موجودیت……………………………………………………………………………………………. 68

2-2-۴-۲-۱.غیر ارجاعی……………………………………………………………………………………………….. 69

2-2-۴-۲-۲.ارجاعی………………………………………………………………………………………………………. 69

2-2-۴-۲-۲-۱.ارزیابی به شکل منفی……………………………………………………………………… 69

2-2-۴-۲-۲-۲.ارجاعی خاص………………………………………………………………………………….. 70

2-2-۴-۲-۲-۳.ارجاعی عمومی……………………………………………………………………………….. 70

2-2-۴-۲-۲-۴.ارجاعی زیر مشخص شده………………………………………………………………. 70

2-2-۴-۳.انواع اشاره/سطوح اشاره…………………………………………………………………………… 71

2-2-۴-۳-۱.اشاره ساده………………………………………………………………………………………………….. 72

2-2-۴-۳-۱-۱.محدوده اشاره………………………………………………………………………………….. 72

2-2-۴-۳-۱-۲. هسته اشاره……………………………………………………………………………………. 72

2-2-۴-۳-۱-۳.انواع اشاره ساده………………………………………………………………………………. 72

2-2-۴-۳-۲.ساختارهای پیچیده………………………………………………………………………………………. 74

2-2-۴-4-۲-۱.ساختارهای عطف بیان یا بدل……………………………………………………….. 75

2-2-۵.جمع‏بندی………………………………………………………………………………………………………… 75

فصل 3: الگوریتم­های پیشنهادی……………………………………………………………….. 76

3-۱. رده بندی دودویی…………………………………………………………………………………………… 76

3-1-1.جدا کننده‏های خطی………………………………………………………………………………… 77

3-1-1-1 پرسپترون……………………………………………………………………………………………… 78

3-1-1-2 ماشین بردار پشتیبان…………………………………………………………………………………….. 80

3-1-1-3 درخت تصمیم………………………………………………………………………………………………… 85

3-۲.خوشه ‏بندی…………………………………………………………………………………………………………. 88

3-2-1 .الگوریتم‏های افراز بسته‏ای…………………………………………………………………………………… 89

3-2-1-1 .خوشه ‏بندی سلسله مراتبی پایین به بالا……………………………………………………. 90

3-2-1-2 .آموزش الگوریتم خوشه‏بندی سلسله مراتبی…………………………………………….. 93

3-3.جمع‏بندی……………………………………………………………………………………………………….. 96

فصل 4: سیستم ارزیابی…………………………………………………………………………….. 97

4-۱.مقدمه………………………………………………………………………………………………………………. 97

4-۲.سیستم شناسایی اشاره لوتوس………………………………………………………………….. 98

4-2-1 .بانک اطلاعاتی…………………………………………………………………………………… 98

4-2-2.سیستم شناسایی اشاره………………………………………………………………………….. 102

4-3.تشخیص اشاره‏های هم مرجع……………………………………………………………………………….. 103

4-3-1 ویژگی‏ها…………………………………………………………………………………………………….. 104

4-3-2.الگوریتم یادگیری…………………………………………………………………………………….. 105

4-3-3.معیار ارزیابی…………………………………………………………………………………………….. 107

4-3-4.نتیجه ارزیابی……………………………………………………………………………………… 110

4-3-4-1.نتایج بدست آمده……………………………………………………………………………………….. 110

4-3-4-.2چالش‏ها و تحلیل خطا……………………………………………………………………………….. 112

4-4.جمع‏بندی……………………………………………………………………………………………………… 115

فصل 5 :نتیجه گیری و پیشنهادها……………………………………………………………… 116

5-۱.نتیجه‏ گیری………………………………………………………………………………………………….. 116

5-2.پیشنهادها…………………………………………………………………………………………………… 118

فصل .6 منابع………………………………………………………………………………………….. 121

چکیده:

پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصه‏سازی متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد شناسایی شوند. بنابراین وجود سیستمی که بتواند مسئله هم‏مرجع را بررسی نماید، کمک شایانی به انجامِ موفقیت‏آمیز این وظایف خواهد نمود. روش‏های تشخیص مرجع مشترک را می‏توان به دو دسته‏ روش‏های زبان‏شناسی و روش‏های یادگیری ماشین تقسیم نمود. روش‏های زبان‏شناسی بیشتر به اطلاعات زبان‏شناسی نیاز دارند، البته مشکل این روش‏ها این است که پر خطا و طولانی می‏باشند. از طرف دیگر روش‏های یادگیری ماشین کمتر به اطلاعات زبان‏شناسی نیاز دارند و نتایج حاصل از

پایان نامه و مقاله

 آنها قابل اعتماد‏تر است. در این پایان ‏نامه تلاش می‏کنیم تا فرآیند تشخیص مرجع‏مشترک را مورد مطالعه قرار دهیم و چارچوبی ارائه دهیم تا بتواند علاوه بر شناسایی اشاره ‏ها، عبارت‏های هم‏مرجع را نیز تشخیص دهد. به همین منظور باید سه رکن اساسی کار را که پیکره نشانه‏ گذاری شده، سیستم شناساییِ اشاره و محدوده آن، و الگوریتم پیشنهادی پیش‏بینی عبارت‏های اسمی هم‏‏مرجع را مبنای کار قرار دهیم. درهمین راستا، در قدم اول، پیکره‏ای با نشانه ‏هایی شامل محدوده‏ی اشاره، نوع اشاره، هسته‏ی اشاره، نوع موجودیت، نوع زیر گروه موجودیت، کلاس موجودیت تهیه می‏کنیم، این پیکره می‏تواند به عنوان اولین پیکره دارای نشانه ‏های اشاره و هم‏مرجعی، مبنای کار بسیاری از پژوهش‏های مربوط به شناسایی و کشف اشاره و تحلیل هم‏مرجعی قرار گیرد. همچنین با استفاده از این پیکره و بررسی قوانین و اولویت‏های میان اشاره ‏ها، سیستمی ارائه می‏کنیم که اشاره ‏های موجود در متن را شناسایی کرده و سپس نمونه ‏های مثبت و منفی را از پیکره لوتوس استخراج می‏کند. در نهایت نیز با استفاده از الگوریتم‏های یادگیری پایه درخت تصمیم، شبکه عصبی و ماشین بردار پشتیبان، نمونه‏ های حاصله را مورد ارزیابی و مقایسه قرار دادیم. نتایج حاصل نشان می‏دهد که یادگیر شبکه عصبی، نسبت به سایرین عملکرد بهتری دارد.

فصل اول

1-1- مقدمه و بیان مسئله

امروزه رایانه در تمام لایه‏های زندگی بشر نفوذ کرده است. بطوریکه استفاده از فناوری رایانه در حوزه زبان‏شناسی، بیش از پیش احساس می‏شود. «پردازش زبان طبیعی[1]»شاخه‏ای از علم «هوش مصنوعی[2]» است كه به ماشینی كردن فرآیند زبان شناسی سنتی می‏پردازد. به این ترتیب با استفاده از رایانه می‏توان «زبان گفتاری ونوشتاری» را پردازش نمود، به طوریکه رایانه‏ها نیز قادر باشند زبان انسان را درک کرده و بتوانند از زبان طبیعی به عنوان ورودی وخروجی استفاده كند. به این ترتیب یک رایانه، درهنگام دریافت ورودی، نیاز به «درک» و درهنگام ارسال خروجی، نیاز به «تولید» زبان طبیعی دارد. ]81[

در زمینه پردازش زبان طبیعی پژوهش‏هایی مانند طبقه‏بندی متون[3]، برچسب‏گذاری ادات سخن[4]، تعیین و ابهام‏زدایی از معانی واژگان[5] و… انجام شده است که تنها بر روی یک حوزه خاص تمرکز داشته‏اند و در نتیجه راه حل‏هایی جزئی در راستای اهداف کلی پردازش زبان طبیعی محسوب می‏‏‏شوند. تمامی این حوزه‏های جزئی باید حل شوند تا در نهایت رایانه بتواند همانند انسان واژگان و جملات را پردازش کرده و یا آنها را بسازد.

وظایف زبان طبیعی را می‏توان به ریز کاربردها[6] و کلان کاربردها[7] افراز نمود. به طور کلی تا کنون تحقیقات انجام شده بیشتر بر روی پردازش‏هایی در سطح واژه و یا جمله (مانند برچسب گذاری ادات سخن، ابهام زدائی از مفهوم واژگان، شناسایی موجودیت‏های نامدار[8] و … ) و یا در سطح کل متن (تشخیص هرزنامه[9]، رده بندی متون و…) متمرکز شده اند؛ برخی از کاربرد‏ها نیز مانند استخراج اطلاعات[10]، تشخیص مرجع مشترک[11] و ماشین ترجمه[12] در سطح بینابین قرار گرفته‏اند. ]27[بدیهی است که در توسعه یک کاربرد سطح بالاتر همانند تعیین ویژگی‏های معنایی متون، انواع متفاوتی از ویژگی‏های سطح پایین‏تر (مانند ویژگی‏های لغوی[13] و نحوی[14]) نیز لازم است، اما به لطف سیستم‏های جدید که تا حد زیادی به روش‏های آماری یادگیری ماشین بستگی دارند، دیگر در آنها، به تمامی‏‏‏ ویژگی‏های سطح پایین‏تر نیازی نیست. علت اینکه روش‏های یادگیری ماشین توانسته‏اند با وجود سادگی، به موفقیت قابل توجهی دست یابند این است که اطلاعات آماری پایه، دانشی را فراهم می‏آورد که برای بسیاری از کاربرد‏ها کافی بوده و می‏‏‏‏تواند به کارائی قابل توجهی منجر شود. با این وجود، باید توجه داشت که روش‏های آماری محدود است و هرگز نمی‏توانند درک کاملی از محتوای معانی یک متن را فراهم آورند.

از طرفی دیگر، با فراهم شدن اطلاعات و قدرت محاسباتی بیشتر، سیستم‏‏هایی که واژگان و جملات درست را از غلط تشخیص می‏دهند، به طور گسترده‏ای در حال توسعه هستند. به عنوان مثال، در زبان انگلیسی برچسب گذاری ادات سخن به صحتی برابر با ۹۸%، شیوه‏های تجزیه کردن[15] به صحتی برابر با ۹۰%، و شناسایی موجودیت‏های نامدار به صحت ۹۱% رسیده اند. [78,55,38[.

یک مطلب دیگر :

 
 

بسیاری از پژوهشگران معتقدند كه استخراج اطلاعات به عنوان یکی از مهمترین کاربردهای پردازش زبان طبیعی محسوب می‏شود، که مجموعه‏ای از تکنیک‏های رده‏بندی[16]، خوشه‏بندی[17] و قوانین وابستگی[18] است و خروجی استخراج اطلاعات شامل، شناسایی موجودیت‏ها[19] ، تعیین نوع وگروه آنها، طبقه بندی ارتباط میان موجودیت‏ها و همچنین استخراج رویدادهایی كه در آن مشاركت دارند، می‏باشد.[71[ در نهایت می‏توان گفت كه خلاصه سازی، بازیابی اطلاعات[20]، داده‏كاوی[21]، پرسش و پاسخ[22] و درك زبان[23] از جمله كاربردهای این سیستم هستند.

تمرکز اصلی این پژوهش بررسی فرآیند تشخیص مرجع مشترک به عنوان یکی از فرآیندهای مهم استخراج اطلاعات است؛ در تشخیص مرجع مشترک تمام عبارت‏های اسمی‏‏‏ که به یک موجودیت واحد در دنیای واقعی اشاره دارند، تعیین می‏گردند. هدف نهایی این پایان‏نامه شناسایی اشاره‏های هم مرجع شامل ضمیر و اسم اشاره در متون پارسی می‏باشد. برای تحقق این هدف نیاز به انجام پیش پردازش‏هایی بر روی متون خام می‏باشد تا داده‏های مورد نیاز برای ورود به فرآیند تحلیل مرجع مشترک فراهم شوند. فرض ما بر این است که خروجی حاصل از فرآیند کشف اشاره[24] به عنوان یک پیش پردازش می‏تواند در کنار سایر پیمانه‏های پیش پردازشی مانند تجزیه‏گر، شناسایی موجودیت‏های نامدار و… بر بهبود عملکرد تحلیل مرجع مشترک موثر واقع شود. [23،38،53،83]

به هر ترتیب شناسایی عبارت‏های اسمی‏‏‏ هم‏مرجع از مهمترین زیر وظایف استخراج اطلاعات می‏باشند که بهبود عملکرد آن موجب بهبود عملکرد کلی سیستم استخراج اطلاعات و سایر سیستم‏های مرتبط با آن خواهد شد.

واحد مورد بررسی در حوزه تشخیص مرجع مشترک، متن می باشد که پس از اجرای ماژول‏هایی متفاوت، متن مورد نظر به عبارت های اسمی یا به عبارت بهتر به اشاره تبدیل می‏شود. روش‏های موجود در این حوزه، به دو دسته روش‏های زبان‏شناسی[25] و روش‏های یادگیری ماشین[26] تقسیم می‏‏‏شوند. [76[ در روش اول، ابتدا به ازای هر عبارت اسمی‏‏، مراجع کاندیدا تعیین می‏‏‏شود و سپس با به کارگیری مجموعه‏ای از قواعد زبان‏شناسی، برخی از کاندیداها حذف شده و کاندیداهای باقیمانده نیز امتیازدهی می‏‏‏شوند و در‏نهایت کاندیدایی به عنوان مرجع برگزیده می‏‏‏شود که بیشترین امتیاز را کسب کرده باشد. مسئله اصلی در این روش این است که کسب اطلاعات زبان‏شناسی مورد نیاز، فرآیندی زمان‏بر، پرهزینه و پر خطاست. البته با پیدایش پیکره‏های[27] زبان‏شناسی و موفقیت روش‏های یادگیری ماشین در سایر حوزه‏ها، روش‏های زبان‏شناسی جای خود را به روش‏های یادگیری ماشین دادند. در یادگیری ماشین، به محاسبات زبان‏شناسی پیچیده و سطح بالای روش‏های زبان‏شناسی نیاز نیست به طوریکه با استفاده از دانش اندکی در زمینه زبان‏شناسی نیز می‏توان به نتایج خوب و قابل توجهی دست یافت.

از سوی دیگر، امروزه اغلب پژوهشگران فرآیند تشخیص مرجع مشترک را به دو مرحله تقسیم می‏‏‏ کنند. (۱) کشف و شناسایی اشاره؛ برای شناسایی عبارت‏های اسمی‏‏‏ که به موجودیت[28] ها در دنیای واقعی اشاره دارند، (۲) شناسائی اشاره‏هایی که به یک مرجع واحد اشاره دارند. به این ترتیب در مرحله اول، اکثر عبارت‏های اسمی‏‏‏ تحت عنوان اشاره[29] و در قالب چهار گروه اصلی ضمایر[30]، اسامی‏‏‏ خاص[31]، اسامی‏‏‏ عام[32] و غیر اشاره‏ها[33] قرار می‏گیرند،[8،910،16،48،53،72] سپس این فرآیند مشخص می‏‏‏‌کند که هر اشاره به کدام موجودیت در دنیای واقعی اختصاص دار[26]می‏‏‏توان گفت که فرآیند کشف اشاره، توسعه یافته‏ی فرآیند شناسایی موجودیت‏های نامدار می‏باشد که علاوه بر شناسایی اسامی‏‏‏ خاص، به شناسایی اسامی‏‏‏ عام و ضمایر نیز می‏پردازد. [،23،72،81،113،114]از آنجائیکه بررسی فرآیند‏های شناسایی اشاره و تحلیل مرجع مشترک به طور همزمان خارج از حوزه‏ی این پایان‏نامه است، ما عبارت‏های اسمی‏‏‏ را در قالب انواع اشاره‏های گفته شده در پیکره‏ای تحت عنوان لوتوس برچسب‏گذاری می‏نمائیم و نتیجه‏ی آن را برای تحلیل مرجع مشترک به کار خواهیم برد.

چارچوب کلی این پایان‏نامه به این صورت می‏باشد: در بخش دوم این فصل گذری کوتاه بر انواع روابط میان دو عبارت اسمی‏‏‏ و به خصوص ارتباط‏های هم‏مرجعی خواهیم داشت. سپس در بخش اول فصل دوم، روش‏های ارائه شده برای تشخیص مرجع مشترک را مورد بررسی و مطالعه قرار می‏دهیم و در بخش دوم آن، به نحوه ایجاد پیکره‏ای مناسب برای کشف اشاره و تحلیل مرجع مشترک خواهیم پرداخت. در فصل سوم، به الگوریتم‏های مناسب برای این پایان‏نامه را معرفی می نمائیم. سیستم پیشهنادی برای شناسایی اشاره‏های ارجاع شده در فصل چهارم معرفی خواهد شد و همچنین در این فصل الگوریتم‏های یادشده را مورد ارزیابی قرار می‏دهیم. در نهایت در فصل پنجم نیز به نتیجه گیری و پیشنهاد كارهای آتی در ادامه‏ی این پژوهش خواهیم پرداخت.

1-2.بررسی ارتباط هم ‏مرجعی

یکی از ‏ویژگی‏های خاص گفتمان این است که می‏توان در یک متن آزادانه در مورد یک یا چند موجودیت صحبت کرد و برای اشاره به هر موجودیت از انواع مختلف عبارت‏ها مانند ضمیر (او)، اسم عام (دانشمند)، اسم خاص (لطفعلی عسگر زاده) و یا یک عبارت اسمی‏(بنیان‏گذار منطق فازی) بهره برد تا به این ترتیب از تکرار عبارت‏ها کاسته و شیوایی مطلب نیز افزایش یابد. همین ویژگی موجب می‏شود که زنجیره‏ها‏ی بالقوه‏ای از تمام عبارت‏های اسمی‏که به یک موجودیت واحد در متن ارجاع دارند، ایجاد گردد. (مانند: او، دانشمند، لطفعلی عسگر زاده، بنیان‏گذار منطق فازی که به شخص پرفسور زاده اشاره دارند).

یکی از اهداف مهم استخراج اطلاعات، شناسایی این زنجیره‏ها در متن است که در فرآیند تحلیل مرجع‏مشترک انجام می‏پذیرد. برای شروع، مثال ۱ را در نظر بگیرید[34]:

مثال۱: (سیستم آبیاری گلاب) ۱Ant, در روز سه شنبه رونمایی شد. (این سیستم)۱Ana, محصول اندیشه‏ی (دکتر سارا شکری)۲Ant, است. (او) Ana,2، ( یک پژوهشگر)Ana در (شرکت آبیاری لاله)۳ است.

اگر فرض کنیم که پیمانه‏های نشانه‏گذاری تا کشف اشاره به عنوان پیش پردازش‏هایی بر روی متن اجرا شوند، با اجرای این پیمانه‏ها، انواع عبارت‏های اسمی‏موجود در متن (سیستم آبیاری، این سیستم، دکتر سارا شکری، او، یک پژوهشگر و شرکت آبیاری لاله) تعیین و نشانه‏گذاری می‏شوند. سپس با اجرای پیمانه تشخیص مرجع‏مشترک، ارتباطات میان این عبارت‏ها و اطلاعات نهفته در مورد موجودیت‏های شرکت کننده در متن آشکار می‏شود. به عنوان نمونه، می‏دانیم «او» و «سارا شکری» (با اندیسِ۲) به یک فرد مشخص و همچنین «سیستم آبیاری گلاب» و «این سیستم» (با اندیسِ۱) نیز به یک سیستم مشخص اشاره می‏کنند.

استفاده از اصطلاح موجودیت در تحلیل مرجع‏مشترک، این سؤال را مطرح می‏کند که چه چیزهایی موجودیت محسوب می‏شوند؟ تاکنون گروه‏بندی‏های متعددی برای انواع موجودیت‏ها ارائه شده است، به عنوان نمونه[35]ACE، یک تقسیم بندی هفت موجودیتی برای انواع موجودیت‏ها (شخص، سازمان، مکان، سیاسی، تسهیلات، سلاح و خودرو) و تعداد زیادی زیرگروه (به عنوان مثال شخص: فرد، گروه) و کلاس برای هر موجودیت پیشنهاد کرده است و[۶۴] که اغلب پژوهشگران همه این موجودیت‏ها و یا گاهی اوقات برخی از آن‏ها را مورد مطالعه و بررسی قرار می‏دهند.

یکی از ‏ویژگی‏های تحلیل مرجع‏مشترک این است که علاوه بر انواع موجودیت‏های رایج، می‏توانیم در حوزه‏ها‏ی متفاوت از تعاریف پیش فرض خود نیز برای موجودیت‏ها نیز استفاده نماییم. همین ویژگی موجب شده است تا برخی از پژوهشگران مانند[97] به تحلیل مرجع‏مشترک در متون پزشکی پرداخته و بررسی موجودیت‏هایی مانند انواع دارو، بیماری، ژن وغیره را هدف پژوهش خود قرار دهند.

موضوعات: بدون موضوع  لینک ثابت
 [ 12:36:00 ب.ظ ]
 
مداحی های محرم