امروز : دوشنبه, 27 دی 1395
دانلود تحقیق ، پروژه و مقالات دانشجویی
برای جستجو لطفا یکی از بخش های مورد نظر را انتخاب کنید
موضوعات

تاریخ : 28 آذر 1395
99 صفحه
قالب بندی : doc
قیمت : 10500 تومان
عنوان مقاله : پایان نامه مدلی کارا برای ساخت پیکره متنی موازی از روی پیکره متنی تطبیقی

‎ قالب بندی : doc

قیمت : 10500

به دلیل افزایش ارتباطات متقابل منطقه‌ای و نیاز برای تبادل اطلاعات، تقاضا برای ترجمه زبان بسیار افزایش یافته است. بسیاری از نوشتجات نیاز به ترجمه دارند از جمله مستندات علمی و فنی، دستورالعمل‌های راهنما، مستندات حقوقی، کتاب‌های درسی، بروشورهای تبلیغاتی، اخبار روزنامه‌ها و غیره؛ که ترجمه برخی از آنها سخت و چالش برانگیز است اما اکثرا خسته کننده و تکراری هستند و در عین حال به انسجام و دقت نیاز دارند. برآوردن نیازهای روز افزون ترجمه برای مترجمان حرفه‌ای دشوار است. در چنین موقعیتی ترجمه ماشینی می‌تواند به عنوان یک جایگزین به کار گرفته شود. ترجمه ماشینی بعد از 65 سال یکی از قدیمی‌ترین کاربردهای کامپیوتر است. در طول سال‌ها، ترجمه ماشینی مرکز توجه تحقیقات زبان‌شناسان، روان‌شناسان، فیلسوفان، دانشمندان و مهندسان علم کامپیوتر بوده است. اغراق نیست اگر بگوییم کارهای جدید در حوزه ترجمه ماشینی، به طور قابل ملاحظه‌ای در توسعه زمینه‌هایی نظیر زبان شناسی رایانه‌ای، هوش مصنوعی و پردازش زبان‌های طبیعی برنامه‌گرا، مشارکت کرده است.  

فهرست مطالب

1. مقدمه 2

1-1. مقدمه 2

1-1-1. ترجمه ماشینی مبتنی بر فرهنگ لغت 3

1-1-2. ترجمه ماشینی مبتنی بر قانون 4

1-1-3. ترجمه ماشینی مبتنی بر دانش 5

1-1-4. ترجمه ماشینی مبتنی بر پیکره 5

ترجمه ماشینی آماری 6

ترجمه ماشینی مبتنی بر مثال 6

ترجمه ماشینی مبتنی بر متن 7

1-2. ضرورت ساخت پیکره موازی 7

1-3. مسئله تحقیق: ساخت پیکره موازی 9

1-4. هدف تحقیق: ساخت پیکره موازی از روی پیکره تطبیقی 10

1-5. سرفصل‌ها 10

1-5-1. فصل دوم: مبانی نظری 10

1-5-2. فصل سوم: مروری بر تحقیقات انجام شده 11

1-5-3. فصل چهارم: مدل پیشنهادی 11

1-5-4. فصل پنجم: ارزیابی و نتیجه گیری 12

2. مبانی نظری 14

2-1. پیکره 14

2-1-1. پیکره موازی 15

2-1-2. پیکره تطبیقی 17

2-2. همترازی 18

2-2-1. همترازی در سطح سند 19

2-2-2. همترازی در سطح جمله 19

2-2-3. همترازی در سطح کلمه (همترازی لغوی) 21

همترازی لغوی با استفاده از مدل‌های آی‌بی‌ام 22

2-3. ارزیابی ترجمه ماشینی 23

2-3-1. بلو 23

2-3-2. متریک NIST 24

2-3-3. نرخ خطای کلمه 24

2-3-4. نرخ خطای ترجمه (TER) 25

3. مروری بر تحقیقات انجام شده 28

3-1. مقدمه 28

3-2. ساخت پیکره موازی از روی متون هم‌ترجمه 28

3-3. استخراج جملات موازی از وب 30

3-4. استخراج جملات موازی از پیکره‌های تطبیقی 32

3-5. تشخیص جملات موازی با استفاده از طبقه‌بند آنتروپی بیشینه 34

3-6. ساخت پیکره موازی انگلیسی – فارسی 36

4. مدل پیشنهادی 39

4-1. مقدمه 39

4-2. انتخاب جفت جملات کاندید موازی بودن 40

4-2-1. فیلتر کلمات مشترک 41

تبدیل کدگذاری کاراکترها 42

مشخص کردن مرز جمله‌ها و کلمه‌ها 43

ریشه‌یابی 44

حذف کلمات پرتکرار 45

رفع ابهام 45

جستجوی معانی از دیکشنری 46

گروه بندی کلمات تکراری جمله به همراه تعداد رخدادشان در جمله 46

الگوریتم یافتن نرخ کلمات مشترک (از طرف مبدأ) 47

4-3. انتخاب جفت جملات موازی از بین جفت جملات کاندید 48

4-3-1. طبقه‌بند آنتروپی بیشینه 48

4-3-2. ویژگی‌های عمومی 49

ویژگی‌های مبتنی بر طول دو جمله 49

نرخ کلمات مشترک 50

4-3-3. ویژگی‌های مبتنی بر همترازی در سطح کلمه یک جفت جمله 50

کلمات همتراز نشده 50

باروری 51

محدوده پیوسته 52

نمره همترازی 53

4-4. بالا بردن دقت جفت جملات موازی استخراج شده 54

4-5. شیوه ارزیابی مدل 55

5. ارزیابی و نتیجه گیری 58

5-1. ارزیابی طبقه‌بند آنتروپی بیشینه 58

5-1-1. ارزیابی ویژگی‌ها 58

5-1-2. حساسیت به دامنه 60

5-2. تنظیمات و آزمایشات ساخت پیکره موازی از پیکره تطبیقی 63

5-2-1. پیکره تطبیقی مورد استفاده 63

پیکره تطبیقی فارسی – انگلیسی دانشگاه تهران (UTPECC) 63

پیکره تطبیقی گرفته شده از مقالات ویکی پدیا 65

5-2-2. پارامترهای تنظیم شده و ابزار مورد استفاده 66

انتخاب جفت جملات کاندید: 66

انتخاب جفت جملات موازی: 68

بالا بردن دقت جفت جملات استخراج شده: 69

5-2-3. ارزیابی جملات موازی استخراج شده با استفاده از ماشین ترجمه 69

5-3. نتیجه گیری 72

5-4. پیشنهادات آینده 75

 

جدیدترین مطالب
تبلیغات