Enrolment options

Coursera / Machine Learning

بازیابی متن و موتورهای جستجو (Mitalearn-334608)

درباره این دوره:

سال‌های اخیر شاهد رشد چشم‌گیر داده‌های متنی زبان طبیعی، از جمله صفحات وب، مقالات خبری، ادبیات علمی، ایمیل‌ها، اسناد سازمانی و رسانه‌های اجتماعی مانند مقالات وبلاگ، پست‌های انجمن، بررسی محصول و توییت‌ها بوده‌ایم. داده‌های متنی از این جهت منحصربه‌فرد هستند که معمولاً به‌جای سیستم رایانه‌ای یا حسگرها، مستقیماً توسط انسان تولید می‌شوند، و بنابراین برای کشف دانش درباره نظرات و ترجیحات افراد، علاوه بر بسیاری از انواع دیگر دانش که در متن کدگذاری می‌کنیم، بسیار ارزشمند هستند. این دوره به فناوری های موتورهای جستجو می پردازد که به دو دلیل نقش مهمی در هر برنامه داده کاوی شامل داده های متنی دارند. اولا، در حالی که داده‌های خام ممکن است برای هر مشکل خاصی بزرگ باشند، اغلب یک زیرمجموعه نسبتا کوچک از داده‌های مرتبط هستند، و یک موتور جستجو ابزار ضروری برای کشف سریع زیرمجموعه کوچکی از داده‌های متنی مرتبط در یک متن بزرگ است. مجموعه دوم، موتورهای جستجو برای کمک به تحلیلگران برای تفسیر هر گونه الگوی کشف شده در داده ها با اجازه دادن به آنها برای بررسی داده های متن اصلی مربوطه برای درک هر الگوی کشف شده مورد نیاز هستند. شما مفاهیم اساسی، اصول و تکنیک های اصلی در بازیابی متن را که علم زیربنایی موتورهای جستجو است، یاد خواهید گرفت.
Guests cannot access this course. Please log in.