متن کاوی کاربردی در پایتون
(Mitalearn-332772)
- مدت زمان: 4 ساعت 13 دقیقه
- انتشار: 23 June 2026
- مدرس: V. G. Vinod Vydiswaran
- سطح: متوسط
- محتواها: 28
- زیرنویس فارسی دارد
درباره این دوره:
این دوره زبان آموز را با مبانی متن کاوی و دستکاری متن آشنا می کند. این دوره با درک نحوه مدیریت متن توسط پایتون، ساختار متن هم برای ماشین و هم برای انسان و مروری بر چارچوب nltk برای دستکاری متن آغاز می شود. هفته دوم بر نیازهای رایج دستکاری، از جمله عبارات منظم (جستجوی متن)، تمیز کردن متن، و آماده کردن متن برای استفاده توسط فرآیندهای یادگیری ماشین تمرکز دارد. هفته سوم روشهای اصلی پردازش زبان طبیعی را در متن اعمال میکند و نشان میدهد که چگونه طبقهبندی متن انجام میشود. در هفته آخر روش های پیشرفته تری برای شناسایی موضوعات در اسناد و گروه بندی آنها بر اساس شباهت (مدل سازی موضوع) بررسی خواهد شد. این دوره باید بعد از: مقدمه ای بر علم داده در پایتون، نقشه برداری کاربردی، نمودار و نمایش داده ها در پایتون، و یادگیری ماشین کاربردی در پایتون گذرانده شود.
مهارتهای مرتبط
محتوا
Announcements
Content
Applied Text Mining in Python