coursera یادگیری ماشینی مقیاس پذیر روی داده های بزرگ با استفاده از اسپارک آپاچی (Mitalearn-333843)

  • Duration: 2 hours 28 minutes
  • Release date: 23 June 2026
  • Author: Romeo Kienzler
  • Level: متوسط
  • Contents: 36
  • Has Caption in Persian
درباره این دوره:

این دوره شما را با مهارت‌های مقیاس‌بندی وظایف علم داده و یادگیری ماشین (ML) در مجموعه‌های کلان داده با استفاده از اسپارک آپاچی توانمند می‌سازد. بیشتر کارهای یادگیری ماشین در دنیای واقعی شامل مجموعه داده های بسیار بزرگی است که فراتر از محدودیت های CPU، حافظه و ذخیره سازی یک کامپیوتر است. Apache Spark یک چارچوب متن باز است که از محاسبات خوشه ای و ذخیره سازی توزیع شده برای پردازش مجموعه داده های بسیار بزرگ به شیوه ای کارآمد و مقرون به صرفه استفاده می کند. بنابراین دانش کاربردی کار با Apache Spark یک دارایی عالی و تمایز بالقوه برای یک مهندس یادگیری ماشین است. پس از اتمام این دوره، شما قادر خواهید بود: - درک عملی Apache Spark را به دست آورید و از آن برای حل مشکلات یادگیری ماشینی که شامل داده های کوچک و بزرگ هستند استفاده کنید. - درک نحوه نوشتن کد موازی که قادر به اجرا بر روی هزاران CPU است. - از خوشه های محاسباتی در مقیاس بزرگ برای اعمال الگوریتم های یادگیری ماشین بر روی پتابایت داده با استفاده از Apache SparkML Pipelines استفاده کنید. - حذف خطاهای خارج از حافظه ایجاد شده توسط چارچوب های یادگیری ماشین سنتی، زمانی که داده ها در حافظه اصلی رایانه جا نمی شوند. - هزاران مدل مختلف ML را به صورت موازی آزمایش کنید تا بهترین عملکرد را پیدا کنید - تکنیکی که توسط بسیاری از کاگلرهای موفق استفاده می شود. - (اختیاری) دستورات SQL را با استفاده از Apache SparkSQL و Apache Spark DataFrame API روی مجموعه داده های بسیار بزرگ اجرا کنید. برای یادگیری تکنیک های یادگیری ماشینی برای کار با Big Data که توسط شرکت هایی مانند Alibaba، Apple، Amazon، Baidu، eBay، IBM، NASA، Samsung، SAP، TripAdvisor، Yahoo!، Zalando و بسیاری دیگر با موفقیت به کار گرفته شده اند، اکنون ثبت نام کنید. توجه: در طول دوره بدون پرداخت هزینه در کلاستر Apache Spark که توسط IBM ارائه شده است، کارهای یادگیری ماشین را بصورت دستی تمرین خواهید کرد و پس از آن می توانید به استفاده از آن ادامه دهید. پیش نیازها: - برنامه نویسی پایه پایتون - یادگیری ماشین اولیه (فیلم های معرفی اختیاری در این دوره نیز ارائه شده است) - مهارت های اولیه SQL برای محتوای اختیاری دوره های زیر قبل از شرکت در این کلاس توصیه می شود (مگر اینکه قبلاً مهارت داشته باشید) https://www.coursera.org/learn/python-for-applied-data-science یا مشابه https://www.coursera.org/learn/machine-learning-with-python یا مشابه https://www.coursera.org/learn/sql-data-science برای سخنرانی های اختیاری
  • Content

    • Announcements
  • Content

    • Scalable Machine Learning on Big Data using Apache Spark