datacamp مقدمه ای بر PySpark (Mitalearn-399242)

  • مدت زمان: 49 دقیقه
  • انتشار: 28 June 2026
  • مدرس: Ben Schmidt
  • سطح: مناسب همه
  • محتوا‌ها: 11
  • زیرنویس فارسی دارد
درباره این دوره:

این دوره برای مهندسان داده، دانشمندان داده و متخصصان یادگیری ماشین طراحی شده است که به دنبال کار با مجموعه داده های بزرگ با استفاده از PySpark هستند. شما سرعت و مقیاس‌پذیری Apache Spark را بررسی خواهید کرد، یاد خواهید گرفت که جلسات Spark ایجاد کنید، با RDD کار کنید و DataFrames را از طریق تمرین‌های عملی دستکاری کنید. این دوره همچنین PySpark SQL را پوشش می دهد و به شما یاد می دهد که چگونه داده ها را با SQL جستجو کنید، طرحواره ها و انواع داده های پیچیده را مدیریت کنید و عملکرد را در محیط های توزیع شده بهینه کنید. در پایان، مهارت‌های اساسی برای پردازش و تجزیه و تحلیل کلان داده‌ها را خواهید داشت که زمینه را برای برنامه‌های کاربردی پیشرفته مانند یادگیری ماشین و تجزیه و تحلیل داده‌های بزرگ فراهم می‌کند.

مهارت‌های مرتبط

  • محتوا

    • Announcements
  • Content

    • Introduction to PySpark