Enrolment options

Datacamp / Data Engineering

مقدمه ای بر PySpark (Mitalearn-399242)

درباره این دوره:

این دوره برای مهندسان داده، دانشمندان داده و متخصصان یادگیری ماشین طراحی شده است که به دنبال کار با مجموعه داده های بزرگ با استفاده از PySpark هستند. شما سرعت و مقیاس‌پذیری Apache Spark را بررسی خواهید کرد، یاد خواهید گرفت که جلسات Spark ایجاد کنید، با RDD کار کنید و DataFrames را از طریق تمرین‌های عملی دستکاری کنید. این دوره همچنین PySpark SQL را پوشش می دهد و به شما یاد می دهد که چگونه داده ها را با SQL جستجو کنید، طرحواره ها و انواع داده های پیچیده را مدیریت کنید و عملکرد را در محیط های توزیع شده بهینه کنید. در پایان، مهارت‌های اساسی برای پردازش و تجزیه و تحلیل کلان داده‌ها را خواهید داشت که زمینه را برای برنامه‌های کاربردی پیشرفته مانند یادگیری ماشین و تجزیه و تحلیل داده‌های بزرگ فراهم می‌کند.

Guests cannot access this course. Please log in.