Enrolment options
Datacamp / Data Engineering
مقدمه ای بر PySpark (Mitalearn-399242)
درباره این دوره:
این دوره برای مهندسان داده، دانشمندان داده و متخصصان یادگیری ماشین طراحی شده است که به دنبال کار با مجموعه داده های بزرگ با استفاده از PySpark هستند. شما سرعت و مقیاسپذیری Apache Spark را بررسی خواهید کرد، یاد خواهید گرفت که جلسات Spark ایجاد کنید، با RDD کار کنید و DataFrames را از طریق تمرینهای عملی دستکاری کنید. این دوره همچنین PySpark SQL را پوشش می دهد و به شما یاد می دهد که چگونه داده ها را با SQL جستجو کنید، طرحواره ها و انواع داده های پیچیده را مدیریت کنید و عملکرد را در محیط های توزیع شده بهینه کنید. در پایان، مهارتهای اساسی برای پردازش و تجزیه و تحلیل کلان دادهها را خواهید داشت که زمینه را برای برنامههای کاربردی پیشرفته مانند یادگیری ماشین و تجزیه و تحلیل دادههای بزرگ فراهم میکند.
Guests cannot access this course. Please log in.