Enrolment options
Datacamp / Data Preparation
پاک کردن اطلاعات با PySpark (Mitalearn-402064)
درباره این دوره:
کار با داده ها مشکل است - کار با میلیون ها یا حتی میلیاردها ردیف بدتر است. آیا مقداری کد پردازش داده که روی یک لپ تاپ با داده های نسبتاً بکر نوشته شده بود دریافت کردید؟ به احتمال زیاد شما مسئول انتقال یک فرآیند داده اولیه از نمونه اولیه به تولید شده اید. ممکن است با مجموعه دادههای دنیای واقعی، با فیلدهای گمشده، قالببندی عجیب و غریب و دادههای بزرگتر کار کرده باشید. حتی اگر همه اینها برای شما جدید باشد، این دوره به شما کمک می کند تا آنچه را که برای آماده سازی فرآیندهای داده با استفاده از Python با Apache Spark لازم است را بیاموزید. اصطلاحات، روشها و برخی از بهترین روشها را برای ایجاد یک پلت فرم پردازش داده کارآمد، قابل نگهداری و قابل درک میآموزید.
Guests cannot access this course. Please log in.