پاک کردن اطلاعات با PySpark
(Mitalearn-402064)
- Duration: 50 minutes
- Release date: 28 June 2026
- Author: Mike Metzger
- Level: مناسب همه
- Contents: 16
- Has Caption in Persian
درباره این دوره:
کار با داده ها مشکل است - کار با میلیون ها یا حتی میلیاردها ردیف بدتر است. آیا مقداری کد پردازش داده که روی یک لپ تاپ با داده های نسبتاً بکر نوشته شده بود دریافت کردید؟ به احتمال زیاد شما مسئول انتقال یک فرآیند داده اولیه از نمونه اولیه به تولید شده اید. ممکن است با مجموعه دادههای دنیای واقعی، با فیلدهای گمشده، قالببندی عجیب و غریب و دادههای بزرگتر کار کرده باشید. حتی اگر همه اینها برای شما جدید باشد، این دوره به شما کمک می کند تا آنچه را که برای آماده سازی فرآیندهای داده با استفاده از Python با Apache Spark لازم است را بیاموزید. اصطلاحات، روشها و برخی از بهترین روشها را برای ایجاد یک پلت فرم پردازش داده کارآمد، قابل نگهداری و قابل درک میآموزید.
Related Skills
Content
Announcements
Content
Cleaning Data with PySpark
