Course catalog

Categories

Showing 1-3 of 3 items.

linkedin Apache PySpark by Example (Mitalearn-162432)

  • 1 hours 58 minutes
  • متوسط
  • Release date: 21 June 2026
  • Author: Jonathan Fernandes
درباره این دوره:

آیا می خواهید در اسرع وقت با Apache Spark شروع به کار کنید؟ اگر به پایتون مسلط هستید، Spark Python API (PySpark) بلیط شما برای دسترسی به قدرت این پلت فرم بسیار محبوب کلان داده است. این دوره عملی و عملی به شما کمک می کند تا با PySpark راحت باشید و توضیح دهد که چه چیزی ارائه می دهد و چگونه می تواند کار علم داده شما را بهبود بخشد. برای شروع، مربی جاناتان فرناندز به بررسی اکوسیستم اسپارک می پردازد و مزایای آن را نسبت به سایر پلتفرم های علم داده، API ها و مجموعه ابزارها شرح می دهد. در مرحله بعد، او به DataFrame API و چگونگی پاسخ پلتفرم به بسیاری از چالش های کلان داده نگاه می کند. در نهایت، او به مجموعه داده‌های توزیع‌شده انعطاف‌پذیر (RDDs)، بلوک‌های سازنده Spark می‌پردازد.

linkedin آموزش ضروری PySpark: مقدمه ای بر ساخت خطوط لوله داده (Mitalearn-440722)

  • 1 hours 18 minutes
  • مناسب همه
  • Release date: 7 August 2025
  • Author: Sam Bail
درباره این دوره: 

 PySpark یک کتابخانه قدرتمند است که قابلیت‌های محاسباتی توزیع شده Apache Spark را به پایتون می‌آورد و آن را به ابزاری کلیدی برای پردازش کارآمد داده‌های مقیاس بزرگ تبدیل می‌کند. در این دوره، مهندس داده و تحلیلگر Sam Bail، مقدمه ای ساختاریافته و عملی برای PySpark ارائه می دهد که با مروری بر آپاچی اسپارک، معماری و اکوسیستم آن شروع می شود. قبل از راه‌اندازی یک محیط آزمایشگاهی و کار با مجموعه داده واقعی، در مورد مفاهیم اصلی Spark، مانند DataFrame API، تبدیل‌ها، ارزیابی‌های تنبل و اقدامات اطلاعاتی کسب کنید. به‌علاوه، بینش‌هایی در مورد اینکه PySpark چگونه با یک اکوسیستم مهندسی داده‌های گسترده‌تر و بهترین شیوه‌های اجرای PySpark در یک محیط تولیدی سازگار می‌شود، به دست آورید.

linkedin راهنمای کامل برای دیتابیک ها برای مهندسی داده ها (Mitalearn-415035)

  • 6 hours 9 minutes
  • مناسب همه
  • Release date: 28 February 2025
  • Author: Deepak Goyal
درباره این دوره: 

 در این دوره ، Master Databricks برای تبدیل شدن به یک مهندس داده ACE. بیاموزید که چگونه می توانید به صورت تخصصی اشکال زدایی ، پردازش و تجزیه و تحلیل مقادیر عظیمی از داده ها و ایجاد راه حل های مقیاس پذیر به عنوان مربی Deepak Goyal شما را از طریق شیرجه عمیق در مورد نحوه عملکرد پلت فرم Databricks راهنمایی کنید. تحول pyspark و Spark SQL را در پایگاه داده ها ، به همراه نحوه خواندن و نوشتن DataFrame در Databricks کاوش کنید. به علاوه ، در مورد دریاچه دلتا ، به بهینه سازی ها ، برنامه ریزی نوت بوک ، مدیریت خوشه ، گردش کار و موارد دیگر بیاموزید.