Course catalog

Course duration

Course provider

Topic

Categories

Showing 1-20 of 25 items.

linkedin Apache Spark Essential Training: Big Data Engineering (2021) (Mitalearn-218685)

  • 1 hours 2 minutes
  • مناسب همه
  • Release date: 29 June 2026
  • Author: Kumaran Ponnambalam
درباره این دوره:

مهندسی داده پایه و اساس ساخت برنامه های کاربردی تجزیه و تحلیل و علم داده در دنیای جدید Big Data است. مهندسی داده مستلزم ترکیب چندین فناوری کلان داده برای ساخت خطوط لوله و شبکه های داده برای جریان، پردازش و ذخیره داده ها است. این دوره بر ساخت راه حل های کامل تمرکز دارد که Apache Spark را با سایر ابزارهای Big Data ترکیب می کند تا خطوط لوله داده سرتاسری ایجاد کند. مربی کوماران پونامبالام با تعریف مهندسی داده، عملکردها و مفاهیم آن شروع می کند. در مرحله بعد، کوماران به نحوه عملکرد قابلیت‌های Spark مانند پردازش موازی، برنامه‌های اجرایی، گزینه‌های مدیریت حالت و یادگیری ماشین با استخراج، تبدیل، بارگذاری (ETL) می‌پردازد. او شما را با موارد و فرآیندهای استفاده از پردازش دسته ای و همچنین خطوط لوله پردازش بلادرنگ آشنا می کند. کوماران پس از آشنایی با چندین روش مفید مفید، با یک پروژه تمرینی پایان به انتها پایان می‌دهد.

linkedin Cloud Hadoop: Scaling Apache Spark (Mitalearn-171748)

  • 3 hours 16 minutes
  • مبتدی
  • Update date: 21 June 2026
  • Author: Lynn Langit
درباره این دوره:

آپاچی هادوپ و اسپارک این امکان را فراهم می‌کنند که بینش‌های تجاری واقعی را از داده‌های بزرگ ایجاد کنید. ابر آمازون خانه طبیعی این مجموعه ابزار قدرتمند است که خدمات متنوعی را برای اجرای گردش‌های کاری پردازش داده در مقیاس بزرگ ارائه می‌کند. در این دوره آموزشی با معمار کلان داده لین لنگیت یاد بگیرید که گردش های کاری Apache Hadoop و Spark خود را در AWS پیاده سازی کنید. با استفاده از ماشین‌های مجازی با EC2، خوشه‌های Spark مدیریت‌شده با EMR یا کانتینرهایی با EKS، گزینه‌های استقرار را برای مشاغل مقیاس تولید کاوش کنید. یاد بگیرید که چگونه خوشه های Hadoop و کارهای Spark را با Databricks پیکربندی و مدیریت کنید و از Python یا زبان برنامه نویسی انتخابی خود برای وارد کردن داده ها و اجرای کارها استفاده کنید. به علاوه، نحوه استفاده از کتابخانه‌های Spark را برای یادگیری ماشینی، ژنومیک و استریم بیاموزید. هر درس به شما کمک می کند بفهمید کدام گزینه استقرار برای حجم کاری شما بهترین است.

linkedin Databricks Certified Data Engineer Associate Cert Prep: 2 ELT با Spark SQL و Python (Mitalearn-395621)

  • 28 minutes
  • مناسب همه
  • Release date: 23 January 2024
  • Author: Noah Gift
درباره این دوره: 

 

آزمون گواهینامه Databricks Certified Data Engineer Associate توانایی شما را در استفاده از پلتفرم Databricks Lakehouse برای تکمیل وظایف اولیه مهندسی داده ارزیابی می کند. همچنین توانایی شما را در استفاده از Apache Spark SQL و Python برای انجام وظایف ETL معماری multihop که به صورت تدریجی داده‌های جدید را از منابع مختلف داده پردازش می‌کند تا برنامه‌های تحلیلی و داشبورد در Lakehouse را تقویت کند، ارزیابی می‌کند.

در این دوره، مربی Noah Gift آموزش عملی و عملی در مورد مفاهیم اصلی و مهارت های تحت پوشش در بخش دوم امتحان ارائه می دهد: ELT با اسپارک آپاچی. اصول تبدیل داده ها را با Apache Spark، از جمله نحوه نصب و استفاده از IntelliJ برای Databricks با Go، Databricks CLI، Databricks برای RStudio، Notebooks، پشتیبانی چند زبانه، Databricks Repos و موارد دیگر را بررسی کنید.


coursera Spark, Hadoop, and Snowflake for Data Engineering (Mitalearn-336529)

  • 10 hours 25 minutes
  • پیشرفته
  • Release date: 23 June 2026
  • Author: Noah Gift,Kennedy Behrman,Matt Harrison
درباره این دوره:

به عنوان مثال این در درجه اول برای دانشجویان سال اول و دوم لیسانس علاقه مند به مهندسی یا علوم، همراه با دانش آموزان دبیرستانی و متخصصان با علاقه به برنامه نویسی است که مهارت هایی را برای ایجاد خطوط لوله داده کارآمد و مقیاس پذیر به دست می آورند. پلتفرم های مهندسی داده های ضروری (Hadoop، Spark و Snowflake) را کاوش کنید و همچنین نحوه بهینه سازی و مدیریت آنها را بیاموزید. در Databricks، یک پلتفرم قدرتمند برای اجرای تجزیه و تحلیل داده ها و وظایف یادگیری ماشین، در حالی که مهارت های علم داده پایتون خود را با PySpark تقویت می کنید، وارد شوید. در نهایت، مفاهیم کلیدی MLflow را کشف کنید، یک پلتفرم منبع باز برای مدیریت چرخه زندگی یادگیری ماشینی سرتاسر، و یاد بگیرید که چگونه آن را با Databricks یکپارچه کنید. این دوره برای زبان آموزانی طراحی شده است که می خواهند حرفه خود را در علم داده یا مهندسی داده دنبال کنند یا پیشرفت کنند، یا برای توسعه دهندگان نرم افزار یا مهندسانی که می خواهند مجموعه مهارت های مدیریت داده خود را افزایش دهند. علاوه بر فناوری‌هایی که یاد خواهید گرفت، متدولوژی‌هایی نیز به دست خواهید آورد که به شما کمک می‌کنند مهارت‌های مدیریت پروژه و گردش کار خود را برای مهندسی داده تقویت کنید، از جمله استفاده از روش‌ها و بهترین روش‌های Kaizen، DevOps و Data Ops. این دوره جامع با آزمون هایی برای آزمایش دانش شما در سراسر جهان، به راهنمای سفر یادگیری شما برای تبدیل شدن به یک مهندس داده ماهر، آماده برای مقابله با چالش های دنیای داده محور امروزی کمک می کند.

linkedin آموزش ضروری Apache Spark Deep Learning (Mitalearn-162721)

  • 42 minutes
  • متوسط
  • Release date: 28 June 2026
  • Author: Jonathan Fernandes
درباره این دوره:

Apache Spark به طور گسترده به عنوان پلتفرم برتر برای حرفه ای ها در نظر گرفته می شود که باید بینش های جامع تری را از داده های خود به دست آورند. در این دوره آموزشی، یکی از هیجان انگیزترین جنبه های این پلتفرم کلان داده را بررسی کنید – توانایی آن در انجام یادگیری عمیق با تصاویر. جاناتان فرناندز، مربی، قبل از اینکه به طور کامل به یادگیری عمیق در اسپارک با استفاده از پایتون بپردازد، راه‌های مختلف برای انجام یادگیری عمیق در Spark و همچنین کتابخانه‌های کلیدی موجود در حال حاضر را بررسی می‌کند. سپس نشان می دهد که چگونه محیط یادگیری عمیق Spark خود را راه اندازی کنید، با استفاده از کتابخانه یادگیری عمیق Databricks با تصاویر در Spark کار کنید، از یک مدل از پیش آموزش دیده استفاده کنید و یادگیری را انتقال دهید، و مدل ها را به عنوان توابع SQL به کار ببرید.

linkedin آموزش ضروری Apache Spark: مهندسی داده های بزرگ (Mitalearn-411346)

  • 1 hours 4 minutes
  • مناسب همه
  • Release date: 21 June 2026
  • Author: Kumaran Ponnambalam
درباره این دوره:

مهندسی داده ها پایه و اساس ساخت و ساز برنامه های کاربردی علوم داده در دنیای جدید داده های بزرگ است. مهندسی داده ها برای ساخت خطوط لوله و شبکه های داده برای پخش ، پردازش و ذخیره داده ها نیاز به ترکیب چندین فناوری داده بزرگ دارد. این دوره بر ساختن راه حل های تمام عیار که Apache Spark را با سایر ابزارهای داده بزرگ برای ایجاد خطوط لوله داده نهایی به پایان می رساند ، متمرکز شده است. مربی Kumaran Ponnambalam با تعریف مهندسی داده ها ، کارکردهای آن و مفاهیم آن آغاز می شود. در مرحله بعد ، Kumaran به این نتیجه می رسد که قابلیت های جرقه ای مانند پردازش موازی ، برنامه های اجرای ، گزینه های مدیریت دولت و یادگیری ماشین با عصاره ، تبدیل ، بار (ETL) چگونه است. او شما را به موارد و فرآیندهای استفاده از پردازش دسته ای و همچنین خطوط لوله پردازش در زمان واقعی معرفی می کند. پس از طی کردن چندین روش مفید ، کوماران با یک پروژه تمرینی پایان به پایان نتیجه می گیرد.

linkedin آموزش ضروری آپاچی اسپارک (Mitalearn-107845)

  • 1 hours 27 minutes
  • متوسط
  • Release date: 21 June 2026
  • Author: Ben Sullins
درباره این دوره:

آپاچی اسپارک یک پلتفرم قدرتمند است که راه های جدیدی را برای ذخیره و استفاده از داده های بزرگ در اختیار کاربران قرار می دهد. در این دوره آموزشی، با Spark به سرعت عمل کنید و کشف کنید که چگونه از این موتور پردازش محبوب برای ارائه بینش مؤثر و جامع در مورد داده های خود استفاده کنید. مربی بن سالینز یک نمای کلی از پلتفرم ارائه می دهد و به اجزای مختلف سازنده آپاچی اسپارک می پردازد. او نحوه تجزیه و تحلیل داده‌ها را در Spark با استفاده از PySpark و Spark SQL نشان می‌دهد، الگوریتم‌های یادگیری ماشین در حال اجرا را با استفاده از Mlib بررسی می‌کند، نحوه ایجاد یک برنامه تحلیل جریانی با استفاده از Spark Streaming و موارد دیگر را نشان می‌دهد.

linkedin استفاده از آپاچی اسپارک با دات نت (Mitalearn-226216)

  • 1 hours 20 minutes
  • مناسب همه
  • Release date: 20 January 2021
  • Author: Microsoft .NET,Brigit Murtaugh
درباره این دوره:

با این دوره مقدماتی درباره دات نت برای آپاچی اسپارک، سفر خود را به سمت تجزیه و تحلیل داده های بزرگ آغاز کنید. مربی Brigit Murtaugh توضیح می دهد که چگونه .NET برای Apache Spark به شما قدرت می دهد تا در دنیای داده های بزرگ در اکوسیستم NET شرکت کنید. او به شما نشان می دهد که چگونه یک دات نت ساده برای برنامه شمارش کلمات Apache Spark ایجاد کنید و آن را بر روی دستگاه محلی خود اجرا کنید، سپس به شما نشان می دهد که چگونه یک برنامه پردازش دسته ای بنویسید. در مرحله بعد، او شما را از طریق یک برنامه استریم ساختاریافته که کلمات را همزمان با تایپ آنها در ترمینال به صورت زنده پردازش می کند، گام بر می دارد. Brigit نحوه استفاده از ML.NET را در ترکیب با .NET برای Apache Spark برای انجام تجزیه و تحلیل احساسات در مجموعه ای از بررسی های آنلاین پوشش می دهد. او به شما می آموزد که چگونه دات نت خود را برای برنامه Apache Spark در Azure Databricks استقرار دهید. سپس او با نشان دادن نحوه استقرار .NET برای برنامه Apache Spark در Azure HDInsight نتیجه گیری می کند.

این دوره توسط Microsoft.NET ایجاد شده است. ما خوشحالیم که میزبان این آموزش در کتابخانه خود هستیم.

linkedin الگوهای طراحی پردازش جریان با Spark (Mitalearn-197401)

  • 1 hours 9 minutes
  • پیشرفته
  • Release date: 28 June 2026
  • Author: Kumaran Ponnambalam
درباره این دوره:

با تولید داده های بیشتر و بیشتر توسط وب سایت ها، دستگاه ها و ارتباطات، پردازش جریان محبوب تر می شود. آپاچی اسپارک یک پلتفرم پیشرو است که پردازش جریانی مقیاس‌پذیر و سریع را ارائه می‌دهد، اما همچنان برای دستیابی به حداکثر کارایی به طراحی هوشمندانه نیاز دارد. این دوره به توسعه دهندگان کمک می کند تا از بهترین شیوه ها و الگوهای طراحی معتبر برای پیاده سازی پردازش جریان در Apache Spark استفاده کنند. مربی Kumaran Ponnambalam نحوه تنظیم محیط خود را نشان می دهد و سپس در چهار الگوی طراحی و موارد استفاده در دنیای واقعی قدم می گذارد: تجزیه و تحلیل جریان، هشدارها و آستانه ها، تابلوهای امتیازات، و پیش بینی های زمان واقعی. در فصل ششم، او پروژه‌ای از شروع تا پایان را معرفی می‌کند که نشان می‌دهد چگونه با استفاده از Spark، Apache Kafka، MariaDB و Redis از طراحی به کار اجرا شده برویم. در پایان دوره، تمام قابلیت های این پلتفرم قدرتمند را درک خواهید کرد و می توانید آن را در راه حل های مهندسی داده خود بگنجانید.

coursera برنامه نویسی تابعی در Scala Capstone (Mitalearn-334846)

  • 3 minutes
  • مناسب همه
  • Release date: 23 June 2026
  • Author: Julien Richard-Foy
درباره این دوره:

در پروژه نهایی Capstone، مهارت‌هایی را که با ساختن یک برنامه کاربردی بزرگ با داده‌های فشرده با استفاده از داده‌های دنیای واقعی آموخته‌اید، به کار خواهید برد. شما یک برنامه کامل را پیاده سازی خواهید کرد که چندین گیگابایت داده را پردازش می کند. این برنامه تجسم های تعاملی از تکامل دما در طول زمان را در سراسر جهان نشان می دهد. توسعه چنین برنامه ای شامل موارد زیر است: - تبدیل داده‌های ارائه‌شده توسط ایستگاه‌های هواشناسی به اطلاعات معنی‌داری مانند، به عنوان مثال، میانگین دمای هر نقطه از کره زمین در ده سال گذشته. - سپس با استفاده از تکنیک های درون یابی فضایی و خطی از این اطلاعات تصاویری تهیه کنید. - در نهایت، پیاده سازی نحوه واکنش رابط کاربری به اقدامات کاربران.

coursera پلتفرم Hadoop و چارچوب برنامه (Mitalearn-334982)

  • 4 hours 38 minutes
  • مناسب همه
  • Release date: 23 June 2026
  • Author: Natasha Balac, Ph.D.,Paul Rodriguez,Andrea Zonca
درباره این دوره:

این دوره برای برنامه نویسان تازه کار یا افراد تجاری است که می خواهند ابزارهای اصلی مورد استفاده برای بحث و تحلیل داده های بزرگ را درک کنند. بدون هیچ تجربه قبلی، این فرصت را خواهید داشت که نمونه های عملی را با چارچوب های Hadoop و Spark که دو مورد از رایج ترین آنها در صنعت هستند، مرور کنید. با توضیح اجزای خاص و فرآیندهای اساسی معماری Hadoop، پشته نرم افزار و محیط اجرا راحت خواهید بود. در تکالیف به شما راهنمایی می‌شود که چگونه دانشمندان داده مفاهیم و تکنیک‌های مهمی مانند Map-Reduce را که برای حل مشکلات اساسی در داده‌های بزرگ استفاده می‌شوند، به کار می‌برند. برای گفتگو در مورد کلان داده ها و فرآیند تجزیه و تحلیل داده ها احساس قدرت خواهید کرد.

linkedin تجزیه و تحلیل داده های بزرگ با Hadoop و Apache Spark (Mitalearn-169470)

  • 1 hours 1 minutes
  • متوسط
  • Release date: 24 February 2020
  • Author: Kumaran Ponnambalam
درباره این دوره: 

 Apache Hadoop پیشگام در دنیای فناوری های کلان داده بود و همچنان در ذخیره سازی کلان داده های سازمانی پیشرو است. Apache Spark برترین موتور پردازش داده های بزرگ است و مجموعه ای چشمگیر از ویژگی ها و قابلیت ها را ارائه می دهد. هنگامی که با هم استفاده می شود، سیستم فایل توزیع شده Hadoop (HDFS) و Spark می توانند یک تنظیم تجزیه و تحلیل داده های بزرگ واقعا مقیاس پذیر را ارائه دهند. در این دوره آموزشی، یاد بگیرید که چگونه از این دو فناوری برای ایجاد خطوط لوله تجزیه و تحلیل داده مقیاس پذیر و بهینه استفاده کنید. مربی کوماران پونامبالام راه‌هایی را برای بهینه‌سازی مدل‌سازی و ذخیره‌سازی داده در HDFS بررسی می‌کند. در مورد مصرف و استخراج داده های مقیاس پذیر با استفاده از Spark صحبت می کند. و نکاتی را برای بهینه سازی پردازش داده ها در Spark ارائه می دهد. به علاوه، او یک پروژه مورد استفاده ارائه می دهد که به شما امکان می دهد تکنیک های جدید خود را تمرین کنید.

linkedin تجزیه و تحلیل داده های بزرگ با Hadoop و Apache Spark (Mitalearn-442847)

  • 51 minutes
  • مناسب همه
  • Release date: 21 June 2026
  • Author: Kumaran Ponnambalam
درباره این دوره:

Apache Hadoop پیشگام در دنیای فناوری های کلان داده بود و همچنان در ذخیره سازی کلان داده های سازمانی پیشتاز است. Apache Spark برترین موتور پردازش داده های بزرگ است و مجموعه ای چشمگیر از ویژگی ها و قابلیت ها را ارائه می دهد. هنگامی که با هم استفاده می شود، سیستم فایل توزیع شده Hadoop (HDFS) و Spark می توانند یک راه اندازی واقعا مقیاس پذیر برای تجزیه و تحلیل داده های بزرگ ارائه دهند. در این دوره، کوماران پونامبالام، متخصص تجزیه و تحلیل داده، به شما نشان می دهد که چگونه از این دو فناوری برای ایجاد خطوط لوله تجزیه و تحلیل داده مقیاس پذیر و بهینه استفاده کنید. کاوش راه هایی برای بهینه سازی مدل سازی و ذخیره سازی داده ها در HDFS؛ بحث در مورد مصرف و استخراج داده های مقیاس پذیر با استفاده از Spark. و نکات قابل اجرا برای بهینه سازی پردازش داده ها در Spark را مرور کنید. به علاوه، یک پروژه مورد استفاده را تکمیل کنید که به شما امکان می دهد تکنیک های جدید خود را تمرین کنید.

coursera تجزیه و تحلیل عملیاتی با Microsoft Azure Synapse Analytics (Mitalearn-333520)

  • 32 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Microsoft
درباره این دوره:

در این دوره آموزشی، نحوه انجام تجزیه و تحلیل عملیاتی در برابر Azure Cosmos DB با استفاده از ویژگی Azure Synapse Link در Azure Synapse Analytics را خواهید آموخت. خواهید آموخت که چگونه پردازش تراکنش های ترکیبی و تحلیلی می تواند به شما در انجام تجزیه و تحلیل عملیاتی با Azure Synapse Analytics کمک کند. همچنین یاد خواهید گرفت که چگونه Azure Synapse Link را برای تعامل با Azure Cosmos DB پیکربندی و فعال کنید و چگونه می توانید با استفاده از Azure Synapse Link تجزیه و تحلیل را در برابر Azure Cosmos DB انجام دهید. این دوره بخشی از یک تخصص در نظر گرفته شده برای مهندسین داده و توسعه دهندگان است که می خواهند تخصص خود را در طراحی و پیاده سازی راه حل های داده ای که از خدمات داده Microsoft Azure استفاده می کنند برای هر کسی که علاقه مند به آماده شدن برای آزمون DP-203: مهندسی داده در Microsoft Azure (بتا) نشان دهد. ). شما در یک آزمون عملی شرکت خواهید کرد که شامل مهارت های کلیدی می شود که با آزمون گواهینامه اندازه گیری می شوند. این هفتمین دوره از یک برنامه 10 دوره ای است که به شما برای شرکت در آزمون کمک می کند تا بتوانید در طراحی و پیاده سازی راه حل های داده ای که از خدمات داده مایکروسافت آژور استفاده می کنند تخصص داشته باشید. مهندسی داده در آزمون Microsoft Azure فرصتی برای اثبات تخصص دانش در یکپارچه‌سازی، تبدیل و تلفیق داده‌ها از سیستم‌های داده‌های مختلف ساختاریافته و بدون ساختار به ساختارهایی است که برای ساخت راه‌حل‌های تحلیلی که از خدمات داده مایکروسافت آژور استفاده می‌کنند، مناسب هستند. هر دوره به شما مفاهیم و مهارت هایی را می آموزد که با امتحان اندازه گیری می شوند. در پایان این تخصص، شما آماده شرکت و ثبت نام در آزمون DP-203: مهندسی داده در Microsoft Azure (بتا) خواهید بود.

coursera تجزیه و تحلیل کلان داده با اسکالا و اسپارک (Mitalearn-311777)

  • 5 hours 52 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Prof. Heather Miller
درباره این دوره:

دستکاری کلان داده های توزیع شده روی یک خوشه با استفاده از مفاهیم کاربردی در صنعت شایع است و مسلماً یکی از اولین استفاده های صنعتی گسترده از ایده های کاربردی است. محبوبیت MapReduce و Hadoop و اخیراً Apache Spark، یک چارچوب مجموعه‌های توزیع شده سریع و درون حافظه که در Scala نوشته شده است، گواه این موضوع است. در این دوره، خواهیم دید که چگونه پارادایم موازی داده را می توان با استفاده از Spark در سراسر مورد توزیع شده گسترش داد. ما مدل برنامه نویسی Spark را با جزئیات پوشش خواهیم داد، و مراقب باشیم که بدانیم چگونه و چه زمانی با مدل های برنامه نویسی آشنا، مانند مجموعه های موازی با حافظه مشترک یا مجموعه های متوالی Scala متفاوت است. از طریق مثال‌های عملی در Spark و Scala، یاد می‌گیریم که چه زمانی مسائل مهم مربوط به توزیع مانند تأخیر و ارتباطات شبکه باید در نظر گرفته شود و چگونه می‌توان به طور مؤثر برای بهبود عملکرد به آنها پرداخت. نتایج یادگیری در پایان این دوره شما قادر خواهید بود: - داده ها را از ذخیره سازی دائمی بخوانید و آن را در آپاچی اسپارک بارگذاری کنید. - دستکاری داده ها با Spark و Scala، - بیان الگوریتم برای تجزیه و تحلیل داده ها به سبک عملکردی، - تشخیص نحوه جلوگیری از تکرار و محاسبه مجدد در Spark، پیشینه پیشنهادی: شما باید حداقل یک سال تجربه برنامه نویسی داشته باشید. تسلط به جاوا یا سی شارپ ایده آل است، اما تجربه با زبان های دیگر مانند C/C++، Python، Javascript یا Ruby نیز کافی است. شما باید با استفاده از خط فرمان آشنایی داشته باشید. این دوره بعد از برنامه نویسی موازی در نظر گرفته شده است: https://www.coursera.org/learn/parprog1.

coursera تجزیه و تحلیل کلان داده با اسکالا و اسپارک (نسخه اسکالا 2) (Mitalearn-312899)

  • 5 hours 52 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Prof. Heather Miller
درباره این دوره:

دستکاری کلان داده های توزیع شده روی یک خوشه با استفاده از مفاهیم کاربردی در صنعت شایع است و مسلماً یکی از اولین استفاده های صنعتی گسترده از ایده های کاربردی است. محبوبیت MapReduce و Hadoop و اخیراً Apache Spark، یک چارچوب مجموعه‌های توزیع شده سریع و درون حافظه که در Scala نوشته شده است، گواه این موضوع است. در این دوره، خواهیم دید که چگونه پارادایم موازی داده را می توان با استفاده از Spark در سراسر مورد توزیع شده گسترش داد. ما مدل برنامه نویسی Spark را با جزئیات پوشش خواهیم داد، و مراقب باشیم که بدانیم چگونه و چه زمانی با مدل های برنامه نویسی آشنا، مانند مجموعه های موازی با حافظه مشترک یا مجموعه های متوالی Scala متفاوت است. از طریق مثال‌های عملی در Spark و Scala، یاد می‌گیریم که چه زمانی مسائل مهم مربوط به توزیع مانند تأخیر و ارتباطات شبکه باید در نظر گرفته شود و چگونه می‌توان به طور مؤثر برای بهبود عملکرد به آنها پرداخت. نتایج یادگیری در پایان این دوره شما قادر خواهید بود: - داده ها را از ذخیره سازی دائمی بخوانید و آن را در آپاچی اسپارک بارگذاری کنید. - دستکاری داده ها با Spark و Scala، - بیان الگوریتم برای تجزیه و تحلیل داده ها به سبک عملکردی، - تشخیص نحوه جلوگیری از تکرار و محاسبه مجدد در Spark، پیشینه پیشنهادی: شما باید حداقل یک سال تجربه برنامه نویسی داشته باشید. تسلط به جاوا یا سی شارپ ایده آل است، اما تجربه با زبان های دیگر مانند C/C++، Python، Javascript یا Ruby نیز کافی است. شما باید با استفاده از خط فرمان آشنایی داشته باشید. این دوره بعد از برنامه نویسی موازی در نظر گرفته شده است: https://www.coursera.org/learn/parprog1. توجه داشته باشید که این نسخه از دوره از Scala 2.13 استفاده می کند. می‌توانید نسخه جدیدتر دوره را که از Scala 3 استفاده می‌کند، در اینجا بیابید: https://www.coursera.org/learn/scala-spark-big-data

linkedin علم داده عملی: تجزیه و تحلیل 4 سرویس در Spark (Mitalearn-215914)

  • 29 minutes
  • مناسب همه
  • Release date: 22 June 2026
  • Author: Free the Data Academy,Ben Sullins
درباره این دوره:

آیا در نظر دارید در علم داده کار کنید و می خواهید ابتدا برخی از ابزارهای محبوب را امتحان کنید؟ این دوره بر روی کارهایی که می توانید با Apache Spark انجام دهید تمرکز دارد. مربی Ben Sullins به شما نشان می دهد که چگونه Spark را روی Databricks راه اندازی کنید. بن به نحوه وارد کردن داده‌های خود و شروع کار با آن‌ها، با استفاده از هر دو زبان Python و SQL در Spark می‌پردازد. او با تجسم داده های آسان پروژه شما را به سطح بعدی می برد. بن پس از توضیح برخی نکات و ترفندها برای ارائه داده های خود با استفاده از Spark، با برخی منابع اضافی که می توانید از آنها برای پیگیری سفر علم داده خود استفاده کنید، نتیجه گیری می کند.n ما خوشحالیم که میزبان این آموزش در کتابخانه خود هستیم.

coursera مبانی علم داده های مقیاس پذیر (Mitalearn-328335)

  • 1 hours 49 minutes
  • مناسب همه
  • Release date: 23 June 2026
  • Author: Romeo Kienzler
درباره این دوره:

آپاچی اسپارک استاندارد واقعی برای پردازش داده در مقیاس بزرگ است. این اولین دوره از یک سری دوره ها به سمت تخصص IBM Advanced Data Science است. ما قویاً معتقدیم که برای موفقیت در شروع یادگیری یک پلتفرم علم داده مقیاس‌پذیر بسیار مهم است زیرا محدودیت‌های حافظه و CPU برای ساختن مدل‌های پیشرفته یادگیری ماشینی عامل محدودکننده هستند. در این دوره ما اصول Apache Spark را با استفاده از پایتون و pyspark به شما آموزش می دهیم. ما Apache Spark را در دو هفته اول معرفی خواهیم کرد و یاد خواهیم گرفت که چگونه از آن برای محاسبه وظایف اولیه اکتشافی و پیش پردازش داده در دو هفته گذشته استفاده کنیم. از طریق این تمرین شما همچنین با اساسی ترین معیارهای آماری و فناوری های تجسم داده ها آشنا می شوید. این به شما دانش کافی برای به عهده گرفتن نقش یک مهندس داده در هر محیط مدرن می دهد. اما به شما مبنایی برای پیشبرد حرفه خود به سمت علم داده نیز می دهد. لطفاً به برنامه درسی تخصصی کامل نگاهی بیندازید: https://www.coursera.org/specializations/advanced-data-science-ibm اگر این دوره را بگذرانید و گواهی دوره Coursera را دریافت کنید، یک IBM دیجیتال نیز کسب خواهید کرد. نشان برای کسب اطلاعات بیشتر در مورد نشان های دیجیتال IBM پیوند ibm.biz/badging را دنبال کنید. پس از تکمیل این دوره، شما قادر خواهید بود: • توضیح دهید که چگونه معیارهای آماری اساسی برای آشکار کردن الگوهای موجود در داده ها استفاده می شود. • شناسایی تکنیک های مفید برای کار با داده های بزرگ مانند روش های کاهش ابعاد و انتخاب ویژگی • استفاده از ابزارهای پیشرفته و کتابخانه های نموداری برای: o بهبود کارایی تجزیه و تحلیل داده های بزرگ با تجزیه و تحلیل موازی و پارتیشن بندی o تجسم داده ها به صورت تعدادی دو بعدی و فرمت های سه بعدی (Box Plot، Run Chart، Scatter Plot، Pareto Chart، و Multidimensional Scaling) برای تکمیل موفقیت آمیز دوره، پیش نیازهای زیر توصیه می شود: • مهارت های برنامه نویسی اولیه در پایتون • ریاضی پایه • SQL پایه (شما می توانید آن را به راحتی دریافت کنید. از https://www.coursera.org/learn/sql-data-science در صورت نیاز) برای تکمیل این دوره از فناوری های زیر استفاده می شود: (این فناوری ها در دوره در صورت لزوم معرفی شده اند بنابراین هیچ دانش قبلی وجود ندارد. لازم است.) • نوت بوک های Jupyter (به صورت رایگان توسط IBM Watson Studio برای شما آورده شده است) • ApacheSpark (به صورت رایگان توسط IBM Watson Studio برای شما آورده شده است) • Python گزارش شده است که برخی از مطالب این دوره بسیار پیشرفته است. بنابراین اگر شما هم همین احساس را دارید، لطفا قبل از شروع این دوره ابتدا به مطالب زیر نگاهی بیندازید، گزارش شده است که این واقعا کمک می کند. البته می توانید ابتدا این دوره را امتحان کنید و سپس در صورت نیاز دوره ها/مواد زیر را بگذرانید. این برنامه رایگان است... https://cognitiveclass.ai/learn/spark https://dataplatform.cloud.ibm.com/analytics/notebooks/v2/f8982db1-5e55-46d6-a272-fd11b670be38/view?access3311a945333333333333333333333333333333333333333333694=533311a9455 b3eae2a99e0dc923ec0775d891c31c5bbbc68 این دوره چهار هفته طول می کشد، 4-6 ساعت در هفته

linkedin مقدمه ای بر Spark SQL و DataFrames (Mitalearn-157162)

  • 1 hours 54 minutes
  • متوسط
  • Update date: 21 June 2026
  • Author: Dan Sullivan
درباره این دوره:

DataFrames، یک ساختار داده پرکاربرد در Apache Spark را کاوش کنید. DataFrames به توسعه دهندگان Spark اجازه می دهد تا عملیات داده های رایج مانند فیلتر کردن و تجمیع و همچنین تجزیه و تحلیل داده های پیشرفته را روی مجموعه های بزرگ داده های توزیع شده انجام دهند. با اضافه شدن Spark SQL، توسعه دهندگان به زبان جستجوی محبوب تر و قدرتمندتر از DataFrames API داخلی دسترسی دارند. در این دوره، مدرس دن سالیوان نحوه انجام عملیات اساسی - بارگیری، فیلتر کردن، و جمع آوری داده ها در DataFrames - با API و SQL و همچنین تکنیک های پیشرفته تری را که به راحتی در SQL انجام می شود را نشان می دهد. در این بخش از دوره، Dan نحوه اتصال داده ها، حذف موارد تکراری و مقابله با مقادیر null یا NA را توضیح می دهد. دروس با سه مثال عمیق از استفاده از DataFrames برای علم داده به پایان می رسد: تجزیه و تحلیل داده های اکتشافی، تجزیه و تحلیل سری های زمانی، و یادگیری ماشین.

coursera مقدمه ای بر تحلیل داده ها [coursera] (Mitalearn-326346)

  • 3 hours 44 minutes
  • مبتدی
  • Release date: 27 June 2026
  • Author: Rav Ahuja
درباره این دوره:

برای شروع حرفه ای در تجزیه و تحلیل داده ها آماده هستید اما نمی دانید از کجا شروع کنید؟ این دوره به شما معرفی ملایمی با تجزیه و تحلیل داده ها، نقش یک تحلیلگر داده و ابزارهای مورد استفاده در این شغل می دهد. شما در مورد مهارت ها و مسئولیت های یک تحلیلگر داده یاد خواهید گرفت و از چندین متخصص داده که نکات و توصیه های خود را برای شروع یک حرفه به اشتراک می گذارند، خواهید شنید. این دوره به شما کمک می کند تا بین نقش های تحلیلگران داده، دانشمندان داده و مهندسان داده تفاوت قائل شوید. شما با اکوسیستم داده ها، در کنار پایگاه های داده، انبارهای داده، مارت های داده، دریاچه های داده و خطوط لوله داده آشنا خواهید شد. این سفر هیجان انگیز را ادامه دهید و پلتفرم های Big Data مانند Hadoop، Hive و Spark را کشف کنید. در پایان این دوره شما قادر خواهید بود مبانی فرآیند تجزیه و تحلیل داده ها از جمله جمع آوری، تمیز کردن، تجزیه و تحلیل و به اشتراک گذاری داده ها و ارتباط بینش خود را با استفاده از تجسم ها و ابزارهای داشبورد درک کنید. همه اینها در پروژه نهایی گرد هم می آیند، جایی که دانش شما را از مواد درسی آزمایش می کند و سناریوی واقعی از وظایف تجزیه و تحلیل داده ها را ارائه می دهد. این دوره نیازی به تجزیه و تحلیل داده، صفحه گسترده یا تجربه علوم کامپیوتر ندارد.

Suggestions