Course catalog
Categories
Showing 1-4 of 4 items.
Spark, Hadoop, and Snowflake for Data Engineering
(Mitalearn-336529)
- 10 hours 25 minutes
- پیشرفته
- Release date: 23 June 2026
- Author: Noah Gift,Kennedy Behrman,Matt Harrison
درباره این دوره:
به عنوان مثال این در درجه اول برای دانشجویان سال اول و دوم لیسانس علاقه مند به مهندسی یا علوم، همراه با دانش آموزان دبیرستانی و متخصصان با علاقه به برنامه نویسی است که مهارت هایی را برای ایجاد خطوط لوله داده کارآمد و مقیاس پذیر به دست می آورند. پلتفرم های مهندسی داده های ضروری (Hadoop، Spark و Snowflake) را کاوش کنید و همچنین نحوه بهینه سازی و مدیریت آنها را بیاموزید. در Databricks، یک پلتفرم قدرتمند برای اجرای تجزیه و تحلیل داده ها و وظایف یادگیری ماشین، در حالی که مهارت های علم داده پایتون خود را با PySpark تقویت می کنید، وارد شوید. در نهایت، مفاهیم کلیدی MLflow را کشف کنید، یک پلتفرم منبع باز برای مدیریت چرخه زندگی یادگیری ماشینی سرتاسر، و یاد بگیرید که چگونه آن را با Databricks یکپارچه کنید. این دوره برای زبان آموزانی طراحی شده است که می خواهند حرفه خود را در علم داده یا مهندسی داده دنبال کنند یا پیشرفت کنند، یا برای توسعه دهندگان نرم افزار یا مهندسانی که می خواهند مجموعه مهارت های مدیریت داده خود را افزایش دهند. علاوه بر فناوریهایی که یاد خواهید گرفت، متدولوژیهایی نیز به دست خواهید آورد که به شما کمک میکنند مهارتهای مدیریت پروژه و گردش کار خود را برای مهندسی داده تقویت کنید، از جمله استفاده از روشها و بهترین روشهای Kaizen، DevOps و Data Ops. این دوره جامع با آزمون هایی برای آزمایش دانش شما در سراسر جهان، به راهنمای سفر یادگیری شما برای تبدیل شدن به یک مهندس داده ماهر، آماده برای مقابله با چالش های دنیای داده محور امروزی کمک می کند.
Related Skills
پلتفرم Hadoop و چارچوب برنامه
(Mitalearn-334982)
- 4 hours 38 minutes
- مناسب همه
- Release date: 23 June 2026
- Author: Natasha Balac, Ph.D.,Paul Rodriguez,Andrea Zonca
درباره این دوره:
این دوره برای برنامه نویسان تازه کار یا افراد تجاری است که می خواهند ابزارهای اصلی مورد استفاده برای بحث و تحلیل داده های بزرگ را درک کنند. بدون هیچ تجربه قبلی، این فرصت را خواهید داشت که نمونه های عملی را با چارچوب های Hadoop و Spark که دو مورد از رایج ترین آنها در صنعت هستند، مرور کنید. با توضیح اجزای خاص و فرآیندهای اساسی معماری Hadoop، پشته نرم افزار و محیط اجرا راحت خواهید بود. در تکالیف به شما راهنمایی میشود که چگونه دانشمندان داده مفاهیم و تکنیکهای مهمی مانند Map-Reduce را که برای حل مشکلات اساسی در دادههای بزرگ استفاده میشوند، به کار میبرند. برای گفتگو در مورد کلان داده ها و فرآیند تجزیه و تحلیل داده ها احساس قدرت خواهید کرد.
Related Skills
مقدمه ای بر داده های بزرگ
(Mitalearn-334421)
- 4 hours 29 minutes
- مناسب همه
- Release date: 23 June 2026
- Author: Ilkay Altintas,Amarnath Gupta
درباره این دوره:
علاقه مند به افزایش دانش خود از چشم انداز کلان داده هستید؟ این دوره برای کسانی است که تازه به علم داده می پردازند و علاقه مند به درک دلیل به وجود آمدن عصر داده های بزرگ هستند. این برای کسانی است که می خواهند با اصطلاحات و مفاهیم اصلی پشت مشکلات، برنامه ها و سیستم های کلان داده آشنا شوند. این برای کسانی است که می خواهند به این فکر کنند که چگونه داده های بزرگ ممکن است در تجارت یا حرفه آنها مفید باشد. مقدمهای بر یکی از رایجترین چارچوبها، Hadoop، ارائه میکند که تجزیه و تحلیل کلان دادهها را آسانتر و در دسترستر کرده است -- افزایش پتانسیل دادهها برای تغییر جهان ما! در پایان این دوره، شما قادر خواهید بود: * چشم انداز کلان داده را شامل نمونه هایی از مشکلات داده های بزرگ در دنیای واقعی از جمله سه منبع کلیدی داده های بزرگ: افراد، سازمان ها و حسگرها توصیف کنید. * V از داده های بزرگ (حجم، سرعت، تنوع، صحت، ظرفیت و ارزش) و اینکه چرا هر کدام بر جمع آوری داده ها، نظارت، ذخیره سازی، تجزیه و تحلیل و گزارش تأثیر می گذارد را توضیح دهید. * با استفاده از یک فرآیند 5 مرحله ای برای ساختار تجزیه و تحلیل خود، ارزش داده های بزرگ را بدست آورید. * مشکلات کلان داده را شناسایی کنید و چه چیزهایی را نام ببرید و بتوانید مشکلات کلان داده را به عنوان سؤالات علم داده بازنویسی کنید. * توضیحی در مورد مولفه های معماری و مدل های برنامه نویسی مورد استفاده برای تجزیه و تحلیل داده های بزرگ مقیاس پذیر ارائه دهید. * ویژگی ها و ارزش اجزای پشته Hadoop از جمله سیستم مدیریت منابع و شغل YARN، سیستم فایل HDFS و مدل برنامه نویسی MapReduce را خلاصه کنید. * یک برنامه را با استفاده از Hadoop نصب و اجرا کنید! این دوره برای کسانی است که تازه وارد علم داده می شوند. هیچ تجربه برنامه نویسی قبلی مورد نیاز نیست، اگرچه توانایی نصب برنامه ها و استفاده از ماشین مجازی برای تکمیل تکالیف عملی ضروری است. الزامات سخت افزاری: (الف) پردازنده چهار هسته ای (پشتیبانی VT-x یا AMD-V توصیه می شود)، 64 بیتی؛ (ب) 8 گیگابایت رم؛ (C) 20 گیگابایت دیسک رایگان. نحوه پیدا کردن اطلاعات سخت افزاری خود: (ویندوز): با کلیک بر روی دکمه Start، روی Computer راست کلیک کرده و سپس روی Properties کلیک کنید. (Mac): با کلیک بر روی منوی اپل و کلیک کردن روی «درباره این مک»، نمای کلی را باز کنید. اکثر رایانههای با رم 8 گیگابایتی خریداری شده در 3 سال گذشته حداقل شرایط لازم را برآورده میکنند. شما به اتصال اینترنت پرسرعت نیاز دارید زیرا فایلهایی تا حجم 4 گیگابایت را دانلود خواهید کرد. نرم افزار مورد نیاز: این دوره متکی بر چندین ابزار نرم افزار منبع باز از جمله Apache Hadoop است. تمامی نرم افزارهای مورد نیاز را می توان به صورت رایگان دانلود و نصب کرد. الزامات نرم افزار عبارتند از: Windows 7+، Mac OS X 10.10+، Ubuntu 14.04+ یا CentOS 6+ VirtualBox 5+.
Related Skills
یک تور سریع در کلان داده و هوش تجاری
(Mitalearn-350231)
- 46 minutes
- مبتدی
- Release date: 23 June 2026
- Author: Elio Masciari
درباره این دوره:
این دوره به مبتدیان و شاغلین حوزه های Big Data و AI اختصاص داده شده است. این یک مرور سریع از برخی مفاهیم اساسی است که می تواند توسط متخصصان بیشتر توضیح داده شود. از قضیه CAP تا فرض تورینگ، راهنمای شروعی برای غواصی در این موضوعات جذاب ارائه خواهیم داد.