Course catalog

Course duration

Course provider

Topic

Categories

Showing 1-4 of 4 items.

linkedin آموزش هدوپ (2020) (Mitalearn-171765)

  • 4 hours 6 minutes
  • مبتدی
  • Release date: 19 March 2020
  • Author: Lynn Langit
درباره این دوره: 

 Hadoop هنگام پردازش کلان داده ضروری است - همانطور که سرورها برای ذخیره اطلاعات شما لازم است. این دوره مقدمه ای برای Hadoop است. فایل سیستم های کلیدی مورد استفاده با Hadoop. موتور پردازش آن، MapReduce، و بسیاری از کتابخانه ها و ابزارهای برنامه نویسی آن. توسعه‌دهنده و مشاور داده‌های بزرگ Lynn Langit نحوه راه‌اندازی یک محیط توسعه Hadoop، اجرای و بهینه‌سازی مشاغل MapReduce، کد پرس‌وجوهای اساسی با Hive و Pig، و ایجاد گردش‌های کاری برای زمان‌بندی کارها را نشان می‌دهد. به‌علاوه، درباره عمق و وسعت کتابخانه‌های Apache Spark موجود برای استفاده با خوشه Hadoop و همچنین گزینه‌هایی برای اجرای کارهای یادگیری ماشین در خوشه Hadoop اطلاعات کسب کنید.

coursera پلتفرم Hadoop و چارچوب برنامه (Mitalearn-334982)

  • 4 hours 38 minutes
  • مناسب همه
  • Release date: 23 June 2026
  • Author: Natasha Balac, Ph.D.,Paul Rodriguez,Andrea Zonca
درباره این دوره:

این دوره برای برنامه نویسان تازه کار یا افراد تجاری است که می خواهند ابزارهای اصلی مورد استفاده برای بحث و تحلیل داده های بزرگ را درک کنند. بدون هیچ تجربه قبلی، این فرصت را خواهید داشت که نمونه های عملی را با چارچوب های Hadoop و Spark که دو مورد از رایج ترین آنها در صنعت هستند، مرور کنید. با توضیح اجزای خاص و فرآیندهای اساسی معماری Hadoop، پشته نرم افزار و محیط اجرا راحت خواهید بود. در تکالیف به شما راهنمایی می‌شود که چگونه دانشمندان داده مفاهیم و تکنیک‌های مهمی مانند Map-Reduce را که برای حل مشکلات اساسی در داده‌های بزرگ استفاده می‌شوند، به کار می‌برند. برای گفتگو در مورد کلان داده ها و فرآیند تجزیه و تحلیل داده ها احساس قدرت خواهید کرد.

coursera دستکاری داده ها در مقیاس: سیستم ها و الگوریتم ها [coursera] (Mitalearn-334727)

  • 10 hours 26 minutes
  • مناسب همه
  • Release date: 27 June 2026
  • Author: Bill Howe
درباره این دوره:

تجزیه و تحلیل داده ها به عنوان گلوگاه تصمیم گیری مبتنی بر شواهد جایگزین اکتساب داده شده است --- ما در حال غرق شدن در آن هستیم. استخراج دانش از مجموعه داده های بزرگ، ناهمگن و پر سر و صدا، نه تنها به منابع محاسباتی قدرتمند، بلکه به انتزاعات برنامه نویسی برای استفاده مؤثر از آنها نیاز دارد. انتزاعی‌هایی که در دهه گذشته پدیدار شدند، ایده‌هایی را از پایگاه‌های داده موازی، سیستم‌های توزیع‌شده و زبان‌های برنامه‌نویسی ترکیب می‌کنند تا کلاس جدیدی از پلت‌فرم‌های تجزیه و تحلیل داده مقیاس‌پذیر را ایجاد کنند که پایه و اساس علم داده را در مقیاس‌های واقعی تشکیل می‌دهند. در این دوره، چشم انداز سیستم های مربوطه، اصولی که آنها بر آن تکیه می کنند، معاوضه آنها و نحوه ارزیابی کاربرد آنها در برابر نیازهای خود را خواهید آموخت. شما خواهید آموخت که چگونه سیستم های عملی از مرز تحقیقات در علوم کامپیوتر استخراج شده اند و چه سیستم هایی در افق قرار دارند. رایانش ابری، پایگاه‌های داده SQL و NoSQL، MapReduce و اکوسیستمی که ایجاد کرده، Spark و هم‌عصران آن، و سیستم‌های تخصصی برای نمودارها و آرایه‌ها پوشش داده خواهد شد. شما همچنین تاریخچه و زمینه علم داده، مهارت‌ها، چالش‌ها و روش‌هایی که این اصطلاح به آن اشاره می‌کند، و نحوه ساختار یک پروژه علم داده را خواهید آموخت. در پایان این دوره، شما قادر خواهید بود: اهداف آموزشی: 1. الگوها، چالش ها و رویکردهای رایج مرتبط با پروژه های علم داده و اینکه چه چیزی آنها را از پروژه ها در زمینه های مرتبط متمایز می کند، شرح دهید. 2. مدل های برنامه نویسی مرتبط با دستکاری داده های مقیاس پذیر، از جمله جبر رابطه ای، کاهش نقشه و سایر مدل های جریان داده را شناسایی و استفاده کنید. 3. استفاده از فناوری پایگاه داده که برای تجزیه و تحلیل در مقیاس بزرگ، از جمله مفاهیم محرک پایگاه داده موازی، پردازش پرس و جو موازی، و تجزیه و تحلیل درون پایگاه داده سازگار شده است. 4. فروشگاه‌های ارزش کلیدی و سیستم‌های NoSQL را ارزیابی کنید، معاوضه‌های آنها را با سیستم‌های قابل مقایسه، جزئیات نمونه‌های مهم در فضا، و روندهای آینده را شرح دهید. 5. "Think" در MapReduce برای نوشتن موثر الگوریتم‌ها برای سیستم‌هایی از جمله Hadoop و Spark. شما محدودیت ها، جزئیات طراحی، رابطه آنها با پایگاه های داده و اکوسیستم مرتبط با الگوریتم ها، برنامه های افزودنی و زبان ها را درک خواهید کرد. نوشتن برنامه در Spark 6. چشم انداز سیستم های تخصصی داده های بزرگ را برای نمودارها، آرایه ها و جریان ها توصیف کنید.

coursera مقدمه ای بر داده های بزرگ (Mitalearn-334421)

  • 4 hours 29 minutes
  • مناسب همه
  • Release date: 23 June 2026
  • Author: Ilkay Altintas,Amarnath Gupta
درباره این دوره:

علاقه مند به افزایش دانش خود از چشم انداز کلان داده هستید؟ این دوره برای کسانی است که تازه به علم داده می پردازند و علاقه مند به درک دلیل به وجود آمدن عصر داده های بزرگ هستند. این برای کسانی است که می خواهند با اصطلاحات و مفاهیم اصلی پشت مشکلات، برنامه ها و سیستم های کلان داده آشنا شوند. این برای کسانی است که می خواهند به این فکر کنند که چگونه داده های بزرگ ممکن است در تجارت یا حرفه آنها مفید باشد. مقدمه‌ای بر یکی از رایج‌ترین چارچوب‌ها، Hadoop، ارائه می‌کند که تجزیه و تحلیل کلان داده‌ها را آسان‌تر و در دسترس‌تر کرده است -- افزایش پتانسیل داده‌ها برای تغییر جهان ما! در پایان این دوره، شما قادر خواهید بود: * چشم انداز کلان داده را شامل نمونه هایی از مشکلات داده های بزرگ در دنیای واقعی از جمله سه منبع کلیدی داده های بزرگ: افراد، سازمان ها و حسگرها توصیف کنید. * V از داده های بزرگ (حجم، سرعت، تنوع، صحت، ظرفیت و ارزش) و اینکه چرا هر کدام بر جمع آوری داده ها، نظارت، ذخیره سازی، تجزیه و تحلیل و گزارش تأثیر می گذارد را توضیح دهید. * با استفاده از یک فرآیند 5 مرحله ای برای ساختار تجزیه و تحلیل خود، ارزش داده های بزرگ را بدست آورید. * مشکلات کلان داده را شناسایی کنید و چه چیزهایی را نام ببرید و بتوانید مشکلات کلان داده را به عنوان سؤالات علم داده بازنویسی کنید. * توضیحی در مورد مولفه های معماری و مدل های برنامه نویسی مورد استفاده برای تجزیه و تحلیل داده های بزرگ مقیاس پذیر ارائه دهید. * ویژگی ها و ارزش اجزای پشته Hadoop از جمله سیستم مدیریت منابع و شغل YARN، سیستم فایل HDFS و مدل برنامه نویسی MapReduce را خلاصه کنید. * یک برنامه را با استفاده از Hadoop نصب و اجرا کنید! این دوره برای کسانی است که تازه وارد علم داده می شوند. هیچ تجربه برنامه نویسی قبلی مورد نیاز نیست، اگرچه توانایی نصب برنامه ها و استفاده از ماشین مجازی برای تکمیل تکالیف عملی ضروری است. الزامات سخت افزاری: (الف) پردازنده چهار هسته ای (پشتیبانی VT-x یا AMD-V توصیه می شود)، 64 بیتی؛ (ب) 8 گیگابایت رم؛ (C) 20 گیگابایت دیسک رایگان. نحوه پیدا کردن اطلاعات سخت افزاری خود: (ویندوز): با کلیک بر روی دکمه Start، روی Computer راست کلیک کرده و سپس روی Properties کلیک کنید. (Mac): با کلیک بر روی منوی اپل و کلیک کردن روی «درباره این مک»، نمای کلی را باز کنید. اکثر رایانه‌های با رم 8 گیگابایتی خریداری شده در 3 سال گذشته حداقل شرایط لازم را برآورده می‌کنند. شما به اتصال اینترنت پرسرعت نیاز دارید زیرا فایل‌هایی تا حجم 4 گیگابایت را دانلود خواهید کرد. نرم افزار مورد نیاز: این دوره متکی بر چندین ابزار نرم افزار منبع باز از جمله Apache Hadoop است. تمامی نرم افزارهای مورد نیاز را می توان به صورت رایگان دانلود و نصب کرد. الزامات نرم افزار عبارتند از: Windows 7+، Mac OS X 10.10+، Ubuntu 14.04+ یا CentOS 6+ VirtualBox 5+.

Suggestions