دستکاری داده ها در مقیاس: سیستم ها و الگوریتم ها [coursera]
(Mitalearn-334727)
- مدت زمان: 10 ساعت 26 دقیقه
- انتشار: 27 June 2026
- مدرس: Bill Howe
- سطح: مناسب همه
- محتواها: 133
- زیرنویس فارسی دارد
درباره این دوره:
تجزیه و تحلیل داده ها به عنوان گلوگاه تصمیم گیری مبتنی بر شواهد جایگزین اکتساب داده شده است --- ما در حال غرق شدن در آن هستیم. استخراج دانش از مجموعه داده های بزرگ، ناهمگن و پر سر و صدا، نه تنها به منابع محاسباتی قدرتمند، بلکه به انتزاعات برنامه نویسی برای استفاده مؤثر از آنها نیاز دارد. انتزاعیهایی که در دهه گذشته پدیدار شدند، ایدههایی را از پایگاههای داده موازی، سیستمهای توزیعشده و زبانهای برنامهنویسی ترکیب میکنند تا کلاس جدیدی از پلتفرمهای تجزیه و تحلیل داده مقیاسپذیر را ایجاد کنند که پایه و اساس علم داده را در مقیاسهای واقعی تشکیل میدهند. در این دوره، چشم انداز سیستم های مربوطه، اصولی که آنها بر آن تکیه می کنند، معاوضه آنها و نحوه ارزیابی کاربرد آنها در برابر نیازهای خود را خواهید آموخت. شما خواهید آموخت که چگونه سیستم های عملی از مرز تحقیقات در علوم کامپیوتر استخراج شده اند و چه سیستم هایی در افق قرار دارند. رایانش ابری، پایگاههای داده SQL و NoSQL، MapReduce و اکوسیستمی که ایجاد کرده، Spark و همعصران آن، و سیستمهای تخصصی برای نمودارها و آرایهها پوشش داده خواهد شد. شما همچنین تاریخچه و زمینه علم داده، مهارتها، چالشها و روشهایی که این اصطلاح به آن اشاره میکند، و نحوه ساختار یک پروژه علم داده را خواهید آموخت. در پایان این دوره، شما قادر خواهید بود: اهداف آموزشی: 1. الگوها، چالش ها و رویکردهای رایج مرتبط با پروژه های علم داده و اینکه چه چیزی آنها را از پروژه ها در زمینه های مرتبط متمایز می کند، شرح دهید. 2. مدل های برنامه نویسی مرتبط با دستکاری داده های مقیاس پذیر، از جمله جبر رابطه ای، کاهش نقشه و سایر مدل های جریان داده را شناسایی و استفاده کنید. 3. استفاده از فناوری پایگاه داده که برای تجزیه و تحلیل در مقیاس بزرگ، از جمله مفاهیم محرک پایگاه داده موازی، پردازش پرس و جو موازی، و تجزیه و تحلیل درون پایگاه داده سازگار شده است. 4. فروشگاههای ارزش کلیدی و سیستمهای NoSQL را ارزیابی کنید، معاوضههای آنها را با سیستمهای قابل مقایسه، جزئیات نمونههای مهم در فضا، و روندهای آینده را شرح دهید. 5. "Think" در MapReduce برای نوشتن موثر الگوریتمها برای سیستمهایی از جمله Hadoop و Spark. شما محدودیت ها، جزئیات طراحی، رابطه آنها با پایگاه های داده و اکوسیستم مرتبط با الگوریتم ها، برنامه های افزودنی و زبان ها را درک خواهید کرد. نوشتن برنامه در Spark 6. چشم انداز سیستم های تخصصی داده های بزرگ را برای نمودارها، آرایه ها و جریان ها توصیف کنید.
مهارتهای مرتبط
Content
Data Manipulation at Scale: Systems and Algorithms [coursera]