درس: دستکاری داده ها در مقیاس: سیستم ها و الگوریتم ها [coursera]

دستکاری داده ها در مقیاس: سیستم ها و الگوریتم ها [coursera] (Mitalearn-334727)

مدت زمان: 10 ساعت 26 دقیقه
انتشار: 27 June 2026

مدرس: Bill Howe
سطح: مناسب همه
محتوا‌ها: 133
زیرنویس فارسی دارد

درباره این دوره:

تجزیه و تحلیل داده ها به عنوان گلوگاه تصمیم گیری مبتنی بر شواهد جایگزین اکتساب داده شده است --- ما در حال غرق شدن در آن هستیم. استخراج دانش از مجموعه داده های بزرگ، ناهمگن و پر سر و صدا، نه تنها به منابع محاسباتی قدرتمند، بلکه به انتزاعات برنامه نویسی برای استفاده مؤثر از آنها نیاز دارد. انتزاعی‌هایی که در دهه گذشته پدیدار شدند، ایده‌هایی را از پایگاه‌های داده موازی، سیستم‌های توزیع‌شده و زبان‌های برنامه‌نویسی ترکیب می‌کنند تا کلاس جدیدی از پلت‌فرم‌های تجزیه و تحلیل داده مقیاس‌پذیر را ایجاد کنند که پایه و اساس علم داده را در مقیاس‌های واقعی تشکیل می‌دهند. در این دوره، چشم انداز سیستم های مربوطه، اصولی که آنها بر آن تکیه می کنند، معاوضه آنها و نحوه ارزیابی کاربرد آنها در برابر نیازهای خود را خواهید آموخت. شما خواهید آموخت که چگونه سیستم های عملی از مرز تحقیقات در علوم کامپیوتر استخراج شده اند و چه سیستم هایی در افق قرار دارند. رایانش ابری، پایگاه‌های داده SQL و NoSQL، MapReduce و اکوسیستمی که ایجاد کرده، Spark و هم‌عصران آن، و سیستم‌های تخصصی برای نمودارها و آرایه‌ها پوشش داده خواهد شد. شما همچنین تاریخچه و زمینه علم داده، مهارت‌ها، چالش‌ها و روش‌هایی که این اصطلاح به آن اشاره می‌کند، و نحوه ساختار یک پروژه علم داده را خواهید آموخت. در پایان این دوره، شما قادر خواهید بود: اهداف آموزشی: 1. الگوها، چالش ها و رویکردهای رایج مرتبط با پروژه های علم داده و اینکه چه چیزی آنها را از پروژه ها در زمینه های مرتبط متمایز می کند، شرح دهید. 2. مدل های برنامه نویسی مرتبط با دستکاری داده های مقیاس پذیر، از جمله جبر رابطه ای، کاهش نقشه و سایر مدل های جریان داده را شناسایی و استفاده کنید. 3. استفاده از فناوری پایگاه داده که برای تجزیه و تحلیل در مقیاس بزرگ، از جمله مفاهیم محرک پایگاه داده موازی، پردازش پرس و جو موازی، و تجزیه و تحلیل درون پایگاه داده سازگار شده است. 4. فروشگاه‌های ارزش کلیدی و سیستم‌های NoSQL را ارزیابی کنید، معاوضه‌های آنها را با سیستم‌های قابل مقایسه، جزئیات نمونه‌های مهم در فضا، و روندهای آینده را شرح دهید. 5. "Think" در MapReduce برای نوشتن موثر الگوریتم‌ها برای سیستم‌هایی از جمله Hadoop و Spark. شما محدودیت ها، جزئیات طراحی، رابطه آنها با پایگاه های داده و اکوسیستم مرتبط با الگوریتم ها، برنامه های افزودنی و زبان ها را درک خواهید کرد. نوشتن برنامه در Spark 6. چشم انداز سیستم های تخصصی داده های بزرگ را برای نمودارها، آرایه ها و جریان ها توصیف کنید.