Course catalog

Course duration

Course provider

Topic

Categories

Showing 1-12 of 12 items.

coursera پیش بینی و کنترل با تقریب تابع (Mitalearn-330222)

  • 3 hours 48 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Martha White,Adam White
درباره این دوره:

در این دوره یاد خواهید گرفت که چگونه مسائل را با فضاهای بزرگ، با ابعاد بالا و بالقوه بی نهایت حل کنید. خواهید دید که تخمین توابع ارزش را می توان به عنوان یک مشکل یادگیری تحت نظارت --- تقریب عملکرد --- به شما امکان می دهد تا نمایندگانی را بسازید که با دقت تعادل و تبعیض را به منظور حداکثر رساندن پاداش تعادل برقرار کنید. ما این سفر را با بررسی اینکه چگونه روش‌های ارزیابی خط‌مشی یا پیش‌بینی ما مانند مونت کارلو و TD را می‌توان به تنظیمات تقریب تابع گسترش داد، آغاز خواهیم کرد. شما در مورد تکنیک های ساخت ویژگی برای RL و یادگیری نمایش از طریق شبکه های عصبی و backprop یاد خواهید گرفت. ما این دوره را با یک فرو رفتن عمیق در روش‌های گرادیان سیاست به پایان می‌رسانیم. راهی برای یادگیری مستقیم سیاست ها بدون یادگیری تابع ارزش. در این دوره شما دو وظیفه کنترل حالت پیوسته را حل می کنید و مزایای روش های گرادیان خط مشی را در یک محیط کنش پیوسته بررسی می کنید. پیش نیازها: این دوره به شدت مبتنی بر مبانی دوره های 1 و 2 است و فراگیران باید قبل از شروع این دوره این موارد را تکمیل کرده باشند. همچنین زبان آموزان باید با احتمالات و انتظارات، جبر خطی پایه، حساب دیفرانسیل و انتگرال، پایتون 3.0 (حداقل 1 سال) و پیاده سازی الگوریتم ها از کد شبه راحت باشند. در پایان این دوره، شما قادر خواهید بود: - درک نحوه استفاده از رویکردهای یادگیری نظارت شده برای تقریبی توابع ارزش درک اهداف برای پیش بینی (تخمین ارزش) تحت تقریب تابع -اجرای TD با تقریب تابع (تجمع حالت)، در محیطی با فضای حالت نامحدود (فضای حالت پیوسته) - درک رویکردهای مبتنی بر شبکه های عصبی ثابت و شبکه های عصبی برای ساخت ویژگی پیاده سازی TD با تقریب تابع شبکه عصبی در یک محیط حالت پیوسته -در هنگام حرکت به سمت تقریب تابع، مشکلات جدید در اکتشاف را درک کنید -تضاد فرمول‌های مشکل با تخفیف برای کنترل در مقابل فرمول‌بندی مشکل پاداش متوسط -پیاده سازی Sarsa و Q-Learning مورد انتظار با تقریب تابع در یک کار کنترل حالت مستمر - درک اهداف برای برآورد مستقیم خط مشی ها (اهداف شیب سیاست) - یک روش گرادیان خط مشی (به نام Actor-Critic) روی یک محیط حالت گسسته پیاده سازی کنید

coursera تصمیم گیری و یادگیری تقویتی (Mitalearn-308734)

  • 5 hours 4 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Tony Dear
درباره این دوره:

این دوره مقدمه ای بر تصمیم گیری متوالی و یادگیری تقویتی است. ما با بحث در مورد نظریه مطلوبیت شروع می کنیم تا یاد بگیریم که چگونه ترجیحات را می توان برای تصمیم گیری نشان داد و مدل سازی کرد. ما ابتدا مسائل تصمیم گیری ساده را به عنوان مشکلات راهزن چند مسلح مدل می کنیم و چندین رویکرد را برای ارزیابی بازخورد مورد بحث قرار می دهیم. سپس مسائل تصمیم‌گیری را به‌عنوان فرآیندهای تصمیم‌گیری مارکوف محدود (MDP) مدل‌سازی می‌کنیم و راه‌حل‌های آن‌ها را از طریق الگوریتم‌های برنامه‌نویسی پویا مورد بحث قرار می‌دهیم. ما مفهوم مشاهده پذیری جزئی در مسائل واقعی را که توسط POMDP مدل شده و سپس با روش های برنامه ریزی آنلاین حل شده است، لمس می کنیم. در نهایت، مسئله یادگیری تقویتی را معرفی می کنیم و دو پارادایم را مورد بحث قرار می دهیم: روش های مونت کارلو و یادگیری تفاوت زمانی. ما دوره را با یادآوری اینکه چگونه این دو پارادایم بر روی طیفی از روش‌های تفاوت زمانی n مرحله‌ای قرار دارند، به پایان می‌رسانیم. تاکید بر الگوریتم ها و مثال ها بخش کلیدی این دوره خواهد بود.

coursera روش های یادگیری مبتنی بر نمونه (Mitalearn-330205)

  • 3 hours 1 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Martha White,Adam White
درباره این دوره:

در این دوره، با چندین الگوریتم آشنا خواهید شد که می توانند سیاست های نزدیک به بهینه را بر اساس تعامل آزمون و خطا با محیط بیاموزند --- یادگیری از تجربه خود عامل. یادگیری از تجربه واقعی قابل توجه است زیرا نیازی به دانش قبلی در مورد پویایی محیط ندارد، اما هنوز می تواند به رفتار مطلوب دست یابد. ما روش های مونت کارلو ساده اما قدرتمند و روش های یادگیری تفاوت زمانی از جمله یادگیری Q را پوشش خواهیم داد. ما این دوره را با بررسی اینکه چگونه می‌توانیم بهترین‌ها را از هر دو دنیا بدست آوریم، به پایان می‌رسانیم: الگوریتم‌هایی که می‌توانند برنامه‌ریزی مبتنی بر مدل (مشابه برنامه‌نویسی پویا) و به‌روزرسانی‌های تفاوت زمانی را برای تسریع اساسی یادگیری ترکیب کنند. در پایان این دوره شما قادر خواهید بود: - یادگیری تفاوت زمانی و مونت کارلو را به عنوان دو استراتژی برای تخمین توابع ارزش از تجربه نمونه برداری شده درک کنید. - درک اهمیت اکتشاف، هنگام استفاده از تجربه نمونه برداری شده به جای برنامه نویسی پویا در یک مدل - ارتباط بین Monte Carlo و Dynamic Programming و TD را درک کنید. - پیاده سازی و اعمال الگوریتم TD، برای تخمین توابع مقدار - پیاده سازی و اعمال Expected Sarsa و Q-Learning (دو روش TD برای کنترل) - تفاوت بین کنترل در سیاست و خارج از سیاست را درک کنید - درک برنامه ریزی با تجربه شبیه سازی شده (بر خلاف استراتژی های برنامه ریزی کلاسیک) - یک رویکرد مبتنی بر مدل برای RL به نام Dyna پیاده سازی کنید که از تجربه شبیه سازی شده استفاده می کند - یک مطالعه تجربی برای مشاهده بهبود کارایی نمونه در هنگام استفاده از Dyna انجام دهید

coursera طراحی هوش مصنوعی مستقل (Mitalearn-329593)

  • 3 hours 5 minutes
  • مبتدی
  • Release date: 23 June 2026
  • Author: Kence Anderson
درباره این دوره:

(این برنامه قبلاً بخشی از یک تخصص سه دوره ای به نام هوش مصنوعی مستقل برای صنعت بود. به دلیل توقف برنامه نرم افزاری Bonsai، ارجاعات به Bonsai حذف شده است. شما همچنان می توانید از طریق دو دوره جداگانه ما "طراحی" در مورد هوش مصنوعی مستقل و آموزش ماشینی بیاموزید. هوش مصنوعی مستقل» و «آموزش ماشین برای هوش مصنوعی خودمختار».) برای طراحی یک سیستم هوش مصنوعی مستقل، باید نحوه تقطیر یک چالش تجاری را در اجزای سازنده آن بیابید. وقتی بچه‌ها یاد می‌گیرند چطور بیس‌بال بزنند، با توپ‌های سریع شروع نمی‌کنند. مربیان آنها با اصول اولیه شروع می کنند: چگونه دسته خفاش را بگیرند، پاهای خود را کجا بگذارند و چگونه چشم خود را روی توپ نگه دارند. به طور مشابه، یک سیستم هوش مصنوعی مستقل به یک متخصص موضوعی (SME) نیاز دارد تا یک فرآیند پیچیده یا مشکل را به وظایف آسان‌تر تقسیم کند که سرنخ‌های مهمی در مورد چگونگی یافتن سریع‌تر راه‌حل به هوش مصنوعی بدهد. در این دوره، نحوه ایجاد یک طرح طراحی خودکار هوش مصنوعی را یاد خواهید گرفت. با تعیین اهداف، شناسایی مهارت‌های قابل آموزش، و به‌کارگیری آن مهارت‌ها در استراتژی‌های هدف‌گرا، دانش SME خود را مستقیماً در «مغز» هوش مصنوعی خود، عاملی که سیستم مستقل شما را نیرو می‌دهد، ترکیب می‌کنید. شما یاد خواهید گرفت که چه زمانی و چگونه الگوهای طراحی معماری هوش مصنوعی مختلف را با هم ترکیب کنید، همچنین یاد خواهید گرفت که چگونه یک هوش مصنوعی پیشرفته را در سطح معماری بدون نگرانی در مورد اجرای شبکه های عصبی یا الگوریتم های یادگیری ماشین طراحی کنید. در پایان این دوره، شما قادر خواهید بود: • مصاحبه با SMEها برای استخراج دانش منحصر به فرد آنها در مورد یک سیستم یا فرآیند • ترکیب یادگیری تقویتی با قوانین خبره، بهینه سازی و محاسبات ریاضی در مغز هوش مصنوعی • طراحی یک مغز هوش مصنوعی مستقل از اجزای مدولار برای هدایت فرآیند یادگیری برای یک کار خاص • طراحی مغز خود را در برابر تخصص و تکنیک های موجود برای حل مشکلات اعتبار سنجی کنید • یک سند مشخصات دقیق تهیه کنید تا شخص دیگری بتواند مغز هوش مصنوعی شما را بسازد

linkedin مبانی یادگیری تقویتی (Mitalearn-198421)

  • 44 minutes
  • متوسط
  • Update date: 21 June 2026
  • Author: Khaulat Abdulhakeem
درباره این دوره:

نوآوری‌ها در امور مالی، بهداشت، رباتیک و بخش‌های مختلف دیگر با یادگیری تقویتی (RL) امکان‌پذیر شده‌اند که شامل آموزش ماشین‌ها برای یادگیری از محیطشان می‌شود. بسیاری از شرکت های برتر فناوری سرمایه گذاری زیادی در این زمینه انجام می دهند. در این دوره، مربی خلعت عبدالحکیم به شما کمک می کند تا اصول اولیه این مهارت نسبتا جدید، اما ارزشمند را بیاموزید. با اصطلاحات کلیدی مورد استفاده در RL، نحوه ایفای نقش اصلی RL در پیشرفت هوش مصنوعی و انواع مشکلاتی که می توانید از RL برای حل آنها استفاده کنید، آشنا شوید. Khaulat به شما نشان می دهد که چگونه مشکلات یادگیری تقویتی را تعریف و نشان دهید. او همچنین به الگوریتم‌های RL، از جمله مونت کارلو و روش‌های تفاوت زمانی می‌پردازد. به علاوه، او به بررسی RL عمیق و چند عاملی می‌پردازد، همچنین نحوه عملکرد یادگیری معکوس و چگونگی کمک به عوامل یادگیری با تقلید را بررسی می‌کند.

coursera مبانی یادگیری تقویتی (Mitalearn-330052)

  • 3 hours 51 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Martha White,Adam White
درباره این دوره:

یادگیری تقویتی زیرشاخه یادگیری ماشینی است، اما یک فرمالیسم با هدف کلی برای تصمیم گیری خودکار و هوش مصنوعی نیز هست. این دوره شما را با تکنیک های یادگیری آماری آشنا می کند که در آن یک عامل به صراحت اقداماتی انجام می دهد و با جهان تعامل دارد. درک اهمیت و چالش های عوامل یادگیری که تصمیم گیری می کنند امروزه از اهمیت حیاتی برخوردار است، زیرا شرکت های بیشتری به عوامل تعاملی و تصمیم گیری هوشمند علاقه مند هستند. این دوره شما را با اصول یادگیری تقویتی آشنا می کند. وقتی این دوره را تمام کردید، خواهید داشت: - رسمی کردن مشکلات به عنوان فرآیندهای تصمیم مارکوف - روش های اولیه اکتشاف و معاوضه اکتشاف / بهره برداری را بدانید - درک توابع ارزش، به عنوان یک ابزار همه منظوره برای تصمیم گیری بهینه - بدانید که چگونه برنامه نویسی پویا را به عنوان یک رویکرد راه حل کارآمد برای یک مشکل کنترل صنعتی پیاده سازی کنید این دوره مفاهیم کلیدی یادگیری تقویتی، زیربنای الگوریتم های کلاسیک و مدرن در RL را به شما آموزش می دهد. پس از اتمام این دوره، می توانید از RL برای مشکلات واقعی استفاده کنید، جایی که MDP را دارید یا می توانید مشخص کنید. این اولین دوره تخصصی آموزش تقویتی است.

coursera مقدمه ای بر یادگیری ماشینی (Mitalearn-332313)

  • 10 hours 24 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Lawrence Carin ,David Carlson,Timothy Dunn
درباره این دوره:

این دوره یک درک اساسی از مدل های یادگیری ماشین (رگرسیون لجستیک، پرسپترون های چندلایه، شبکه های عصبی کانولوشن، پردازش زبان طبیعی و غیره) ارائه می دهد و نشان می دهد که چگونه می توانند مشکلات پیچیده در صنایع مختلف، از تشخیص پزشکی گرفته تا تشخیص تصویر تا پیش بینی متن را حل کنند. از طریق تمرین‌های عملی، این مدل‌های علم داده را بر روی مجموعه داده‌ها پیاده‌سازی خواهید کرد و در الگوریتم‌های یادگیری ماشین با PyTorch که توسط شرکت‌های فناوری پیشرو مانند Google و NVIDIA استفاده می‌شود، مهارت کسب خواهید کرد.

coursera مقدمه یادگیری ماشین برای همه (Mitalearn-328301)

  • 1 hours 23 minutes
  • مبتدی
  • Release date: 23 June 2026
  • Author: Aije Egwaikhide,Yasmine Hemmati
درباره این دوره:

این دوره سه ماژول، یادگیری ماشین و علم داده را برای همه کسانی که درک اساسی از مدل‌های یادگیری ماشین دارند، معرفی می‌کند. شما در مورد تاریخچه یادگیری ماشینی، کاربردهای یادگیری ماشینی، چرخه عمر مدل یادگیری ماشینی و ابزارهایی برای یادگیری ماشینی خواهید آموخت. همچنین درباره یادگیری تحت نظارت در مقابل بدون نظارت، طبقه بندی، رگرسیون، ارزیابی مدل های یادگیری ماشین و موارد دیگر خواهید آموخت. آزمایشگاه‌های ما تجربه عملی با این مفاهیم یادگیری ماشینی و علم داده را به شما می‌دهند. شما مهارت های یادگیری ماشینی مشخص را توسعه خواهید داد و همچنین یک پروژه نهایی ایجاد خواهید کرد که مهارت شما را نشان می دهد. پس از تکمیل این برنامه، می‌توانید پتانسیل الگوریتم‌های یادگیری ماشین و هوش مصنوعی را در سناریوهای مختلف کسب‌وکار درک کنید. شما می توانید تشخیص دهید که چه زمانی از یادگیری ماشینی برای توضیح برخی رفتارها استفاده کنید و چه زمانی از آن برای پیش بینی نتایج آینده استفاده کنید. همچنین یاد خواهید گرفت که چگونه مدل‌های یادگیری ماشینی خود را ارزیابی کنید و بهترین روش‌ها را به کار ببرید. این دوره بخشی از برنامه های متعدد است همچنین می‌توانید از یادگیری این برنامه برای تکمیل دو دوره باقی‌مانده از گواهینامه حرفه‌ای یادگیری ماشینی IBM استفاده کنید و شغل جدیدی را در زمینه یادگیری ماشین ایجاد کنید.

coursera یادگیری بدون نظارت، توصیه‌کنندگان، یادگیری تقویتی (Mitalearn-327859)

  • 7 hours 14 minutes
  • مبتدی
  • Release date: 23 June 2026
  • Author: Andrew Ng,Aarti Bagul,Geoff Ladwig
درباره این دوره:

در دوره سوم تخصص یادگیری ماشین، شما: • از تکنیک های یادگیری بدون نظارت برای یادگیری بدون نظارت استفاده کنید: از جمله خوشه بندی و تشخیص ناهنجاری. • ساخت سیستم های توصیه گر با رویکرد فیلتر مشترک و روش یادگیری عمیق مبتنی بر محتوا. • یک مدل یادگیری تقویتی عمیق بسازید. The Machine Learning Specialization یک برنامه آنلاین اساسی است که با همکاری DeepLearning.AI و Stanford Online ایجاد شده است. در این برنامه مبتدی دوستانه، اصول یادگیری ماشینی و نحوه استفاده از این تکنیک ها برای ساخت اپلیکیشن های هوش مصنوعی در دنیای واقعی را خواهید آموخت. این تخصص توسط اندرو انگ، یک آینده‌نگر هوش مصنوعی که تحقیقات انتقادی را در دانشگاه استنفورد و کارهای پیشگامانه در Google Brain، Baidu و Landing.AI برای پیشرفت در زمینه هوش مصنوعی رهبری کرده است، آموزش داده می‌شود. این تخصص 3 دوره ای، نسخه به روز شده و توسعه یافته دوره پیشگام یادگیری ماشین اندرو است که از زمان راه اندازی آن در سال 2012، دارای امتیاز 4.9 از 5 است و بیش از 4.8 میلیون زبان آموز آن را دریافت کرده اند. این مقدمه گسترده ای برای یادگیری ماشین مدرن، از جمله یادگیری نظارت شده (رگرسیون خطی چندگانه، رگرسیون لجستیک، شبکه های عصبی و درختان تصمیم)، یادگیری بدون نظارت (خوشه بندی، کاهش ابعاد، سیستم های توصیه گر) و برخی از بهترین شیوه های مورد استفاده در سیلیکون ارائه می کند. Valley برای نوآوری های هوش مصنوعی و یادگیری ماشین (ارزیابی و تنظیم مدل ها، اتخاذ رویکرد داده محور برای بهبود عملکرد، و موارد دیگر). در پایان این تخصص، شما بر مفاهیم کلیدی تسلط خواهید داشت و دانش عملی برای به کارگیری سریع و قدرتمند یادگیری ماشینی در مسائل چالش برانگیز دنیای واقعی را به دست خواهید آورد. اگر به دنبال ورود به هوش مصنوعی یا ایجاد حرفه ای در یادگیری ماشین هستید، تخصص جدید یادگیری ماشین بهترین مکان برای شروع است.

coursera یادگیری عمیق با Keras و Tensorflow (Mitalearn-330188)

  • 2 hours 13 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Samaya Madhavan,Ricky Shi,Alex Aklson
درباره این دوره:

یادگیری عمیق در بسیاری از زمینه ها از جمله بینایی کامپیوتر، پردازش زبان طبیعی و روباتیک انقلابی ایجاد کرده است. علاوه بر این، Keras، یک API شبکه های عصبی سطح بالا که به زبان پایتون نوشته شده است، به بخشی ضروری از TensorFlow تبدیل شده است و یادگیری عمیق را در دسترس و ساده می کند. تسلط بر این تکنیک ها فرصت های زیادی را در تحقیقات و صنعت باز خواهد کرد. شما یاد خواهید گرفت که لایه ها و مدل های سفارشی را در Keras ایجاد کنید و Keras را با TensorFlow 2.x برای عملکرد بهبودیافته ادغام کنید. شما شبکه های عصبی کانولوشنال پیشرفته (CNN) را با استفاده از Keras توسعه خواهید داد. همچنین با استفاده از TensorFlow با Keras، مدل‌های ترانسفورماتور را برای داده‌های متوالی و سری‌های زمانی خواهید ساخت. این دوره همچنین اصول یادگیری بدون نظارت در Keras و TensorFlow را برای بهینه سازی مدل و حلقه های آموزشی سفارشی پوشش می دهد. در نهایت، شبکه‌های Q عمیق (DQN) را با Keras برای وظایف یادگیری تقویتی توسعه داده و آموزش خواهید داد (مروری از مدل‌سازی تولیدی و یادگیری تقویتی ارائه شده است). شما می توانید مفاهیم آموخته شده را با استفاده از آزمایشگاه های عملی در هر درس تمرین کنید. یک پروژه نهایی نهایی در آخرین ماژول به شما فرصتی می دهد تا دانش خود را برای ایجاد یک مدل طبقه بندی با استفاده از یادگیری انتقالی به کار ببرید. این دوره برای همه مهندسین مشتاق هوش مصنوعی که می خواهند TensorFlow و Keras را یاد بگیرند مناسب است. این نیاز به دانش کاربردی برنامه نویسی پایتون و مفاهیم پایه ریاضی مانند گرادیان و ماتریس، و همچنین اصول یادگیری عمیق با استفاده از Keras دارد.

linkedin یادگیری ماشین در ارتباط از راه دور: از اصول اولیه گرفته تا موارد دنیای واقعی (Mitalearn-427683)

  • 2 hours 11 minutes
  • مناسب همه
  • Release date: 22 July 2025
  • Author: Itelcotech
درباره این دوره: 

 این دوره در سطح متوسط، کاوش متمرکزی را در مورد چگونگی تغییر شبکه‌های مخابراتی مدرن توسط یادگیری ماشین (ML) ارائه می‌کند. این دوره برای دانش‌آموزان و متخصصان با دانش پایه از مخابرات یا هوش مصنوعی طراحی شده است که می‌خواهند درک خود را از برنامه‌های ML در بهینه‌سازی شبکه، تجزیه و تحلیل پیش‌بینی‌کننده و اتوماسیون هوشمند عمیق‌تر کنند، این دوره چندین پارادایم یادگیری ماشین کلیدی را پوشش می‌دهد: تحت نظارت، بدون نظارت و یادگیری تقویتی. از طریق مطالعات موردی در دنیای واقعی، مفاهیم کلیدی ML مانند رگرسیون، طبقه‌بندی، خوشه‌بندی، آزمایش فرضیه، توابع هزینه، نزول گرادیان و ارزیابی مدل را بررسی کنید. بیاموزید که چگونه مدل‌ها معیارهای مخابراتی مانند قدرت سیگنال، بار شبکه، و تقاضای پهنای باند را پیش‌بینی می‌کنند و چگونه تکنیک‌های طبقه‌بندی به شناسایی خطاها و ناهنجاری‌ها کمک می‌کنند. در پایان این دوره، شما به مهارت هایی که برای استفاده از ML برای تقویت شبکه های مخابراتی هوشمندتر و سازگارتر نیاز دارید، مجهز خواهید شد.

coursera یک سیستم آموزشی کامل تقویتی (Capstone) (Mitalearn-330443)

  • 2 hours 35 minutes
  • متوسط
  • Release date: 23 June 2026
  • Author: Martha White,Adam White
درباره این دوره:

در این دوره نهایی، دانش خود را از دوره های 1، 2 و 3 برای پیاده سازی یک راه حل کامل RL برای یک مشکل گرد هم می آورید. این سنگ بنا به شما اجازه می دهد تا ببینید که چگونه هر جزء --- فرمول بندی مسئله، انتخاب الگوریتم، انتخاب پارامتر و طراحی نمایش --- در یک راه حل کامل با هم تطبیق می یابد و چگونه می توانید انتخاب های مناسب را هنگام استقرار RL در دنیای واقعی انجام دهید. این پروژه از شما می خواهد که هم محیط را برای تحریک مشکل خود پیاده سازی کنید و هم یک عامل کنترل با تقریب تابع شبکه عصبی. علاوه بر این، شما یک مطالعه علمی در مورد سیستم یادگیری خود انجام خواهید داد تا توانایی خود را برای ارزیابی استحکام عوامل RL توسعه دهید. برای استفاده از RL در دنیای واقعی، ضروری است که (الف) مسئله را به‌عنوان یک MDP به‌طور مناسب رسمی‌سازی کنید، (ب) الگوریتم‌های مناسب را انتخاب کنید، (ج) شناسایی کنید که چه انتخاب‌هایی در پیاده‌سازی شما تأثیرات زیادی بر عملکرد خواهند داشت و (د) اعتبارسنجی رفتار مورد انتظار الگوریتم های شما این سنگ بنا برای هر کسی که قصد دارد از RL برای حل مشکلات واقعی استفاده کند ارزشمند است. برای موفقیت در این دوره، باید دوره های 1، 2 و 3 این تخصص یا معادل آن را گذرانده باشید. در پایان این دوره، شما قادر خواهید بود: تکمیل یک راه حل RL برای یک مسئله، شروع از فرمول بندی مسئله، انتخاب الگوریتم مناسب و پیاده سازی و مطالعه تجربی تا اثربخشی راه حل.

Suggestions