یادگیری تقویتی از بازخورد انسانی (RLHF)
(Mitalearn-447624)
- مدت زمان: 47 دقیقه
- انتشار: 28 June 2026
- مدرس: Mina Parham
- سطح: مناسب همه
- محتواها: 35
- زیرنویس فارسی دارد
درباره این دوره:
در این دوره آموزشی در مورد یادگیری تقویتی از بازخورد انسانی، کارایی هوش مصنوعی تولیدی را با درک تخصص انسانی ترکیب کنید. شما یاد خواهید گرفت که چگونه مدلهای GenAI را واقعاً منعکسکننده ارزشها و ترجیحات انسانی کنید، در حالی که تجربه عملی با LLM کسب میکنید. همچنین پیچیدگیهای مدلهای پاداش را بررسی میکنید و یاد میگیرید که چگونه بر اساس LLMها برای تولید هوش مصنوعی که نه تنها یاد میگیرد بلکه با سناریوهای دنیای واقعی سازگار میشود، بسازید.
مهارتهای مرتبط
محتوا
Announcements
Content
Reinforcement Learning from Human Feedback (RLHF)
