درس: یادگیری تقویتی از بازخورد انسانی (RLHF)

یادگیری تقویتی از بازخورد انسانی (RLHF) (Mitalearn-447624)

مدت زمان: 47 دقیقه
انتشار: 28 June 2026

مدرس: Mina Parham
سطح: مناسب همه
محتوا‌ها: 35
زیرنویس فارسی دارد

درباره این دوره:

در این دوره آموزشی در مورد یادگیری تقویتی از بازخورد انسانی، کارایی هوش مصنوعی تولیدی را با درک تخصص انسانی ترکیب کنید. شما یاد خواهید گرفت که چگونه مدل‌های GenAI را واقعاً منعکس‌کننده ارزش‌ها و ترجیحات انسانی کنید، در حالی که تجربه عملی با LLM کسب می‌کنید. همچنین پیچیدگی‌های مدل‌های پاداش را بررسی می‌کنید و یاد می‌گیرید که چگونه بر اساس LLMها برای تولید هوش مصنوعی که نه تنها یاد می‌گیرد بلکه با سناریوهای دنیای واقعی سازگار می‌شود، بسازید.

مهارت‌های مرتبط

Artificial Intelligence Python

محتوا
- Announcements
Content
- Reinforcement Learning from Human Feedback (RLHF)

یادگیری تقویتی از بازخورد انسانی (RLHF) (Mitalearn-447624)

مهارت‌های مرتبط

محتوا

Content