datacamp مدل های چند وجهی با صورت در آغوش گرفته (Mitalearn-447539)

  • مدت زمان: 53 دقیقه
  • انتشار: 28 June 2026
  • مدرس: Sean Benson
  • سطح: مناسب همه
  • محتوا‌ها: 17
  • زیرنویس فارسی دارد
درباره این دوره:

تولید متن بسیار 2024 است! در این دوره، ما روش‌های داده را برای تولید تصاویر، صدا و حتی ویدیو ترکیب می‌کنیم! ما از مدل‌ها و مجموعه‌های داده Hugging Face برای انجام وظایف بینایی کامپیوتری مانند طبقه‌بندی تصویر، تشخیص اشیا و تقسیم‌بندی استفاده می‌کنیم. ما صدا را حذف می کنیم و موسیقی را با استفاده از مدل های متا تولید می کنیم، و از دستورات برای ویرایش تصاویر و تولید ویدیو استفاده می کنیم. امروز در این سفر مولد هوش مصنوعی به ما بپیوندید!

مهارت‌های مرتبط

  • محتوا

    • Announcements
  • Content

    • Multi-Modal Models with Hugging Face