datacamp پاک کردن داده ها در R (Mitalearn-401775)

  • Duration: 49 minutes
  • Release date: 28 June 2026
  • Author: Maggie Matsui
  • Level: مناسب همه
  • Contents: 21
  • Has Caption in Persian
درباره این دوره:

غلبه بر مشکلات رایج داده مانند حذف موارد تکراری در R

معمولاً گفته می شود که دانشمندان داده 80٪ از زمان خود را صرف تمیز کردن و دستکاری داده ها می کنند و فقط 20٪ از زمان خود را برای تجزیه و تحلیل آنها می گذرانند. زمان صرف شده برای تمیز کردن بسیار مهم است زیرا تجزیه و تحلیل داده های کثیف می تواند شما را به نتیجه گیری نادرست سوق دهد. در این دوره، تکنیک‌های مختلفی را یاد خواهید گرفت که به شما کمک می‌کند داده‌های کثیف را با استفاده از R تمیز کنید. با تبدیل انواع داده‌ها، اعمال محدودیت‌های محدوده، و مقابله با موارد تکراری کامل و جزئی برای جلوگیری از شمارش مضاعف شروع می‌کنید.

در چالش های داده های پیشرفته

تحقیق کنید هنگامی که کار روی مسائل رایج داده ها را تمرین کردید، به سمت چالش های پیشرفته تر مانند اطمینان از ثبات در اندازه گیری ها و مقابله با داده های از دست رفته حرکت خواهید کرد. پس از هر مفهوم جدید، شما این شانس را خواهید داشت که یک تمرین عملی برای تقویت دانش و ایجاد تجربه خود انجام دهید.

استفاده از Record Linkage در حین پاکسازی داده را بیاموزید

Record Linkage برای ادغام مجموعه داده‌ها با یکدیگر استفاده می‌شود، زمانی که مقادیر دارای مشکلاتی مانند غلط املایی یا املای متفاوت هستند. شما این تکنیک مفید را در فصل آخر بررسی خواهید کرد و با استفاده از آن برای پیوستن دو مجموعه داده بررسی رستوران به یکدیگر در یک مجموعه داده واحد، برنامه را تمرین خواهید کرد.

Related Skills

  • Content

    • Announcements
  • Content

    • Cleaning Data in R