MIDOONY Logo

شرح اجمالی انواع روش های یادگیری ماشین (Supervised and Unsupervised Machine Learning)

1400/09/11
شرح اجمالی انواع روش های یادگیری ماشین (Supervised and Unsupervised Machine Learning)

یادگیری با نظارت و بی نظارت دو روش یادگیری ماشین هستند که در سناریوها و مجموعه داده های مختلف استفاده می شوند.

#یادگیری_با_نظارت ( #Supervised_Learning )

در یادگیری با نظارت، ماشین با استفاده از داده های برچسب دار آموزش می بیند. یعنی برخی از داده ها قبلاً با پاسخ صحیح برچسب گذاری شده اند. این نوع یادگیری را می توان با یادگیری نزد استاد راهنما یا معلم مقایسه کرد.

یک الگوریتم یادگیری با نظارت، با فراگیری از طریق داده های برچسب دار، کمک می کند نتایج برای سایر داده ها پیش بینی شود. ساخت موفق، تغییر مقیاس و استقرار دقیق این مدل، نیازمند زمان و مهارت تیم متخصصان داده است. بعلاوه، متخصص داده باید مدل ها را باز تولید کند تا مطمئن شود دید بدست آمده از مدل تا زمانی که داده ها تغییر نکنند، صادق است.

برای مثال فرض کنید می خواهید ماشینی را آموزش دهید تا به شما برای پیش بینی مدت زمان رانندگی از محل کار تا خانه کمک نماید. شما اینکار را با ایجاد مجموعه ای از داده های برچسب دار شروع می کنید. این داده ها عبارتند از :

  • شرایط آب و هوایی
  • ساعت روز
  • تعطیلات

این اطلاعات ورودی هستند و خروجی، مقدار زمان لازم برای بازگشت به خانه در آن روز خاص است.
شما بطور طبیعی می دانید که اگر هوا بارانی باشد، زمان رانندگی بیشتر می شود اما ماشین برای پی بردن به این موضوع به آمار و داده ها نیاز دارد.

حال ببینیم چطور می توان یک مدل یادگیری با نظارت برای این مثال ایجاد کرد تا در تعیین زمان تردد کمک کند. اولین قدم، ایجاد یک مجموعه داده آموزشی است. این مجموعه داده شامل کل زمان تردد و عوامل مرتبط مانند وضعیت آب و هوا، ساعت و غیره است. بر اساس این مجموعه داده، ماشین متوجه رابطه مستقیم بین میزان بارندگی و زمان رسیدن به خانه می گردد.

بنابراین، تشخیص می دهد هر چه باران شدیدتر باشد، مدت زمان بازگشت به خانه هم بیشترمی شود. همچنین ارتباط بین ساعت ترک محل کار و مقدار زمانی که در راه هستید را مد نظر قرار می دهد.

هر چه به ساعت 6 عصر نزدیکتر باشیم، زمان بازگشت بیشتری نیاز است. ماشین روابطی را با استفاده از داده های برچسب دار کشف می کند. مانند تاثیر باران بر نحوه رانندگی افراد و یا اینکه افرادبسیاری در یک زمان خاص از روز تردد می کنند.

در مثالی دیگر فرض کنید می خواهیم مدلی با استفاده از تصویر میوه ها، آنها را شناسایی و طبقه بندی کند. بنابراین مدل را با شکل، اندازه، رنگ و طعم هر میوه آموزش می دهیم و سپس مدل با استفاده از الگوریتم مناسب، میوه جدید را شناسایی و حدس می زند.

مزایای یادگیری با نظارت

  • یادگیری با نظارت امکان جمع آوری یا تولید داده ها با استفاده از تجربیات قبلی را فراهم می کند.
  • امکان  بهینه کردن شرایط عملکردی با استفاده از تجربیات قبلی را فراهم می کند.
  • امکان حل انواع مختلف مسائل محاسباتی دنیای واقعی را فراهم می کند.

انواع روش های یادگیری با نظارت

رگرسیون (Regression)

این روش یک مقدار خروجی با استفاده از داده های آموزشی، پیش بینی می کند. مثال: می توان از رگرسیون برای پیش بینی قیمت مسکن با استفاده از داده های آموزشی استفاده کرد. متغیرهای ورودی شامل محل، اندازه خانه و غیره خواهد بود.

طبقه بندی (Classification)

طبقه بندی به معنای گروه بندی یک کلاس است. اگر الگوریتم بخواهد ورودی را بصورت دو کلاس مجزا برچسب گذاری کند، به آن طبقه بندی دودویی می گویند.

سایر روش های یادگیری با نظارت عبارتند از :

  • Logistic Regression
  • Naive Bayes Classifiers
  • K-NN (k nearest neighbors)
  • Decision Trees
  • Support Vector Machine

#یادگیری_بی_نظارت ( #Unsupervised_Learning )

در یادگیری بی نظارت نیازی به نظارت بر مدل نیست و باید به مدل اجازه داد خودش به تنهایی برای کشف اطلاعات تلاش کند که عمدتاً با داده های بدون برچسب سروکار دارد.
الگوریتم های یادگیری بی نظارت پردازش های پیچیده تری در مقایسه با یادگیری با نظارت انجام می دهند. گرچه، در یادگیری بی نظارت نسبت به سایر روش های یادگیری عادی، #یادگیری_عمیق ( #Deep_Learning ) و #یادگیری_تقویتی ( #Reinforcement_Learning )، نتایج غیرقابل پیش بینی تر است.
برای مثال یک نوزاد و سگ خانواده را در نظر بگیرید. او این سگ را می شناسد. چند هفته بعد یکی از دوستان خانواده سگی را به همراه می آورد و سعی می کند با بچه بازی کند. بچه قبلاً این سگ را ندیده بود. اما تشخیص می دهد بسیاری از ویژگی های این موجود، از قبیل داشتن دو گوش، داشتن دو چشم و راه رفتن روی چهار پا مانند سگ خانگی خودشان است بنابراین او یک حیوان جدید شبیه سگ را شناسایی می کند. اینکار  یادگیری بی نظارت است که از قبل آموزشی داده نشده و  یادگیری با استفاده از داده‌ها انجام می شود. اگر این یادگیری از نوع با نظارت بود، دوست خانواده به کودک می‌گفت که این یک سگ است.
به عنوان مثال دیگر همان مثال میوه ها را در نظر بگیرید. ولی اینجا هیچگونه آموزشی انجام نمی شود و مدل با استفاده از الگوریتم مناسب الگوها را کشف نموده و آموزش می بیند و میوه ها را بر اساس ویژگی های مشابه تفکیک می نماید. 

مزایای یادگیری بی نظارت

  • امکان کشف انواع الگوهای ناشناخته در داده ها را فراهم می کند.
  • امکان کشف ویژگی هایی را فراهم می کند که برای دسته بندی داده ها مفید هستند.
  • دریافت داده های بدون برچسب از رایانه آسان تر از داده های برچسب دار است که نیاز به مداخله دستی دارند.

انواع روش های بی نظارت

خوشه بندی (Clustering)

هنگام صحبت از یادگیری بی نظارت، خوشه بندی مفهومی مهم می باشد که عمدتا به یافتن یک ساختار یا الگو در مجموعه ای از داده های دسته بندی نشده می پردازد. الگوریتم های خوشه بندی، داده ها را پردازش نموده و خوشه های (گروه های) موجود در داده ها را پیدا می کنند. تعداد خوشه های قابل شناسایی توسط الگوریتم ها قابل تغییر است و اینکار امکان می دهد تفکیک پذیری گروه ها را تنظیم کرد.

قواعد وابستگی (Association rules)

قواعد وابستگی امکان می دهد وابستگی هایی بین داده ها در پایگاه های داده بزرگ وضع شود. این روشی برای کشف روابط دلخواه بین متغیرها در پایگاه های داده  بزرگ می باشد. بعنوان مثال، افرادی که یک خانه جدید می خرد، به احتمال زیاد مبلمان جدید هم خریداری می کنند.

سایر روش های یادگیری بی نظارت عبارتند از :
  • Exclusive (partitioning)
  • Agglomerative
  • Overlapping
  • Probabilistic
  • Hierarchical clustering
  • K-means clustering
  • Principal Component Analysis
  • Singular Value Decomposition
  • Independent Component Analysis
مقایسه برخی ویژگی های دو روش در جدول زیر نشان داده شده است:
0 481
دیدگاه کاربران
0 دیدگاه
شما هم دیدگاه خود را ارسال کنید