supervised learning

Topics

ml paradigm

SL is about learning mapping from input X to output Y. It uses labeled training data (X, Y).

Goal: predict Y for new, unseen X accurately
Core tasks:: Classification (predict discrete category, e.g., spam/not spam), Regression (predict continuous value, e.g., price)

It contrasts unsupervised learning (no labels, finds patterns) & reinforcement learning (learns via rewards/penalties). The reliance on labeled data is SL’s defining feature. Data quality, labeling effort are critical prerequisites. Classification/regression distinction is fundamental: dictates algorithm choice and evaluation metrics.

Common algorithms: logistic regression, support vector machines (SVM), K-Nearest Neighbors (KNN algorithm), decision trees (DT), bagging (random forests - RF), boosting (adaboost - AB, gradient boosting - GB) etc.

High-level comparison of fundamental supervised algorithms:

Algorithm	Key Idea	Core Math Concept(s)
Logistic Regression	Model probability of binary outcome via sigmoid function	Sigmoid, Log Loss, gradient descent
SVM	Maximize margin between classes (Classification)	Hyperplane, Margin, Hinge Loss, Kernels, Quadratic Programming
KNN	Classify/predict based on K nearest neighbors	distance metrics (Euclidean, Manhattan), Majority Vote/Avg.
Decision Tree	Recursive partitioning of data based on feature tests	Entropy, Gini Impurity, Information Gain, Variance Reduction
Random Forest	Ensemble of DTs via bagging + feature randomness	Bagging, Decision Trees, Feature Importance, OOB Error
AdaBoost	Sequential ensemble, weights misclassified points higher	Boosting, Weak Learners, Weighted Voting, Exponential Loss
Gradient Boosting	Sequential ensemble, fits new models to residual errors (gradients)	Boosting, Weak Learners, Gradient Descent, Loss Functions

Altamash Khan

Altamash Khan

supervised learning

Backlinks

Altamash Khan

supervised learning

Related

Backlinks