machine-learning机器学习监督学习无监督学习ML基础
机器学习基础:监督学习与无监督学习
2026-05-04
1分钟阅读
作者: CoLink Team深入理解机器学习的两大核心范式:监督学习和无监督学习,掌握算法原理与应用场景。
机器学习基础
机器学习是人工智能的核心分支,主要分为监督学习和无监督学习两大范式。
监督学习
监督学习使用标注数据进行训练,适用于分类和回归任务。
核心算法
- 线性回归 - 预测连续值
- 逻辑回归 - 二分类问题
- 决策树 - 可解释性强
- SVM - 高维数据分类
- 随机森林 - 集成学习方法
应用场景
# 监督学习示例:房价预测
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 准备数据
X_train, X_test, y_train, y_test = train_test_split(
features, prices, test_size=0.2
)
# 训练模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测
predictions = model.predict(X_test)
无监督学习
无监督学习无需标注数据,用于发现数据内在结构。
核心算法
- K-Means - 聚类分析
- PCA - 降维处理
- DBSCAN - 密度聚类
- 层次聚类 - 多层次分组
应用示例
# 无监督学习示例:客户聚类
from sklearn.cluster import KMeans
# K-Means聚类
kmeans = KMeans(n_clusters=3, random_state=42)
clusters = kmeans.fit_predict(customer_data)
# 可视化结果
plt.scatter(customer_data[:, 0], customer_data[:, 1], c=clusters)
plt.title('客户群体聚类结果')
plt.show()
总结
- 监督学习: 需要标注数据,适合预测任务
- 无监督学习: 无需标注,适合探索性分析
选择合适的机器学习方法,取决于数据特性和业务需求。
相关阅读: