机器学习的基本概念
1. 机器学习的基本概念
1.1 什么是机器学习?
机器学习(Machine Learning, ML)是人工智能的一个分支,它的核心思想是让计算机从数据中学习规律,而不是直接编写规则。
传统编程 vs. 机器学习
- 传统编程:程序员手写规则,输入数据,输出结果。
- 机器学习:输入数据和结果,算法自动学习规则,然后应用到新数据上。
📌 示例:垃圾邮件检测
- 传统编程:手写规则(比如含“中奖”关键词的邮件是垃圾邮件)。
- 机器学习:提供大量垃圾邮件和正常邮件,算法自动找出特征(比如垃圾邮件常含“免费”、“优惠”等词)。
2. 机器学习的分类
机器学习主要分为以下三类:
2.1 监督学习(Supervised Learning) 🎯
👉 训练数据有输入(X)和输出(Y),模型学习 X 到 Y 之间的映射关系。\ 📌 应用场景:
- 分类(Classification):判断邮件是否是垃圾邮件(输出是离散值,如 0 或 1)。
- 回归(Regression):预测房价、股票价格(输出是连续值,如 $200,000)。
📌 常见算法:
- 线性回归(Linear Regression)
- 逻辑回归(Logistic Regression)
- 决策树(Decision Tree)
- 随机森林(Random Forest)
- 支持向量机(SVM)
- 神经网络(Neural Networks)
2.2 无监督学习(Unsupervised Learning) 🔍
👉 训练数据只有输入 X,没有明确的输出 Y,模型需要自动寻找数据的模式或结构。\ 📌 应用场景:
- 聚类(Clustering):将客户分组,如银行对客户进行信用评分分组。
- 降维(Dimensionality Reduction):简化数据,比如 PCA(主成分分析)。
📌 常见算法:
- K 均值聚类(K-Means Clustering)
- 层次聚类(Hierarchical Clustering)
- 主成分分析(PCA)
2.3 强化学习(Reinforcement Learning, RL) 🕹️
👉 通过奖励和惩罚机制,让 AI 通过试错学习最佳策略。\ 📌 应用场景:
- 游戏 AI(AlphaGo 下围棋)
- 机器人控制(自动驾驶)
- 金融交易(自动交易策略)
📌 核心概念:
- Agent(智能体):决策者,比如机器人或游戏 AI。
- Environment(环境):智能体交互的世界,比如棋盘或真实世界。
- Action(动作):智能体可以执行的行为。
- Reward(奖励):智能体执行动作后获得的反馈(正面或负面)。
3. 机器学习的基本流程
1️⃣ 收集数据:从数据库、API、传感器等获取数据。\ 2️⃣ 数据预处理:清理数据,填补缺失值,标准化数据。\ 3️⃣ 特征工程:选择或创建最能代表问题的数据特征。\ 4️⃣ 选择模型:根据任务(分类、回归等)选择合适的算法。\ 5️⃣ 训练模型:使用训练数据调整模型参数。\ 6️⃣ 评估模型:用测试数据衡量模型性能,调整参数优化。\ 7️⃣ 部署与优化:将模型应用到实际场景,并不断优化。