第二部分

AI发展历史

从1950年图灵测试到2026年的大模型时代，人工智能经历了跌宕起伏的75年发展历程。探索AI从诞生到繁荣的五大发展阶段，见证改变世界的关键技术里程碑。

五大发展阶段

AI的发展并非一帆风顺，而是经历了多次起伏与突破

1950s

AI起源

图灵测试的提出标志着人工智能概念的诞生。达特茅斯会议正式确立了AI作为独立学科的地位，奠定了符号主义AI的基础。

图灵测试 (1950)

达特茅斯会议 (1956)

感知机模型 (1958)

1960-70s

第一次浪潮

早期AI程序展现出惊人能力，ELIZA聊天机器人、专家系统原型相继问世。研究者们对AI的未来充满乐观，预言机器将在20年内超越人类。

ELIZA 聊天机器人 (1966)

Shakey 机器人 (1969)

知识表示研究兴起

1980-90s

AI寒冬

由于计算能力限制和过高期望，AI研究遭遇瓶颈。专家系统难以扩展，神经网络研究陷入低谷，资金投入大幅减少。

专家系统局限性暴露

第五代计算机项目受挫

神经网络研究停滞

1990-2010s

机器学习崛起

统计学习方法兴起，SVM、随机森林等算法广泛应用。互联网带来海量数据，数据驱动的方法开始展现优势。

深蓝击败卡斯帕罗夫 (1997)

统计学习理论发展

大数据时代来临

2012-2020

深度学习革命

AlexNet在ImageNet竞赛中的突破开启了深度学习时代。GPU计算、大数据、新算法的结合，使AI在图像、语音、NLP领域取得突破性进展。

AlexNet (2012)

AlphaGo (2016)

Transformer架构 (2017)

2020-2026

大模型时代

GPT-3、ChatGPT引爆生成式AI革命。大语言模型展现涌现能力，多模态模型实现图文音视频统一理解，AI Agent开启自主智能新纪元。

GPT-3 / ChatGPT (2020-2022)

GPT-4 / Claude / Gemini (2023)

多模态大模型 / AI Agent (2024-2026)

关键里程碑时间线

回顾改变AI历史进程的重要时刻

1950

图灵测试

艾伦·图灵发表《计算机器与智能》，提出著名的图灵测试，探讨机器是否能够思考。这篇论文被广泛认为是人工智能领域的奠基之作。

1956

达特茅斯会议

约翰·麦卡锡、马文·明斯基等科学家在达特茅斯学院召开会议，正式提出"人工智能"(Artificial Intelligence)这一术语，AI成为独立研究领域。

1958

感知机

弗兰克·罗森布拉特发明感知机(Perceptron)，这是第一个能够学习的神经网络，开启了连接主义AI的研究方向。

1966

ELIZA

约瑟夫·魏泽鲍姆开发ELIZA，第一个聊天机器人程序，能够模拟心理治疗师的对话，展示了自然语言处理的早期可能性。

1997

深蓝战胜世界冠军

IBM的深蓝(Deep Blue)超级计算机击败国际象棋世界冠军加里·卡斯帕罗夫，标志着AI在特定领域首次超越人类顶尖水平。

2012

AlexNet突破

亚历克斯·克里泽夫斯基等人在ImageNet竞赛中使用深度卷积神经网络AlexNet取得压倒性胜利，误差率降低近一半，引爆深度学习革命。

2016

AlphaGo

DeepMind的AlphaGo以4:1击败围棋世界冠军李世石。围棋的复杂度远超国际象棋，这一胜利展示了深度强化学习的强大能力。

2017

Transformer架构

Google发布《Attention Is All You Need》论文，提出Transformer架构，彻底改变了自然语言处理领域，成为现代大语言模型的基础。

2022

ChatGPT发布

OpenAI发布ChatGPT，基于GPT-3.5架构的对话AI系统。其流畅的对话能力和广泛的知识覆盖引发全球AI应用热潮，标志着生成式AI时代的到来。

2023-2026

大模型时代

GPT-4、Claude、Gemini等大语言模型快速迭代，多模态能力不断增强。AI Agent、MCP协议等新技术涌现，AI正在深刻改变人类的工作和生活方式。

交互演示

动手体验AI的基石——感知机模型

感知机可视化

x1 1

x2 0

w1: 0.5

w2: 0.5

求和 0.5

输出 1

偏置 b: 0.0

y = f(w1×x1 + w2×x2 + b) = f(0.5×1 + 0.5×0 + 0.0) = 1

输入控制

权重 w1 0.5

权重 w2 0.5

偏置 b 0.0

感知机(Perceptron)是1958年由弗兰克·罗森布拉特提出的二元线性分类器，是人工神经网络的基础。通过调整权重和偏置，感知机可以学习简单的逻辑运算如AND、OR。尝试不同的参数组合，观察输出如何变化。

感知机的直观理解

用生活中的例子来理解这个AI最基础的算法

感知机的本质

感知机(Perceptron)是二分类模型，本质上是在寻找一个"决策边界"。

把它想象成：根据一些证据（输入），做出一个二元判断（是/否）。

核心问题：给出一堆数据，能不能找到一个规则，把它们分成两类？

工作原理

感知机的计算过程只有三步：

1. 加权求和
y = w₁x₁ + w₂x₂ + ... + wₙxₙ + b

2. 激活判断
如果 y > 0，输出 1（正类）
如果 y ≤ 0，输出 0（负类）

3. 学习调整
如果分类错误，就调整权重

生活类比：相亲决策

想象你帮朋友决定要不要相亲：

输入：学历(x₁)、收入(x₂)、长相(x₃)
权重：你觉得哪个重要？收入最重要(0.5)，学历次之(0.3)，长相最后(0.2)
偏置：你朋友有多挑剔？越挑剔越难达标

决策：总分 > 阈值 → 去相亲

能力与局限

能做：
• 线性可分的问题（如AND、OR逻辑）
• 简单的二元分类

不能做：
• XOR问题（异或）—— 这导致了第一次AI寒冬
• 复杂的非线性分类

解决：多层感知机（神经网络）

实际应用案例

垃圾邮件分类

输入：关键词出现频率
输出：垃圾邮件 or 正常邮件

信用风险评估

输入：收入、负债、信用记录
输出：高风险 or 低风险

疾病初筛

输入：症状指标
输出：疑似患病 or 正常

情感分析

输入：文字特征
输出：正面评价 or 负面评价

核心思想：感知机是最简单的"神经元"模型。它奠定了神经网络的基础——虽然单层感知机能力有限，但多层堆叠后形成的神经网络可以解决复杂问题，这也是现代深度学习的核心原理。

上一章什么是AI

下一章 AI工作原理