第二部分

AI发展历史

从1950年图灵测试到2026年的大模型时代,人工智能经历了跌宕起伏的75年发展历程。 探索AI从诞生到繁荣的五大发展阶段,见证改变世界的关键技术里程碑。

五大发展阶段

AI的发展并非一帆风顺,而是经历了多次起伏与突破

1950s

AI起源

图灵测试的提出标志着人工智能概念的诞生。达特茅斯会议正式确立了AI作为独立学科的地位,奠定了符号主义AI的基础。

图灵测试 (1950)
达特茅斯会议 (1956)
感知机模型 (1958)
1960-70s

第一次浪潮

早期AI程序展现出惊人能力,ELIZA聊天机器人、专家系统原型相继问世。研究者们对AI的未来充满乐观,预言机器将在20年内超越人类。

ELIZA 聊天机器人 (1966)
Shakey 机器人 (1969)
知识表示研究兴起
1980-90s

AI寒冬

由于计算能力限制和过高期望,AI研究遭遇瓶颈。专家系统难以扩展,神经网络研究陷入低谷,资金投入大幅减少。

专家系统局限性暴露
第五代计算机项目受挫
神经网络研究停滞
1990-2010s

机器学习崛起

统计学习方法兴起,SVM、随机森林等算法广泛应用。互联网带来海量数据,数据驱动的方法开始展现优势。

深蓝击败卡斯帕罗夫 (1997)
统计学习理论发展
大数据时代来临
2012-2020

深度学习革命

AlexNet在ImageNet竞赛中的突破开启了深度学习时代。GPU计算、大数据、新算法的结合,使AI在图像、语音、NLP领域取得突破性进展。

AlexNet (2012)
AlphaGo (2016)
Transformer架构 (2017)
2020-2026

大模型时代

GPT-3、ChatGPT引爆生成式AI革命。大语言模型展现涌现能力,多模态模型实现图文音视频统一理解,AI Agent开启自主智能新纪元。

GPT-3 / ChatGPT (2020-2022)
GPT-4 / Claude / Gemini (2023)
多模态大模型 / AI Agent (2024-2026)

关键里程碑时间线

回顾改变AI历史进程的重要时刻

1950

图灵测试

艾伦·图灵发表《计算机器与智能》,提出著名的图灵测试,探讨机器是否能够思考。这篇论文被广泛认为是人工智能领域的奠基之作。

1956

达特茅斯会议

约翰·麦卡锡、马文·明斯基等科学家在达特茅斯学院召开会议,正式提出"人工智能"(Artificial Intelligence)这一术语,AI成为独立研究领域。

1958

感知机

弗兰克·罗森布拉特发明感知机(Perceptron),这是第一个能够学习的神经网络,开启了连接主义AI的研究方向。

1966

ELIZA

约瑟夫·魏泽鲍姆开发ELIZA,第一个聊天机器人程序,能够模拟心理治疗师的对话,展示了自然语言处理的早期可能性。

1997

深蓝战胜世界冠军

IBM的深蓝(Deep Blue)超级计算机击败国际象棋世界冠军加里·卡斯帕罗夫,标志着AI在特定领域首次超越人类顶尖水平。

2012

AlexNet突破

亚历克斯·克里泽夫斯基等人在ImageNet竞赛中使用深度卷积神经网络AlexNet取得压倒性胜利,误差率降低近一半,引爆深度学习革命。

2016

AlphaGo

DeepMind的AlphaGo以4:1击败围棋世界冠军李世石。围棋的复杂度远超国际象棋,这一胜利展示了深度强化学习的强大能力。

2017

Transformer架构

Google发布《Attention Is All You Need》论文,提出Transformer架构,彻底改变了自然语言处理领域,成为现代大语言模型的基础。

2022

ChatGPT发布

OpenAI发布ChatGPT,基于GPT-3.5架构的对话AI系统。其流畅的对话能力和广泛的知识覆盖引发全球AI应用热潮,标志着生成式AI时代的到来。

2023-2026

大模型时代

GPT-4、Claude、Gemini等大语言模型快速迭代,多模态能力不断增强。AI Agent、MCP协议等新技术涌现,AI正在深刻改变人类的工作和生活方式。

交互演示

动手体验AI的基石——感知机模型

感知机可视化
?
1
0
w1: 0.5
w2: 0.5
0.5
1
偏置 b: 0.0
y = f(w1×x1 + w2×x2 + b) = f(0.5×1 + 0.5×0 + 0.0) = 1
x1
x2
感知机(Perceptron)是1958年由弗兰克·罗森布拉特提出的二元线性分类器,是人工神经网络的基础。 通过调整权重和偏置,感知机可以学习简单的逻辑运算如AND、OR。尝试不同的参数组合,观察输出如何变化。

感知机的直观理解

用生活中的例子来理解这个AI最基础的算法

感知机的本质

感知机(Perceptron)是二分类模型,本质上是在寻找一个"决策边界"。

把它想象成:根据一些证据(输入),做出一个二元判断(是/否)。

核心问题:给出一堆数据,能不能找到一个规则,把它们分成两类?

工作原理

感知机的计算过程只有三步:

1. 加权求和
y = w₁x₁ + w₂x₂ + ... + wₙxₙ + b

2. 激活判断
如果 y > 0,输出 1(正类)
如果 y ≤ 0,输出 0(负类)

3. 学习调整
如果分类错误,就调整权重

生活类比:相亲决策

想象你帮朋友决定要不要相亲:

输入:学历(x₁)、收入(x₂)、长相(x₃)
权重:你觉得哪个重要?收入最重要(0.5),学历次之(0.3),长相最后(0.2)
偏置:你朋友有多挑剔?越挑剔越难达标

决策:总分 > 阈值 → 去相亲

能力与局限

能做:
• 线性可分的问题(如AND、OR逻辑)
• 简单的二元分类

不能做:
• XOR问题(异或)—— 这导致了第一次AI寒冬
• 复杂的非线性分类

解决:多层感知机(神经网络)

实际应用案例

垃圾邮件分类

输入:关键词出现频率
输出:垃圾邮件 or 正常邮件

信用风险评估

输入:收入、负债、信用记录
输出:高风险 or 低风险

疾病初筛

输入:症状指标
输出:疑似患病 or 正常

情感分析

输入:文字特征
输出:正面评价 or 负面评价

核心思想:感知机是最简单的"神经元"模型。它奠定了神经网络的基础——虽然单层感知机能力有限,但多层堆叠后形成的神经网络可以解决复杂问题,这也是现代深度学习的核心原理。