人工智能文章系列

概述

本章在研究人类社会科技革命演进的基础上,介绍人工智能的形成、定义、特征等;同时梳理人工智能发展简史,列举不同时期的重要里程碑事件,分析其技术和产业发展趋势,说明人工智能对社会发展的影响,并帮助学生了解就业方向。

参考资料

  • 本系列文章的内容主要参考了王万良教授的人工智能导论与吴飞的人工智能导论模型与算法
image-20240716202907608 image-20240716202940694
  • 其他的参考引用内容,如图片与插画等等绝大多数都来源与知乎,csdn与博客园等博客网站,如有侵权,联系侵删

人类社会4次科技革命

image-20240716203331402

信息革命的4次浪潮

image-20240716203547777

注:时间层面,中国延后10年左右。

生产要素演进变迁

农耕社会 机械革命 电力革命 信息革命 智能革命
生产力 人力 ,水力 ,火等 蒸汽机 、机械工具 、精密机床 强电:电力应用、 弱电:电子应用 、无线电:电场与 磁场 、机电一体化 计算机、互联网 、手机、 物联网 人工智能 、机器人技术、 虚拟现实、 量子技术、 可控核聚变 、清洁能源、 生物技术
生产要素 土地、劳动力 生产资料、资本、劳动力 生产资料、资本、劳动力 资本、工程师、信息 资本、信息、数据、算法模型
生产形态 小农经济 工厂生产 自动化 线上化 智能化

人工智能 - 重要性

自然界四大奥秘

  • 物质的本质(夸克)
  • 宇宙的起源(有限无边模型)
  • 生命的本质(无机、有机)
  • 智能的发生(人的思维机制)

20世纪三大科学技术成就(生产力决定生产关系)

  • 空间技术(人造卫星、导弹等)

    image-20240716204448112

  • 原子能技术(核裂变原子弹)

    image-20240716204454059

  • 人工智能技术(机器学习、神经网络等)

    image-20240716204502843

人工智能 - 定义

  • 人工智能:用人工的方法在机器(计算机)上实现的智能;或者说是人们使机器具有类似于人的智能。或,智能主体可以理解数据及从中学习,并利用知识实现特定目标和任务的能力。
  • 人工智能学科:一门研究如何构造智能机器(智能计算机)或智能系统,使它能模拟、延伸、扩展人类智能的学科。

人工智能 - 研究目的及特征

通过探索智慧的实质,扩展人类智能——促使智能主体会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、专家系统等)、会学习(知识表示,机器学习等)、会行动(机器人、自动驾驶汽车等)。

人工智能 - 学派

学派 主要思想 代表方法 章节
1 符号主义 知识表示 认知就是通过用有意义的表示符号进行推 导计算,使用公理和逻辑体系搭建AI系统 知识图谱决策树 专家系统等 第2、7.1章
逻辑推理 确定性推理:使用依赖关系(确定性) 不确定性推理:使用概率规则(不确定性)进行推理。 朴素贝叶斯等 搜索求解 第3、4、5 章
2 联结主义 基于联结模型、机器学习 利用数学模型来研究人类认知的方法,如用神经元的连接机制实现人工智能。 神经网络、SVM等 第7.2、8章
3 行为主义 强化学习 以控制论及感知-动作型控制系统原理模拟行为以复现人类智能。 基于价值、基于策略 Q-earning等
4 博弈论 对策论 研究具有斗争或竞争性质现象的数学理论 和方法。 纳什均衡
5 群体智能 生物群体 智能进化算法:对生物进化进行模拟,使用遗传算法和遗传编程。 遗传算法、蚁群粒子群等 第6章

AI分类

image-20240716204801469

AI平台 - 分层体系架构

image-20240716204816316

AI演进 – 1个根基+3大阶段

  • 1个根基:知识、知识的表示、知识系统

3大阶段:

  • 逻辑推理,确定与不确实推理
  • 搜索、智能算法、专家系统,
  • 机器学习、神经网络
image-20240716204850744

AI发展 - 兴衰历程(3次高峰、2次危机)

image-20240716205005449

AI萌芽(50年代) - 图灵测试

图灵测试:1950年,艾伦·图灵(Alan Turing)在发表的《计算机与智能》中提出“图灵测试”(测试机器是否能表现出与人无法区分的智能),用以说明人工智能的概念。

image-20240716205037548 image-20240716205041341

AI诞生(50年代) - 达特茅斯会议

1956年,达特茅斯学院人工智能夏季研讨会上正式使用了人工智能这一术语。

这是人类历史上第一次人工智能研讨,标志着人工智能学科的诞生。

image-20240716205110996

报告列举了Artificial Inteligence值得关注七个问题

  • Automatic Computers
  • How Can a Computer be Programmed
  • to Use a anguage
  • Neuron Nets
  • Theory of the Size of a Calcuation
  • Self-improvement:自我学习与提高
  • Abstractions:归纳与演绎
  • Randomness and Creativity

让机器能像人那样认知、思考和学习,即用计算机模拟人的智能。

人工智能(Artifilcial Inteligence)是以机器为载体所展示的人类智能,因此人工智能也被称为机器智能

第1次高峰(50-60年代) - 感知机、机器学习定义

  • 1957 年 , 弗兰克 · 罗森布拉特在一台IBM- 704计算机上模拟实现了一种他发明的叫做“感知机”(Perceptron)的神经网络模型。
  • 1959年,萨缪尔(Arthur Samue)给机器学习了一个明确概念: Field of study that gives computers the ability to learn without being expicity programmed.(机器学习是研究如何让计算机不需要显式的程序也可以具备学习的能力)。

第1次低谷(60末-70年代中) - XOR线性不可分

1969年,“符号主义”代表人物马文·明斯基(Marvin Minsky)的著作《感知器》提出对XOR线性不可分的问题。单层感知器无法划分XOR原数据,解决这问题需要引入更高维非线性网络(MP, 至少需要两层),但多层网络并无有效的训练算法。这些论点给神经网络研究以沉重的打击,神经网络的研究走向长达10年的低潮时期。

image-20240716205752326

1974年起,各国开始陆续消减在AI研究方面的经费开支。

第2次高峰(60-70年代) - 专家系统、神经网络+BP

1974年,哈佛大学沃伯斯(Paul Werbos)博士论文里,首次提出了通过误差的反向传播(BP)来训练人工神经网络,但在该时期未引起重视。

  • 专家系统(Expert Systems)可视作“知识库(knowledge base)”和 “推理机(inference machine)”的结合。它是AI的一个重要分支,同自然语言理解,机器人学并列为AI的三大研究方向。
  • BP算法的基本思想不是(如感知器那样)用误差本身去调整权重,而是用误差的导数(梯度)调整。通过误差的梯度做反向传播,更新模型权重, 以降低学习的误差,拟合学习目标,实现“网络的万能近似功能”的过程。

第2次高峰(80年代) - 应用发展新高峰

专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。而机器学习(特别是神经网络)探索不同的学习策略和各种学习方法,在大量的实际应用中也开始慢慢复苏。

  • 1980年,美国卡内基梅隆大学(CMU) 召开了第一届机器学习国际研讨会, 标志着机器学习研究已在全世界兴起。
  • 1980 年 , CMU 为 DEC公司 开发了一个名为 XCON 的专家系统, 每年为公司节省4000万美元,取得巨大成功。
  • 1981年,保罗(R.P.Pau出版第一本机器人学课本 “ Robot Manipuator : Mathematics , Programmings and Control”,标志着机器人学科走向成熟。
  • 1982 年, 马尔( David Marr ) 发表代表作《视觉计算理论》提出计算机视 觉 ( Computer Vision)的概念,并构建系统的视觉理论,对认知科 学 ( Cognitive Science)也产生了很深远的影响。

第2次高峰(80年代) - 应用发展新高峰(神经网络)

1982年,约翰·霍普菲尔德发明了霍普菲尔德网络,是最早RNN雏形。它是一种单层反馈神经网络(神经网络结构主要可分为“前馈NN、反馈NN、图网络)。它的出现振奋神经网络领域,可在机器学习、联想记忆、模式识别、优化计算、VSI和光学设备的并行实现等方面广泛应用。

image-20240716205938183

第2次高峰(90年代) - 应用发展新高峰

1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫。深蓝是基于暴力穷举实现国际象棋领域的智能,通过生成所有可能的走法然后执行尽可能深的搜索,并不断对局面进行评估,尝试找出最佳走法。

image-20240716210133156

1998年,英国人蒂·李(Tim Berners-lee)提出语义网(Semantic Web)。

核心思想:给万维网文档(如HTML)添加能被计算机理解的语义(Meta data),使互联网成为基于语义链接的通用信息交换媒介

构建一个能够实现人与电脑无障碍沟通的智能网络

image-20240716210226583

第2次低谷(80年代末)

人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更 具挑战性任务,然而计算力及理论等匮乏使得不切实际目标的落空,AI发展走入低谷。

1974-80及1987-93是两个主要低谷期,伴随的是失望及批评,以及研究资金断绝。

其他还有几个较小的低谷,包括:

  • 1966年:机器翻译的失败
  • 1970年:联结主义的放弃。
  • 1971-75年:美国国防高等研究计划署在在卡内基美隆大学所进行的研究遭到挫折。
  • 1973年:英国的人工智研究受到莱特希尔对国会的报告所影响而大幅减少。
  • 1973-74年:美国国防高等研究计划削减对人工智能的学术研究。
  • 1987年:isp机器市场的萎缩。苹果和IBM公司生产的中小型台式机性能都超过了 Symboics等厂商生产的通用计算机。从此,专家系统风光不再。
  • 1988年:美国国家战略计算计划取消对AI研究的新花费。
  • 1993年:专家系统逐渐达到极限。
  • 20世纪90年代:日本第五代计算机计划未能达到预期目标。

第3次高峰(2000年代) – 基于大数据的机器学习

互联网技术迅速发展,加速AI的创新研究,促使AI技术进一步走向实用化,AI各个领域取得长足进步。

  • 2000年初,由于专家系统需要编码太多的显式规则,降低了效率并增加了成本,人工智能研究的重心从基于知识系统转向了基于大数据的机器学习方向。
  • 2003年,Google 3篇奠基性论文,为大数据存储及分布式处理提供思路,奠定现代大数据技术理论基础。
  • Bigdata内容包括:非结构化文件分布式存储(GFS) 、 分布式计算 (MapReduce) 、 结构化数据存储 (BigTable)
image-20240716210416951

第3次高峰(2000年代) - 机器人学

2005年,波士顿动力公司推出一款动力平衡四足机器狗,有较强的通用性,可适应较复杂的地形

image-20240716210444151

第3次高峰(2000年代) - 深度学习诞生

  • 2006年,杰弗里·辛顿以及他的学生鲁斯兰·萨拉赫丁诺夫正式提出了深度学习的概念(Deeping earning),开启了深度学习在学术界和工业界的浪潮。
  • 2006年也被称为深度学习元年,杰弗里·辛顿也因此被称为深度学习之父。

image-20240716210506789

第3次高峰(2010年代) - 暴发式增长(深度学习)

随着大数据、云计算物联网等信息技术发展, 泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的AI 技术飞速发展, 大幅跨越科学与应用之间的技术鸿沟。

图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现重大技术突破, 迎来爆发式增长的新高潮。

image-20240716210555381

第3次高峰(2010年代) - 暴发式增长(知识图谱)

2012年,谷歌正式发布谷歌知识图谱(Google Knowledge Graph),它是Google的一个从多种信息来源汇集的知识库。

通过知识图谱在普通的字串搜索上叠一层相互之间的关系,协助使用者更快找到所需的资料的同时,也可以知识为基础的搜索更近一步,以提高Google搜索的质量。

image-20240716210612667

第3次高峰(2010年代) - 暴发式增长(深度学习)

2015年,为纪念人工智能概念提出60周年,深度学习三巨头YannleCun、 Bengio和Hinton(他们于2018年共同获得了图灵奖)推出了深度学习的联合综述《Deep learning》。

image-20240716210636862

第3次高峰(2010年代) - 暴发式增长(强化学习)

  • 2016年,AlphaGo前后战胜围棋世界冠军、职业九段棋手李世石、柯洁等人。

image-20240716210658706

image-20240716210704150

  • 2017年,更新的AlphaGo Zero,可以结合强化学习进行自我训练。它在下棋前完全不知道游戏规则,完全是通过自己的试验和摸索,洞悉棋局和游戏的规则,形成自己的决策。随着自我博弈的增加,神经网络逐渐调整,提升下法胜率。

image-20240716210714558

  • 更为厉害的是,随着训练的深入, AlphaGo Zero 还独立发现新游戏规则,并走出了新策略,为围棋这项古老游戏带来新见解。

image-20240716210725173

第4次高峰(2020年至今) - 新纪元

  • 2020年,OpenAI开发的文字生成 (text generation) 人工智能 GPT-3,它具有1,750亿个参数的自然语言深度学习模型,可在“答题、翻译、写文章”上达到最先进的性能。

image-20240716210740702

  • 2020年,马斯克的脑机接口公司Neuralink举行现场直播,展示 了植入Neuralink设备的实验猪的脑部活动。

image-20240716210747971

  • 2020 年, 谷歌DeepMind 的 AlphaFod2解决了蛋白质结构预测的里程碑式问题。它在国际竞赛上展示的准确性 可 与 冷 冻 电 子 显 微 镜(cryo-EM)、核磁共振或X射线晶体学等相媲美。

image-20240716210758832

第4次高峰(2020年至今) - 新纪元(ChatGPT4)

2023年3月15日,OpenAI发布GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。它的输入可以是文字(上限2.5万字),还可以是图像。

image-20240716210828704

问:(图片示意) 手套掉下去会怎样?

ChatGPT回答:它会掉到木板上,并且球会被弹飞。

image-20240716210833580

哥伦布发现新大陆 – 先进文明的降维打击

欧洲人的财富发现

使得西班牙成为了当时扩张最为迅猛、领土最广阔的国家之一,西班牙更成为当时的世界霸主之一。

image-20240716210906577

美洲原著民的种族灾难

哥伦布的到来是一场史无前例的灾难,它使人口众多、欣欣向荣的美洲土著人几乎灭绝90%以上人口。

image-20240716210914796

AI产业 - 业界应用及发展现状

人工智能在国内外应用均以科技公司和互联网企业最为突出。应用技术以机器学习、自然语言处理、计算机视觉为主。已广泛应用于广告推荐、医疗诊断、个人助理、客户服务、图像识别等领域;国外Google、IBM、Facebook等公司的应用范围更广。

image-20240716210936890 image-20240716210955770

AI产业 - 生态图谱

image-20240716211015045

AI发展基础 - 三大要素

新一轮人工智能离不开大数据、高性能分布式并行计算框架以及效率更高的算法、硬件的发展。

要素1:大数据

燃料:海量结构化数据和非结构化数据为各类机器学习和深度学习计算引擎提供了燃料。

image-20240716211052709

要素2:计算能力

硬件设施:高性能分布式并行计算框架以及以GPU为代表的计算加速器(类似的加速器还包括FPGA、 TPU等)技术

image-20240716211110669

要素3:算法

软件灵魂:深度学习等算法随着分布式计算框架等基础软件的完善,展现了强大的预测能力

image-20240716211126824

AI发展基础 - 数据层面

数据是现实世界映射构建虚拟世界的基本要素,随着数据量以指数形式增长,开拓的虚拟世界的疆土也不断扩张。不同于AI算法开源,关键数据往往是不开放的,数据隐私化、私域化是一种趋势。数据之于AI应用,如同流量是互联网的护城河,有核心数据才有关键的AI能力。

AI发展基础 - 算力层面

2010年代以来深度学习浪潮,很大归功于计算能力的进步。

  • 量子计算
  • 边缘计算
  • 类脑计算
  • AI计算中心

推理就是计算(reason is nothing but reckoning) -托马斯.霍布斯

AI发展基础 - 算法层面 - 策略优化热点

  • 分布式 隐私保护
  • 数据和机理融合
  • 神经网络模型结构演进发展
  • 多学派方法融合发展

AI发展趋势 - 产业生态

  • 智能服务呈线下和线上的无缝结合
  • 智能化应用场景从单一向多元发展
  • 人工智能和实体经济深度融合进程将进一步加快