人工智能现状与未来 2024.11.09 (纪委干部) PDF
Document Details
西南交通大学
张晖
Tags
Summary
This document discusses the current state and future trends of artificial intelligence. Presented by Dr. Zhang Hui, a professor at Southwest Jiaotong University, the content delves into various aspects of AI, highlighting recent advancements, achievements, and applications.
Full Transcript
人工智能发展现状、趋势与前景展望 西南科技大学 张晖 博士、教授 人工智能所取得的成就 10 月 8 日,瑞典皇家科学院宣 布, 2024 年度诺贝尔物理学奖授予美国 科学家约翰 · 霍普菲尔德( John Hopfield )以及加拿大学者杰弗里 · 辛 顿( Geoffrey Hinton ),以表彰他 们“为利用人工神经网络进行...
人工智能发展现状、趋势与前景展望 西南科技大学 张晖 博士、教授 人工智能所取得的成就 10 月 8 日,瑞典皇家科学院宣 布, 2024 年度诺贝尔物理学奖授予美国 科学家约翰 · 霍普菲尔德( John Hopfield )以及加拿大学者杰弗里 · 辛 顿( Geoffrey Hinton ),以表彰他 们“为利用人工神经网络进行机器学习做 出的基础性发现和发明”。 人工智能所取得的成就 10 月 9 日,瑞典皇家科学院宣布, 将 2024 年诺贝尔化学奖授予戴维 · 贝 克( David Baker ),以表彰其在计 算蛋白质设计方面的贡献;另一半则共 同授予英国伦敦谷歌旗下人工智能公司 “深层思维”( DeepMind )的德米 斯 · 哈萨比斯( Demis Hassabis ) 和约翰 · 江珀( John M. Jumper ), 以表彰其在蛋白质结构预测方面的贡献。 人工智能所取得的成就 chatGPT 生成的“请生成一幅反映丹桂飘香,有山有水的中国大学 校园景色” 人工智能所取得的成就 chatGPT 生成的“请生成一幅反映丹桂飘香,秋风送爽的校园的七 律” 秋日校园 丹桂飘香沁染秋, 云山倒映碧波流。 清风徐送书声远, 霜叶轻飘路影幽。 楼阁曲桥依翠岭, 花黄叶红映斜楼。 学园处处和声起, 共赏金秋韵满眸。 这首七律希望能捕捉到校园中秋日的美景,丹桂香飘, 秋风和煦,清新的学园氛围,让人陶醉在浓浓的秋意之中。 人工智能所取得的成就 chatGPT 生成的“请生成一段简短的 python 代码,能够对一组输 入的数据进行冒泡法排序,并输出排序后的数据” def bubble_sort(arr): n = len(arr) for i in range(n): for j in range(0, n - i - 1): if arr[j] > arr[j + 1]: arr[j], arr[j + 1] = arr[j + 1], arr[j] return arr # 示例用法 data = [64, 34, 25, 12, 22, 11, 90] sorted_data = bubble_sort(data) print(" 排序后的数据 :", sorted_data) 人工智能所取得的成就 李强总理在大会开幕式上致 辞,强调了人工智能作为新一轮 科技革命和产业变革的重要驱动 力量,同时指出了在法律、安全、 就业、道德伦理等方面面临的新 课题。他提到中国积极拥抱智能 变革,推进人工智能创新发展和 安全治理,并发布了《全球人工 智能治理倡议》。 人工智能所取得的成就 2024 年世界人工智能大会( WAIC )在上海成功举行,由国 家部门和上海市人民政府联合主办。本次大会以 " 以共商促共享 以善治促善智 " 为主题,特色鲜明:创新性地采 用 "1+3+10+X" 论坛架构,深入讨论 AI 伦理、大模型等关键 议题 , 为全球人工智能的发展贡献中国智慧和上海方案。 人工智能的意义 习近平总书记强调:“人工智能是引领这一轮科技革命和产业变革的战略 性技术,具有溢出带动性很强的‘头雁’效应。” (一)是促进新质生产力发展的重要引擎。作为新一轮科技革命和产业变革的重要驱动力,人工智能 将带来技术革命性突破。人工智能融入各产业和社会再生产各环节,与各种产业互相融合,从而孕育 出新产业新模式,大力推动生产力跃升。 (二)是满足人民美好生活需要的重要举措。从与人顺畅聊天到写合同、剧本,从检测程序安全漏洞 到辅助创作游戏甚至电影……生成式人工智能本领加速进化,当前,人工智能在医疗、教育、交通、 助残养老、家政服务等领域快速发展,能满足人民群众对日益增长的美好生活需要,大幅提升生活便 利度和幸福感,有效增强公共服务和城市管理能力。 (三)是形成国际竞争新优势的战略抓手。近年来,以生成式人工智能为代表的新一代人工智能技术 加速创新,成为各国抢占科技革命与产业革命优势地位的技术制高点。加快人工智能技术的发展和应 用不仅有利于我国在这一轮人工智能技术竞赛中掌握主动权,更是我国在本轮产业革命中积累竞争优 势的战略抓手。 人工智能的意义 人工智能的发展对当今社会具有深远的意义 (一)自动化和效率提升。 AI 可极大提高生产力和效率。可能使人类自蒸汽机、电气化、信息化后的 新一代“智能化“工业革命。 (二)社会变革。人工智能导致就业结构的深刻调整,可能会影响近 40% 的工作岗位,尤其是脑力 劳动者的职业替代性更高。这将导致社会形态的转变,可能会使得人们有更多的精力用于休闲娱乐。 (三)虚实相生的社会形态。人工智能的发展推进人类社会迈向人机共存的智能增强时代,冲击传统 伦理。 (四)政府角色的转变。 AI 协助社会治理方式走向精细化、智能化、国际化。技术能力的提升和独立 性的增强,使得构建合作、协同型的社会治理模式成为探索的重要方向。 ( 五)经济领域的变革。人工智能加速推动企业数字化转型、产业链结构重塑优化以及生产效率的提 升。 (六)就业和教育的影响。人工智能的应用使得例行性任务变得次要,一些工作将由 AI 完成,人们可 以更专注于高层次的规划和分析工作。职场将更加重视发现和解决问题的能力、创造力以及批判性思 维。 (七)信息安全与社会观念。人工智能可能会改变我们所看到的内容,影响信息的真实性,乃至通过 信息手段影响每个人的社会观念。人工智能的广泛应用将影响科研与教育的方式和内容。 何为人工智能? 人工智能( Artificial Intelligence ),英文缩写为 AI 。是新一轮科技革命和产业变革的重要驱动力量, 是研究、 开发用于模拟、延伸和扩展人的智能的理论、方法、技术及 应用系统的一门新的技术科学。 美国斯坦福大学尼尔逊教授对人工智能下了这样一个定义:“人工智能是关于知识 的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”麻省理工学院的温 斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工 作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类 智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需 要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些 智能行为的基本理论、方法和技术。 人工智能的常见概念 1. 人工智能 (AI): 一个广泛的学科,目标是创造智能机器,相对于人类和动物表现出的自然智能。 2. 通用人工智能 (AGI): 相对于专用人工智能系统如机器视觉而言,可以在所有任务中达到并超 越人类认知能力的人工智能。 3. 人工智能代理 : 一个人工智能驱动的系统,可以在环境中采取行动。例如,一个 LLM 可以使 用一套工具,并且必须决定使用哪一个来完成它被提示要做的任务。 4. 生成式人工智能 (AIG): 一种人工智能系统,能够基于“提示”生成新内容 ( 例如,文本、图像、 音频或视频 ) 。 5. 大语言模型 (LLM): 一种在大量数据上训练的模型,以自我监督的方式预测下一个单词。 人工智能的常见概念 图灵测试由英国数学家和计算机科学家 阿兰 · 图灵( Alan Turing )在 1950 年 提出,用以判断机器是否具有人类智能。 图灵测试的核心思想是通过与人类的对 话来评估机器的智能水平。图灵测试作为 AI 领域的经典测试方法,为我们提供了评估机 器智能的一个重要基准。尽管存在一定的局 限性,但它依然激励着研究人员不断追求更 高水平的人工智能。 人工智能的分类 根据实现方式分类 1. 弱人工智能( Narrow AI ):机器或系统只能在特定的领域或任务中 表现出人类的智能,比如语音识别、图像识别、自动驾驶等。 2. 强人工智能( General AI ):机器或系统能够在任何领域或任务中表 现出人类的智能,甚至超过人类的智能,比如通用人工智能、人工生命等。 3. 超人工智能( Super AI ):机器或系统能够在所有领域或任务中远远 超越人类的智能,目前还处于理论和探索的阶段。 人工智能的分类 根据功能分类 1. 感知型 AI :包括计算机视觉、语音识别等,用于感知和理解环境,如人 脸识别、语音助手等。 2. 认知型 AI :涉及对信息的理解、推理和学习,如自然语言处理、机器学 习等,如智能客服、聊天机器人等。 3. 执行型 AI :在感知和认知的基础上做出决策和执行动作,如自动驾驶、 智能家居等。 人工智能的分类 根据学习方式分类 1. 监督学习:通过标注好的数据进行学习,如分类算法、回归算法等。 2. 无监督学习:从没有标注的数据中学习,如聚类算法、降维算法等。 3. 强化学习:通过与环境的交互,通过奖励机制学习,如马尔可夫决策过 程、 Q-learning 等。 人工智能的分类 根据应用领域分类 1. 医疗健康:如医学诊断、患者监测等。 2. 金融证券:如风险管理、信用评估、欺诈监测等。 3. 教育培训:如个性化学习路径、智能辅导、课程推荐等。 4. 交通物流:如自动驾驶、路线优化、流量分析等。 5. 新闻媒体:如稿件采写、素材创造等。 6. 游戏娱乐:如角色设计、元素生成、剧情设计等。 计算机热点追踪 2000 年 网格计算 2005 年 物理网 2009 年 区块链 2010 年 云计算 数 2012 年 大数据 2016 年 深度学习 据 2017 年 人工智能 2021 年 元宇宙 2022 年 大模型 第 18 页 人工智能发展史 电子 BP 深度 达特茅斯 第一次 计算机 神经网络 神经网络 会议 寒冬 1941 1950 1956 1970 1974 1980s 1982 1998 2006 图灵 第一次 专家 支持 贝叶斯 测试 高潮 系统 向量机 方法 人工神经网络发展史 感知器 BP 算法提出 深度神经网络 RNN/LSTM 语音识别ChatGPT 发布 F. Rosenblatt 提出 可逼近高维空间 Hinton 提出 错误率降低到 8% 中的任意非线性函数 大模型成为热点 正常人类是 4% 1957 1969 1986 1997 2006 2012 2015 2016 2022 Perceptron 支持向量机提出 自动识别猫 AlphaGo 战胜李世石 一书出版 神经网络的第二次寒冬 16000 个处理器, 1000 万个视频 神经网络的 第一次寒冬 近年国内外大模型发展史 Transformer 是什么 Transformer 就像是一个超级聪明的翻译官,它 特别擅长理解和处理一系列的信息,比如一句话 里的每个单词。它不像以前的方法那样一个词一 个词地按顺序来,而是能同时看到并理解整句话 的每个部分,然后准确地给出翻译或答案。这全 靠它里面一个叫“自注意力”的神奇机制,让它能 更灵活、更高效地处理信息。 可以看到 Transformer 主要由编码器 Encoder 和解码器 Decoder 两个部分组成。 Transformer 是什么 自注意力机制 红色圈中的部分为 Multi-Head Attention ,是由多个 Self- Attention 组 成 的 , 可 以 看 到 Encoder block 包 含 一 个 Multi-Head Attention , 而 Decoder block 包 含 两 个 Multi-Head Attention ( 其中有一个用到 Masked) 。 自注意力机制可以理解为一种让模型在阅读句子时“关注”不同 单词之间关系的方式。想象你在看一本书时,可能会特别关注 某些词语或句子,因为它们与当前理解的内容密切相关。自注 意力机制就是让模型也能做到这一点。 举个例子 想象你在阅读句子“我有一只猫”时,思考“有”这个词的意思。 你可能会特别注意“猫”和“老鼠”,因为这两个词与“有”的动作 密切相关。在这个过程中,自注意力机制帮助模型自动识别出 “有”这个动作与“我”和“猫”的联系,形成更准确的理解。 Transformer 是什么 综合前面的讨论, Transformer 展现出了显著的并行处理能 力,这一特性极大地加速了计算进程。其内置的自注意力机制 我有一只猫 如同一双锐利的眼睛,精准捕捉句子中词语间的长距离依赖关 系,使得模型能够深入理解句子内部词语之间的复杂关联。更 进一步, Transformer 的多头注意力机制仿佛为模型配备了 多副透镜,从不同角度审视并解析语义,从而生成丰富而全面 的语义表示。 Transformer 的架构设计简洁明了,易于扩展,得益于多重的 编码器和解码器配置,它能够轻松应对大规模数据的处理需求, 并完美融入分布式计算环境。更为重要的是, Transformer 的通用性使其能够跨越不同领域,无论是文本处理、图像识别 还是音频分析,都能展现出卓越的性能。 I have a cat 这些优势使 Transformer 成为现代深度学习中的重要架构, 推动了 AI 技术的发展。 大模型的几个关键问题 模型体积过大 随着大型语言模型的持续发展,模型规模呈现出 不断膨胀的趋势,这一显著的增长直接导致了计 算与存储成本的急剧上升。在模型的训练与推理 阶段,均需消耗庞大的资源,进而加剧了环境负 担,例如, OpenAI 的 GPT-3 单次训练耗电量 达 1287 兆瓦时。 大模型的几个关键问题 模型体积过大 在此背景下,模型压缩技术,诸如剪枝、量化和 知识蒸馏等,显得尤为重要。然而,这些技术在 有效缩减模型体积的同时,也可能会对模型的性 能和准确性产生不利影响,从而在保持模型效果 与减小模型体积之间寻求一个恰当的平衡点成为 了一项复杂而艰巨的任务,这也是当前研究人员 亟待解决的一项重大挑战。 大模型的几个关键问题 算力要求较高 当前,预训练大型语言模型已成为主流,这类模 型拥有数十亿乃至万亿级别的参数规模,并在训 练过程中需处理数以万亿计的 Token 数据,从而 构成了对海量数据处理能力的极高要求,并伴随 着 巨 额 的 算 力 消 耗 。 据 OpenAI 的 估 算 , 自 2012 年以来,全球范围内用于训练大型模型的 计算量呈现出指数级激增的趋势,其增长速率惊 人,平均每 3.43 个月即实现翻倍,至今已累计 增长了超过 30 万倍,这一增速显著超越了全球 算力的整体发展步伐。随着大型模型持续不断的 研发与广泛应用,全球算力消耗预计将持续以指 数级速度攀升。 据 统 计 , 训 练 ChatGPT 所 需 的 算 力 大 约 为 3640PFlop/s-day (即如果每秒计算一千万亿 次,需要计算 3640 天) , 约等于 64 个英伟达 A100 GPU 训练 1 年的时间。 大模型的几个关键问题 算力要求较高 中国信息通信研究院的预测进一步指出,至 2030 年,全球算力总量预计将达到 56ZFlops 的空前规模,而在 2021 年至 2030 年间,其年 复合增长率预计将维持在约 65% 的高位水平。 尤为值得注意的是,智能算力将成为驱动这一算 力增长趋势的核心动力。 大模型的几个关键问题 高质量的数据 高质量数据,是大模型性能跃升的基石。它不仅 显著提升模型的可靠性与精准度,更深度削减偏 差与噪声,铸就模型无坚不摧的泛化能力。优质 数据如催化剂,加速模型收敛进程,令其稳健性 倍增,轻松驾驭多元场景与复杂任务。 然 而 , 根 据 权 威 研 究 机 构 EpochAI 预 测 , 到 2028 年,互联网上的高质量文本数据将被采集 殆尽,而机器学习所需的优质语言数据集可能在 2026 年前枯竭。为应对这一“数据墙”难题, AI 界正探索使用合成数据,它由机器生成,理论上 可无限供应,为训练数据短缺提供新解。但合成 数据可能带有偏差,导致模型对现实世界理解出 现扭曲,甚至出现模型崩溃。 大模型的几个关键问题 人工智能的伦理问题 我国《个人信息保护法》等对个人信息保护提出了明确要求。近期国家互联网信息办公室等七部委联合 颁布的《生成式人工智能服务管理暂行办法》对预训练大模型使用的数据作出明确规定,提出要“使用 具有合法来源的数据和基础模型”“涉及个人信息的,应当取得个人同意”等。 人工智能的伦理核心是责任,当人工智能系统如自动驾驶出车祸时,谁应该承担责任。因此,虽然自动 驾驶、 AI 读片等系统已经超过人类水平,但其大规模应用仍需谨慎,需要大量的实验和公众的认可。 AI 对齐: AI 对齐是指设计和开发 AI 系统时,使其行为与人类的价值观、目标和利益相一致的过程。这 包括确保 AI 系统在决策过程中考虑到伦理、公平、透明度和可解释性等因素。 大模型的几个关键问题 垂直模型 特定的领域需要特定的知识。 相比能做很多事,但每件事都马马虎虎的通用大 模型;只能做一两件事,但这一两件事都能做好, 可被信赖的垂直大模型会更有价值。这样的垂直 大模型能帮助我们真正解决问题,提高生产效率。 垂直模型需要专用数据集。 某些特定领域的数据可能相对稀缺,难以获取足 够的高质量数据来训练或微调大模型,影响模型 的准确性和可靠性。 大模型在各领域均有应用 工业领域 医疗领域 制造业中的生产流程优化和设备监测与预警: 智能化诊疗 智慧能源中的设备运检知识助手 智能读片 基于机器视觉的质量检测 癌症早期发现 危险环节的机器人替代人工 大模型在各领域均有应用 社会治理 教育领域 社会治理数据的全面感知 基于机器视觉的学生课堂学习效果测评 智能防控 个性化测试 智能决策助手 学习内容动态推荐 知识图谱应用系统 含能材料基础数据平台 含能材料领域知识图谱、主题知识图谱 知识库系统 网络舆情监测系统 时空动态演化图... 突发公共事件网络舆 情检测与分析引擎 突发公共事件话题建模 舆情情报报送 及网络舆情检测 剖面图 简报 集采据数 用户 突发公共全事件舆情意 见挖掘 短信 曲线图 突发公共事件舆情态势 可视化 邮件 云计算环境下突发公共 事件网络舆情数据管理 统计报表 互联网舆情监测( V2.0 ) 企业知识库管理平台 数据处理能力: 1. 为分布在全国 5000 多网点的近 20000 余名工程师在线技术知识服 务 2. 各类知识库数据可达 TB 级 3. 支持并发 500 以上 基于数据相关性分析的生丝水分控制智能决策系统 生丝水分叶加料加水量的稳定性对烟丝质量具有决定性的影响。影响生丝水分 的因素较多,目前依赖人工经验控制生丝水分叶加料加水量的稳定性和一致性 不够高。 中控操作 叶加料出 操作经验 手动调节 人员 口水分 加料后烟叶 采集生丝水 经 4—36 切丝 分进入烘丝 小时存储后 段控制 谢 谢 您 的 关 注!