人工智能现状与未来 2024.11.09 (纪委干部) PDF

人工智能发展现状、趋势与前景展望西南科技大学张晖博士、教授人工智能所取得的成就 10 月 8 日，瑞典皇家科学院宣布， 2024 年度诺贝尔物理学奖授予美国科学家约翰 · 霍普菲尔德（ John Hopfield ）以及加拿大学者杰弗里 · 辛顿（ Geoffrey Hinton ），以表彰他们“为利用人工神经网络进行...

人工智能发展现状、趋势与前景展望西南科技大学张晖博士、教授人工智能所取得的成就 10 月 8 日，瑞典皇家科学院宣布， 2024 年度诺贝尔物理学奖授予美国科学家约翰 · 霍普菲尔德（ John Hopfield ）以及加拿大学者杰弗里 · 辛顿（ Geoffrey Hinton ），以表彰他们“为利用人工神经网络进行机器学习做出的基础性发现和发明”。人工智能所取得的成就 10 月 9 日，瑞典皇家科学院宣布，将 2024 年诺贝尔化学奖授予戴维 · 贝克（ David Baker ），以表彰其在计算蛋白质设计方面的贡献；另一半则共同授予英国伦敦谷歌旗下人工智能公司 “深层思维”（ DeepMind ）的德米斯 · 哈萨比斯（ Demis Hassabis ）和约翰 · 江珀（ John M. Jumper ），以表彰其在蛋白质结构预测方面的贡献。人工智能所取得的成就 chatGPT 生成的“请生成一幅反映丹桂飘香，有山有水的中国大学校园景色” 人工智能所取得的成就 chatGPT 生成的“请生成一幅反映丹桂飘香，秋风送爽的校园的七律” 秋日校园丹桂飘香沁染秋，云山倒映碧波流。清风徐送书声远，霜叶轻飘路影幽。楼阁曲桥依翠岭，花黄叶红映斜楼。学园处处和声起，共赏金秋韵满眸。这首七律希望能捕捉到校园中秋日的美景，丹桂香飘，秋风和煦，清新的学园氛围，让人陶醉在浓浓的秋意之中。人工智能所取得的成就 chatGPT 生成的“请生成一段简短的 python 代码，能够对一组输入的数据进行冒泡法排序，并输出排序后的数据” def bubble_sort(arr): n = len(arr) for i in range(n): for j in range(0, n - i - 1): if arr[j] > arr[j + 1]: arr[j], arr[j + 1] = arr[j + 1], arr[j] return arr # 示例用法 data = [64, 34, 25, 12, 22, 11, 90] sorted_data = bubble_sort(data) print(" 排序后的数据 :", sorted_data) 人工智能所取得的成就李强总理在大会开幕式上致辞，强调了人工智能作为新一轮科技革命和产业变革的重要驱动力量，同时指出了在法律、安全、就业、道德伦理等方面面临的新课题。他提到中国积极拥抱智能变革，推进人工智能创新发展和安全治理，并发布了《全球人工智能治理倡议》。人工智能所取得的成就 2024 年世界人工智能大会（ WAIC ）在上海成功举行，由国家部门和上海市人民政府联合主办。本次大会以 " 以共商促共享以善治促善智 " 为主题，特色鲜明：创新性地采用 "1+3+10+X" 论坛架构，深入讨论 AI 伦理、大模型等关键议题 , 为全球人工智能的发展贡献中国智慧和上海方案。人工智能的意义习近平总书记强调：“人工智能是引领这一轮科技革命和产业变革的战略性技术，具有溢出带动性很强的‘头雁’效应。” （一）是促进新质生产力发展的重要引擎。作为新一轮科技革命和产业变革的重要驱动力，人工智能将带来技术革命性突破。人工智能融入各产业和社会再生产各环节，与各种产业互相融合，从而孕育出新产业新模式，大力推动生产力跃升。（二）是满足人民美好生活需要的重要举措。从与人顺畅聊天到写合同、剧本，从检测程序安全漏洞到辅助创作游戏甚至电影……生成式人工智能本领加速进化，当前，人工智能在医疗、教育、交通、助残养老、家政服务等领域快速发展，能满足人民群众对日益增长的美好生活需要，大幅提升生活便利度和幸福感，有效增强公共服务和城市管理能力。（三）是形成国际竞争新优势的战略抓手。近年来，以生成式人工智能为代表的新一代人工智能技术加速创新，成为各国抢占科技革命与产业革命优势地位的技术制高点。加快人工智能技术的发展和应用不仅有利于我国在这一轮人工智能技术竞赛中掌握主动权，更是我国在本轮产业革命中积累竞争优势的战略抓手。人工智能的意义人工智能的发展对当今社会具有深远的意义（一）自动化和效率提升。 AI 可极大提高生产力和效率。可能使人类自蒸汽机、电气化、信息化后的新一代“智能化“工业革命。（二）社会变革。人工智能导致就业结构的深刻调整，可能会影响近 40% 的工作岗位，尤其是脑力劳动者的职业替代性更高。这将导致社会形态的转变，可能会使得人们有更多的精力用于休闲娱乐。（三）虚实相生的社会形态。人工智能的发展推进人类社会迈向人机共存的智能增强时代，冲击传统伦理。（四）政府角色的转变。 AI 协助社会治理方式走向精细化、智能化、国际化。技术能力的提升和独立性的增强，使得构建合作、协同型的社会治理模式成为探索的重要方向。 ( 五）经济领域的变革。人工智能加速推动企业数字化转型、产业链结构重塑优化以及生产效率的提升。（六）就业和教育的影响。人工智能的应用使得例行性任务变得次要，一些工作将由 AI 完成，人们可以更专注于高层次的规划和分析工作。职场将更加重视发现和解决问题的能力、创造力以及批判性思维。（七）信息安全与社会观念。人工智能可能会改变我们所看到的内容，影响信息的真实性，乃至通过信息手段影响每个人的社会观念。人工智能的广泛应用将影响科研与教育的方式和内容。何为人工智能？人工智能（ Artificial Intelligence ），英文缩写为 AI 。是新一轮科技革命和产业变革的重要驱动力量，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。美国斯坦福大学尼尔逊教授对人工智能下了这样一个定义：“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”麻省理工学院的温斯顿教授认为：“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律，构造具有一定智能的人工系统，研究如何让计算机去完成以往需要人的智力才能胜任的工作，也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。人工智能的常见概念 1. 人工智能 (AI): 一个广泛的学科，目标是创造智能机器，相对于人类和动物表现出的自然智能。 2. 通用人工智能 (AGI): 相对于专用人工智能系统如机器视觉而言，可以在所有任务中达到并超越人类认知能力的人工智能。 3. 人工智能代理 : 一个人工智能驱动的系统，可以在环境中采取行动。例如，一个 LLM 可以使用一套工具，并且必须决定使用哪一个来完成它被提示要做的任务。 4. 生成式人工智能 (AIG): 一种人工智能系统，能够基于“提示”生成新内容 ( 例如，文本、图像、音频或视频 ) 。 5. 大语言模型 (LLM): 一种在大量数据上训练的模型，以自我监督的方式预测下一个单词。人工智能的常见概念图灵测试由英国数学家和计算机科学家阿兰 · 图灵（ Alan Turing ）在 1950 年提出，用以判断机器是否具有人类智能。图灵测试的核心思想是通过与人类的对话来评估机器的智能水平。图灵测试作为 AI 领域的经典测试方法，为我们提供了评估机器智能的一个重要基准。尽管存在一定的局限性，但它依然激励着研究人员不断追求更高水平的人工智能。人工智能的分类根据实现方式分类 1. 弱人工智能（ Narrow AI ）：机器或系统只能在特定的领域或任务中表现出人类的智能，比如语音识别、图像识别、自动驾驶等。 2. 强人工智能（ General AI ）：机器或系统能够在任何领域或任务中表现出人类的智能，甚至超过人类的智能，比如通用人工智能、人工生命等。 3. 超人工智能（ Super AI ）：机器或系统能够在所有领域或任务中远远超越人类的智能，目前还处于理论和探索的阶段。人工智能的分类根据功能分类 1. 感知型 AI ：包括计算机视觉、语音识别等，用于感知和理解环境，如人脸识别、语音助手等。 2. 认知型 AI ：涉及对信息的理解、推理和学习，如自然语言处理、机器学习等，如智能客服、聊天机器人等。 3. 执行型 AI ：在感知和认知的基础上做出决策和执行动作，如自动驾驶、智能家居等。人工智能的分类根据学习方式分类 1. 监督学习：通过标注好的数据进行学习，如分类算法、回归算法等。 2. 无监督学习：从没有标注的数据中学习，如聚类算法、降维算法等。 3. 强化学习：通过与环境的交互，通过奖励机制学习，如马尔可夫决策过程、 Q-learning 等。人工智能的分类根据应用领域分类 1. 医疗健康：如医学诊断、患者监测等。 2. 金融证券：如风险管理、信用评估、欺诈监测等。 3. 教育培训：如个性化学习路径、智能辅导、课程推荐等。 4. 交通物流：如自动驾驶、路线优化、流量分析等。 5. 新闻媒体：如稿件采写、素材创造等。 6. 游戏娱乐：如角色设计、元素生成、剧情设计等。计算机热点追踪 2000 年网格计算 2005 年物理网 2009 年区块链 2010 年云计算数 2012 年大数据 2016 年深度学习据 2017 年人工智能 2021 年元宇宙 2022 年大模型第 18 页人工智能发展史电子 BP 深度达特茅斯第一次计算机神经网络神经网络会议寒冬 1941 1950 1956 1970 1974 1980s 1982 1998 2006 图灵第一次专家支持贝叶斯测试高潮系统向量机方法人工神经网络发展史感知器 BP 算法提出深度神经网络 RNN/LSTM 语音识别ChatGPT 发布 F. Rosenblatt 提出可逼近高维空间 Hinton 提出错误率降低到 8% 中的任意非线性函数大模型成为热点正常人类是 4% 1957 1969 1986 1997 2006 2012 2015 2016 2022 Perceptron 支持向量机提出自动识别猫 AlphaGo 战胜李世石一书出版神经网络的第二次寒冬 16000 个处理器， 1000 万个视频神经网络的第一次寒冬近年国内外大模型发展史 Transformer 是什么 Transformer 就像是一个超级聪明的翻译官，它特别擅长理解和处理一系列的信息，比如一句话里的每个单词。它不像以前的方法那样一个词一个词地按顺序来，而是能同时看到并理解整句话的每个部分，然后准确地给出翻译或答案。这全靠它里面一个叫“自注意力”的神奇机制，让它能更灵活、更高效地处理信息。可以看到 Transformer 主要由编码器 Encoder 和解码器 Decoder 两个部分组成。 Transformer 是什么自注意力机制红色圈中的部分为 Multi-Head Attention ，是由多个 Self- Attention 组成的，可以看到 Encoder block 包含一个 Multi-Head Attention ，而 Decoder block 包含两个 Multi-Head Attention ( 其中有一个用到 Masked) 。自注意力机制可以理解为一种让模型在阅读句子时“关注”不同单词之间关系的方式。想象你在看一本书时，可能会特别关注某些词语或句子，因为它们与当前理解的内容密切相关。自注意力机制就是让模型也能做到这一点。举个例子想象你在阅读句子“我有一只猫”时，思考“有”这个词的意思。你可能会特别注意“猫”和“老鼠”，因为这两个词与“有”的动作密切相关。在这个过程中，自注意力机制帮助模型自动识别出 “有”这个动作与“我”和“猫”的联系，形成更准确的理解。 Transformer 是什么综合前面的讨论， Transformer 展现出了显著的并行处理能力，这一特性极大地加速了计算进程。其内置的自注意力机制我有一只猫如同一双锐利的眼睛，精准捕捉句子中词语间的长距离依赖关系，使得模型能够深入理解句子内部词语之间的复杂关联。更进一步， Transformer 的多头注意力机制仿佛为模型配备了多副透镜，从不同角度审视并解析语义，从而生成丰富而全面的语义表示。 Transformer 的架构设计简洁明了，易于扩展，得益于多重的编码器和解码器配置，它能够轻松应对大规模数据的处理需求，并完美融入分布式计算环境。更为重要的是， Transformer 的通用性使其能够跨越不同领域，无论是文本处理、图像识别还是音频分析，都能展现出卓越的性能。 I have a cat 这些优势使 Transformer 成为现代深度学习中的重要架构，推动了 AI 技术的发展。大模型的几个关键问题模型体积过大随着大型语言模型的持续发展，模型规模呈现出不断膨胀的趋势，这一显著的增长直接导致了计算与存储成本的急剧上升。在模型的训练与推理阶段，均需消耗庞大的资源，进而加剧了环境负担，例如， OpenAI 的 GPT-3 单次训练耗电量达 1287 兆瓦时。大模型的几个关键问题模型体积过大在此背景下，模型压缩技术，诸如剪枝、量化和知识蒸馏等，显得尤为重要。然而，这些技术在有效缩减模型体积的同时，也可能会对模型的性能和准确性产生不利影响，从而在保持模型效果与减小模型体积之间寻求一个恰当的平衡点成为了一项复杂而艰巨的任务，这也是当前研究人员亟待解决的一项重大挑战。大模型的几个关键问题算力要求较高当前，预训练大型语言模型已成为主流，这类模型拥有数十亿乃至万亿级别的参数规模，并在训练过程中需处理数以万亿计的 Token 数据，从而构成了对海量数据处理能力的极高要求，并伴随着巨额的算力消耗。据 OpenAI 的估算，自 2012 年以来，全球范围内用于训练大型模型的计算量呈现出指数级激增的趋势，其增长速率惊人，平均每 3.43 个月即实现翻倍，至今已累计增长了超过 30 万倍，这一增速显著超越了全球算力的整体发展步伐。随着大型模型持续不断的研发与广泛应用，全球算力消耗预计将持续以指数级速度攀升。据统计，训练 ChatGPT 所需的算力大约为 3640PFlop/s-day （即如果每秒计算一千万亿次，需要计算 3640 天） , 约等于 64 个英伟达 A100 GPU 训练 1 年的时间。大模型的几个关键问题算力要求较高中国信息通信研究院的预测进一步指出，至 2030 年，全球算力总量预计将达到 56ZFlops 的空前规模，而在 2021 年至 2030 年间，其年复合增长率预计将维持在约 65% 的高位水平。尤为值得注意的是，智能算力将成为驱动这一算力增长趋势的核心动力。大模型的几个关键问题高质量的数据高质量数据，是大模型性能跃升的基石。它不仅显著提升模型的可靠性与精准度，更深度削减偏差与噪声，铸就模型无坚不摧的泛化能力。优质数据如催化剂，加速模型收敛进程，令其稳健性倍增，轻松驾驭多元场景与复杂任务。然而，根据权威研究机构 EpochAI 预测，到 2028 年，互联网上的高质量文本数据将被采集殆尽，而机器学习所需的优质语言数据集可能在 2026 年前枯竭。为应对这一“数据墙”难题， AI 界正探索使用合成数据，它由机器生成，理论上可无限供应，为训练数据短缺提供新解。但合成数据可能带有偏差，导致模型对现实世界理解出现扭曲，甚至出现模型崩溃。大模型的几个关键问题人工智能的伦理问题我国《个人信息保护法》等对个人信息保护提出了明确要求。近期国家互联网信息办公室等七部委联合颁布的《生成式人工智能服务管理暂行办法》对预训练大模型使用的数据作出明确规定，提出要“使用具有合法来源的数据和基础模型”“涉及个人信息的，应当取得个人同意”等。人工智能的伦理核心是责任，当人工智能系统如自动驾驶出车祸时，谁应该承担责任。因此，虽然自动驾驶、 AI 读片等系统已经超过人类水平，但其大规模应用仍需谨慎，需要大量的实验和公众的认可。 AI 对齐： AI 对齐是指设计和开发 AI 系统时，使其行为与人类的价值观、目标和利益相一致的过程。这包括确保 AI 系统在决策过程中考虑到伦理、公平、透明度和可解释性等因素。大模型的几个关键问题垂直模型特定的领域需要特定的知识。相比能做很多事，但每件事都马马虎虎的通用大模型；只能做一两件事，但这一两件事都能做好，可被信赖的垂直大模型会更有价值。这样的垂直大模型能帮助我们真正解决问题，提高生产效率。垂直模型需要专用数据集。某些特定领域的数据可能相对稀缺，难以获取足够的高质量数据来训练或微调大模型，影响模型的准确性和可靠性。大模型在各领域均有应用工业领域医疗领域制造业中的生产流程优化和设备监测与预警：智能化诊疗智慧能源中的设备运检知识助手智能读片基于机器视觉的质量检测癌症早期发现危险环节的机器人替代人工大模型在各领域均有应用社会治理教育领域社会治理数据的全面感知基于机器视觉的学生课堂学习效果测评智能防控个性化测试智能决策助手学习内容动态推荐知识图谱应用系统  含能材料基础数据平台含能材料领域知识图谱、主题知识图谱知识库系统网络舆情监测系统时空动态演化图... 突发公共事件网络舆情检测与分析引擎突发公共事件话题建模舆情情报报送及网络舆情检测剖面图简报集采据数用户突发公共全事件舆情意见挖掘短信曲线图突发公共事件舆情态势可视化邮件云计算环境下突发公共事件网络舆情数据管理统计报表互联网舆情监测（ V2.0 ）企业知识库管理平台数据处理能力： 1. 为分布在全国 5000 多网点的近 20000 余名工程师在线技术知识服务 2. 各类知识库数据可达 TB 级 3. 支持并发 500 以上基于数据相关性分析的生丝水分控制智能决策系统生丝水分叶加料加水量的稳定性对烟丝质量具有决定性的影响。影响生丝水分的因素较多，目前依赖人工经验控制生丝水分叶加料加水量的稳定性和一致性不够高。中控操作叶加料出操作经验手动调节人员口水分加料后烟叶采集生丝水经 4—36 切丝分进入烘丝小时存储后段控制谢谢您的关注！

人工智能现状与未来 2024.11.09 (纪委干部) PDF

Document Details

Tags

Related

Summary

Full Transcript