编码机

AIGC深度报告迭代加速,颠覆人机交互模

发布时间:2023/7/24 16:43:08   

(报告出品方/分析师:中银证券卢翌)

人工智能应用已经进入高速发展阶段

AI能力迭代速度加快

人工智能的研究目的是使机器能够模拟人类的智能行为,从而扩展人类的能力。

于是研究者通过赋予智能主体听觉(语音识别、机器翻译等)、视觉(图像识别、文字识别等)、自然语言能力(语音合成、人机对话等)、思考(人机对弈、专家系统等)、学习(知识表示,机器学习等)和行动(机器人、自动驾驶汽车等)的能力来实现。

AI技术自诞生以来,经历了多个技术研究以及应用方向,目前已经进入了飞速发展阶段,智慧能力愈发强大且迭代速度加快。

AI诞生以及规则驱动时期(-s):

年,艾伦·麦席森·图灵(AlanMathisonTuring)提出了“图灵测试”,其目的是检验机器是否可以表现出与人类难以区分的智能,这一想法引发了机器产生智能的探讨。

年的达特茅斯会议首次提出了“人工智能”概念和理论。随后,人工智能领域出现了符号主义、联结主义(神经网络)等不同的研究方向,也取得了许多重要成果,如机器定理证明、跳棋程序和人机对话等。

在年,FrankRosenblatt设计了第一个计算机神经网络,被称为感知机,它被认为是第一个成功应用神经网络原理解决实际问题的算法。随后的年,赫伯特·西蒙和艾伦·纽厄尔演示了第一个人工智能程序,名为逻辑理论家(LT-LogicTheorist)。

早期的AI研究重点在于利用规则系统来模拟人类思维,采用一系列预先设定的规则来完成推理、分类等任务。

知识系统时期(s):

从年代开始,学术界开始接受了一种新的思路:人工智能不仅需要研究解决问题的方法,还需要引入知识。年的世界人工智能大会上,提出了“知识工程”的概念。

专家系统应运而生,它们模拟人类专家的知识和经验,用于解决特定领域的问题,这标志着人工智能从理论研究转向了实际应用。

日本的第五代计算机计划和英国的阿尔维计划等一系列计划推动了专家系统的高速发展。在这个时期,卡内基梅隆大学的XCON系统和Stanford医学专家系统等重要成果的出现使得专家系统在医疗、工业、金融等领域得到广泛应用。

人工智能的研究方法也从逻辑推理、搜索算法等领域扩展到了知识表示、推理和学习等多个方面。

机器学习时期(s-年):

在这一时期,机器学习成为了AI发展的焦点,这种学习方式是通过算法根据给定的输入数据和对应的输出数据进行学习,从而发现规律和模式,并且能够对新的样本做出判断、识别或预测。机器学习方法包括支持向量机、决策树、朴素贝叶斯等。

IBM成为了彼时AI领域的领导者:年,由IBM开发的超级电脑“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫,这是人工智能在智力运动方面的一次重大胜利。年,企业开始引领AI发展,谷歌的塞巴斯蒂安·特龙领导了自动驾驶汽车项目,企业对人工智能的投资也为其发展注入了强劲动力。

深度神经网络时期(年至今):

年代以来,AI在以深度神经网络为代表的发展过程中,取得了在感知方面的重要进展,例如语音处理、图像分类、视频处理、知识问答、人机对弈、无人驾驶等。

年,IBM的沃森(Watson)在一档美国电视智力竞赛节目《危险边缘》(Jeopardy!)中战胜人类选手获得冠军;同年,苹果推出了自然语言问答工具Siri。

谷歌于年正式发布谷歌知识图谱(GoogleKnowledgeGraph)。年,马斯克等人共同创建OpenAI,其发布的热门产品包括OpenAIGym和GPT等。年,谷歌旗下DeepMind公司推出的阿尔法围棋(AlphaGo)战胜围棋世界冠军李世石。年,谷歌发布了自然语言生成模型BERT,成为NLP领域的重要进展。

同时,DeepMind发布的新版本阿尔法围棋(AlphaGoZero)在没有人类知识的情况下自我学习并战胜前一版阿尔法围棋(AlphaGo)。年,OpenAI发布了语言生成模型GPT-2;和年先后发布了GPT-3.5和GPT-4.0。

自主学习时期(未来方向):

这个阶段是指未来的发展趋势,AI系统能够自己收集、整理和分析数据,并根据这些数据进行自我学习和优化,不断改进自己的性能,具备更高的智能水平,并逐渐适应更加复杂和多变的环境和任务,甚至可能出现自我意识。

AIGC多模态交互能力持续进化从应用类型来看,AI可以分为四类,但这四种类型不是完全独立的,实际中的AI应用可以涵盖多种类型的技术。本篇报告主要讨论的是生成式AI应用(AIGC)。

1)感知型AI:基于计算机视觉、语音识别等感知技术的AI应用,应用于人脸识别、目标行为识别、工业场景视觉识别、全屋智能家居等。这类AI通常是通过对输入数据进行分类、聚类等简单处理来实现对环境的理解,而且通常不需要进行复杂的推理和决策。

2)决策型AI:通过与外界的交互,自主学习并不断优化策略,以实现最优的决策和行动,应用于棋类策略游戏、无人驾驶、铁路调度系统、投资决策系统等等。

3)分析型AI:基于数据挖掘、机器学习等数据分析技术的AI应用,主要通过对大量数据的分析和挖掘,构建模型和算法来预测未来趋势、发现隐藏规律、优化决策等。应用于内容推荐、金融保险风控、商业分析、拦截垃圾邮件等场景。

以字节跳动的推荐算法“灵驹”为例,该算法通过对平台用户的基本特征、行为数据进行归纳分析,打上专属标签,实现内容和广告的精准推送。

Instagram、YouTube等社交媒体巨头使用的核心推荐算法有Reels、Feed等,亚马逊则通过FBT算法(FrequentlyBoughtTogether)推荐用户搜索过的类似商品。

4)生成式AI:即AIGC,是指利用生成式AI技术,例如深度学习、自然语言处理等,让机器能够自动地创造文本、图像、音频、视频等多媒体内容。

其工作方式是基于学习和推理,通过大量数据训练来学习规律并创造新的内容,而非仅仅分析现有的数据。

生成式AI可以通过输入一些参数或者文本,生成出符合语义的自然语言或者图像,应用场景包括自然语言生成、机器翻译、图像生成、音频合成等。

AIGC的发展与整体人工智能技术的发展历程基本相同,但在机器学习和深度神经网络发展阶段获得了加速进步。

小范围探索应用(s-s):

早在年,第一支由计算机创作的弦乐四重奏《依利亚克组》就已经出现。随后,第一款可与人进行对话的机器人“Eliza”于年问世。80年代中期,IBM创造的语音控制打字机Tangora也出现在市场上。

然而,由于高昂的成本以及难以商业化的原因,从80年代末到90年代中期,AIGC仅能进行小范围的实验和应用,资本投入也因此受到了限制。

自主化生成能力尚弱(s-s):

AIGC正逐渐从实验性向实用性转变,开始探索利用人工智能技术生成新闻、音乐、诗歌等内容。其中包括世界上第一部完全由人工智能创作的小说《1TheRoad》。然而,在这一阶段,AIGC仍然受限于算法瓶颈和模板的缺陷,只能通过预先设置的规则和算法来生成内容,缺乏个性化和创意性。因此,AIGC尚未达到真正的自主化水平。

深度学习促进快速发展(s-至今):

AIGC的发展得到了深度学习算法不断迭代更新的助力,例如生成对抗网络(GAN)、变分自编码器(VAE)和语言模型等。AIGC内容变得百花齐放,往往能在短时间内快速生成,在一定程度上达到人类难以分辨的效果。

这引起了许多知名机构和公司的

转载请注明:http://www.aideyishus.com/lkjg/5341.html

------分隔线----------------------------