编码机

大模型,会被算力和数据卡脖子吗丨亮见

发布时间:2024/11/1 11:46:30   
中科白癜风医院好吗 http://www.pfzhiliao.com/

丨划重点

1.大模型可以分为决策式AI和生成式AI,就像人类也分为男人和女人一样。

2.从零开始建立类似于GPT的模型,算力确实至关重要,训练方法同样重要,现有模型基础上微调来适用特定场景,算力需求就不那么高。

.数据训练就是「垃圾进,垃圾出」,数据量不仅要大,还要质量好,更要数据深度。

4.让人工智能来承担体力劳动、乏味和耗时的机械化工作,符合工业革命的逻辑。

5.模型本身它是一个数字化的产物,不具备人类情感的机制。

编辑/赵杨博苏扬

丨概述

大模型遍地开花,激进者高喊超越ChatGPT,在追赶的路径上,大家各有差异。

大厂们将目光对准通用大模型,也有越来越多的团队选择从更加垂直的细分赛道切入,比如医疗、科学等领域。

《生产式人工智能》作者、人工智能专业博士、PayPal全球数据科学平台创始负责人丁磊博士认为大模型的发展越来越具象化,可以融入到我们的工作和生活中,以提高效率,满足各种需求。

关于算力和数据是否会「卡大模型的脖子」,在丁磊博士看来,要分情况而定,「在讨论大模型的应用时,除了算力之外,我认为训练方法也非常重要。」

伴随着人工智能的极速「狂飙」,有人认为AI未来将会取代大量的工作,丁磊博士认为不要只看静态的情况,从动态角度来看工作的需求也在增加,需要更多中高端的岗位来创造更多机会,让人工智能来承担体力劳动、乏味和耗时的机械化工作。这符合工业革命的逻辑,它替代了一些低效的岗位,但同时创造了更多当时中高端的岗位。

01大模型颠覆了巨头的垄断,算力很重要但不是唯一

刘兴亮:大模型为什么会这么热,它到底能做点什么?

丁磊:大模型现在很火,但实际上很多人并不了解模型本身。

模型是什么?我个人的理解是模型可以被定义为知识和逻辑的数字化载体。过去,如果要存储数据和信息,可能使用数据库就足够了,但是如果要同时存储知识和逻辑,就需要一个数字化的载体,这就是模型,它类似于人脑,我们经常将人脑与模型进行比较,人类的特点是根据经验习得规律,这些规律存在于人脑中。

当然,行业也尝试过使用其它形式来存储知识和逻辑,但并不太成功,直到行业形成共识后,我们逐渐都使用模型来记录所谓的AI学习到的知识和逻辑。

大模型可以分为两类,决策式AI和生成式AI,就像人类也分为男人和女人一样。

决策式AI更像是在做选择题,它的特点在于分类,而分类是一种非常强大的表达形式,例如人脸识别就是一个分类问题,当用户刷脸时不会被错误的识别成其他人,自动驾驶汽车也有一定的内在分类判断逻辑,AI知道何时加速、何时减速,甚至何时刹车,这都是决策式AI的领域。

与决策式AI相对应的是生成式AI,也就是今天所说的大模型,它更擅长回答简答题,创造内容或者创作,这是它的强项。

刘兴亮:大模型发展到今天的这个能力经历了哪些阶段,它早期的设想是什么,未来它还将发展到何处?

丁磊:生成式人工智能,是人工智能的一种形式,可以理解是AIGC技术的基础。AIGC是指通过人工智能生成各种内容,包括图片、文本、视频,它的出现使得我们的模型变得越来越具象化。

当下AIGC应用图谱,来源:清华大学AIGC发展研究报告1.0

现在的模型越来越趋向于根据输入生成对应的内容,比如ChatGPT,你可能很熟悉它生成的是什么,甚至可还以提供交互式的对话体验。

在年,业界首次发明了一种模型,称为序列到序列(Sequencetosequence)模型,在此之前,人工智能模型只能输出有限的内容,可能只能是一个分类或一个数值,序列到序列模型出现之后,我们可以输出任何东西。比如你的工作任务可以编码成模型的输入序列,要求的结果可以编码成输出序列,模型可以实现日常工作任务的自动化。

在年出现了一种称为Transformer的模型,GPT(生成式预训练)模型就是应用案例。这个模型引入了注意力机制,类似于人类在做事时的注意力。

到了年,OpenAI发布了第一版的GPT模型,也称为GPT-1。当时它的效果还没有达到引爆点,没有引起公众的广泛

转载请注明:http://www.aideyishus.com/lktp/7231.html

------分隔线----------------------------