中国工程院院士邬贺铨:大模型纯粹对话聊天绝对不是刚需,很难形成商业模式

2023-12-21 www.dnxtw.com

12 月 21 日下午,新浪财经客户端、新浪科技联合主办的“2023”消息 今天,科技风云榜年度盛典开幕,今年活动的主题是“智涌”・跳跃”。中国工程院院士吴贺泉发表了题为《大模型上手,数智化进步》的演讲。

吴贺泉说,人工智能的发展使互联网迅速进入了智能时代。一年前 ChatGPT 当然,给你一双明亮的眼睛。 ChatGPT 它仍然是一个基本的大型模型,仍然是第二代人工智能。我们希望它在未来是普遍的,至少有三个方面:第一,一个模型不仅可以适应一个任务,而且可以适应多个任务。第二,不能局限于一种模态输入,而是希望多模态输入。第三,未来的推理可以非常准确。

他认为,大型模型的出现将为我们的工业数字化转型和高质量发展带来良好的技术支持。现在的问题是,如果我们做一个基本的大型模型,我们如何才能更紧密地与我们的行业结合起来。”我已经注意到,虽然中国几个著名的大型模型单位有一些语料对话和聊天,但事实上,纯粹的对话和聊天绝对不仅仅是需要的,而且很难形成一种商业模式。”

除了工业应用场景,吴贺泉还举了一个例子。现在手机上有了大模型,手机可以训练超过 100 作为推理,目前有人已经做到了1亿参数 130 亿参数了。估计到明年 150 也有可能在手机里做一亿。这种大模型的实施将催生新一轮的创新,降低用户生成三维视频的门槛。很多年前,我们的手机通常在一年半内更换,但近年来没有这样的需求。在未来,更多的实际推广依赖于用户生成内容,大型模型落在手机上,可以提高用户的内容水平。我们不仅消费,还有健康、养老、监护和教育。最有价值的是工业应用程序。你可以落在手机、机器人和工业模块上,这可以带来新的飞跃。

他援引 IDC 预测数据称,到 2026 年中国市场超过 50% 会有终端设备处理器 AI 引擎,将使中国互联网产业走出低谷,将迎来激动人心的井喷式发展。

以下是演讲实录:

各位专家,各位领导,下午好,我的演讲题目是大模型,数智化先进。明年 4 中国将于1月份成功进入互联网 30 我们可以回顾周年纪念日 30 中国互联网在过去的几年里发生了很大的变化。

一个发现,我们整个互联网的移动化发展迅速,尤其是 4G 推动移动互联网的快速普及,现在 5G 推动工业互联网的发展。

互联网从最初的点到点连接到一般消费者客户,现在已经成为一个平台,从点平台、云平台、社交平台、直播平台、工业平台,特别是近年来,人工智能的发展使互联网迅速进入智能时代。

我刚才谈到了大模型。事实上,我刚才谈到了大模型。 60 1956年前有人工智能的研究 2008年,当时在学术界,知道的人并不多。每个人都知道的是 1997 年 IBM 深蓝计算机战胜了国际象棋大师。过了一段时间,大家都没什么感觉。2016年 年阿尔法战胜围棋高手,发现人类下棋不能下电脑。

下棋不仅仅是需要,对社会生活影响不大。去年年底,一年前 ChatGPT 当然,给你一双明亮的眼睛。 ChatGPT 它仍然是一个基本的大模型,仍然是第二代人工智能。我们希望它在未来是普遍的,至少有三个方面:

首先,一个模型不仅可以适应一个任务,还可以适应多个任务。

第二,不能局限于一种模态输入,而是希望多模态输入。

第三,未来的推理可以非常准确。

大型模型也有很多层和节点。我们开始对应某个任务。我们不知道哪条路最准确,但我们可以通过大规模的训练、反复迭代、尝试和错误来知道哪个节点和应该通过的全值概率。这些是参数。显然,参数越多,分解越精细。我现在来看,从 2018 年 ChatGPT1 到今年年初 ChatGPT4,参数增加了1万倍,当然,相应的训练数据和调用 GPU 卡数也相应增加。

现在我们来谈谈大模型。刚才,对话嘉宾也谈到了。我们在中国有 188 这些大型模型基本上都是互联网公司和 IT 对于企业来说,这种基础大模型的门槛还是比较高的。现在垂直行业的企业还很少。大企业自己做大模型和基础大模型。正如林院长刚才所说,它不能用于工业。基本语料不是工业预期。工业数据没那么多,找这么多数据训练也不容易。基础大模型在节点上还不能落地,要落地怎么办?在节点上,基本的大型模型不能落地。我们该怎么办?我们必须与行业合作。行业合作有两种方式。一是将企业数据发送给基本的大型模型提供商,然后让他们帮助添加行业数据进行微调。这类企业会担心我的数据是否会泄露。技术上完全依赖于基本的大模型。

还有一种方法是把基本的大模型培训模型给企业,企业添加自己的数据微调,面对企业技术水平要求高,基础培训是老师教的,企业培训是另一个老师,两个老师会教不一致,最终可能没有办法接受。

与行业合作仍存在问题。对于大多数中小企业来说,更难访问大模型。我们希望把大模型变成一个简单的模块,放在云平台上吗? PAAS 和 SAAS 这样,我们就可以通过一个简单的接口,企业就可以访问这个模型模块。我们还需要配置一些低代码的开发软件,可以通过鼠标拖动为企业的基本场景访问和微调提供机会。如果我们真的这样做了,我们将来可以在企业会议上使用这个模型。我用这种方法制作中小企业的模型,我称之为场景的大模型,它仍然是针对特定应用程序的。

大型模型的出现将为我国工业数字化转型和高质量发展带来良好的技术支持。现在问题是,我们做基本的大模型,如何与我们的行业更紧密地结合,我已经注意到一些著名的单位,虽然他们有一些语料对话,聊天,事实上,纯粹的对话聊天绝对不仅仅是需要,也很难形成一个商业模式。国内一些大型单位的目标是做工业。比如百度要和吉利合作做智能客服,和国家电网合作,做分布式电网调度。百度还做 MLA 疫苗序列有效分析,在新冠肺炎疫情期间,灭活疫苗在中国得到广泛应用,在美国得到广泛应用 MLA,有很多序列,并不是所有的序列都对新冠肺炎有效,所以很难找到最好的序列。据说超过一秒计算一百亿年,现在使用大型模型可以选择更好的疫苗,当然,不一定是最好的,百度曾经发表在杂志上,也得到了认可。我认为从这些方面来看,这些方面还没有直接进入制造业生产线。

华为盘古模型主要针对制造业。他的目标是了解制造业的需求、文档的生成、工业软件的编程、阅读图纸和我们的供应链管理。我们还可以看到,这些也在生产线的外围,行业的核心部分仍然没有真正进入。

腾讯有一个微低代码平台,专注于中小网站、网站开发等。

阿里有一个通义问题,训练参数多,可以支持 8K 在上面的窗口,他可以聊天,你输入的长度也反映了大模型的能力。阿里巴巴可以输入 8K 左右。

海尔是制造业领域的大型模型。他自己也是一个制造业。通过海尔自身家用电器的生产,他基本上掌握了家用电器的生产过程。海尔的大型模型并没有在家用电器行业得到推广。为什么?其他的都是他的竞争对手,海尔的大型模型被推广到服装行业、汽车行业和这些地方。

随着大型模型和初级人工智能的发展,它也给了社会中更多的中小企业机会。此时,为更多的中小企业提供了一些平台企业。例如,广州有一家企业做服装设计建模、服装厂管理。大量的服装厂只有大量的缝纫女工,没有技术,引进了广州景观软件,使生产管理达到了很好的水平。

山东橙云原本是一家设计工具软件租赁公司。许多企业使用工具软件。他们自己买的太贵了,用的时间也不多。他们可以通过租房来省钱。后来,城市运营发展成为一个设计承接和分包平台。许多企业在那里发布了一些需求。他分解了设计需求,然后进行了投标。最后,通过它整合了完成的结果。现在它已经面向5万多家中小企业。

深圳有云工业技术。有些企业需要订购和一些产品。他们不知道在哪里订购和发布。许多企业应该在这方面进行投标,并且可以在半年内进行匹配 100 亿的交易。

广州有一家公司,主要从事女装出口,利用珠江三角洲的服装加工能力、国际快速物流能力,从品牌、设计、面料、采购、销售、金融、保险等一站式,现在是世界 54 一个国家最重要的手机购物环节,他即将上市,估值超过1000亿美元。江苏有一个虚拟工厂,三一重工是供应链管理平台,以三一重工为龙头 200 许多上下游企业相互关联,最重要的是实现零库存或少库存,大大提高了效率。

现在,大多数大型模型都是在大型智能计算中心和超级计算中进行的。现在一个新的模型出来了,把大型模型放在手机上。现在手机可以训练超过了 100 作为推理,目前有人已经做到了1亿参数 130 1亿参数。估计到明年。 150 也有可能在手机里做一亿。

有人说只有超过 130 1亿参数在手机上有什么好处?未来大模型训练可以离线,成本低,不需要智算,超算中心,延迟低。现在美国有一家公司,Aizip,要在手机上做一些模型压缩工作,手机芯片也要升档。量化压缩,重新做模型压缩工作。该公司表示,小模型可以从大模型中复制,并且可以落在手机上。

同声传译,我们打电话给外国人,他说英语,我听中文,如果是视频,也可以帮助你对口型。我们可以和聋哑人、手语对话和盲文翻译。歌曲创作,你哼几段,然后续集。

搜索,过去要非常准确,现在不需要准确,一个模糊的词也可以让你想要搜索什么。当然,你可以使用手机,平板电脑,PC、电视互通。

给出一句话,一个 32 年轻女性的自然保护者在丛林中冒险,带着亲切的微笑为你制作了这张照片。中间的照片只拍了一点,现在已经延伸了。也许你只有半身照片,现在可能是全身照片。

现在我们的手机有前拍和后拍。现在我们可以同时使用它们。我们可以将前拍的照片嵌入后面。当然,我们需要调整光线。这是自拍的合成。

这种大模型的实施将催生新一轮的创新,降低用户生成三维视频的门槛。很多年前,我们的手机通常在一年半内更换,但近年来没有这样的需求。在未来,更多的实际推广依赖于用户生成内容,大型模型落在手机上,可以提高用户的内容水平。我们不仅消费,还有健康、养老、监护和教育。最有价值的是工业应用程序。你可以落在手机、机器人和工业模块上,这可以带来新的飞跃。

IDC 预测到 2026 年中国市场超过 50% 会有终端设备处理器 AI 引擎,我们认为,它将使中国的互联网产业走出低谷,并将迎来令人兴奋的井喷式发展。

数字经济说了很多,其实我们未来的大模式为数字经济增添了新的能力,我在这里回顾一下 90 全球市值最高的前十名主要是日本银行,2000 年主要是红色的,是美国的 IT 企业,2010 2020年是能源、金融和能源 年又回到了互联网的主导地位,中国的阿里巴巴和腾讯也在上面,直到今年 12 现在可以看到月份,除了食药公司,基本上还是有的 IT 和 IC 企业,我们说数智化企业是最重要的,数据是主要的生产要素。

谢谢大家。

广告声明:文本中包含的外部跳转链接(包括不限于超链接、二维码、密码等形式)用于传递更多信息,节省选择时间。结果仅供参考。计算机系统网络上的所有文章都包含了本声明。

相关阅读