AI 大模型进一步释放自动化
发布时间:2023-04-29 09:53

基于大语言模型,九游会ag自动化将能够到达第三个发展阶段

4 月 25 日,由中国科技产业智库「甲子光年」主办、上海市信息服务业行业协会支持的「共赴山海 · 2023 甲子引力 X 智能新世代」峰会在上海顺利召开!

36 位嘉宾齐聚本次峰会,全方位聚焦新一代人工智能,为科技与产业的结合寻找新机会,层层剖析中国科技产业新风向和趋势判断,一起驰骋在智能新世代,共同探寻智能新世代的过去,现在和未来。

当天下午,澜码科技创始人 &CEO 周健带来了《智能新时代下自动化的新思考》的分享。

周健表示,任何技术的突破都会存在明、暗两条线。明线是应用场景不断被解锁,暗线是技术应用的成本下降、技术走向 " 平民化 "。以往基于 RPA 技术实现的自动化需求,将在 AI 大模型的加持下变得更加容易,进一步释放自动化的价值。

此外,周健还分享了他对自动化三个发展阶段的理解和预判。他表示,当前大语言模型下,我们正处在部分自动化的第二阶段。而真正到了完全自动化的第三阶段时,机器就能够完全自动的帮助我们实现各种我们需要的操作,相信这一天也会在不久的将来到来。

以下是澜码科技创始人 &CEO周健演讲实录,「甲子光年」整理删改:

大家好,很高兴能够在此与大家分享智能时代下我们对自动化发展的新想法。

1. 三位一体结构演化模式

首先简单自我介绍一下,我毕业于上海交大计算机专业,2002 年获得 ACM 国际大学生程序设计竞赛世界冠军,当时我们是第一个获得这项竞赛冠军的亚洲团队。2006 年我加入谷歌美国总部,负责中文网站搜索质量优化,在之后的职业生涯中,我在阿里云、MediaV、依图科技等工作过,我创业前的上一个身份是弘玑 RPA 公司 CTO。这些经历和学习,让我能够比较深入了解 AI 和自动化等领域。

澜码科技是一家基于大语言模型的自动化平台公司,致力于人机协同、人机融合、人机共生等领域的研究和探索。

前不久,陆奇博士分享了 " 三位一体结构演化模式 ",本质是讲任何复杂体系,包括一个人、一家公司、一个社会,甚至数字化本身的数字化体系,都是复杂体系。

" 三位一体 " 包括:" 信息 " 系统,从环境当中获得信息;" 模型 " 系统,对信息做一种表达,进行推理和规划;" 行动 " 系统,我们最终和环境做交互,达到人类想达到的目的。

陆奇博士比较好地描述了新时代下的三个科技发展系统,让人们可以更多地从 AGI 的视角下看待机器的不同功能。第一个信息系统其实就是信息化系统,例如记录供应链、HR 等信息,它对于 AGI 而言是一个感知系统。

模型系统其实就可以对应到现在的 AI 大模型,模拟人的语言生态。其中语言模型相当于大脑,各种各样的信息系统相当于手、脚,但仍然需要一个神经中枢,将人类的意图通过大语言模型翻译为不同的软件操作,这个过程实际上就是所谓的自动化。

过去,工业革命时代自动化是工厂里替代蓝领工人的工具。AI 时代则有机会通过越来越多、越来越便宜的智能涌现,替代白领办公室里重复性的知识劳动,让他们将精力集中在创新性的工作上。这也是自动化软件所定位的方向,也就是第三个行动系统。

2. 技术成本降低,并催生新的应用场景

接下来是我的一些个人感受。从 2015 年 AlphGo 以来的两次 AI 浪潮,两次 AI 革命的主要发展方向是图像识别,因为深度学习技术的出现,许多计算机视觉技术变得更加普遍易用,其中最典型的例子是人脸识别技术。

下面这张是我在上一家公司画出的人脸识别图像技术发展趋势,随着技术的突破,模型参数能够达到 20 亿的指标。显而易见,技术的不断进步带来了新的应用场景。

在 2014-2015 年,我们只能进行人和身份证的比对,类似于酒店登记时的应用。后来在银行的手机端,我们能够进行活体检测,例如眨眼、张嘴、左右转头,这是 2015-2016 年的水平。现在,我们能够实现人脸闸机、门禁以及安防场景下的人脸搜索,甚至在摄像头下实现人脸识别。随着技术的不断革新,新场景也不断涌现。

现在的市场环境,已经和 2015 年相比有了巨大变化。最初我们在做 CV(计算机视觉)的时候,市场上没有任何的图像识别供给,花 100 万可能都买不到一套。而现在 OCR 识别身份证成本只需要 1-2 万元,非常低。大 B 端采购 70-80 个 AI 模型可能只需要花费百万元。这是一个典型的,技术曲线从底层快速拉升,再到 " 天花板 " 的过程。