中国国内对开启AGI(人工通用智能)未来之门的LLM(大语言模型)的技术本质认知、场景技术应用和相应的商业化探索之速度与深度,超越想象。
(资料图片)
2022年12月,OpenAI推深具革命意义的ChatGPT应用。此举再次引爆国内技术公司追捧AI的无比热情:半年内,中等规模技术公司、技术创业类公司和技术应用平台型公司,均不同程度扎进此轮AI技术创新和应用大潮。
研发AI技术应用的软硬件产品固然重要,但商业组织最高层级掌舵人对AGI的技术理解和未来形态之预判,才是真正观察一家商业组织在AI新技术发展浪潮中,具备何种竞争力、能走多远的关键。
近期,中科创达展示了其包括Rubik Language基础语义大模型在内的AGI多种软硬件产品,而从中科创达执行总裁邹鹏程对LLM的认知和未来形态的理解与预判、商业应用深度与战略布局的阐述可知,中科创达是除了平台巨头和创业类技术公司之外,位于中间层的中等规模技术公司,推进AGI技术商业探索的样本主流。
AGI底层技术逻辑路径探求
一周前,中科创达发布多种AGI产品类型,覆盖了从底层软硬件开发到终端应用的整个生命周期;同时中科创达还发布了智能原生操作系统、大模型研发方向与战略布局框架。在令人眼花缭乱的软硬件产品中,也包括了创达魔方大模型Rubik在智能汽车领域的新应用:Rubik GeniusCanvas。
尽管中科创达此次发布的AGI产品种类繁多,功能强悍,但真正值得关注的是中科创达对AGI的底层技术思考。
在明了这些技术思考之前,先要厘清基本概念。比如,什么是AGI?首先,AI(Artifical Intelligence),即人工智能,也就是“任何能感知环境并采取最适当的行动,从而成功实现目标之机会的终端设备,即为人工智能,也称机器智能”。
AI的核心要点有两个:感知和决策,即感知环境并采取最适当的行动,以提升实现目标的成功概率。
其次,由于机器智能(AI)与人类智慧存在极大差距,故若要追平或超越人类智慧,就需要更多AI能力:比如,存在不确定性因素时做推理、使用策略、解决问题和制定决策的能力;展现知识、规划、学习和使用自然语言做交流沟通的能力,以及综合运用这些新能力,以实现既定目标的能力。
拥有这些堪比人类智慧的新能力之后的设备,即可称为AGI(人工通用智能:Artifical General Intelligence)。人工超级智能(ASI:Artifical Super Intelligence)是这些AI设备的下一个发展阶段。
就ChatGPT4.0展现的AI能力来看,当前正处于AGI阶段。国内技术公司的AI探索,也保持了阶段同步。
那么,LLM和AGI又是什么关系?
从底层技术角度看,AGI是一种基于Transformer(语义理解和形成有逻辑的语言输出)架构的预训练语言模型。若要保证Transformer效果,就必须拥有一个超大语言模型,即LLM(Large Language Model)。
LLM是Google在2019年推出的巨型自然语言处理模型。这个模型拥有数万亿的参数,在多项自然语言处理任务上表现极为卓越。
美国有家AI技术公司“JUNLALA”:在LLM模型领域深耕多年,长时间持续探索和拓展LLM模型极限和边界。JUNLALA认为,LLM模型是通往AGI的必由之路;而AGI在关键技术领域的突破,离不开LLM模型规模的增长。
事实上,LLM模型规模正在各个领域持续快速增长。LLM模型涉及了众多垂类领域(场景),如办公会议、销售、B2B互动、搜索、Chat、法律、学术、会计和医学等众多应用或行业。
LLM涉及如此之多的产业(细分场景所在领域),AGI会否出现兼容问题?毕竟AGI是拥有部分人类智慧的AI硬件,其依然运行在现有的Andriod或Windows操作系统之上。
“可以把AGI看做是一套新的操作系统,或者可以用操作系统角度理解AGI。”科大讯飞联合创始人、未来智能董事长胡郁说,“从LLM的迭代速度看,AGI可能会以各种形式出现。如果AGI是操作系统,那么其在多种行业的存在,相互之间的兼容度将不再是个问题。”
LLM:新一代交互操作系统
与胡郁类似,中科创达执行总裁邹鹏程认为,各个产业的LLM,有人看成是技术,也有人认为是Date(数据),“我们从操作系统角度看,LLM有两个特征:复杂度和交互。操作系统诞生的原因只有一个,那就是应用,我相信LLM也是这样。”
看上去,邹鹏程和胡郁,分别从软硬件两个方面,做了AGI垂类场景技术解释。鉴于AGI和LLM的关系,胡郁和邹鹏程应当是同一个意思。因为胡郁还提到,“AGI时代,也可以把LLM本身看作是操作系统。”
邹鹏程提到LLM的交互特征,胡郁认为,“触摸定义了Smart Phone,这与AGI相比,属于上一代的交互模式产品;而技术规律是新交互模式,这将推动新的终端形式。”胡郁没有明确说新交互模式是什么,邹鹏程则认为,“LLM有能力实现自然交互梦想。”
什么是自然交互?与智能手机的触摸(Touch)交互形式有什么不同?简单说,自然交互,就是支持人与终端相互影响或作用的自然用户界面的技术。通过更自然、更直接的方式,人能操控AI终端设备(智能手机也是AI设备的一种)。
比如,最初的人机交互,需要通过键盘键入命令,或以鼠标实现对终端设备的操控。但是自然交互,无需键盘或鼠标,如现阶段操控智能手机的触摸式。在AGI时代,人机交互可能不需要触摸,仅用声音(目前已实现),甚至意念(尚未实现)就能实现与键鼠同样的功能。
自然交互很可能还包括基于LLM操作系统的新应用的产生过程。
邹鹏程认为LLM是新一代操作系统。“作为新的操作系统,LLM跟传统Android、甚至鸿蒙系统都不太一样:除了分布式,还有一个动态自发。也就是说,LLM可自动产生需求,自动产生应用,这从来没有过。以前的应用都要程序员做,需要花很长时间,现在操作系统终于也可以自动产生新应用了。”
自然交互的本质是让操作变得更加简单,这与操作系统的技术效果类似。操作系统本身的任务是解决复杂性问题:要能把复杂的软硬件,如云端计算,模型技术,翻译成用户能理解的价值。
操作系统的作用是什么?
“操作系统需要把LLM能力翻译成用户可接受的、或能很好交互的应用。”邹鹏程说,“三年前,我们研发了一个平台,就是WuChat。简单说,WuChat能让人和手机、车机等,相互之间用语言沟通。比如用户不通过任何软硬件,直接和电脑、冰箱、空调等的应用沟通操控。在这个基础上,我们提供了一整套企业工具,可做数据管理和数据标注。”
有必要指出,LLM分为通用公共大模型和垂类大模型。这两者之间,邹鹏程认为,通过分布式方式,能实现从通用到垂类规模的转换。
邹鹏程说,“无论LLM多聪明,它还是需要驱动硬件、安全性、实时控制、多媒体展示和分布式。”分布式的作用,是把数据和算力分配到合适的地方。如此,就能将不同形态的大模型Fine-Tuning(微调)成领域(垂类领域或细分场景)模型。
智能家居和汽车座舱应用
为何强调垂类LLM的必要性?建立通用LLM又需要什么能力?
邹鹏程说,“我相信,不管做技术、商务、甚至财务,大家都关注通用大模型。这需要融合算法、算力、数据和服务器,才能完成。”
从LLM技术发展的现状和趋势看,拥有通用LLM能力的公司不会太多,更多的公司会自己构建或与生态伙伴合作共同构建垂类LLM,并且会持续做出这些垂类LLM的能力优化。
中科创达也不例外。他们构建了Rubik Enterprise工具层,通过底层Rubik OS提供整个IT的支撑底座,两者结合,就能将LLM的能力,更好地为应用所用。
要实现垂类LLM能力为应用所用,还需要有各类硬件承载。就像胡郁说过的那样,“操作系统的本质是应用服务选取了哪类硬件作为标准载体。”中科创达推出了一种新型的硬件形态:Rubik device family。在呈现为应用终端时,这两者是软硬一体的形态。
如何应用?也就是说,如何商业化?
简单说,就是通过Rubik server、Rubik box和IDC(数据中心:Internet Data Center),结合前端服务和云端算力,为各个行业提供需求应用解决通道。
其中,Rubik box,面向用户(B&C),支持企业数据库、个人知识库,以及健康、医疗、宠物和厨房管理等等的应用。
从应用特性看,Rubik box除提供传统NAS(网络附属存储:Network Attached Storage)系统(注:NAS就是存储服务器操作系统)所具备的功能外,还有家居智能管理应用和汽车座舱应用管理。
举个例子,北京房山区的一个牛场,通过中科创达的WuChat和Rubik OS,实现了降本增效。
与降本相比,比如在应用中科创达AGI解决方案前——这个牛场的B端应用研发周期6个月起,应用之后,周期缩短至4-6周,流程定制效率提升60%——更重要的是实现了增效。
作为养牛专家而非IT专家,这个牛场在面临新需求时,原本需要重塑整个IT流程,现在通过中科创达的WuChat技术和垂类LLM,能将所有与牛相关的生理和环境数据、传感设备的各种变化等信息,直接读入并实现人和设备的协同,自动生成应用类解决方案。
在智能家居方面,中科创达服务过一个割草机厂商。应用中科创达垂类LLM和Rubik OS后,研发和维护时间从标准的30多人团队的人力和耗费9个月时间,大幅降低了时间和维护成本。
智能汽车的智能座舱,中科创达也通过Rubik Language(基础语义大模型)、Rubik Copilot(编码效率工具)、Rubik device(垂类LLM部署工具)和Rubik GeniusCanvas(智舱设计插件)等工具,实现智舱环境更为engaging(有趣的)的界面。
其中,Rubik GeniusCanvas基于中科创达智能编码大模型Rubik Studio、汽车HMI设计软件与3D引擎Kanzi构建,能为设计师提供从概念创作、3D元素设计、特效代码生成以及场景搭建制作等方面的超强智能辅助。
通过Rubik GeniusCanvas,设计师只需一些简单的语言对话,Rubik GeniusCanvas便可按照要求设计图像与构建模型等,极大提升了汽车座舱HMI的设计效率与质量。
短短数千字,很难完全解释中科创达对LLM和AGI技术(应用)两者关系的技术底层逻辑理解深度的全貌。从当前中科创达应用案例的能力,不难看到,这家技术公司的商业前景,正在“AI+”的加持之下,走向更为广阔的新技术蓝海。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。关键词: