高峰:从私域AI到具身智能
高峰:从私域AI到具身智能- 相关专题top start-->专题:2024中国 AIGC创新发展论(lùn)坛
2024年服贸会(huì)专题论(lùn)坛之一——“2024中国AIGC创新发展(zhǎn)论坛”于9月13日-14日在北京举(jǔ)行。智子引擎产(chǎn)品(pǐn)副总裁高峰出席并演讲。
高峰介绍,和大多数大(dà)模型企业一样,过去一年,智(zhì)子(zi)引擎在垂直领域中做了很多落地项目,但(dàn)经过(guò)内部复盘,发现很多多模态大(dà)模(mó)型的(de)能力其实还没有被企业充分利用(yòng)。传统(tǒng)企业和我们AI大模型公司之间,似(shì)乎隔着一层“窗户纸”。因此,公司决定 走一条艰难但(dàn)有效的路(lù),这条路就是私域(yù)AI。“我们重新思考,企(qǐ)业与AI公司的关系不应(yīng)该是供(gōng)需关系,而应是共创关系”。
“积跬步,行千里”,高峰(fēng)说(shuō),开发私域AI解决方(fāng)案的过程,也是(shì)在帮助Awaker逐步认识和(hé)理解世界。“我相信,当我们积累到一定程度时,先进的生产力将会爆发,而那(nà)时我们就可以进行更为(wèi)先进的通用层面的整合。那将是一个新的时机,作为一个技术创新型企业,我们更 多的是把自己(jǐ)定位在创新领域,推动AI给产业的赋能”。
以下(xià)为演讲实录:
高峰:尊敬(jìng)的各位来宾(bīn),大家好!非(fēi)常荣幸能代表智子引擎科技有限(xiàn)公司分享我(wǒ)们(men)的科研成果(guǒ),今天我演讲的主题是《从私域AI到具身智能》。
首先,我想谈谈(tán)过(guò)去一年我们(men)所做(zuò)的工作(zuò)。和大多数大模型企业一样,我们在垂直领域中做了很多落地项目,但经过(guò)我们内部的复盘,发现很多多模态大模型(xíng)的能力其实还没有被企业充分利用。传统企(qǐ)业和我们AI大模型公司之间(jiān),似(shì)乎隔(gé)着(zhe)一层“窗户纸”。因此,我(wǒ)们决定走一(yī)条艰难但有效的路(lù),这条路就是私域AI。我们重新思考,企业与AI公司的关系不应该(gāi)是供需关系,而应是共创关系。
接下来,我将从四个方面展(zhǎn)开我的分(fēn)享。首先,请允许我简单介绍一下我们公司。
智子引擎科技有限公司的科研人员主要(yào)来自中国人民(mín)大学高瓴(líng)人工智能学院,我们的核心团队曾参与智源(yuán)研究院的悟道·文澜项目。我们研发(fā)了国产首个国产(chǎn)多 模态大模型。
接下来介绍一下我们的“孩子”——Awaker,中文名叫觉醒者。我们希望(wàng)Awaker能像人的大(dà)脑一样(yàng)进行思考决策,赋予企业流水线和机器以生命(mìng)。Awaker可以像普通人一样思(sī)考,也可以像领域专(zhuān)家或技(jì)术工人一样思考。它由三部分能力组成:对话(huà)能力、检 索能(néng)力和生(shēng)成能力。你可以从拟人化(huà)的角度来(lái)理解它,它能够对话,能(néng)够感(gǎn)知外部(bù)环境,但这(zhè)种感知基于数据进行。Awaker还能生成我们需要的一些指令,涵盖感知、理解、决策、规划和控制。这些能力可以应用于有形的(de)硬件(jiàn),比如四足机器人或两足机器人,也可以应用于无形的(de)系统,比如程序(xù)大(dà)脑(nǎo)、企业大(dà)脑(nǎo),甚至私(sī)人管(guǎn)家。重点在于(yú)Awaker如何感知、理解、决策、规(guī)划并最终实现控(kòng)制。
感知可以(yǐ)通过语言交流(liú),也可(kě)以通过声音传感器接(jiē)收音频信号,当然还包括温度、湿度等复杂的(de)传感器。Awaker通过多模态数据融合(hé)理解外界 信息,基于之(zhī)前学习的知识进行决策和规划。如果是在硬件上,它可以控制(zhì)机械臂;如果是(shì)在软件系统中,它可以控制API,执行各种操作。
这就是(shì)我们所(suǒ)谓的“多模态输入、多模态输出”架构(PPT图示)。输入形式是多模态(tài)的,比如(rú)文本问答、图片问答、声音问(wèn)答。在专业领(lǐng)域,还包括通过传感器(qì)采集的数据。Awaker通过多模态融合理解(jiě)这些(xiē)数据后,能进行(xíng)决策(cè)、规划和控制。
前面提(tí)到(dào)的共创关系,意味着企业不只是提供数据,而是提供(gōng)学习素(sù)材。大模型(xíng)通过学习这些素材得到只是。大模型出厂时,可能就像(xiàng)一个有强烈求知欲望的孩子,但如(rú)果没有学习材料,它仍(réng)只是一个普通的孩子。我们和企业共创(chuàng),打造先进(jìn)的生产工具。私域AI为企业提供的不仅是降本增效,更是提升核(hé)心竞争力(lì)的关键。
接下来,我讲一个实际案例——无人机巡检。传统(tǒng)无人(rén)机通过摄像头、激(jī)光雷达等传感(gǎn)器采集(jí)农场数据,传输(shū)到大模型数据分析中心,检测农作物是(shì)否异常。如果异常,传统小模型会直接发(fā)出警告(gào)。而(ér)Awaker具(jù)备农业领域的知识,它不仅能识别病虫害,还能生成(chéng)一整套解决(jué)方案,告诉维修人员需(xū)要用(yòng)什么农药、喷洒多少、具体喷洒(sǎ)位置,并通过API下发工(gōng)单给(gěi)相关人(rén)员(yuán)。如果配备了(le)喷洒农药的无人机,Awaker可以(yǐ)直接 生成报告,并下发(fā)任务,自动(dòng)规划喷洒路径并执行作业(yè)。
这套框架还可应用于搜救任(rèn)务,如无人机通过(guò)传感器感知受灾区域并生成救援路(lù)径。
第二个例子,我们(men)先看一(yī)段视频。
(现(xiàn)场播(bō)放 视频)
通(tōng)过这个视频大(dà)家可以(yǐ)看到,企业内部的系统大多是通过点击功能模块来(lái)进行操(cāo)作的。而在AI时代,我们提前预置了指令。大模型能够理解自然语言,在刚才(cái)演示的变电(diàn)站案(àn)例中(zhōng),控制(zhì)的最小动(dòng)作其实是通过API来实现(xiàn)的。用户发出的自然语言(yán)指令被(bèi)系(xì)统理解为中文,之后(hòu)与(yǔ)原子动作相关的API进行匹(pǐ)配,并最终输出结果。对于(yú)大模(mó)型来(lái)说,这没(méi)有什么(me)神秘之处,关键在于企业需要为大模型提供 学习材料,比如相关的知识文档。大模型能够(gòu)自主学习(xí)这些内容,从而提升其能(néng)力。
接下(xià)来(lái)谈一下我们的未来规(guī)划。我们希望(wàng)与传统企业共创,走私域AI解决方案这条路。虽然过程(chéng)中可(kě)能会遇到很多不确定性,但先进的生 产(chǎn)力和优秀的解决方案,往往是在双方紧(jǐn)密合作中迸发出(chū)来的。如果仅仅是供需关(guān)系,企业可能只会将自己认(rèn)知范围内的问题交(jiāo)给大模型处理,但真(zhēn)正(zhèng)有(yǒu)效的合作是要让大模型参与到企业的核心生产流程中,重塑整个流水线和生产环境(jìng)。如果(guǒ)结合云 边协同,整个(gè)大模型将变得更(gèng)加强大,因为城市(shì)中的(de)摄 像头(tóu)、巡逻车(chē)、无人机等都会(huì)成为大模型的传感器(qì),城市中各(gè)个(gè)单位的(de)工作职责和路线关系都可能因此发(fā)生变化(huà)。
“积跬步,行千里(lǐ)”,我(wǒ)们开发私域AI解决方案的过程,也是(shì)在帮助Awaker逐(zhú)步认识(shí)和理(lǐ)解世界。我相(xiāng)信,当我(wǒ)们积累到一定程(chéng)度时,先进的生产力将会爆发,而那时我们(men)就可以进行更为先进(jìn)高峰:从私域AI到具身智能的通用层面的(de)整(zhěng)合(hé)。那将是(shì)一(yī)个新的时(shí)机,作为一个技术(shù)创新型企业,我们更多的是把(bǎ)自己定(dìng)位在创新领域,推动AI给产(chǎn)业的赋能。
最后,我真诚期望有更多的合作伙伴加入(rù)到我们的AI事业中,与我们共同打(dǎ)造新质(zhì)生产力,推动先进流(liú)水线的发展。我的分享到此(cǐ)结(jié)束,感谢大家的聆听。
新浪声明(míng):所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实(shí)其描述。
责任编辑:梁斌 SF055
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了