ChatGPT所引领的AI热潮,将改变各行各业生态,对数据中心及算力需求扩大。这款生成式AI聊天机器人上线两个月,活跃用户数就超过一亿,更因访问激增多次引发宕机。
ChatGPT的爆火迅速引发了新一轮的人工智能竞赛,国内外科技巨头纷纷启动此类AIGC产品规划: 谷歌宣布推出竞品Bard,并召开发布会展示; 微软推出集成ChatGPT技术的Bing和Edge浏览器; 百度表示正打造“文心一言”,于3月正式推出; 阿里达摩院研发类ChatGPT产品开放内测; 京东宣布推出产业版ChatGPT——ChatJD;快手正在开展大规模语言模型研究……
ChatGPT将引发的改变远不止这些,正如比尔·盖茨的评价“(这)不亚于互联网和个人电脑的诞生”。AI的训练和推理都需要大规模算力支撑,国家战略“东数西算”也会加快建设。ChatGPT带来的AI火爆无疑将带来算力需求的爆发式增长,也将对算力基础设施——数据中心和计算设备带来长远改变。
在人工智能技术的发展历程中,ChatGPT代表了自然语言处理技术的一个重要突破,为语言模型的研究和应用提供了新的思路和方法。ChatGPT的成功表明,通过大规模数据的训练和深度学习技术的应用,人工智能可以在自然语言处理领域取得更好的表现。因此,可以说ChatGPT代表了人工智能技术的进步和创新,但它并不是整个人工智能的革命,因为人工智能技术的进步还需要依赖于许多其他方面的技术和应用,例如计算机视觉、机器学习、自动化等等。
一、人形机器人
ChatGPT 促进了人机交互能力的提升,加速了算法的采用。NLP技术带来的人机交互能力,只有人形机器人才有必要,尤其是C端场景。截至2022年10月,Tesla已经发布了Optimus人形机器人原型机,需要配合算法,形成全面的软硬件协同才能落地。我们认为ChatGPT有望提升人形机器人的人机交互能力,加速人形机器人体验的提升。在场景2C中,人形机器人需要基于NLP的人机交互能力。人形机器人在与C端用户打交道时,由于其人形形态特征,需要人机交互能力作为接受指令的入口。在人机交互技能中,NLP能力无疑是重中之重。人形机器人必须能够理解人类的指令才能更好地完成各种任务。基于NLP的人机交互能力是类人机器人所需要的。
特斯拉Optimus人形机器人原型机于2022年10月发布,将在上海进博会上首次面向公众展出。2022年10月1日,特斯拉在AIDay发布了人形机器人Optimus原型机,并于2022年11月5日在上海进博会上展示了原件,现场展示的是附壳的二代机。虽然由于交货时间短,运行功能还不成熟,但现场展示版直立不动,但完成率高现场视频显示,样机已经可以完成物体搬运、浇花等动作。这是TeslaBot首次面向公众展示,为后续B端、C端落地埋下伏笔。
二代版本训练时间短未能行走,还有出色的组合动作和手部动作。装壳的最新版本(2代Optimus),这个版本刚出厂还没有完全训练,现场也没有展示其行走功能,但视频显示了四肢和细微的手部动作组合,指关节快速执行1、2、6、拳头等动作,展现高精度、高灵敏度,为未来功能迭代留下巨大想象空间。
以 AI 算法为核心的运动迭代展示了开创性的想法,从艰难移步到双脚离地快速行走用了 5 个月的时间。在特斯拉之前,本田ASIMO与波士顿动力机器人等其他人形机器人已经存在很长时间,能够实现的功能一般为直立行走、挥手、握手、搬运物品、拧瓶盖等。根据特斯拉发布会的官方公告,Tesla Optimus 仅开发了六个月,但已经基本实现了直立行走、挥手、给植物浇水、搬箱子等算法功能。一口气提升 4个月,软件迭代高效。此时,由于二代机才到货一个月,还没有完全调试好;但是,我们希望二代机在落地之后能够在应用中快速学习,实现快速的技术进步和可迭代性。
机器人共享汽车自动驾驶算法
机器人是智能手机的超越版本,单靠硬件无法实现,需要与软件算法协同工作,形成全面协同。 统一的硬件是机器人运行的基础,需要高精度、高灵敏度和高力矩以满足各种活动对机器人活动能力的要求。机器人的实际功能是通过综合算法来实现的,需要智能感知能力、运动控制能力、感控一体技术和AI算法等软硬件能力的综合配合。总之,硬件是机器人的躯体,软件是机器人的灵魂,软件与硬件的结合,灵魂与肉体的结合,才能构成一个完整的、可用的智能机器人。特斯拉的机器人产品迭代过程以及大量的算法和软件发布表明,软件的生态进步是推动当前机器人应用场景实现的关键因素。
特斯拉人形机器人拥有强大的AI软硬件完整备份,增加了后续开发的效率。除了对感知和控制算法的高要求外,人形机器人应用训练需要密集的计算负荷、强大的硬件平台以及合适的软件开发工具和框架;同时,迭代改进的算法模型可以提升AI芯片的性能,帮助解决长尾场景难题。软件、硬件和AI算法的融合,更有利于进一步激活生态,促进机器人未来场景的拓展。
算法框架和AI软硬件加速训练的备份,TESLAOT将进入快速迭代时代。强大的算法框架和AI软硬件储备才是机器人功能实现的真正核心。未来随着FSD的逐渐成熟和DOJO的落地,其算法和数据的闭环将进一步夯实。人形机器人在各种场景下的准确度和灵敏度训练将更加容易,TESLABOT将进入快速迭代时代。
我们认为ChatGPT有望提升人形机器人的人机交互能力,加快算法迭代过程,提升机器人体验升级。ChatGPT的出现进一步推进了NLP技术前沿,使人机对话体验不断优化。如果接入机器人应用,有望带来更好的人形机器人交互体验,加快人形机器人的落地过程。
二、AI 语音语义
NLP 技术正在不断优化被认为是AI皇冠上的明珠。对话式AI和知识图谱正在推动行业发展。到2026年,国内NLP驱动的相关产业规模可破千亿。我们认为,ChatGPT算法的突破,进一步提升了NLP技术的天花板,有望加速NLP技术在千行百业中的应用。
NLP被誉为人工智能皇冠上的明珠,由于语义理解需要海量数据让AI理解常识而壁垒较高。NLP或者说自然语义理解,技术上是指让人工智能理解人类预测背后的含义。NLP衍生的应用涵盖方方面面,包括机器翻译、AI应答机器人等。从技术角度来看,如果要让人工智能理解人类语言,最大的难点在于让机器理解人类对话背后的海量常识设定。因此,NLP训练需要海量数据,比训练其他AI技能难度更大,因此被称为“人工智能皇冠上的明珠”。
对话式人工智能和知识图谱正在推动工业规模的增长。到2026年,国内NLP驱动的相关产业规模可突破千亿。与其他人工智能技术相比,NLP一般不作为独立产品出售,而是作为一项基础技术,结合智能语音和知识图谱等技术,通常以对话式人工智能、机器翻译、知识库等形式出现,产品不断涌现,在独立生产模块的情况下,开发速度较慢。近两年,在对话机器人应用的推动下,智能知识库、分模块对话、对话语义理解、评论正负识别、对话自动输出等NLP产品迎来了发展机遇,并伴随着通用或垂直行业知识的发展在图谱构建中,NLP 与知识图谱的绑定关系将更加紧密。据艾瑞统计研究,到2021年,中国NLP核心产品规模将达到171亿元,带动规模将达到450亿元,到2026年,核心产品规模将达到459亿元,驱动规模将超过1000亿元。
我们认为,作为NLP模型,ChatGPT算法的突破带来了NLP技术的进一步提升,有望加速NLP技术在智能语音、智能客服、机器人等各个行业和领域的应用。
三、AI 视觉
AIGC方兴未艾,图像识别技术进入落地阶段,有望催化进一步迭代。一方面AIGC技术方兴未艾。这种基于AI的人工智能创作有望在未来彻底改变内容生产方式,而NLP能力是其生产力的重要组成部分。ChatGPT有望加速其技术迭代。另一方面,AI图像识别技术进入广泛应用阶段,以海康威视、大华为首的龙头企业已将该技术应用于G端安防、B端产业/文旅等领域,助力降低成本和提高效率。
1、图像识别技术已经相对成熟,进入广泛落地阶段
人工智能图像识别技术进入广阔应用阶段,以海康、大华为首的人工智能视觉领军企业已将技术应用于安防、工业、文旅等领域。海康、大华等企业以愿景为切入点,落地AI应用,赋能千行百业降本增效。基于人脸识别、温度识别、动态追踪等技术,海康、大华等人工智能龙头企业为制造、旅游、金融等行业提出了智能化解决方案,有效降本增效。
1)在制造业,老板车间与海康威视合作,实现AR数字车间,助力智能生产。海康威视利用AR视频技术结合企业生产信息化,推出AR数字车间业务,为老板电器无人工厂“九天中枢”智能制造平台提供助力。AR数字车间可以在直观的物理世界屏幕上为现场管理人员提供生产线和设备的实时数据,并将大量视频画面、生产数据和设备数据组合成一个视图,帮助企业更快地应对突发事件;还可以将现场人员与管理人员或远程专家联系起来,提供远程实时指导;同时,通过视频图像可以确定分配给高周转量产品的线边空间量,实时监控装卸、计划数据、产出数据,帮助公司优化空间。
2、AIGC技术方兴未艾,基于NLP技术未来有望创新内容创作方式
AIGC是一种利用AI技术自动生成内容的生产方式,包括文本、图片、视频等多种形式的内容。AIGC 是基于人工智能的内容生产,一般来说,使用形式是将需要生成的内容通过句子以一定的格式描述出来,然后让AI系统自动生成文字/图片/视频等。目前,国内外已有多家厂商在AIGC领域布局,比如国内的 AI 小说续写软件彩云小梦、OpenAI 推出的 AI 绘画 模型 Dall-E、知名 AI 绘画网站 midjourney 等。