聊天机器人(行情300024,诊股)ChatGPT爆红全球,掀起AI浪潮。一时间,人工智能生产内容(AI Generated Content,AIGC)也再次被推上了风口浪尖,国内外科技巨头争相布局。
随着新市场的打开,AIGC将如何影响资本行业的发展?人工智能的发明终究会对人类产生怎样的影响? 结合当下ChatGPT,金融界推出《颠覆——人类与 AI 之争》特别策划,对话新闻传播、服务行业以及前沿科技等领域专家、学者,探讨人工智能新技术如何驱动经济发展,实现新旧动能转换,促进产业生态的良性发展。
本期嘉宾:旷视研究院基础科研负责人张祥雨
核心观点:
◎人工智能作为新一轮科技革命和产业变革的核心力量,会在未来几年更快速地发展和应用,从而改变我们的世界。
◎ChatGPT 在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的 AI 产品。但对于常识建模、尤其是数学逻辑能力比较欠缺,对数字的敏感性不强。
◎“AI in Digital”和“AI in Physical”是两条不同的技术路线,相辅相成,对我们的未来会产生根本性的影响。
以下为对话全文:
金融界:请您谈一下最新风口上的ChatGPT,将会给人工智能带来哪些变革?
张祥雨:人工智能作为新一轮科技革命和产业变革的核心力量,从底层推动着社会生产力的提升。我们相信,人工智能会在未来几年更快速地发展和应用,从两个方向改变我们的世界。
一是“AI in Digital”,即以 AIGC 为代表的技术浪潮,通过重构内容生产力,让数字世界发生变革。二是“AI in Physical”,即以特斯拉为代表的企业,通过构建不同形态的机器人载体,对物理世界进行改造。
ChatGPT 在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的 AI 产品。 如果我们从智能的角度看,AI 要能完整模拟人脑,大概是“感知-决策-执行-反馈 + 知识/记忆”这几个模块。ChatGPT 的核心技术是 AI 语言大模型,关键是如何让 AI 模型具备逻辑推理能力,以及如何让 AI 学习全互联网的知识。ChatGPT 基本都做到了, 因此在决策和知识这个环节有了很大的突破。但是它基本上是没有跟物理世界发生关系,包括输入和输出。
我们会发现,人类在物理世界的生存能力和基础运动能力,看似简单,其实经过漫长的进化,底层机制是更难被破解的。某种意义上来说,是一种更难学习的智能。 “AI in Digital”和“AI in Physical”是两条不同的技术路线,相辅相成,对我们的未来会产生根本性的影响。“AI in Digital”背后的生成式大模型也为“AI in Physical”的发展带来了新的机遇。旷视的技术愿景是“AI in Physical“,通过构建底层统一的感知 -决策-执行技术体系,做真正影响物理世界的 AI 技术创新。
金融界: 你认为ChatGPT存在的瓶颈是什么?
张祥雨:自从ChatGPT发布之后每天都在体验。我主要关注它的逻辑能力,而不是知识容量。给我最大感受是多轮对话、语义理解能力很强,语言逻辑非常流畅,在高阶的指代关系推理、思维链(chain-of-thought)方面做得也很好。但是对于常识建模、尤其是数学逻辑能力比较欠缺,对数字的敏感性(比如大小关系等)不强。总体上来讲,还是非常超出预期的。虽然在此之前我们已经接触过很多语言大模型,但ChatGPT的出现还是让我感觉技术又前进了一大步。
ChatGPT 在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的 AI 产品。
期待国内能够培养出更多有前瞻能力、能出题的帅才,提出好的课题,带领团队做出具有原创性的科研成果。
金融界:如何看待 ChatGPT 的应用趋势?旷视研究院的核心科研成果有哪些?
张祥雨:从能力上来说,ChatGPT 背后的关键技术底座是生成式大模型;从公司自身角度谈起,模型设计能力是旷视研究院多年以来积累的核心能力。我们围绕“感知算法+算法量产”,不仅在算法模型上有深厚积累,而且还可以将算法生产的全过程实现标准化,从而形成了自己独特的技术优势。
旷视研究院的核心科研成果包括AI生产力平台Brain++ 、开源深度学习框架旷视天元MegEngine、AI算法生产平台AI Service、移动端高效卷积神经网络ShuffleNet等多项创新技术和产品。随着预训练大模型技术在近几年的快速成熟,旷视研究院围绕通用图像大模型、 视频理解大模型、计算摄影大模型和自动驾驶感知大模型四个方向积极布局,并取得了多项突破。比如,在通用大模型方面,旷视提出了RepLKNet、RevCol等创新性模型。在自动驾驶感知大模型方面,旷视提出的PETR系列大模型、 LargeKernel3D和BEVDepth 3D检测模型在检测、分割等任务上均取得了最优成果。