视觉智能的未来:从感知到认知的产业实践
2020-08-26

近日,湾区AI前沿盛会“2020全球人工智能和机器人峰会(CCF-GAIR 2020)”在深圳举行。本次峰会由雷锋网联合中国计算机学会,香港中文大学(深圳)举办,聚焦AI新基建浪潮下的产业发展新机遇。暗物智能科技(以下简称“暗物智能”)联合创始人兼CEO林倞受邀出席大会「视觉智能·城市物联」专场会议并发表演讲,与来自华为、京东、微软等科技巨擘的顶级专家共同探讨视觉智能的未来。

AI如何从感知走向认知?三个关键值得注意

会上,林倞发表了《从感知到认知——多模态人机互动的产业实践》的主题演讲。从人工智能产业现状入手,梳理了AI从感知走向认知的三个关键发现,并展示了暗物智能强认知AI技术的落地实践成果。

当前人工智能发展到了什么阶段?阿里巴巴达摩院在今年年初发表的科技趋势报告中指出,人工智能的趋势是从感知智能向认知智能演进。目前,人工智能在“听、说、看”等感知智能领域已经达到甚至超越了人类水准,但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。

跨领域知识图谱、因果推理、持续学习等技术,以及认知科学等跨学科研究,将有望为AI建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,实现从感知智能到认知智能的关键突破。

那么,在这个AI从感知向认知过渡的时期,我们应注意哪些问题?林倞分享了三个观点:

首先,即使是感知层的智能,目前的计算机视觉和人工智能系统依然存在较大局限性。林倞提到,一是成本问题。当前很多成功的人工智能应用,不管是自监督还是网络搜索的方法,本质上都是依靠大量的数据,通过亿万参数的神经网络去学习和训练,最后进行分类和回归,一定程度上导致人工智能的应用成本长期居高不下。二是稳定性、鲁棒性并没有达到或真正超越人的水平。

其次,感知智能和认知智能不可分割,必须统一在计算过程中。脑科学研究发现,人的大脑皮层感知区和认知推理区域是不可分割的,视觉跟语言的大部分理解主要依靠想象和推测,而非依靠大数据的感知。林倞举例说,一个婴儿12个月以后会说话,会推测他人的意图,但目前AI的智力水平甚至不足12个月大的婴儿,远未达到认知智能。AI系统欠缺的是推测他人意图的能力。

最后,什么才是认知人工智能?林倞提出了第三个观点:所谓的认知人工智能,必须要理解人的意图,懂因果,可解释。例如,暗物智能的桌面陪伴机器人在指导孩子做数学题时,可以通过丰富的方式与人交互,能看到、能听懂、能回复,甚至能知道计算数学背后的因果逻辑,并且以高自然度的方式与人交流。这就是AI从感知跨越到认知的一种体现。

深入行业场景,暗物智能引领认知AI产业实践

当前,AI新基建正为众多产业换代升级带来新的机遇。暗物智能作为新一代强认知AI引领者,正致力于将认知人工智能及多模态交互技术应用于产业实践。

例如,教育领域普遍存在因材施教难、教师工作负担重、教学资源分配不均等痛点。但目前大多数依赖大数据和题库的AI+教育产品缺乏精准的指导,无法引导学生走出盲目刷题的怪圈。

林倞认为,教育行业要求教师适应不同教学场景完成各类授课任务,且师生之间存在大量交互。这与新一代认知AI在智能化认知推理、高自然度强交互等方面的独特优势高度契合。认知智能技术的深入运用,将突破传统感知智能的技术局限,引领教育走向真正的个性化、规模化,实现商业模式的创新升级。

对此,暗物智能深入教育场景,在该领域已打造涵盖学前教育、K12、在线教育的产品矩阵,形成用户生命周期完整闭环。

针对学龄前儿童家庭陪伴学习场景,暗物智能研发了具有高度自适应能力的桌面机器人,能根据孩子学习参与度主动调整教学方式。产品在美国亚马逊等购物网站电子类教育产品中排名第一,并获得“Mom's Choice Gold Award”等多项大奖。

针对K12学段,推出集讲题、辅导、批改为一体的认知AI学习服务平台,具有业界首创的自动讲题功能,率先在数学学科实现全题型自动求解与标准化讲解,助力教培机构改善讲解质量、提升服务效率。

此外,当前线上教育发展迅速,而高效可靠的课堂学情及教情分析能力,对教培机构打造差异化优势、提升核心竞争力至关重要。为此,暗物智能研发基于认知AI的教研分析云平台,融合多模态AI技术,打造全方位、跨平台的AI可视化教学分析系统。

在教育行业之外,暗物智能亦发挥强认知AI平台在认知推理、人机交互等方面的独特优势,向金融服务、游戏、电竞等新兴行业延展,成为认知AI走向产业实践的范例。

上一篇
为DNN“科学瘦身”!暗物智能前沿技术入选ECCV 2020 Oral