您所在的位置:长平澉东信息门户网>科技>十年磨一剑,AI落地惊人,这样的“智能语义理解大脑”才够炫
十年磨一剑,AI落地惊人,这样的“智能语义理解大脑”才够炫
发布时间:2019-10-17 02:14:15   点击数:887

[云搜索网北京]10月12日报道(文本/奇点)

在人机交互技术方面,业界仍在进行各种探索和尝试。人机交互的技术分类包括基本交互技术、图形交互技术、语音交互技术和体感交互技术。其中,语音交互技术不仅是人工智能中最重要的,而且在智能语音中也起着重要的作用。

目前,智能语音在个人市场和行业领域的应用场景也在快速扩展,用户对相关语音产品的使用时长和粘性也有了显著提高。其主要领域包括教育、汽车、医疗、家居、客户服务、手机、个人语音助理等领域。

个人语音助理被业界视为潜在的用户流量门户,包括技术巨头和新兴制造商。然而,就整个智能语音技术而言,它也面临着一个难以突破的技术瓶颈:语义理解技术。

从语言的本质来说,语言的开放性使得计算机很难准确理解人类语言表达的真实意图,这也使得相应的登陆产品在需要逻辑驱动的功能层面表现出相对较弱的性能。

在人机交互领域,有许多以垂直场和细分场景为切入点的新星。根据云狩猎网的了解,人工智能机器人技术有限公司的深度思考(以下简称“深度思考”)是值得学习的案例之一。

深度思考(Deep Thinking)是一家专注于类大脑人工智能和核心技术深度学习的人工智能公司。核心团队由来自中国科学院和清华大学的前沿人工智能科学家和领域业务专家组成。

公司的核心技术专注于“多模态深层语义理解和人机交互技术”。目前,汉语语义理解、多轮人机交互和机器阅读理解已经取得突破。

与此同时,华为的哈勃科技投资有限公司最近“抛出了一个绣球”,陷入了深思。据眼部调查,华为的哈勃科技投资有限公司已经投入了深度思考。

一方面,这表明华为的人工智能生态正在逐步建立。另一方面,它也表明深度思维在人工智能的某个领域应该具有绝对的核心竞争力。

就人工智能行业而言,语音识别首先实现产业化,其次是视觉和图像识别,最后是语义理解。在语义理解技术中,同一行业的大多数朋友和商家基本上保持单峰状态——即图像、文本和语音不能同时考虑。

在这方面,深度思维集中于“多模态深层语义理解”。这种引擎技术使机器能够同时理解文本和图像视觉等多模态非结构化数据背后的深层语义。

如果将“语音技术”与负责表达和获取信息的眼睛、耳朵、鼻子和嘴巴相比较,“语义技术”相当于人类的核心大脑。对于多模态深层语义理解技术,深层思维将其视为传统语音和图像识别的进一步理解和融合。

在整个学术界,甚至在可预见的未来,语义理解技术将继续是“多模态的”。这一次深入思考也是语义理解发展的前沿。

一方面,深层思维不断打磨着多模态语义理解技术的多场景落地。总体战略布局与人、车、家三大模块紧密相连,智能医疗、智能车、智能生活、智能手机等解决方案已经开发出来,涉及从人工智能医疗到智能家居的多种应用场景。

据深度思考的创始人兼首席执行官杨志明说,一个真正能让人工智能落地的场景实际上接近我们的日常生活。

事实上,如果只使用应用程序远程打开窗帘和关灯,这个传统的智能家居就不能满足人们的迫切需求,也不是每个家庭都需要智能音箱。这个家庭真正需要的是一个虚拟的“中央语义理解大脑”。

传统的人机交互在对话体验的意义上远远不够,因为这样简单的语音命令只能“听到”。由于缺乏语义理解,它无法真正理解用户在特定场景中的意图。但是,通过多模态深层语义理解技术进行深度思考,在智能家居的背景下,通过与用户的“人性化互动”,用户可以真正了解家庭中语义娱乐、健康生活、饮食和营养的实际需求,这就像是一种以家庭为中心的人工智能服务。

另一方面,对深度语义理解技术在智能医学领域的应用进行了深入思考,开发了ideepwise.ai4.0宫颈癌辅助筛查系统,实现了ai在大规模医学筛查场景中的应用。

宫颈癌筛查的重点是在大量不同形状的细胞中识别具有诊断意义的异常细胞。通过“多模态深层语义理解”进行深层思考,综合分析单个细胞的特征和细胞之间的相关性,可以有效提高异常细胞的识别准确率。

据云Hunting.com称,杨志明曾在“2019年智慧超级进化论者”会议上表示:“这是语义理解,也就是说,我可以理解这句话和这幅图像背后的含义。

其次,他还在汽车领域创造了一个“智能场景”,并为汽车配置了一个深刻的语义理解大脑。介绍了一种基于人工智能多模态深度语义理解引擎的智能交互式机器人。车内车外场景一体化,为用户提供一站式旅游服务。

其中,人工智能多模态深层语义理解技术在车辆中的应用有四个主要特点:

1.人工智能引擎和rpa(机器人过程自动化)的结合大大减少了用户在简单工作中消耗的时间,改善了车内人机交互体验。例如,当人工智能通过场景理解识别出用户正在上班的路上时,它可以自动宣布主人的工作安排,并自动预订会议室、会议场所、机票和酒店等。具体来说,点餐时,深思熟虑的解决方案通过机器人自动调用餐厅的预订界面来完成预订,避免了中间人工预订可能带来的误解和麻烦,实现了一站式服务。

2.车辆与智能家居信息融合的同步。深层思考通过车载系统与智能家居的连接实现了智能家居的远程控制。同时,公司的产品也可以通过用户日程上的语音提醒,并为用户提供适当的建议或决策。

3.相关意图的建议和理解。对于旅行过程中的场景,深思熟虑的智能交互机器人会主动识别和理解它,并推测下一个场景。当到达某个地方时,ai会自动判断下一个目的地是停车场还是酒店等场景,并根据v2x信息为用户进行智能导航和推荐。

4.车辆-道路协调和车辆-车辆协调的智能交互对于前方的路况和驾驶过程中周围车辆的驾驶行为,深度思考解决方案还将提供实时感知和理解。当前方发生交通事故、交通拥堵减缓或周围车辆有变道趋势时,人工智能会通过语音提醒用户防止事故发生。

基于智能车联网的数字驾驶舱场景下的深层思考,车载摄像头和语音传感器实现了多模态非结构化信息的深层语义,并具有自由跨领域上下文理解和多轮对话交互的能力。这相当于给汽车一个智能语义理解的大脑,让你的数字驾驶舱更智能,更好地理解你。

同时,多模态语义理解也可以用于汽车营销。它将整合用户的对话信息和在线咨询,以实现多模态语义理解。最后,将对用户进行存档和分析,以帮助汽车制造商扩大用户的交通入口,使他们能够更好地了解用户的肖像,并使用人工智能来帮助主机制造商提高销售转化率。

目前,深度思考为奇瑞捷特提供了技术支持。今年,几家主要品牌制造商和数千家4s商店将应用于深度思考的基础产品和解决方案。

在人机交互系统中,“siri”等人机助手的交互形式大多以“一问一答”的方式进行——即一问一答。

然而,深度思考在人机交互方面实现了机器与人之间的“多轮问答”人机交互:准确识别意图、准确理解上下文、深入提取个性化特征,从而在把握用户真实意图的同时实现多轮人机交互。

同时,根据对云搜索网络的深入理解,人机交互中深层思维的最大特点是实现“自由跨域”——即理解用户的“口语化”,使机器更加人性化:根据不同用户的个性化特征提供不同的交互过程。在这个过程中,“互动对象”不断被理解,达到“更多互动,更多理解”的程度。

如果没有其团队开发的核心级技术——多轮对话管理引擎,就无法实现对独特的“自由跨域”技术的深入思考。这套引擎旨在监督、管理和跟踪“对话过程”。它是通过模拟人的记忆和采用一些深度学习的算法模型来保证机器的长期和短期记忆而设计的。

就算法而言,业内许多从事语义理解的朋友仍然使用基于统计的机器学习算法来进行语义理解。深思熟虑已经是这里的“长者”。目前,深度思考团队正专注于最先进的语义理解技术,如bert、xlnet和albert,用于商业登陆。

目前,我认为整个公司主要以tob为主,我将与手机厂商就当前手机终端应用场景进行深入的战略合作。将来我也可以利用这些场景对toc进行一些探索。

杨志明说:“人工智能发展的现状就像一部不受欢迎的电影:吸引眼球的导演做了一部伟大的作品,但是很少有人看。因为现在一家真正的人工智能公司,其核心团队往往来自学术界,而学术界几乎都来源于“实验室”场景,这也将导致许多公司在早期阶段较少关注工业化。

另一方面,深刻的思考使技术投资和商业登陆从一开始就保持同步。

人工智能不同于其他行业。在团队中,“核心人才”是关键。深度思考不仅拥有优秀的技术团队,还拥有强大的商业基因和对应用场景的理解。

其核心团队主要来自核心人工智能在中国的发源地:其内部成员由来自中国科学院自动化研究所、软件研究所、中国科学院计算与微电子研究所等中国科学院研究所的一线人工智能科学家和领域业务专家组成,以及清华大学和海外知名大学的人工智能方向。许多人已经相继在人工智能领域开展业务,并且从未停止过商业产业登陆的脚步。他们在此过程中也获得了丰富的经验。

团队的重心一直是人工智能领域的领先科学家,他们在深度语义理解、计算机视觉和深度学习处理器方面拥有多项发明专利,拥有深厚的技术积累。

杨志明说:“事实上,我们已经深入从事人工智能领域十多年了,包括许多以前的创业经历。这为我们积累了大量基于场景的语料库和数据,使得我们的技术不断迭代进化,商业着陆的考虑更加成熟。”

不可否认的是,经过十多年的技术积累,杨志明和他的团队,依靠“多模态深层语义理解和人机交互”技术,确实通过深度思考建立了坚实的技术壁垒。今天,他们积累了很多,赚了一大笔钱,十年磨一剑。

根据云Hunting.com的说法,在深度思考建立之前,杨志明在人工智能道路上经历了三次创业。从第一次尝试将人工智能与信息安全结合到第三次尝试在法律垂直行业中使用人工智能,还穿插了人工智能加广告推荐。

杨志明曾经说过:“许多次的创业经验让我充分认识到,技术必须实现到特定产品的落地,所以我一直将技术积累与实地业务相结合来创业”。

直到2015年,杨志明的第四次创业——深度思考人工智能机器人有限公司的成立,才刚刚开始在中国悄然兴起。可以说这是一个完美的时刻。

从时间的长短和领域的宽度来看,杨志明的开拓经验在一定程度上跨越了人工智能在中国的发展历程,这使他知道如何实现人工智能的规模化和产业化。

人工智能在其发展过程中必须被感知或理解。随着5g和物联网的发展,对人工智能领域未来的深入思考值得期待,无论是在登陆还是技术、数据壁垒和计算能力布局方面。