财新传媒

“新经济·中国说”系列访谈 NO.8搜狗CEO王小川:用户体验驱动AI技术进步

2018年09月25日 11:29 来源于 财新网

2018年是贯彻党的十九大精神的开局之年,是改革开放40周年,是决胜全面建成小康社会、实施“十三五”规划承上启下的关键一年。作为现代化经济新体系中最为重要的一环,新经济在新时代的发展显得更为重要。

在此背景下,万事达卡财新BBD中国新经济指数(以下简称“NEI”)推出“新经济·中国说”年度主题项目,基岩资本提供特别支持。

我们聚焦中国新经济领域的关键产业,邀请优秀企业代表,录制《新经济·中国说》系列访谈节目,分享企业未来发展规划以及对中国新经济发展的建言,集中呈现嘉宾智慧,勾勒中国新经济时代全貌,深度解读中国新经济形态。

 

主题:“新经济•中国说”系列访谈  第八期

对话嘉宾:王小川 搜狗CEO

主持人:张丽敏  财新NEI研究总监

 

导读

作为国内用户量位居第四的互联网公司,搜狗业已于去年在美国纽交所成功上市。搜狗搜索,是目前国内第二大搜索引擎。搜狗输入法,作为国内第一大语音输入应用,被誉为国民输入法。

王小川,搜狗CEO。被称为“五道口守门员”的他,自清华大学毕业之后,就再也没有离开过五道口,这个绰号形象的肯定了王小川十几年的坚守。

不懈怠,才能突破,创新,才能突围。

搜索、输入法、浏览器,搜狗的发展模式不断演化。在当前人工智能的风口上,搜狗在以语言为核心的人工智能技术创新领域,实现了诸多突破。搜狗旅行翻译宝、录音翻译笔、定制化虚拟主播、个性化语音合成与人脸迁移技术,这些高科技产品和技术,是如何让搜狗做到持续“让表达和获取信息更简单”的呢?

 

【精彩呈现】

张丽敏:中国数字经济指数显示,2018年5月份,人工智能产业指数达到了399,比2016年1月增长了290%。对此,你如何看待?

王小川:我觉得分成几个维度来看,第一块是中国的人工智能的发展,特别是在产业应用当中,包括投资、商业化,在全球还是代表一个领先的高度的。美国的华人、工程师也回中国来创业,加入到大公司,这个本身是代表高质量。

第二块我们还没认识清楚,人工智能今天还是在一个早期,我们从2006年开始由深度学习起步,到了2012年产生实际作用。深度学习其实只是人工智能当中的一部分,关于推理、理解的问题依然没有解决。所以,我们看到的独角兽或者是应用场景,它是只局限在语音,图象这些领域,但是不代表广义的人工智能是突破了的。所以,这种情况下今天在很多的投资,在中国甚至是全球有自己的泡沫。

第三块真的要突破是需要从底层的技术,甚至跟脑科学、神经这样一些基础的生物有更多的结合。而这些方面其实中国非常的薄弱。虽然我们的论文很多,但是很多是跟进的,就是实实在在这里面有创造性的网络结构和基础算法的突破,依然不是我们做到的。

张丽敏:你觉得我们未来怎么样走一条路径才能满足更多的基础性的研究的需求?

王小川:我认为这件事情在中国今天的体量里面,你光靠拿资金投创业公司一定是不够的,因为创业公司是带着一个先进的算法一定成熟的理论,赶快去找市场。所以,在真正有机会的是一些,大一点的公司他们有机会在里面通过产学研一体化,跟高校建立一个联合。使得高校在人才储备里面有巨大的提升。所以我们目光应该放在大公司跟高校的能力提升里面,而不是放在创业公司里。

张丽敏:有一种观点会认为,中国人工智能弯道超车就在应用层面,因为我们人多、市场多可能在应用产品层面能够产生很多很多领先世界的产品,你认同这个观点吗?

王小川:我同意在这个里面能够保持一个局部的领先,我们把它叫弯道超车也是挺好,就是我们互联网也使得中国经济的活力或者是消费者的这种升级里面是有了弯道超车了,但是问题是我们的底子,就是我们的发动机其实有严重的缺失,所以这样的情况下,在长跑当中,有可能在新机会到来的时候我们已经取得哪些成果会重新倒退。

张丽敏:搜狗发展人工智能的着力点在哪儿?

王小川:一般讲有两类公司,一个是2B的,今天很多是人工智能的公司是给别的公司提供图像服务、语音服务,这个时候他们的侧重点就只需要在技术领域里面,数据、算法做得足够得好,把客户的需求满足的足够好。

搜狗是2C的,就是对于消费者的,所以我们其实特别强调跟消费者的交互界面能变得更加的友好,所以我们对于体验很看重。因此,我们对于自然交互里面是找得更好的应用的场景。比如在搜狗搜索中可以利用英文去搜索全球的信息,搜索完了之后再把它翻译成中文让你去读,这样把我们的语音技术、合成技术、翻译技术甚至包括问答技术融合在一块,给用户提供一个最自然的交互界面,但是背后其实融合了我们很多的在人工智能相关的这样一种技术的继承能力,用户体验可以驱动我们技术在进步。

张丽敏:搜狗在智能硬件方面,有哪些布局?

王小川:搜狗以语言为核心,我们其实是翻译、对话和问答都会做很大,包括语音图像。举个例子像语音,是今天突破最多的。像搜狗今年发布了两款产品,一款搜狗旅行翻译宝,做翻译的独立硬件,还有一款我们叫录音翻译笔,那个是手机的配件,它能够更好的去录音,也能够做同声传译。到今年的年底我们还会再推出好几款的智能硬件。

我们在这里面统一有个逻辑,就是希望在人机交互、语音里面能够让机器更多的理解人。我们在里面可以做情绪的识别,分析中间语音的结构,这里面我们会对音色、音调都做更多的分析。

用声音去提取这样一个数字资产和知识是重要的一件事情,我们做翻译,不只是意思对,最后合成的音色还是用我的音色,甚至我的情绪,我愤怒的讲了一句中文,我翻译的英文也是愤怒的情感。

所以,在语音里面可以藏很多的信息,技术要大量的深挖。

张丽敏:搜狗发展AI技术的竞争优势在哪儿?

王小川:我觉得我们的优势会非常的明显。

第一,有的创业公司他可能是做局部的技术,但是有完整技术体系的公司,全中国其实没有几家。以搜索为核心的,像我们的语音能力、图像能力、对话、问答、翻译我们有全套的技术能力,而且后面有持续不断的研究能力。我们跟清华成立天工智能研究院,清华这里面非常顶尖的老师跟我们也是协同工作,所以这里面的技术能力非常好。

第二,一些有能力的公司其实还没有一个成熟的应用场景,像搜狗我们一天的语音识别的请求是在4亿次,这也是单一最大的语音识别的引擎,就是搜狗的输入法。所以,我们有这样的场景,有这样的用户,就是既有用户又有技术,而且我们还是一个盈利的公司。

有技术、场景和利润去驱动我们不断去改进我们的产品和做出突破来,这是一个很大优势。

Copyright 财新网 All Rights Reserved 版权所有 复制必究