项目管理资源网

您的位置:项目管理资源网 >> 新闻

王小川:自然交互、知识计算是搜狗两大核心理念

2021/5/24 21:26:10 |  896次阅读 |  来源:网友转载   【已有0条评论】发表评论

517日,2021搜狐科技5G&AI峰会在北京隆重召开。搜狗CEO王小川作为嘉宾,现场联合搜狐新闻发布了搜狐新闻24小时数字人,并发表主题演讲,分享数字人背后的新技术。随后,他接受了搜狐科技的专访,针对数字人技术亮点,以及搜狗最新的人工智能研发成果进行了详细解答。

谈到推出“数字人”的初衷,王小川指出,源头是搜狗基因里涵盖着搜索,表达了知识获取、和人对话的能力,输入法更强调沟通,输入法和搜索背后的原始核心都是强调的语言。

相比于此前发布的AI合成主播雅妮,王小川表示,最大的变化是从2D变成3D雅妮是2D形象的,动的时候也只是面对镜头的移动,到3D之后有不同的视角来拍你的人形,你可以旋转你的机位来看,手势有更大范围的表达。

王小川透露,接下来,主播的成熟到推广背后仍有很多工作要做,包括不断提升它的流畅度、更高的理解能力,以及在更多的场景落地。

以下为专访实录精编:

搜狐科技:川总您好,刚刚发布了数字人技术,背后有哪些亮点?

王小川:首先,数字人技术不仅在中国,在全球也是足够领先的,我们七代的产品发布都走在了行业的前面,引领了大家的关注和后面的模仿学习。因此,从最早的一个表情到全方位能够从坐起来、站起来,有手势、有多模态的互动,把人工智能非常多的技术用进去了,也是落地人工智能产品之间比较亮眼的一个。

搜狐科技:这一技术在实现过程中有没有难度,或者一些研发历程可以分享一下?

王小川:这个很有意思,最早的时候,我们也在做语音识别,国内的技术非常好,我们就把搜狗的技术实力展示出来,在互动里面不仅只是基于文字和语音,我们研发了唇语识别,通过嘴唇运动识别你说的什么内容,积累了大量的经验。

反过来,我们开始构建唇形的合成,通过你的语音把它变成表情,变成你的唇动,从语音合成走向了视觉合成,这个我们走得非常领先的,缘起来自于从语音到唇语到合成,因此的话,大概2018年开始,首先和新华社有了第一次的合作。就这个事情的难度而言,随着从2D3D,包括肢体到表情有含义变得越来越难。

搜狐科技:更新版的数字人和之前发布的雅妮有没有什么区别,有怎样的进步?

王小川:一个大的变化是从2D变成3D了,雅妮是2D形象的,动的时候也只是面对镜头的移动,到3D之后有不同的视角来拍你的人形,你可以旋转你的机位来看,手势有更大范围的表达。今天集大成发布的所谓主播,你把这样一种语音的一种能力,包括像翻译技术,更严格的表情管理,从翻译之后的文字的表征变成了数字化的手势表征,这里面是有非常多的不同技术的融合。

搜狐科技:搜狗下一步有没有探索新的技术,是怎样规划的呢?

王小川:我们认为在下一个阶段里面主播本身它的成熟到推广背后有特别多的工作要做,包括不断提升它的流畅度,使得大家能够得到更高的理解能力,行业60,我们到85。同时能够在更多场景应用,手语要需要规范的,官方有官方的手语以外,还有方言的手语,全球有全球的手语体系,如何能够实现,或者规范成标准的一个普通化一样的语言,这里面我们认为有更多的社会意义。

搜狐科技:数字人之外,整个人工智能领域来讲,搜狗有没有新落地的成果可以分享一下?

王小川:我们需要把各种能力做一个结合,之前提到的营养师,搜索里面大量问跟健康相关的问题,尤其不同的饮食,孕妇能不能吃西瓜

等等的,我们要把这些一些知识跟用户的需求做到连接,同时经过数字人的载体给用户带来更好的互动。

我们提两个核心的理念,自然交互、知识计算,知识计算使得最大化的给用户的满足能够提高。


    项目经理胜任力免费测评PMQ上线啦!快来测测你排多少名吧~

    http://www.leadge.com/pmqhd/index.html

“项目管理生根计划”
企业项目经理能力培养和落地发展方案下载>>

分享道


网站文章版权归原作者所有,如有认为侵权请联系我们,将于1个工作日内作出处理!
网友评论【 发表评论 0条 】
网友评论(共0 条评论)..
验证码: 点击刷新

请您注意护互联网安全的决定》及中华人民共和国其他各项有关法律法规或间接导致的民事或刑事法律责任
·您在项目管理资源网新闻评论发表的作品,项目管理资源网有权在网站内保留、转载、引用或者删除
·参与本评论即表明您已经阅读并接受上述条款