我在科大讯飞实验室探索A.I.赋能行业的实例

时间:2019-10-30 09:28 来源:IT之家

10月26日,为期三天的2019科大讯飞全球1024开发者大会圆满闭幕。大会期间IT之家全程跟踪报道,据统计,到场人士超过14000人次。科大讯飞全球1024开发者节是以A.I.开发者为受众群体的人工智能大会,由科大讯飞公司发起并主办,自2017年至今已第三届。

大会闭幕后,IT之家受邀参观了科大讯飞A.I.实验室。在这里,我看到了A.I.赋能各行业的实例。

川普会说中国话?语音合成技术已达世界级

“非洲农业不发达,必须要有金坷垃”。几年前,一段金坷垃广告视频在B站走红,许多UP主开始恶搞金坷垃广告视频,通过剪辑配音等手法用视频人物的声音做成了各种各样的翻唱歌曲恶搞视频。从此鬼畜视频在B站一炮而红,只是到目前为止鬼畜视频仍然停留在用现有素材剪辑拼接的基础上,制作较为繁琐,效果也不是很自然。

科大讯飞的语音合成技术让我看到了鬼畜视频更先进的“玩法”。科大讯飞别出心裁地合成了川普的中英文讲话视频。与发音一致的嘴型和川普特有的语调让B站鬼畜区常客川建国跃然纸上,因视频内容全部为语音合成而非剪辑拼接,所以效果更加逼真自然,这样趣味性的展示方式也让很多零专业基础的参观者对科大讯飞的语音合成技术有了更深的了解。SHE《中国话》里的歌词“各种颜色的皮肤,各种颜色的头发,嘴里念的说的开始流行中国话”不再是空中楼阁。

2019年是虚拟主播的高光时刻,各大官方媒体纷纷推出虚拟主播播报主持节目。在实验室里,我们看到了科大讯飞研发的全球首个人工智能多语种虚拟主播——小晴。

与其他虚拟主播不同的是,小晴可以实现多种语言的实时播报,据了解,这位高颜值主播已经在央视网、央广网和众多地方融媒体亮相,与多位知名主播零距离对话。

▲科大讯飞小晴—全球首个A.I.多语种虚拟主播

基于科大讯飞的语音识别技术,讯飞输入法能将快速将语音转换为文字显示。除了支持普通话外,讯飞输入法还支持粤语、四川话等方言识别。在外国语方面,随声译的功能支持中文与英语、韩语、日语的多语种双向互译,同时也可以实现英语、韩语、日语等的直接录入。

目前,科大讯飞的语音合成技术在学习强国等APP上也得到应用。以学习强国为例,点击APP右上角的小喇叭,通过实时播报就可以直接听新闻。

发力TO C多款产品 针对用户痛点

今年5月21日,在上海举行的新品发布会上,科大讯飞发布了讯飞翻译机3.0、智能办公本、智能录音笔等6款产品,正式发力T0 C方向。

图片来源:豆瓣@爱哭鬼

在出国旅游时,图示菜单的奇葩翻译或许会毁掉游客的出国体验。对经常出国却不精通外语的人来说,外国餐厅的菜单可能仅仅是噩梦的开始,语言不通可能影响到衣食住行的种种体验,与外国人沟通尚可利用肢体语言,但面对路标、指示牌、菜单等静态文字,普通的翻译机就束手无策了。

针对这一用户痛点,讯飞翻译机3.0可以通过图像识别技术将图片上的文字直接译为中文,对于看不懂的菜单、路标等文字,用讯飞翻译机3.0拍张照片就可以翻译成中文。此外,讯飞翻译机3.0不仅支持日常中英文语音转换,还支持医疗、金融、计算机等行业专业术语的翻译。例如,在医疗行业翻译模式下,SUV会被准确翻译为医学术语“标准摄取值”而不是日常翻译中常用的“运动型实用汽车”。

▲讯飞翻译机3.0现场讲解

智能办公本是一款专为商务办公人士打造的产品,采用10.3英寸Eink柔性墨水屏,支持支持手写和语音记录,目前可以实现会议模式下3米到5米的语音转写工作,准确率保持在98%左右。会议结束后,只需要点击手写的关键点标记,系统就可以定位到所对应的文字。智能办公本所记录的会议内容也可以通过二维码的形式进行分享。

赋能医疗、政法行业解决从业者刚需问题

在智慧医疗方面,科大讯飞研发的人工智能医学影像诊断平台已经在安徽省的905家医院得到真实落地应用。人工智能医学影像诊断平台可以进行X光片和肺部薄层CT筛查,可以辅助医生进行诊断,减少了医生工作量,赋能医疗行业。讯飞智医助理在2017年的国家临床执业医师考试中超过了96.3%的人类考生,成为全球首次通过国家医师资格测试的机器人.

▲刑事案件辅助办案平台

除此之外,科大讯飞还开发了刑事案件辅助办案平台,通过图文识别技术,识别每一份材料的具体内容,划分类型后构建不同的目录结构。在查阅卷宗时可以进行自动调取,无需翻阅厚厚的纸质卷宗。通过提取案件中的关键词,系统还可以对卷宗的作案时间、地点、作案人员进行详细分析。同时,系统还可以在全国案例中提取出与本案相近的案件,并把案件的判决书展示给法官进行类案推送。目前这套系统已经在上海高院得到了应用,基本上覆盖了上海全市公检法部门。

A.I.+个性化教育 助力因材施教

两千多年前,孔子提出因材施教。但是直到今天,针对不同的学生进行不同的教育方式仍然难以实现,有限的教育资源与因材施教的教育需求成为矛盾。为了解决这一矛盾,科大讯飞借助人工智能和大数据技术,帮助学校实现真正的因材施教。

▲知识路径图

以图示为例,系统通过知识路径图的形式呈现了高二上学期的所有知识点及其内在逻辑关系。基于对学生学习数据伴随式的采集,可以针对每位同学实现个性化的分析和统计。系统会追根溯源,通过错题找到该生的薄弱项和易错项并进行不同颜色的分类,帮助同学实现最佳的学习路径并针对不同错题提出针对性的练习。

简言之,系统会针对每个同学的不同学习情况布置不同的家庭作业。在摆脱传统题海战术的同时,将自己更多的精力放在真正薄弱的知识点上。

AIUI全双工语音交互系统 告别智障对话

很多AI语音助手因为回答问题过于机械化,被网友调侃为“人工智障”。

AIUI全双工语音交互系统

科大讯飞的AIUI全双工语音交互系统一扫语音助手常常带给用户的机械生硬化印象,也是这次参观中给我最大惊喜的项目。它支持一次唤醒、多轮交互,即使中途被打断对话依然可以很流畅,在系统回答问题时插入另一个问题系统仍然可以非常快速的反应。使人机交互像人与人之间交流一样流畅自然,工作人员称这是未来科大讯飞语音技术的发展方向。

例如,我有两个问题要问语音助手。在以往,需要等待语音助手回答完上一问题后再进行下一个问题的提问。而科大讯飞的AIUI全双工语音交互系统在回答第一个问题时就可以回答下一个问题,让我们“调戏”语音助手变得更加简单粗暴自然。

AI能给我们带来什么?

在科大讯飞全球1024开发者节上,科大讯飞董事长刘庆峰强调人工智能会因为解决人类刚需而载入史册。人工智能如何赋能产业解决人类刚需?人工智能的红利如何兑现?科大讯飞A.I.实验室中展示的AI赋能教育、医疗、政法等行业的应用案例或许可以回答这个问题。

目前,科大讯飞在深耕医疗、教育、智慧城市、汽车、智能服务、消费者赛道外,也向TO C产品发力。同时以A.I.O.T为核心战略,发布了家电行业专用语音芯片CSK400X系列。

AI不应该成为某些厂商用来做噱头的A.I.芯片、A.I.能力,而是应该转换成实实在在落地的应用,赋能各行业的驱动力。A.I.落地、赋能产业背后是科大讯飞自主创新的核心技术支持。

在A.I.助力因材施教、平衡医疗资源、解放障碍人士时,这世界也因A.I.更加美好。

更多数字经济相关信息,请关注公众号“通信信息报”(ID:txxx-news)

中国电信四大亮点亮相2018国家网络安全宣传周网络安全博览会
贸易战对中国经济影响几何?
漫画展示

    通信信息报社版权所有 地址:福建省福州市鼓楼区西洪路长春埔电信IT大楼 电话:0591-83365172 联系人:黄女士 闽ICP备08001196号

    短信息类服务接入代码使用证:闽[2008]00019-B011 增值电信业务经营许可证:闽B2-20080034 闽互联网新闻信息服务备案:20080501