语音识别的入门门槛较高

    来源:卯卯儿 作者:长生果爸爸 日期:2018-12-17

日前,由JDD空间站及京东大学联合主办的“JDD技术摸索日”语音区别专场活动在京举行,来自京东团体、京东金融、猎户星空、小米和东南工业大学的语音区别技术专家分享了研究功效。在摸索日现场,还举行了“京东金融对话语音区别大赛”颁奖典礼,得到冠亚季军的三位选手分享了参赛心得,并与现场观众举办了深刻的互动调换。

JDD空间站是由京东金融制造的间隔产业界最近的数据摸索者社区,蕴涵大赛、社区和配合同伙三大板块,不但为数据摸索者制造完成自我价值的平台,同时也为配合同伙连接卓越人才与前沿技术,助力企业提拔数据和AI材干,让科技与商业应用急迅调和。

京东金融对话语音区别大赛是JDD空间站上线后的首场逐鹿,是面向巨大语音技术嗜好者、高校学生、企业启发者而举办的语音区别聘请赛。大赛赛题基于京东金融语音区别团队的现实业务场景——客服质检而来。在大赛中,台湾百万彩图库。京东金融初度关闭了5000小时的京东金融客服语音数据(经严峻脱敏)及GPU资源,抱负和各人一同去摸索对话语音区别技术。

在大赛中,来自中国迷信院主动化研究所的白烨,来自小米的庄伟基,来自猎户星空的宋莎莎三位选手在数百名参赛选手中矛头毕露,分获冠亚季军。

在分享调换环节,冠军得到者白烨无私地分享了参赛经过中的解题思绪,并坦言,从初赛的50小时数据到决赛时的5000小时数据,要解决区别方言、口语语法以及扫除数据乐音等问题,并在短时辰内创办与训练模型,难度至极之大。但从另一个角度来说,在这样的压力下逼迫本身不息翻阅文献并调试完好模型,也是一个对自我极限的寻事经过,收获至极之大。他特别感动了京东金融关闭对话语音数据的做法,他表示,基于确实应用场景的对话语音数据熟行业内至极可贵,京东金融关闭的5000小时对话语音数据看待启发者以至看待整个行业来说,都有至极大的帮手作用。

在分享调换的经过中,亚军庄伟基、季军宋莎莎也高度确定了JDD空间站关闭数据、关闭资源的做法。对此,在调换会后的采访中,东南工业大学计算机学院音频、语音与说话治理研究组的谢磊教授也赐与了高度评价。

谢磊教授是语音区别界限的着名专家,他以为,对话语音区别是语音区别界限难度大且极端具有寻事性的工作。对话语音的"即兴化"和"口语化"的特征,变成语速快、发音恣意、吞音少字、讲话不契合语法风俗、语音不流利、说话人语音交叠等景色,再叠加场景的噪声,给声学模型和说话模型的建立带来了不小的寻事。京东金融这次关闭的语音数据是脱敏后的确实客服对话背景,鼓励了学术界对语音区别方面的研究。

谢磊教授还表示,你知道台湾福星彩现场直播。语音区别的入门门槛较高,触及的学问方方面面,特别是开源数据较量欠缺,在一定水平上变成了语音人才的欠缺。京东金融的这次活动是一个很好的桥梁,为连接学术界和工业界的技术人才和技术发展起到了主动作用。

谢磊教授指出,校企配合会完成“三赢”。学校在一定水平上欠缺数据和大算力,也难以获取业界厚实的大数据资源,和工业界的配合没关系上风互补,运用工业界的场景大数据和大算力,做出"更靠谱"的研究结果。工业界没关系把一些技术难题和前瞻性的问题放给学校去摸索,同时经过校企配合吸收学生配合研究和实习,联合培育和储蓄人才。学生则经过接触工业界的现实场景和现实问题,得到"接地气"的陶冶,对异日求职和职业滋长都很有帮手。

本次京东金融对话语音区别大赛曾经画上圆满的句号,但JDD空间站才刚刚启碇。京东金融将会依托JDD空间站继续鼓励技术关闭,和更多的配合同伙去摸索鼓励语音界限技术发展的方式;会不息的公布更具寻事性的赛题,也会尝试关闭更多的资源和数据。另外,本年的JDD大会及大赛还将如期举行,旨在为科技界、产业界、金融界、学术界搭建起一个全球化的关闭平台,合伙摸索数字科技创新之道,实体经济数字化进级之路。