来源:IPRdaily中文网(IPRdaily.cn)
作者:连立杰 审协北京中心通信部 IP创新赢
原标题:听懂你说话才是真的人工智能
前些天,小编接到将十几个小时的讲座录音转文本的任务,傻敲了半天,才想到是否有专业软件能解决问题?果然有,且转换正确率相当高!让小编狠想扒一扒这产品以及相关的专利技术。
今年两会期间,“人工智能”这个词火了。
因为《政府工作报告》中首次写入了“人工智能”,这也意味着人工智能(AI)将正式进入国家策略层面。
要想实现AI,首先就需要让机器能够与人类进行对话,语音识别便成为AI的热点技术。
一、语音识别技术的进阶
今天小编为您介绍的是语音识别技术的进阶——语音转写技术。
该技术将自然语言转换为文本输出,结合不同语言之间的转换,实现多语种的文本输出。
在两会期间,科大讯飞公司董事长刘庆峰向总理李克强展示了他们公司最新研发的该人工智能技术产品。
李克强总理听取刘庆峰介绍人工智能“晓译”翻译机
总理“各位代表:现在,我代表国务院,向大会报告政府工作”的话音刚落,一行通过该技术将语音实时转换成的字幕,立即就出现在屏幕上。
科大讯飞研发的语音转写技术以及相关的产品专利已经获得授权(CN 102779508B)。其通过语音提取、语音识别、文本标注三个模块实现语音到文本转换。
“讯飞听见”为颁奖典礼提供实时语音转写
语音识别的难点问题在于讲话的人有方言、口音或者自己特殊的表达风格。这类问题如何解决呢?这就需要听者对说话人的说话风格要有足够的了解。
(举个栗子:听到了声音“qìng fēng”,说话人想说的是一个名字“庆峰”还是包子铺“庆丰”?)
看来要让冷冰冰的计算机了解每个人的风格是一件很复杂的事情。
从讯飞的语音自适应专利技术(CN 105895104A)来看,其根据说话人声音的特征建立模型,基于此模型对说话人的声音进行识别。看来,能够获得说话人声音特征的建模方法就是语音识别中的关键技术。
为了能够准确、快速的掌握说话人的声音特征,多种性能各异的建模方法被应用于语音识别中,在研发的过程中,先后出现了DNN(深度神经网络)、CNN(卷积神经网络)、LSTM(时间递归神经网络)、Deep CNN(深度卷积神经网络)等性能优异的语音模型。
创新实体也在不断的对语音模型进行改进,以进一步优化性能。
语音建模技术的积累在国内也取得了长足的进步,专利申请量逐年递增,成为了人工智能领域研究的热点。
在研发过程中,涌现出了以百度,科大讯飞为代表的国内优秀企业,技术上在全球也是处于领先地位。
此外,讯飞产品还能够自动生成一段语音精华,其中使用了语音摘要技术(CN 106446109A)。有了这个技术,机器人不但能够听懂你,而且能够帮你归纳总结。
是不是感觉机器已经具备思考的基础了?
讯飞录音笔实时转文字
最炸裂的是:它还可以自己做摘要
人工智能是对人的意识、思维的信息过程的模拟,其出现就是为了代替人类完成某些繁重的工作。
二、它的发展代表了未来?
原来从1999年成立的科大讯飞,早就陪伴在你身边。
“对不起,您拨打的电话正在通话中,请稍后再拨!sorry, the telephone you dialed is busy now, please redial later. ”这句经常回荡在耳边的话,竟然出自讯飞之手。
你拨打各大运营商、银行等电话时的自助语音客服,背后是来自科大讯飞的技术。
每天使用的微信、高德地图(例如林志玲和郭德纲的合成音)、滴滴出行、携程、大众点评、新浪微博等在内的20余万+合作伙伴使用的语音技术来自讯飞。讯飞通过这些终端覆盖超过9亿的用户,每天在线服务量达20亿次。
教育方面,每年的国家普通话评测、中高考的口语评测,机器评测技术都是来自科大讯飞。2015年科大讯飞机器智能阅卷技术便已在安庆、合肥等地成功试点应用。
经过对人机评分结果的分析,指标方面都已达到或超过人工评分水平。这意味着,让机器评阅主观题已不再是空想。其中最让人眼前一亮的,是哈工大讯飞联合实验室研发的语文作文评分技术。
机器人方面,让机器人参加高考,并考上重点大学,这是“讯飞超脑”计划的目标之一。
“高考机器人项目”始于2015年7月,起源于科大讯飞(002230)牵头承办了国家“十二五”863计划信息技术领域“基于大数据的类人智能关键技术与系统”项目。
只有能够跟人交流,懂人类语言的机器人,才是最NB的机器人。据悉,讯飞正在探索让机器自动学习,能够让机器理解自然语言,同时将自然语言与我们人类的概念连接在一起。
习大大在2016年4月参观讯飞的机器人“晓曼”,并进行了亲切的交谈。
在汽车领域,讯飞开发了“飞鱼助理”,它承担了一个车载秘书的功能。使用的越多,它对用户的个人喜好越了解,对答的时候便能提供更准确的服务。
专业领域和个性化方面
科大讯飞与北京协和医学院签署全面战略合作框架协议,推出智慧医疗系统,智能语音是其中一项重要技术。通过采集医生的语音信息并实时转换成文字来记录病例和布置医嘱,节省了医生手写病例的时间,提高了医生的工作效率。
科大讯飞还与最高人民法院信息技术服务中心签订战略合作协议,将智能语音识别系统应用于庭审文字记录的生成中,共同致力于打造“智慧法院”。
还有娱乐方面,讯飞还将语音合成产品进行了个性化应用。如通过语音合成模拟奥巴马等名人的音色,可以模仿奥巴马发出声音,让你分分钟变身名人。
不清楚各行各业的人工智能化是否会让人失业,但也许这就是未来,让人类从重复劳动中抽身去发挥创意特长。
有了这样的智能语音技术,或许在以后的现实生活中,我们也能够与擎天柱做朋友,有大白温馨的陪伴,体验人工智能伴随我们的人类世界。
来源:IPRdaily中文网(IPRdaily.cn)
作者:连立杰 审协北京中心通信部 IP创新赢
编辑:IPRdaily.cn 赵珍
校对:IPRdaily.cn 纵横君
推荐阅读
点击下方图片即可阅读
「智战2017」首届知识产权竞争策略挑战赛,等你来战!要你好看!
首席知识产权官:一个即将崛起的知识产权职业群体!
十七种知识产权商业模式!
「关于IPRdaily」
IPRdaily成立于2014年,是全球影响力的知识产权媒体+产业服务平台,致力于连接全球知识产权人,用户汇聚了中国、美国、德国、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司、成长型科技企业IP高管、研发人员、法务、政府机构、律所、事务所、科研院校等全球近50多万产业用户(国内25万+海外30万);同时拥有近百万条高质量的技术资源+专利资源,通过媒体构建全球知识产权资产信息第一入口。2016年获启赋资本领投和天使汇跟投的Pre-A轮融资。
(英文官网:iprdaily.com 中文官网:iprdaily.cn)
本文来自IPRdaily.cn 中文网并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意,并附上出处与作者信息。文章不代表IPRdaily.cn立场,如若转载,请注明出处:“http://www.iprdaily.cn/”
文章不错,犒劳下辛苦的作者吧