• [公告] [服务公告] 短语音支持的格式增加mp3, wav, amr等多种格式了!
    应各位华为云用户的强烈诉求:从2018年6月28日起, 华为云短语音识别将短语音的格式支持,从wav扩展到了mp3, wav, amr....不变的接口使用方法,更多的语音格式类型支持,欢迎广大用户使用。更多的信息,请参见短语音接口说明。
  • [精选单品] 十分舒心,百分放心—云翌通信助力诺肯卫浴更好的服务客户
    诺肯水槽源于德国,由全球5大五金卫浴供应商之一--中国中捷集团荣誉出品。中捷集团目前主要经营“桑耐丽”、“欧菲顿”、“诺肯”品牌系列的高档水龙头、不锈钢水槽、沥水篮、卫浴洁具等五金制品;集团拥有各类产品共100个系列1000多个品种,公司年产水槽能力逾100万只。全部服务点之间的相互协调沟通,快速响应奠定了诺肯卫浴全球知名度以及领导者地位!诺肯在努力改变浴室的传统概念。他们传输给消费者最现代的生活方式,让消费者看到现代浴室的与众不同,与此同时,用户满意度以及服务是也成了诺肯的首要任务,但原有的电话系统是传统的拨号呼叫,手动拨号速度慢,销售及服务工作效率低下。因来电咨询以及核对信息也不是一次性沟通,当客户二次打来电话时,不能及时了解客户需求,重复劳动,造成沟通效率低下。员工内部信息流通、跨部门跨地域间协作缓慢。云翌通信作为专业的IP通信系统厂商,为诺肯设计智能呼叫中心方案,多点无缝互联互通,帮其实现内部协同办公联络需求,同时提高了客户的满意度。快速点击呼叫,提高工作效率 时间即为成本,云翌通信企业统一通信平台与诺肯系统做对接,员工登录诺肯业务系统,可进行客户管理,需要沟通时,直接点击呼叫按钮与客户建立通话,很大程度提高了员工的工作效率。 自带CRM管理,来电可弹屏编辑顾客致电客服中心,可快速弹出顾客信息,云翌呼叫中心和诺肯业务系统做了无缝对接,座席人员可快速看到顾客以往信息,快速预测或者处理顾客问题,管理客户资料,提高客户满意度! 通话实时录音  报表有据可查客服及销售在沟通中全程实时录音,质量高保真。录音可在系统后台在线播放或者下载试听,方便查询沟通,保障双方权益,提高服务满意度。系统具有多样性的报表,可查看并导出,进行大数据分析。录音及报表功能也有助于诺肯领导对工作人员进行监管和工作调整,从而提高公司的工作效率提升销售业绩。 远程办公,服务无延迟企业员工可远程登录座席客户端,联络客户,处理客户服务问题,不再受地域限制,需要其他部门协调沟通的可协同转移服务记录,同事可无缝处理客户问题,客户满意度大大提高。诺肯的设计师,正是迎合了消费者的目标设计了极具个性的浴室,使消费者能按自己的意愿进行配备,如厕所、水槽、浴室家具、水龙头等产品,已经不再是纯粹的功能性产品,它们因诺肯优雅的设计,具备了极佳的观赏性。而云翌通信自成立以来,专注于IP通信产品的开发与销售,在多元化发展中,开拓自有产品的创新之道。云翌与诺肯的合作,将创新与服务完美结合,让用户的生活十分舒心,百分放心! 关于云翌上海云翌通信科技有限公司总部位于上海市浦东新区世博软件园,致力于向社会企事业单位提供自主研发的VoIP全系列语音/视频产品和企业通信,IP呼叫中心等解决方案。是上海市重点高新技术企业和专利试点企业。公司核心管理与研发团队均为通信行业内从业十年以上的资深人士,在呼叫中心、IP语音通信、虚拟运营、软交换、融合通信等领域有着丰富的专业经验。公司产品充分利用Internet和全球IP互连的环境,提供比传统业务更全面、更专业的服务解决方案。2017年7月,公司在南昌成立研发中心,为上海总部研发的有效补充及创新研发基地,主要职责为通信云平台的持续开发与创新。 为客户提供易用、功能齐全、节省成本的通信云平台!
  • [精选单品] 花儿为什么这样红--云翌通信助力香朵呼叫中心系统新升级
    农家乐、亲子游、慢生活……上海有一个别致的新去处——香朵开心农场,位于「全国美丽宜居乡村」的上海崇明庙镇合中村,这里不仅有大片的草坪供你和孩子或漫步或手牵手奔跑,还有新鲜的蔬果可以采摘玩乐,不仅有小鸡、小鹅供观赏,还可以与小羊亲密接触,喂喂草,是不是有一种重拾童真,跟孩子更近一步的感觉。除此之外,农场还有垂钓区,户外活动区,儿童游戏区......大家各得其所,动静皆宜。宜人的风景、健康的食物、舒适的别墅,是否惹得你蠢蠢欲动想要去体验一把呢?但是面对美景美食诱惑,小翌我自岿然不动,专心致志的把香朵的呼叫中心系统升级完毕了!根据香朵的需要,小翌为其量身定制,选择了IPPBX-EPX系列产品,轻松实现分机互打、语音导航、电话会议等功能。呼叫中心升级之后,香朵的各分机可轻松免费互打且可出差或在家办公时使用,小姐姐之间的沟通既方便又高效,笑容便如开心农场上盛开的花朵,格外芬芳灿烂!另外,小翌帮香朵家呼叫中心开通了语音导航,支持分时段多层次嵌套,根据香朵的业务需求自定义编辑不同的IVR流程,使得香朵客服专业高档,欢迎致电哦!再者,该呼叫中心支持召开电话会议,多个会议桥同时开会。会议中可邀请内线和外线,并可全程录音。无论是在如火的枫林间驻足还是在碧波的水池旁守护,无论是在醇香的厨房忙绿还是在精致的别墅服务,随时随地加入会议,工作更高效,旅客更满意!香朵开心农场呼叫中心升级之后,不仅旅客的脸上笑容洋溢,香朵的工作人员及管理者的心中也绽放出香气袭人的花朵。用户满意的笑容,便是小翌不懈努力的动力!伙伴们,随小翌到香朵一游吧!关于云翌 上海云翌通信科技有限公司总部位于上海市浦东新区世博软件园,致力于向社会企事业单位提供自主研发的VoIP全系列语音/视频产品和企业通信,IP呼叫中心等解决方案。是上海市重点高新技术企业和专利试点企业。公司核心管理与研发团队均为通信行业内从业十年以上的资深人士,在呼叫中心、IP语音通信、虚拟运营、软交换、融合通信等领域有着丰富的专业经验。公司产品充分利用Internet和全球IP互连的环境,提供比传统业务更全面、更专业的服务解决方案。2017年7月,公司在南昌成立研发中心,为上海总部研发的有效补充及创新研发基地,主要职责为通信云平台的持续开发与创新。 为客户提供易用、功能齐全、节省成本的通信云平台!
  • [精选单品] 【捷通华声】捷通华声灵云入驻华为云市场,助力每家企业拥有人工智能
    【云端大事件】捷通华声灵云入驻华为云市场,助力每家企业拥有人工智能 【摘要】2018年7月30日,捷通华声灵云全方位人工智能平台入驻华为云市场,为广大企业提供语音识别、语音合成、语义理解、麦克风阵列、语音唤醒、图像识别、人脸识别、机器翻译、手写识别、声纹识别、指纹识别、数据挖掘等12项人工智能技术能力,定位专注打造企业级品质的人工智能云服务,与华为云携手,实现让人工智能像“水和电”一样更好地服务千企万户。 2018年7月30日,捷通华声灵云全方位人工智能平台入驻华为云市场,为广大企业提供语音识别、语音合成、语义理解、麦克风阵列、语音唤醒、图像识别、人脸识别、机器翻译、手写识别、声纹识别、指纹识别、数据挖掘等12项人工智能技术能力,定位专注打造企业级品质的人工智能云服务,并与华为云携手,实现让人工智能像“水和电”一样更好地服务千企万户。什么是灵云平台?灵云平台作为捷通华声推出的国内首个全方位人工智能开放平台,致力于为开发者提供智能语音、智能图像、智能语义、生物特征识别等全方位人工智能技术服务,打造一站式智能人机交互解决方案。用户可通过互联网、移动互联网,使用任何设备、在任何时间、任何地点,随时随地享受灵云平台提供的“听、说、读、写、认……”等全方位的人工智能服务。目前,开放平台以“云+端”的形式向开发者提供语音合成、语音识别、语义理解、语音唤醒、麦克风阵列、人脸识别、图像识别、手写识别等十二项AI技术服务。国内外企业、中小创业团队和个人开发者,均可通过华为云市场在灵云平台直接体验国内领先的人工智能技术,并简单快速集成到产品中,同时多种能力间也可自由灵活组合,从而让每一台终端、每一台机器“能说会听、能写会看、能辨音会认人、能思考会判断”,让每一个人都享受人工智能带来的轻松与便捷。平台特色捷通华声通过与清华大学深入建立“灵云科技 源自清华”的合作理念,致力于人工智能技术与应用的研发,使得灵云平台整合了国内顶尖的人工智能技术成果,语音交互、图像识别、人脸识别等核心技术均达到了国际领先水平,同时与学术界、产业界合作,共同打造了全方位人工智能技术与产品云服务生态圈。灵云平台具有如下特色优势:一站式解决方案:作为一个综合性的智能人机交互平台,提供世界领先的语音合成、语音识别、语义理解、图像识别、人脸识别等技术,开发者可以同时获得所需的多项服务能力,并自由灵活组合,一站式解决了需要到不同技术供应商获取服务的繁琐过程,让智能人机交互技术更简单、实用。丰富的接入方式:支持所有主流的操作系统接入,提供业内最全的SDK,Android、iOS、WP8、Java、Flash、Windows、Linux等平台SDK应有尽有。同时支持多类型终端,如智能手机、智能家电、车载、PC、可穿戴设备等,保证了用户可以在任何地点以任何方式通过灵云平台获得智能人机交互服务。稳定的服务支撑:灵云平台配备完善的基于B/S架构的管理平台,按照权限登录,可实时监视开放平台服务状态;自动化监控、自动化部署以及自动化测试等平台为开放平台的稳定运行全程护航;利用云计算、大数据等相关技术处理完备的日志记录,为服务性能的提升、优化提供支持。专业全面的服务支持:通过灵云平台,可以获得开发、调试、评估、调优等全方位的技术支持和点对点的技术服务。开放平台技术支持团队可通过电话、论坛、邮件、QQ群、微信、微博等工具,或现场支持的方式,为开发者提供及时有效的技术支持服务,保障开发者大幅提升开发效率,快速构建智能应用。免费易用可定制:灵云平台在线开发接口可供任何团队和个人免费使用;提供可视化控件以及demo程序和源码;支持自定义界面、音频保存类型以及个性化语音能力,使得短短几分钟即可构建一款具备智能交互能力的应用。强大的数据分析能力:灵云平台向开发者提供了国内领先的数据分析能力,让开发者随时随地更懂应用发展趋势,全面倾听用户“心声”,助力精细化运营,辅助决策,明晰产品迭代方向。核心技术能力灵云语音识别技术:采用行业领先的深度学习算法,为开发者提供行业领先的语音识别服务,广泛应用于客服中心、呼叫中心智能客服系统、智能电视等场景中。普通话识别准确率高达97%,对特定词汇进行优化,可进一步提升语音识别率,采用实时识别方式,实现语音数据的传输和识别的同步,实时率可达0.3以下,支持普通话、英语、粤语、维吾尔语、客家话等多种语言,具备很强的口音普适性,并可自由定制垂直领域的语音识别模型,识别效果更精确。灵云语音合成技术:可将文本实时、准确地转换为自然、流畅的语音,可调节语速、音调、音量等。为企业提供男声、女声、童声等多种合成音色,支持支持中文普通话、粤语、维语、英语、日语、德语、法语等21种语言,同时支持金融证券、天气预报、体育赛事、公交信息、旅游餐饮、等超多领域专业词库,并为用户提供定制化的语音合成服务,支持字符、词组、句子读音定制,也可根据用户需求定制特定发音人。灵云语义理解技术:可实现意图理解与智能问答两类核心功能,支持上下文语义分析、多轮对话、实体属性等,支持天气、导航、航班、音乐、闲聊等20多个常见领域,广泛应用于智能客服、车载导航、智能家居、穿戴式设备、智能机器人等领域。灵云语音唤醒技术:为终端设备提供超高效的语音唤醒服务,无需网络,实时离线唤醒,随叫随到,使用先进的芯片, ROM小于40K,低功率持续侦听,唤醒率大于95%,且误唤醒率低于小于 1次/24小时,支持自定义设置多个唤醒词,满足用户个性化需求。灵云麦克风阵列技术:通过麦克风阵列对声音信号进行处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪等功能,进而提高语音信号处理质量,解决远距离拾音痛点,3米识别率大于 95%,5米识别率大于92%。独有的回声消除技术,让识别更精准,可增强说话人方向语音,抑制其他噪音,同时可有效辨别环境杂音,并能确定位声音来源,扩大识别范围。灵云光学字符识别技术:可实现纸质文档的电子化,识别率高达99.99%,支持文档识别、票据识别、证照识别、银行卡识别、名片识别等多种应用领域,可高效准确地从证照等纸质文档中提取文本信息,节省了信息填写与录入所带来的成本负担,使业务流程变得既直观,又方便。灵云人脸识别技术:可准确识别图片中的人脸信息,提供人脸属性识别、关键点定位、人脸1:1比对、人脸1:N识别、**检测等能力。能够精准定位图中人脸的眼、口、鼻等多个关键点位置,能够进行人脸对比、人脸关键点定位、**检测,支持超大人像库检索,并能获取年龄、性别、情绪、眼睛状态等多种人脸属性。灵云机器翻译技术:采用国际先进的翻译技术及深度学习算法,可生成流畅的译文,支持中英、中维、中韩等多种语言互译,具有翻译准确率高、翻译快速等优点。直接语音输入即可翻译成文本,随后可直接获取对应的语音并播报,翻译结果地道流畅,忠实表达原文内容,满足高质量的翻译要求。灵云声纹识别技术:能够通过抽取说话人语音中的声纹特征和已登记的声纹模型进行比较,对用户进行身份校验和鉴别,提供声纹自由说、动态数字、开放文本、固定文本密码等多种识别模式,识别准确率高达99%。可辨别说话人身份并提取声音物理特征,判断其情绪倾向,如开心、悲伤等,并能从多人对话场景中分离出单个说话人音频,并识别出每个人的说话内容。灵云手写识别技术:可直接在智能终端设备进行流畅、自然的手写输入,支持中、英文以及数字的混合识别,支持中文、英文、维文等95种语言,覆盖全球82%的国家与地区,可连续自由行写、叠写,提供钢笔、铅笔、毛笔等多种笔形,并可识别50种笔势,单字识别率达99%,市场占有率超50%。灵云数据挖掘技术:运用前沿机器学习技术,通过海量数据进行预处理、结构化、统计分析、隐信息挖掘、知识图谱构建等步骤,挖掘分析有价值的信息,为政府、企业等相关机构提供决策依据,可进行话术标准检查、通话话题分析、文本规则解析、用户个体画像、情绪检测分析、文本新词发现、文本处理过滤等功能。应用领域在行业应用方面,灵云平台各项人工智能技术能够为智能应用、智能家电、智能车载、智能音箱、智能机器人等众多领域客户提供多种人工智能技术能力云服务。在移动应用领域,灵云SDK为移动应用提供了智能语音、图像、手写、生物特征识别等智能技术集成手段,云+端方式确保应用体验高效稳定,目前已在京东商城、出国翻译官、滴滴出行、高德地图、快快查字典等上万个APP中得以应用,覆盖聊天通讯、工具、视频、新闻、导航等生活领域的方方面面。在智能家电领域,通过灵云语音助手实现语音搜索、语音控制、天气查询、航班检索等功能,用户可进行个性定制,麦克风阵列技术则可摆脱遥控器,实现远场精准识别,让电视、音箱、空调等家电从此言听机从。目前,灵云平台已为小米电视、PPTV、广电机顶盒等众多电视、机顶盒厂商提供了语音交互服务。在智能车载领域,具备软硬降噪远场精准识别、场景化引擎唤醒、云端计算和内容服务,可通过语音进行打电话、发短信、搜索、多轮对话和深度导航等各项车载服务,并针对胎噪、发动机噪音、风噪等采用特殊降噪算法过滤,识别效果更佳,真正实现释放双手驾驶更安全。通过与华为企业云的有机整合,灵云平台快速、精准契合了用户的应用需求,切实降低了人工智能应用的门槛,为政府、企业提供了最实用的人工智能服务,实现泛在人工智能技术接入。依托华为云的大规模数据处理与云计算能力,以及遍布全国、高密度覆盖的数据网络,灵云平台能够充分发挥人工智能的技术威力。多节点部署让灵云平台更加稳定,容灾能力得到进一步增强,能够确保业务持久稳定运行。就近访问的模式达到了更高水平的数据处理容错性能,让企业用户能够享受到更流畅的人工智能交互体验,唤醒业务敏捷活力。未来,捷通华声灵云将与华为云继续并肩前行,不断实现多点部署、就近访问,扩大业务范围,提升客户体验,让人工智能可以像“水和电”一样全面服务行业用户与大众生活,满足各领域对人工智能技术服务迅猛增长的需求。
  • 支持中文域名的重要性和建议
    支持中文域名既能在根域名这个节点上维护我国的网络自主权,也能方便用户在中文环境下访问网站,再者,中文域名方便用户语音输入域名访问网站,日文域名和韩文域名分别在日本和韩国都很流行,据此,我们更应将中文域名这一具有中国特色文化的互联网基础应用加以推广。 中文域名最大的优势在于语音输入进行直接访问网站,例如UC浏览器就支持这一功能,打开UC浏览器,当按地址栏旁边的语音输入按钮时,语音输入“佛山点中国”能自动转换成“佛山.中国”来直接访问该中文域名网站。智能时代越加注重语音交流和操控,语音输入和语音操控已经成为智能手机必不可少的实用功能,而未来增强现实眼镜取代智能手机成为最流行的移动设备,语音输入和语音操控将成为主流,为了能语音输入中文域名直接访问网站,我给出以下几点建议: 一、与华为、三星、苹果、小米、OPPO、VIVO、中兴、联想和魅族等主流手机生产厂家进行沟通,让其手机系统的语音输入功能支持中文域名,例如苹果的Siri,当用户说出“国务院点政务”,手机自动打开浏览器直接访问“国务院.政务”网站; 二、与讯飞科大、百度、苹果和谷歌等语音识别应用开发公司进行沟通,让其友好对待中文域名输入,例如用户说出“佛山点中国”能自动转换成“佛山.中国”,且标记为网址格式; 三、与IE、Safari、百度浏览器、qq浏览器、360浏览器、Firefox和UC浏览器等主流浏览器的开发商进行沟通,让其友好对待中文域名输入,例如用户语音输入“佛山点中国”能自动转换成“佛山.中国”,且直接访问该网站;另外,当用户拼音输入“佛山。中国”,浏览器能自动转换成“佛山.中国”访问网站,值得注意的是要手机版和电脑版同时支持;除此以为,像淘宝商城等动态页面网站下中文域名子链接的生成需要给出技术指引,例如“淘宝.中国/服装/女装/裙子”这样的中文域名子链接能在浏览器地址栏上如实显示,不能混杂显示punycode码和中文。 四、与百度、搜狗、360搜索和神马搜索等主流搜索引擎服务商进行沟通,让其友好支持中文域名网站的收录,且在搜索结果返回界面正确显示其对应的中文域名,而不是显示punycode码的网址,这很影响用户对该网站网址的认知。 五、与腾讯、网易、新浪、中国电信、中国移动和中国联通等国内主要邮箱提供商进行沟通,让其支持纯中文邮箱地址,例如“李三@佛山.中国”“李三@亚马逊.公司”和“李三@特斯拉.中国”等纯中文邮箱地址,这样方便用户在中文环境下记忆和使用。 六、与阿里、百度、腾讯和京东等大企业进行沟通,让其启用相关的中文域名,以便用户在中文环境下更好地访问该公司网站,毕竟用手写输入、五笔输入和语音输入的用户数量很多,退一步来讲,从中文输入环境切换成英文输入环境来输入字母格式的域名去访问网站也是一大不便。 七、推动语音输入中文域名的国家标准规范,推动国家质量监督检验检疫总局和国家标准化管理委员会批准发布的《中文语音合成互联网服务接口规范》GB/T34145-2017和《中文语音识别互联网服务接口规范》GB/T 34083-2017有针对语音输入中文域名的规范。
  • [问题求助] FAQ
    问:UVoice 现在是否可以使用?答:UVoice现在处于邀测阶段,预计2017年底上线公测。 问:UVoice服务如何购买?答:目前处于邀测阶段,当前可以联系 zhongweicai@huawei.com咨询,上线后公测期间华为云用户可免费使用。 问:什么是UVoice:答:UVoice致力于为企业和个人提供语音识别和语音合成服务,通过API 调用即可实现语音转文字、从文本生成语音等功能。 问:UVoice 有哪些能力?语音识别:可以快速识别语音内容,将语音转换为文字。语音合成:可以快速将文字合成语音,提供多种音色选择,支持语速调节,合成效果流畅自然,更接近人声。 问:怎么使用UVoice?答:用户通过API调用使用UVoice服务,用户开通UVoice服务后即可参考接口文档调用服务。 问:使用UVoice需要购买华为云的哪些配套资源?答:用户开通UVoice就可以使用;为了获得更好的体验,建议用户购买华为云的弹性云服务器和OBS搭配使用。 问:UVoice处理一段语音需要多久?答:UVoice基于华为新一代GPU弹性云服务器,处理一段10S短语音最快0.1秒。 问:UVoice可以处理多长的语音识别?答:UVoice即可以识别短语音,也可以识别长语音。 问:我的文件发送给UVoice会不会泄露?答:UVoice和华为云其他服务采用同样的安全措施保证用户数据安全,并且UVoice承诺不保存用户数据用于商业用途。
  • [其他] IoT任务型问答场景
    面临的问题:在如今的IoT市场,语音技术的发展也为控制入口做了一个补充,在抛去了传统遥控器和设备按钮之后,通过语音发送口令让设备达到指定运行状态,让操作更便捷智能。IoT语音控制的技术难点包括:•距离是障碍:用户能随意用语音控制设备的一个必要条件就是在远场条件下发出指令,设备都能准确的识别,语音识别技术必须突破距离的障碍;•语音交互差,识别率低:语音交互受到背景噪音、其他人声干扰、回声、混响等多重复杂因素影响;•地区方言多,语义识别难:单是中国语系、方言和口音就相当多,加上中文的多语义性,所以不同地区的人使用语音控制识别率差异较大。诉求:•远场拾音。•能够对短语音进行精准的识别。•能够对设备进行语音唤醒。•能够通过语音对设备下达指令。•能够通过声纹识别不同人下发的语音命令。
  • [精选单品] 【云端大事件】听“鉴”智能:深鉴科技高效语音识别引擎DDESE入驻华为云市场
    【导语】2018年4月26日星期四,北京深鉴科技有限公司入驻华为云市场,在华为云市场发布了“深鉴笛卡尔高效语音识别引擎” —— DDESE(DeePhi Descartes Efficient SpeechRecognition Engine)。该产品针基于Xilinx FPGA,针对深度神经网络(主要针对LSTM),为用户提供软硬件协同设计的快速、灵活、高效的推理计算解决方案。 【标签】华为云市场 云端大事件 FPGA LSTM加速 产品介绍DDESE是深鉴科技自主研发的高效端到端自动语音识别引擎,它使用了算法、软件、硬件协同设计的深度学习加速解决方案(包括剪枝、定点、编译和FPGA执行推理)。我们使用了DeepSpeech2框架和LibriSpeech 1000小时数据集来做模型训练和压缩,支持用户测试对比CPU/FPGA的性能以及执行单句语音识别。 产品特色业界领先的原创深度学习语音识别加速解决方案 (ESE,FPGA2017 best paper)- 针对模型推理支持对单向、双向LSTM使用FPGA做加速- 支持卷积层、全连接层、BN层和多种激活函数(例如Sigmoid、Tanh和HardTanh)- 支持测试CPU/FPGA的性能比较以及单句语音识别解决方案我们的解决方案包括算法、软件和硬件协同设计(包括剪枝、定点、编译和FPGA执行推理)。经过剪枝,可以在精度损失很小的情况下得到稀疏模型(稠密度为15%~20%),然后将模型的权重和激活值定点到16bit,这样一来整个模型能够被压缩超过10倍,可以借助稀疏存储格式编译并部署在深鉴科技自主研发的笛卡尔平台上,采用FPGA执行高效的推理。 应用场景/行业DDESE聚焦语音识别场景,构建了以赛灵思FPGA为平台的自动语音识别系统加速引擎,可以为用户提供端到端的语音识别服务。基于FPGA平台,结合深鉴科技算法、软件和硬件协同设计的深度学习加速解决方案,DDESE在语音识别端到端的计算速度是同等级GPU(Tesla P4)的2倍,其中LSTM部分的加速比超过2.5倍。深鉴科技在云端部署FPGA加速解决方案,面向全球用户提供加速服务,支持其降低开发与部署成本,消除硬件壁垒,同时通过软硬件协同优化,取得更高效的云端计算能力。 产品价值点深鉴科技的核心加速引擎主要针对RNN/LSTM,能够显著的降低语音识别、机器翻译等AI时序类应用的延时。深鉴科技在华为云市场发布DDESE,目的是以语音识别为应用载体,展现基于Xilinx FPGA的AI类应用推理计算加速能力,并通过云端推广,让更多客户试用并深入了解深鉴科技的全流程解决方案。关于DDESE的更多信息,请参考深鉴科技官网:http://www.deephi.com/zh-cn/ddese.html
  • [公告] 语音服务体验环境
    现已开放体验环境,直观、快速的体验语音服务能力!语音识别体验环境:http://49.4.4.141/demo/ais/#/ais-demo/pc/asr语音合成体验环境:http://49.4.4.141/demo/ais/#/ais-demo/pc/tts
  • 智能语音解决语音访问网站和应用的通用性解决方案
    智能语音应解决语音接入通用性和开放性这个问题,例如其他企业需要用户通过语音访问其网站或者应用,那智能语音要提供一个通用性的指令来完成这个操作。而实现这个操作的重要部分就是实现语音输入中文域名,例如当用户说出“国务院点政务”,能直接访问“国务院.政务”网站,目前阿里巴巴的UC浏览器就支持语音输入中文域名,中华人民共和国工业和信息化部令第43号公布了新的《互联网域名管理办法》,里面第一条着重提到“推动中文域名和国家顶级域名发展和应用”,而且第一章总则的第六条着重提到“中文域名是中国互联网域名体系的重要组成部分。国家鼓励和支持中文域名系统的技术研究和推广应用。”。目前已经有很多政府机构和企业启用了中文域名,例如:“国务院.政务”“佛山.中国”“特斯拉.中国”“迪士尼.公司”“亚马逊.公司”。实现语音输入中文域名就能让成千上万的企业网站和应用接入到语音平台,解决了语音接入通用性的问题,是从语音识别到语音操控锐变的重要一步,而智能语音也通过如此来成为入口级的应用,成为百度那样的超大规模的语音搜索平台。
  • 国内首款基于FPGA平台的语音识别加速解决方案登陆华为云
    国内首款基于FPGA平台的语音识别加速解决方案登陆华为云近期,华为云与国际领先深度学习加速方案提供者深鉴科技共同发布语音识别加速引擎DDESE——DeePhi Descartes Efficient SpeechRecognition Engine,即深鉴科技笛卡尔架构高效语音识别引擎。该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。成为目前国内公有云市场上,首款基于FPGA平台的原创深度学习语音识别加速解决方案。现已全面登录华为云市场。近年来,云端业务发展日新月异,市场对底层硬件架构提出更高性能的要求,而FPGA的可定制化和多功能的灵活特性,与云端灵活、复杂、多变的需求“不谋而合”,继而在全球云端业务中广泛加快布局。而华为云顺应趋势,并结合自身硬件优势全面推出FPGA加速云服务器平台,应用场景覆盖基因分析、视频/图片处理、深度学习、加解密、大数据等多个领域,致力于为企业提供极致、易用、专业的FPGA加速云服务。华为云结合深鉴科技,在FPGA加速云服务器平台上发布了DDESE。该产品是以Xilinx FPGA为计算架构平台,为用户打造的一款算法、软件和硬件协同设计的推理计算加速解决方案。基于深鉴科技独有的深度压缩能力,可以在保持精度的同时将神经网络压缩超过10倍,并部署在深鉴科技自主研发的笛卡尔架构硬件平台上,其核心加速引擎能够显著降低语音识别的延时,同时达到更低的功耗。根据单句语音识别重复测试的结果,DDESE端到端语音识别的计算速度是同等级GPU(Tesla P4 + c**n)的2倍,其中LSTM部的加速比超过2.5倍。该款产品主要应用于语音识别场景,可为用户提供端到端语音识别服务。未来,深鉴科技希望依托于华为云的平台,能够在FPGA领域继续突破前沿技术,引领国际先进的深度学习加速方案,进一步赋能语音识别应用场景。目前,DDESE正面向华为云用户提供免费试用,期待更多开发者与厂商体验深鉴算法、软件、硬件协同设计的深度学习加速解决方案。DDESE体验链接:https://app.huaweicloud.com/product/00301-110982-0--0
  • 语音识别SDK
    语音识别有python的SDK吗
  • [精选单品] 十分舒心,百分放心—云翌通信助力诺肯卫浴更好的服务客户
    诺肯水槽源于德国,由全球5大五金卫浴供应商之一--中国中捷集团荣誉出品。中捷集团目前主要经营“桑耐丽”、“欧菲顿”、“诺肯”品牌系列的高档水龙头、不锈钢水槽、沥水篮、卫浴洁具等五金制品;集团拥有各类产品共100个系列1000多个品种,公司年产水槽能力逾100万只。全部服务点之间的相互协调沟通,快速响应奠定了诺肯卫浴全球知名度以及领导者地位!诺肯在努力改变浴室的传统概念。他们传输给消费者最现代的生活方式,让消费者看到现代浴室的与众不同,与此同时,用户满意度以及服务是也成了诺肯的首要任务,但原有的电话系统是传统的拨号呼叫,手动拨号速度慢,销售及服务工作效率低下。因来电咨询以及核对信息也不是一次性沟通,当客户二次打来电话时,不能及时了解客户需求,重复劳动,造成沟通效率低下。员工内部信息流通、跨部门跨地域间协作缓慢。云翌通信作为专业的IP通信系统厂商,为诺肯设计智能呼叫中心方案,多点无缝互联互通,帮其实现内部协同办公联络需求,同时提高了客户的满意度。快速点击呼叫,提高工作效率 时间即为成本,云翌通信企业统一通信平台与诺肯系统做对接,员工登录诺肯业务系统,可进行客户管理,需要沟通时,直接点击呼叫按钮与客户建立通话,很大程度提高了员工的工作效率。 自带CRM管理,来电可弹屏编辑顾客致电客服中心,可快速弹出顾客信息,云翌呼叫中心和诺肯业务系统做了无缝对接,座席人员可快速看到顾客以往信息,快速预测或者处理顾客问题,管理客户资料,提高客户满意度! 通话实时录音  报表有据可查客服及销售在沟通中全程实时录音,质量高保真。录音可在系统后台在线播放或者下载试听,方便查询沟通,保障双方权益,提高服务满意度。系统具有多样性的报表,可查看并导出,进行大数据分析。录音及报表功能也有助于诺肯领导对工作人员进行监管和工作调整,从而提高公司的工作效率提升销售业绩。 远程办公,服务无延迟企业员工可远程登录座席客户端,联络客户,处理客户服务问题,不再受地域限制,需要其他部门协调沟通的可协同转移服务记录,同事可无缝处理客户问题,客户满意度大大提高。诺肯的设计师,正是迎合了消费者的目标设计了极具个性的浴室,使消费者能按自己的意愿进行配备,如厕所、水槽、浴室家具、水龙头等产品,已经不再是纯粹的功能性产品,它们因诺肯优雅的设计,具备了极佳的观赏性。而云翌通信自成立以来,专注于IP通信产品的开发与销售,在多元化发展中,开拓自有产品的创新之道。云翌与诺肯的合作,将创新与服务完美结合,让用户的生活十分舒心,百分放心!  关于云翌上海云翌通信科技有限公司总部位于上海市浦东新区世博软件园,致力于向社会企事业单位提供自主研发的VoIP全系列语音/视频产品和企业通信,IP呼叫中心等解决方案。是上海市重点高新技术企业和专利试点企业。公司核心管理与研发团队均为通信行业内从业十年以上的资深人士,在呼叫中心、IP语音通信、虚拟运营、软交换、融合通信等领域有着丰富的专业经验。公司产品充分利用Internet和全球IP互连的环境,提供比传统业务更全面、更专业的服务解决方案。2017年7月,公司在南昌成立研发中心,为上海总部研发的有效补充及创新研发基地,主要职责为通信云平台的持续开发与创新。 为客户提供易用、功能齐全、节省成本的通信云平台!
  • [其他] 快来围观,语音识别都有哪些应用场景呢
    智能客服集成语音识别的智能客服系统,可以自动识别客户的语音和语义,然后自动以语音形式回复客户。减少人力成本,保证服务质量。智能会议集成语音识别的智能会议系统,可以自动识别参会人员的声纹、语音,通过实时、精准的识别,达到实时弹幕显示、会议记录等。直播字幕在视频直播场景中,将音频实时转写成文本字幕,与视频一起播出,提升观众友好性。结合敏感关键词检测服务,进行质检审查。人机交互通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验。
  • [其他] 听说,语音合成有这些应用场景哦~
    语音导航使用语音合成服务将车载导航数据转换成语音素材,为用户提供精确的语音导航服务。利用个性化定制能力,提供丰富的导航语音服务。有声读物将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。电话回访在客服系统场景中,通过语音合成服务将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。智能教育集成语音合成的教育系统可以实现中英文标准朗读及带读,应用于课堂和学生自学,提升教学效率。
总条数:192 到第
上滑加载中