-
本帖最后由 speedy2016 于 2018-6-28 20:21 编辑国内首款基于FPGA平台的语音识别加速解决方案登陆华为云 近期,华为云与国际领先深度学习加速方案提供者深鉴科技共同发布语音识别加速引擎DDESE——DeePhi Descartes Efficient SpeechRecognition Engine,即深鉴科技笛卡尔架构高效语音识别引擎。该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。成为目前国内公有云市场上,首款基于FPGA平台的原创深度学习语音识别加速解决方案。现已全面登录华为云市场。18350近年来,云端业务发展日新月异,市场对底层硬件架构提出更高性能的要求,而FPGA的可定制化和多功能的灵活特性,与云端灵活、复杂、多变的需求“不谋而合”,继而在全球云端业务中广泛加快布局。而华为云顺应趋势,并结合自身硬件优势全面推出FPGA加速云服务器平台,应用场景覆盖基因分析、视频/图片处理、深度学习、加解密、大数据等多个领域,致力于为企业提供极致、易用、专业的FPGA加速云服务。华为云结合深鉴科技,在FPGA加速云服务器平台上发布了DDESE。该产品是以Xilinx FPGA为计算架构平台,为用户打造的一款算法、软件和硬件协同设计的推理计算加速解决方案。基于深鉴科技独有的深度压缩能力,可以在保持精度的同时将神经网络压缩超过10倍,并部署在深鉴科技自主研发的笛卡尔架构硬件平台上,其核心加速引擎能够显著降低语音识别的延时,同时达到更低的功耗。根据单句语音识别重复测试的结果,DDESE端到端语音识别的计算速度是同等级GPU(Tesla P4 + c**n)的2倍,其中LSTM部的加速比超过2.5倍。该款产品主要应用于语音识别场景,可为用户提供端到端语音识别服务。未来,深鉴科技希望依托于华为云的平台,能够在FPGA领域继续突破前沿技术,引领国际先进的深度学习加速方案,进一步赋能语音识别应用场景。目前,DDESE正面向华为云用户提供免费试用,期待更多开发者与厂商体验深鉴算法、软件、硬件协同设计的深度学习加速解决方案。DDESE体验链接:https://app.huaweicloud.com/product/00301-110982-0--0
-
本帖最后由 speedy2016 于 2018-6-15 17:24 编辑华为云FPGA加速云服务器正式商用华为云FPGA加速云服务器公测半年以来,数百家客户积极参与公测试用,应用场景覆盖基因分析、视频/图片处理、深度学习、加解密、大数据等多个领域。在广泛聆听客户声音及建议之后不断优化与完善,于2018年4月30日正式商用,聚焦基因测序、视频处理和图像处理三大场景,为企业提供极致、易用、专业的FPGA加速云服务。基因测序,GATK标准分析流程,测序性能提升5X在基因测序领域,华为云联合合作伙伴峰科(Falcon)共同推出基因加速解决方案,该方案采用GATK标准分析流程,将基因测序时间从传统模式下的30个小时降低到5~6个小时,性能提升5X,同时测序精度与标准流程保持一致。对客户来说在大幅缩短测序时间的同时实现TCO的大幅降低。为了能更好的发挥FPGA在基因领域的优势,华为云还定制了一款32核 224G内存的高规格FP1实例,该实例集成了峰科的加速IP,能够为客户提供最优的解决方案。同时峰科基因加速解决方案也正式上线华为云市场,为企业提供更多选择!视频处理,H.264编码路数提升6X在视频领域,高清直播、高清视频游戏、VR/AR等需要实时在线转播,因此对性能和时延有着极高的要求。为此华为云联合合作伙伴NGCodec共同推出H.264/H.265的实时在线转码加速方案,该方案中FP1的8卡实例最高可以实现64路以上的H.264/H.265在线转码,同时将延时降低到10ms以内,相较于普通虚拟机而言H.264/H.265编码路数提升6X。图像处理,图片缩放性能提升10X,时延降低3X在图片处理领域,云相册、社交、新闻、电商网站等每天都要面对海量的图片处理。CTAccel专注于互联网媒体的FPGA加速应用,推出基于FP1实例的CIP图像加速解决方案,应用于图像编解码、图像转码、缩略图、水印等众多的图片处理场景,帮助客户提升吞吐速率、降低时延和节省成本。以图片缩放为例,该方案能够将图片缩放性能提升10倍的同时,时延降低到1/3,TCO降低40%,为客户带来良好的性能体验。从传统的模式看,FPGA开发和部署有着非常高的技术门槛。但是现在基于华为云平台,客户只需要在华为云市场点击购买解决方案相应的镜像即可完成一键式部署。从部署到应用客户完全感知不到FPGA,同时能享受FPGA加速带来的性能提升。未来华为将凭借超过20余年FPGA加速应用的积累打造一片FPGA加速服务的黑土地,与合作伙伴一起共筑开放、共赢的加速生态,为客户提供领先的加速解决方案!为了能让更多的用户体验华为云FPGA加速云服务器,针对基因加速场景,华为云联合峰科(Falcon)推出“基因加速服务0元体验套餐”,该套餐规格为32核CPU224GB内存500GB数据盘5M带宽,欢迎各企业登录华为云官网使用。“基因加速0元体验”套餐试用方法如下:https://bbs.huaweicloud.com/forum/thread-8733-1-1.html
-
本帖最后由 FPGA加速云服务器助手 于 2018-6-25 18:52 编辑华为致力于提供从硬件、工具链和云OS全面技术支持,定制合作模式以充分发挥合作伙伴商业优势。与合作伙伴共建开放共赢的开发生态,推出FPGA云加速服务解决方案已覆盖基因测序、视频编解码、金融风控、人工智能、图片处理和大数据分析等领域,面向更多行业提供高性价比可重构加速解决方案。 一、基因加速解决方案 1、峰科加速基因解决方案 提供商: Falcon 产品链接: https://app.huaweicloud.com/product/00301-120455-0--0 产品描述: 随着第二代测序技术的广泛使用以及与基因有关的人类疾病不断被发现,基因组数据在医学领域中的可用性和重要性与日俱增。 基因组数据必须先完成包括纠正测序错误和识别变异处理流程,才能应用于临床或研究,而处理的速度和成本,现在越已成为其应用于临床或科学研究的瓶颈。当前已经有了一些不同的尝试,来加速处理流程,克服这一瓶颈,取得了一定的成功,但仍然缺乏与标准生物信息学分析工具〔例如基因组分析工具包 (GATK)〕的兼容性。 峰科加速基因解决方案使用基于FPGA平台对GATK Best Practices进行加速,同时保持使用方法和结果与标准GATK完全一致。 二、图片转码解决方案 1、CTAccel Image Processor (CIP) 提供商: CTAccel 产品链接: https://app.huaweicloud.com/product/00301-110809-0--0 产品描述: CTAccel Image Processor 是基于 FPGA 计算技术的高性能图片处理加速器,通过硬件流水设计和任务级并行,大大提升了服务器的图片处理性能,包括更小的响应延时,更大的并发请求和更低的 TCO。 CIP 在图像处理计算中,可以降低延时 3 倍,提高并发度3-7倍,降低 TCO 3 倍。 CIP 提供了目前世界上最强的图片处理能力,重新定义了数据中心图片处理计算模式,为互联网图片计算提供最高效的解决方案。 三、AI解决方案 1、DDESE——深鉴科技笛卡尔架构高效语音识别引擎 提供商: 深鉴科技 产品链接: https://app.huaweicloud.com/product/00301-111291-0--0 产品描述: 北京深鉴科技有限公司入驻华为云市场,并发布“深鉴笛卡尔高效语音识别引擎” —— DDESE(DeePhi Descartes Efficient Speech Recognition Engine)。该产品基于Xilinx FPGA,针对深度神经网络(主要是LSTM),为用户提供软硬件协同设计的快速、灵活、高效的推理计算加速解决方案。 DDESE使用了算法、软件、硬件协同设计的深度学习加速解决方案(包括剪枝、定点、编译和FPGA执行推理),同时使用了DeepSpeech2框架和LibriSpeech 1000小时数据集来做模型训练和压缩,支持用户测试对比CPU/FPGA的识别性能以及执行单句语音识别。 DDESE的核心加速引擎主要针对RNN/LSTM,能够显著的降低语音识别(以及机器翻译等AI时序类应用)的延时。深鉴科技在华为云市场发布DDESE,主要目的是以语音识别为应用载体,充分展现基于Xilinx FPGA对AI类应用推理计算加速能力,并通过云端推广,让更多的客户试用并深入了解深鉴科技的全流程解决方案。FPGA加速云服务器助手 发表于2018-06-07 15:17:06 2018-06-07 15:17:06 最后回复 FPGA加速云服务器助手 2018-06-07 15:17:0619015 0
-
本帖最后由 FPGA加速云服务器助手 于 2018-6-25 19:08 编辑“基因加速0元体验”套餐试用方法如下: 1、[color=rgb(51,51,51)]登录华为云FPGA加速云服务器产品主页,点击【申请基因加速0元体验】按钮,填写申请信息后提交申请; 15476 [color=rgb(51,51,51)]2、官网审批通过后,您会收到短信通知,成为华为云“基因加速0元体验”优选客户; 15475 [color=rgb(51,51,51)]3、进入华为云市场,点击【0元试用】界面,进入“0元试用”活动专区; 15471 [color=rgb(51,51,51)]4、在【基础软件】中“峰科加速基因解决方案”点击【免费试用】; 15470 注:根据审批通过的“0元体验”业务区域点击如下对应链接进入【免费试用】申请界面;“基因加速0元体验”虚机申请链接为: 华东区:https://console.hwclouds.com/gratis/?locale=zh-cn&activityID=P1805091037509891WQHAPL0XZ838O&pkgID=PPP18062517211263304LYDHY11GF08P 华南区:https://console.hwclouds.com/gratis/?locale=zh-cn&activityID=P1805091037509891WQHAPL0XZ838O&pkgID=PPP1806251721127360U622P01L17FGA华北区:https://console.hwclouds.com/gratis/?locale=zh-cn&activityID=P1805091037509891WQHAPL0XZ838O&pkgID=PPP18062517211268006TUTDA0ZXFB08 [color=rgb(51,51,51)]5、填写信息后点击【立即申请】按钮,系统自动创建FPGA基因加速云服务器,就可以开始参与“基因加速0元体验”的活动了 15465
-
本帖最后由 speedy2016 于 2017-10-28 17:56 编辑硬用上云完美体验华为云与Xilinx联合发布FACS FP1 OpenCL实例 【中国,北京,2017 年10月19日】2017年10月19日,华为云在参加北京举行的2017 赛灵思开发者大会期间,与Xilinx联合发布华为FACS FP1 OpenCL实例,并面向与会数百FPGA 开发者展示了华为云FPGA加速云服务器(FACS)及其完整的基础设施服务。该发布和展示成为赛灵思开发者大会的一大亮点。 华为FPGA首席架构师王琦在2017赛灵思开发者大会主题为“华为FPGA 云展望及解决方案”的主题演讲中表示:“华为云率先实现了基于应用的FPGA软硬件平台及对应实例。其中FP1 DPDK实例,通过开放华为强大的FPGA专业知识及行业应用理解,可以帮助客户构建高数据吞吐率、极低时延的差异化行业解决方案;同时,针对更广阔的的高级语言开发场景及应用领域,此次华为云联手赛灵思正式发布的FP1OpenCL实例, 是面向系统工程师和软件工程师而打造的基于赛灵思SDAccel Shell的FPGA快速开发环境,也是一款全新的编程模型及通用平台。 目前,该此实例已上线华为云正式和大家见面。”3966王琦在Xilinx开发者大会上发布华为FP1 OpenCL实例 FP1 新实例重磅发布—— 打造全新编程模型平台华为云正式发布的FP1 OpenCL实例以赛灵思 SDAccel2017.1版本为基础,可以为用户提供全套软件驱动。借助这个开发环境,用户无需RTL设计经验,就可以使用OpenCL,C和C++等多种高级语言开发所需的加速算法。另外用户也可以把现有算法做简单适配,便可短时间看到基于华为FPGA云服务的硬件加速效果。如果用户已经有基于OpenCL开发的算法或者已经熟悉XilinxSDAccel,更是可以直接使用华为FPGA云服务上线进行业务加速。针对RTL开发者,SDAccel也支持用RTL来开发FPGA,方便用户利用已有的RTL“加速资产”,帮助用户在华为FPGA云服务平台上追求最大的加速效果。 开放华为强大FPGA优势—— 实现高效共赢生态华为FPGA加速云服务为行业和用户提供的是整套的开发套件。 借助全新FPGA加速云服务器业务,华为首次把超过十五年积累的FPGA行业开发工具以及IP库放到云端,致力于为云上开发者提供一键式FPGA开发环境。此外,作为行业领导者,华为还联合多领域合作伙伴一起,共同为行业提供了丰富的FPGA IP库和高性能的分布式算法库,可以覆盖高速增长的AI、网络处理和大数据等核心应用。目前,华为FPGA加速云服务,合作伙伴解决方案已覆盖图像处理、深度学习、视频处理、大数据、教学培训等多个领域。未来华为还将引领并联合更多第三方伙伴一起,共同打造更丰富的生态系统,为更多行业提供丰富的计算加速解决方案。 FPGA vs CPU: 将性能提升10倍以上——真真切切的高性能体验 在赛灵思开发者大会上,王琦还向大家展示了华为FPGA加速云服务器和CPU在H.265视频编码和数据压缩方面表现出的可靠且可扩展的性能优势。数据显示, FPGA在视频转码处理方面的性能能够提升10倍以上,在存储压缩方面性能可提升5倍以上。3965王琦向客户展示FP1实例的在视频编解码和数据压缩方面的性能优势 展望未来, 华为将与赛灵思公司持续深入合作,借助赛灵思全球领先的全可编程系列产品, 共同做大产业蛋糕,为用户创造更大价值!!
-
本帖最后由 爱计算的小书童 于 2017-8-17 10:09 编辑随着通信和互联网产业的快速发展,FPGA作为高性能计算加速器在大数据、深度学习、图像视频处理、基因计算、金融分析和加解密等众多领域得到广泛应用,市场空间巨大。 传统FPGA开发模式存在无法解决的问题:开发者需花费大量费用和人力调试专用硬件环境、加速部件、购买开发工具license、搭建开发和测试环境等,通常这些投资属于一次性支出,导致开发成本高,集成难度大;FPGA开发环境封闭,无法有效利用业界先进的经验和成熟IP,开发效率和质量难以保证,加速功能交付周期长;由于缺少专业技术团队支持,开发者门槛较高,运维成本高,限制了FPGA广泛应用。华为FPGA加速云服务器实现“硬用”高效上云 华为推出全新一代FPGA加速云服务器,解决传统FPGA方案一系列痛点问题,提供面向多个行业应用的开发套件,大幅提升开发效率,保证软件质量,支持一键式申请开发资源“按需取用”,最大程度保护用户投资,实现FPGA加速业务的快速交付、快速部署和弹性伸缩。极高性价比、全套工具链、丰富IP应用,以及灵活多样的合作模式,使得华为FPGA加速云服务器成为同类中的翘楚。 厚积薄发,十五年磨一剑华为作为业界领先的解决方案和云服务提供商,在过去的十五年间,充分利用FPGA技术构建差异化竞争力推动产业发展:在电信领域采用专有硬件实现与业务深度融合,提供业界最佳性价比的软硬件一体机;在NFV领域率先发布软硬件解耦云化架构,通过FPGA实现网络协议加解密和压缩的硬件加速,用户面性能提升2~5倍;在云场景下,华为FPGA硬件加速在图片分类、视频编解码、5G无线仿真和算法加速等领域已得到广泛商用。华为推动FPGA产业发展成功实践 极致高性价比,一览众山小华为FPGA加速云服务器硬件平台单物理节点包含8片Xilinx 16nm Virtex UltraScale Plus VU9P FPGA,如图3所示,每片FPGA含约250万逻辑单元、约6800个DSP、外挂64G Bytes@2133Mhz的 DDR4。FPGA通过PCIe Gen3X16接口和CPU连接,速率可达100Gbps,任意两片FPGA之间通过光互联网络连接,速率高达200Gbps,满足大量数据流传输,可为机器学习等大型加速应用提供更低的时延。 华为FPGA加速云服务器硬件架构图 更丰富IP,开发更简,上线更快在提供硬件开发套件(HDK)和软件开发套件(SDK)的基础上,华为首次把十多年积累的FPGA行业开发工具放到云端,为云上开发者提供专业逻辑设计组件、仿真平台和系列自动化平台及脚本,简化云上开发流程,降低用户使用门槛,真正做到一键式FPGA开发环境,让FPGA开发更便捷。华为提供多年积累的丰富IP库,覆盖媒体、AI、网络处理和大数据等核心应用,用户直接通过华为云Marketplace选择使用,快速构建和部署基于FPGA硬件加速器的应用,实现所想即所得的加速组件服务。 合作模式灵活多样与伙伴共赢成长华为致力于提供从硬件、工具链和云OS全面技术支持,定制合作模式以充分发挥合作伙伴商业优势。目前华为联合30多家合作伙伴推出FPGA云加速服务解决方案已覆盖基因测序、视频编解码、金融风控、人工智能、图片处理和大数据分析等领域,面向更多行业提供高性价比可重构加速解决方案。
上滑加载中
推荐直播
-
TinyEngine低代码引擎系列第2讲——向下扎根,向上生长,TinyEngine灵活构建个性化低代码平台
2024/11/14 周四 16:00-18:00
王老师 华为云前端开发工程师,TinyEngine开源负责人
王老师将从TinyEngine 的灵活定制能力出发,带大家了解隐藏在低代码背后的潜在挑战及突破思路,通过实践及运用,帮助大家贴近面向未来低代码产品。
回顾中 -
华为云AI入门课:AI发展趋势与华为愿景
2024/11/18 周一 18:20-20:20
Alex 华为云学堂技术讲师
本期直播旨在帮助开发者熟悉理解AI技术概念,AI发展趋势,AI实用化前景,了解熟悉未来主要技术栈,当前发展瓶颈等行业化知识。帮助开发者在AI领域快速构建知识体系,构建职业竞争力。
去报名 -
华为云软件开发生产线(CodeArts)10月新特性解读
2024/11/19 周二 19:00-20:00
苏柏亚培 华为云高级产品经理
不知道产品的最新特性?没法和产品团队建立直接的沟通?本期直播产品经理将为您解读华为云软件开发生产线10月发布的新特性,并在直播过程中为您答疑解惑。
去报名
热门标签