-
每个FPGA云服务器最大提供8片FPGA,每片FPGA包含约250万逻辑单元。支持PCIe 3.0 x16接口,吞吐量高达100Gbps;FPGA之间提供高达300Gbps的Mesh光互连网络;每片提供64GB的DDR4,接口速率高达2133MHz。让您的应用不再受限硬件配置。
-
FPGA云服务提供应用开发套件 (SDK)。SDK 包括应用示例、硬件抽象接口、加速器抽象接口、加速器驱动和runtime、版本管理工具等必备工具。通过加速器抽象接口实现硬件加速器和驱动的透明化,您的应用即可像调用软件函数库一样调用硬件加速器,让您方便快捷的开发基于硬件加速器的高性能应用。
-
FPGA云服务提供硬件开发套件 (HDK)。HDK 包括加速器示例、编码环境、仿真平台、自动化编译工具、代码加密和调试工具包等必备工具。您可以参照应用示例和用户开发指导手册,迅速开发和测试您的FPGA硬件加速器。
-
应用:视频处理、机器学习、基因组学研究、金融风险分析场景特点:适合密集计算、高并发、高带宽场景。适用场景:视频处理:图片自动分类识别、图片搜索、视频转码、实时渲染、互联网直播和AR/VR等视频应用,需要大量的实时计算能力,普通的云服务器难以满足性能需求,FPGA云服务器可以提供高性价比的视频解决方案,是视频类场景的理想选择。机器学习:机器学习中多层神经网络需要大量计算资源,其中训练过程需要处理海量的数据,推理过程则希望极低的时延。同时机器学习算法还在不断优化中, FPGA以其高并行计算、硬件可编程、低功耗、和低时延等优势,可针对不同算法动态编程设计最匹配的硬件电路,满足机器学习中海量计算和极低时延的要求。因此,FPGA在满足机器学习的硬件需求上提供极具吸引力的替代方案。基因组学研究:通过基因测序和分析、生物和医疗信息等海量数据的快速分析,可实现精准医疗;同时在药物研发、分子育种等领域都有海量数据的处理,该领域需要硬件加速来解决生物计算量的性能瓶颈。FPGA云服务器提供的强大的可编程的硬件计算能力可以很好满足海量生物数据快速计算的需求。金融风险分析:金融行业对计算能力、基于超低时延和高吞吐能力的及时响应有很高的要求,比如基于定价树模型的金融计算、高频金融交易、基金/证券交易算法、金融风险分析和决策、交易安全保证等,FPGA云服务通过可编程的硬件加速技术,可以针对各种场景的提供硬件加速解决方案,部分场景可以提供相比纯软件百倍的性能改善。
-
表1 高性能架构弹性云服务器的规格规格名称vCPU内存(GB)最大带宽/基准带宽(Gbps)最大收发包能力(万PPS)网卡多队列数FPGA虚拟化类型fp1.2xlarge.11888GB5/1.32021×VU9PKVMfp1.8xlarge.1132352GB10/56084×VU9PKVMfp1.16xlarge.1164704GB10/1010088×VU9PKVMfp1.8xlarge.832224GB10/56081×VU9PKVMfp1.16xlarge.864448GB10/1010082×VU9PKVM说明: 网络类型:10GbE表2 通用型架构弹性云服务器的规格规格名称vCPU内存(GB)最大带宽/基准带宽(Gbps)最大收发包能力(万PPS)网卡多队列数FPGA虚拟化类型fp1c.2xlarge.11888GB5/1.32021×VU9PKVMfp1c.8xlarge.1132352GB10/56084×VU9PKVMfp1c.16xlarge.1164704GB10/1010088×VU9PKVMfp1c.8xlarge.832224GB10/56081×VU9PKVMfp1c.16xlarge.864448GB10/1010082×VU9PKVM说明: 网络类型:10GbE
-
FPGA加速云服务器(FPGA Accelerated Cloud Server, FACS)提供FPGA开发和使用的工具及环境,让用户方便地开发FPGA加速器和部署基于FPGA加速的业务,为您提供易用、经济、敏捷和安全的FPGA云服务。FPGA加速云服务器包括两类:高性能架构基于DPDK的高性能交互框架,支持流计算模型,支持数据流并发,主要用于RTL开发场景,满足用户高带宽低时延的要求。通用型架构基于SDAccel的通用型交互框架,支持块计算模块,支持Xilinx SGDMA数据传输框架,主要用于高级语言开发或已有算法移植,满足用户快速上线的需求。
-
近年来,摩尔定律增势放缓,同样价格,每单位芯片面积的晶体管数量无法做到每隔18~24个月增加一倍。也就是说,基于通用CPU进行计算,每代产品的性能提升受到了极大的限制。然而,当前新兴领域,如人工智能,AR/VR,基因计算,以及高清,超高清视频,对计算力的诉求极高。计算密集型业务的快速增长和性能增速放缓的通用计算资源的GAP与日俱增。过去六十年,由摩尔定律主导的计算性能提升模式将不复存在。用户无法继续依赖通用计算力的性能提升来匹配自身的业务增长。以FPGA为代表的异构计算将在各个计算密集型的业务领域成为主流。
-
FPGA加速云服务器提供了GitHub开源的Web化服务平台,便于用户将FPGA加速云服务器集成到第三方系统,用于二次开发。FPGA加速云服务器的使用流程如图所示。图1 FPGA加速云服务器的使用流程
-
硬件开发套件(HDK):HDK包括加速器示例、编码环境、仿真平台、自动化编译工具、代码加密和调试工具包等必备工具。应用开发套件(SDK):SDK包括应用示例、硬件抽象接口、加速器抽象接口、加速器驱动和runtime、版本管理工具等必备工具。加速引擎镜像(AEI):用户采用Open Telekom Cloud平台开发出来的加速实例。现场可编程门阵列(FPGA):一种门级可编程的器件,通过硬件描述语言(Verilog或VHDL)所完成的电路设计,经过综合与布局,实现复杂的组合或者时序逻辑功能镜像:弹性云服务镜像。
-
使用FPGA加速云服务器提供硬件开发套件(Hardware Develop Kit,HDK)和应用开发套件(Software Develop Kit,SDK),可以进行AEI(Accelerated Engine Image)的开发和应用。FPGA加速云服务器提供现场可编程门阵列(FPGA)及较高的计算性能配置的实例,可以适用于并行计算要求较高的应用,例如机器学习、搜索引擎、人工智能等场景。
-
FPGA加速云服务器(FPGA Accelerated Cloud Server, FACS)提供FPGA(Field Programmable Gate Array)开发和使用的工具及环境,让您可以更加方便地开发FPGA加速器和部署基于FPGA加速的业务,为您提供易用、经济、敏捷和安全的FPGA云服务。FPGA加速型弹性云服务器类型如下:高性能架构基于DPDK的高性能交互框架,支持流计算模型,支持数据流并发,主要用于RTL开发场景,满足用户高带宽低时延的要求。通用型架构基于SDAccel的通用型交互框架,支持块计算模块,支持Xilinx SGDMA(Scatter-Gather DMA)数据传输框架,主要用于高级语言开发或已有算法移植,满足用户快速上线的需求。
-
1、我个人觉得类似于DK的主处理应用模式,不知道对不对?2、上述开发方式,pcie的数据输入输出格式是哪种?3、是否可以同时输入输出,用作视频实时处理?4、Atlas200实时处理后视频的帧率可到多少?5、Atlas200的PCIe驱动是否需要重新开发?
-
文档介绍需要UBANTU的操作系统需求,如果数据源是FPGA通过PCIe到Atlas200还需修改驱动吗
-
【摘要】 继2018年9月份,睿视智觉在华为云市场首发FPGA鉴黄系统后,又经过团队半年的潜心研发,深度迭代,现全新推出V2.0版本,并于2019年03月26日上线云市场,支持客户端多种形式调用!睿视智觉智能鉴黄系统V2.0版本采用自主FPGA流水线结构设计,对比V1.0版本提升算力20余倍,每小时可处理360多万张图片(包括硬盘数据提取、图片预处理,模型推理、结果输出等全流程),客户平均使用成本低于1毛钱/万张,帮助企业更快速、准确、低成本的实现涉黄图像过滤。睿视智觉专注于人工智能的计算机视觉应用和芯片级加速技术,提供图像信息解析及系统服务。现在全国多个城市拥有研发团队,成立至今已完成对多个深度学习算法框架的模型加速,结合自主框架设计和自主算法,在保证模型识别准确率高达99.5%的基础之上充分发挥FPGA高算力、低延时(<1ms)、低功耗(仅为GPU的15%)、高并发处理等优势,精准适用于互联网直播、短视频等海量图像数据处理业务场景,助力互联网数据监管部门及多类企业共同打造绿色网络环境!现睿视智觉在华为云上提供全面的API接口和SDK资源,接入便捷,也可根据客户不同的使用场景提供定制化的产品调用方式。 另,睿视智觉即将在短期内全新推出FPGA暴恐数据过滤系统,支持多标签数据输出,敬请广大用户持续关注!
-
基因测序性能提升5倍,华为云是怎么做到的? 近期,华为云携手峰科计算(以下简称“峰科”)发布基于FPGA的基因加速云解决方案,该方案采用GATK(The Genome AnalysisToolkit)标准分析流程,将全基因组测序(WGS)性能提升5倍,比传统模式提升3~5倍,同时测序精度可达99.95%以上,在大幅缩短测序时间的同时实现TCO大幅降低。 1. 基因测序数据分析加速面临的挑战Ø 基因测序分析流程BWT+GATK当前被业界广泛采纳,但采用此流程的传统测序方法需要消耗高额算力及存储资源,且耗时较长Ø 针对基因测序中高算力需求的smith-waterman,pair-hmm等算法处理,其具有计算并行性,不连续,非规则的存储访问,低bit操作等特性,计算依赖不规则区域的操作会对CPU消耗很大,性能难以提升 2. 华为云FPGA基因加速解决方案的优势 为了更好的解决基因测序行业面临的基因组分析标准流程不经济高效以及跨不同云和硬件(CPUs,FPGAs)加速实现的双重挑战,华为云和峰科计算强强联合,合作推出符合行业标准的GATK加速流程,通过对基因测序数据分析流程进行软、硬件联合优化实现端到端加速。· 华为云提供业界领先的FPGA加速云服务平台,采用业界领先的Xilinx 16nm Virtex UltraScale+ VU9PFPGA,并针对基因场景推出32核CPU224GB内存1 VU9P FPGA和64核CPU448GB内存2 VU9P FPGA规格的实例,实现了GATK 软件处理流程和FPGA加速流程的完美结合,从而将加速效率提升3~5倍· 峰科采用GATK标准分析流程,精准性与GATK标准流程完全吻合,精度可达99.95%以上· 不修改GATK标准流程,可访问读取从原始测序数据到生成vcf文件整个过程中的中间数据,便于科研用户使用比对 3. 华为云FPGA基因加速解决方案解析 华为云FPGA基因加速解决方案集成峰科的加速IP,为用户提供一种易于使用,经济实惠的基于FPGA的基因组分析流程加速服务,在该方案中,华为云配备了3核CPU,单个VU9P FPGA的实例。 华为云FPGA基因加速解决方案使用GATK最佳方案对种系突变和体细胞突变进行变异检测,将计算密集型算法如Smith-Waterman、PairHMM等确定为加速对象。每种算法都经过FPGA内核优化,并且实现CPU-FPGA协同执行和资源分配。如图2所示,用户通过分析应用程序,把每个流程的数据传给华为云峰科加速平台,平台里的Kestrel运行时管理工具来管理CPU-FPGA协同执行和资源分配。利用多线程,I / O优化和扩展使用FPGA加速器,华为云FPGA基因加速服务的基因组学分析流程在保证精准度情况下提供显著的加速。19196 图2 华为云峰科FPGA基因加速方案结构图 与GATK 最佳使用流程相对称,典型的基因测序数据分析流程始于原始FASTQ序列两端读长(paired-end reads),进一步获取一组经过滤的变体,对其进行标记以供进一步分析。图3描述了华为云基因加速服务种系变异调用流水线的具体流程,中间面板指示开始的通常工作流程,上下分别显示华为云FPGA基因加速方案中的峰科加速流程和GATK最佳使用流程命令实现方式的工作流程。19197图3 华为云峰科基因加速流程和GATK最佳使用流程对比 基于华为云FPGA加速服务,使用FPGA优化加速GATK流程,基因组分析流程可以实现3~5倍速度提升和99.95%以上的准确度。华为云FPGA基因加速解决方案最快基因组序列分析标准流程可在一天内完成5个全基因组或24个整体外显子组分析。 Performance comparison for GATK 3.8 WGS from Alignmentto Variant Calling using Hoplotypecaller 19198 注:测试数据使用的是30X的WGS样本,碱基数量103G 4. 华为云基因加速服务“0”元体验 为了能让更多的用户体验华为云FPGA加速云服务器,针对基因加速场景,华为云联合峰科(Falcon)推出“基因加速服务0元体验套餐”,套餐规格为32核CPU224GB内存500GB数据盘5M带宽,欢迎各企业登录华为云官网使用。 “基因加速0元体验”套餐试用方法如下:https://bbs.huaweicloud.com/forum/thread-8733-1-1.html
上滑加载中
推荐直播
-
TinyEngine低代码引擎系列第2讲——向下扎根,向上生长,TinyEngine灵活构建个性化低代码平台
2024/11/14 周四 16:00-18:00
王老师 华为云前端开发工程师,TinyEngine开源负责人
王老师将从TinyEngine 的灵活定制能力出发,带大家了解隐藏在低代码背后的潜在挑战及突破思路,通过实践及运用,帮助大家贴近面向未来低代码产品。
回顾中 -
华为云AI入门课:AI发展趋势与华为愿景
2024/11/18 周一 18:20-20:20
Alex 华为云学堂技术讲师
本期直播旨在帮助开发者熟悉理解AI技术概念,AI发展趋势,AI实用化前景,了解熟悉未来主要技术栈,当前发展瓶颈等行业化知识。帮助开发者在AI领域快速构建知识体系,构建职业竞争力。
去报名 -
华为云软件开发生产线(CodeArts)10月新特性解读
2024/11/19 周二 19:00-20:00
苏柏亚培 华为云高级产品经理
不知道产品的最新特性?没法和产品团队建立直接的沟通?本期直播产品经理将为您解读华为云软件开发生产线10月发布的新特性,并在直播过程中为您答疑解惑。
去报名
热门标签