-
5000字!FPGA开发必须知道的五件事FPGA(Field Programmable Gate Array 现场可编程门阵列)是一种可以重构电路的芯片,是一种硬件可重构的体系结构。它是在PAL(可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物,是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。鉴于其可编辑,更灵活;产品上市时间短,节省了ASIC流片周期;避免一次性工程费用,用量较小时具有成本优势等特点,FPGA现已广泛应用于原型验证、通信、汽车电子、工业控制、航空航天、数据中心等领域。一、FPGA的技术发展历程FPGA技术从发明到现在已经经历了三十多年的发展历程,其核心价值是可编程性和灵活性。随着工艺技术、系统设计和应用创新的不断进步,FPGA技术也在不断创新和集成,实现了从逻辑器件到系统平台的转变。根据智慧芽研发情报库生成的技术路线图可见,在近十多年间,随着5G、人工智能、云计算等新技术的快速发展和广泛应用,对于FPGA等可编程逻辑器件的需求也越来越大,代表性技术详见下图:为了解决系统设计问题,FPGA越来越多地整合系统模块:高速收发器、存储器、DSP处理单元和完整处理器。同时还进一步集成了重要控制功能:比特流加密与验证、混合信号处理、电源与温度监控以及电源管理等。这些特性在Xilinx的Zynq系列和Intel的Arria系列中得到了充分体现。同时,器件也推动了工具的发展。系统FPGA需要高效的系统编程语言,现可利用OpenCL和C语言以类似软件的流程来编程。FPGA正在越来越多地取代传统上ASIC,在小批量、个性化的产品市场方面具有明显优势。二、FPGA的基本架构自Xilinx公司于1984年发明了世界首款基于SRAM可编程技术的FPGA至今,FPGA的基本架构已经确定,主要包括以下几个部分:可编程输入输出单元(IOB):IOB是FPGA与外部设备进行信号交互的接口,可以支持多种电气标准和协议,如LVCMOS、LVDS、PCIe等。IOB可以配置为输入、输出或双向模式,可以实现信号缓冲、锁存、延迟等功能。可配置逻辑块(CLB):CLB是FPGA实现逻辑功能的基本单元,每个CLB由两个SLICE组成,每个SLICE包含4个LUT(查找表)、8个寄存器、3个MUX(多路选择器)和一个CARRY4(进位链)。LUT可以实现任意6输入1输出的布尔函数,也可以用作分布式RAM或移位寄存器。寄存器可以实现数据锁存和同步功能。MUX可以将LUT扩展为7输入或8输入的选择器。CARRY4可以实现高速的加法、减法、比较等算术运算。嵌入式块RAM(BRAM):BRAM是FPGA内部提供的大容量存储资源,可以用作数据缓存、队列、FIFO等应用。BRAM有18K和36K两种规格,可以配置为不同的位宽和深度,支持单口或双口模式,也可以级联成更大的存储空间。布线资源:布线资源是FPGA内部连接各种资源的网络,包括水平布线、垂直布线、长线、超长线等不同类型和长度的布线。布线资源通过开关矩阵(switch matrix)进行连接和分配,开关矩阵由可编程的开关组成,可以实现灵活的布线方案。底层内嵌功能单元:底层内嵌功能单元是FPGA内部提供的一些特殊功能模块,如数字时钟管理(DCM)、相位锁定环(PLL)、延迟锁定环(DLL)、全局时钟网络(GCLK)、全局置位网络(GRST)等。这些功能单元可以实现时钟生成、分频、相位调整、延迟补偿、时钟分配、复位分配等功能,提高了FPGA的性能和稳定性。内嵌专用硬核:内嵌专用硬核是FPGA内部集成的一些专用功能模块,如乘法器、除法器、DSP(数字信号处理器)、微处理器、PCIe控制器、以太网控制器等。这些硬核可以提供高效的计算和通信能力,降低了FPGA的逻辑资源消耗和功耗。三、FPGA开发流程FPGA的开发流程是利用EDA(Electronic Design Automation)开发软件和编程工具对FPGA芯片进行开发的过程,主要步骤如下:1)功能定义/器件选型:这个步骤主要进行方案验证、系统设计和FPGA芯片选型等准备工作。根据任务要求,评估系统的指标和复杂度,对工作速度和芯片本身的资源、成本等方面进行权衡,选择合理的设计方案和合适的器件类型。这个阶段往往会花费大量的时间,这个阶段之后一般已经完成了系统建模,功能划分,模块划分以及设计文档的撰写等工作。2)设计输入:这个步骤是将划分好的各功能模块用硬件描述语言(HDL)表达出来,常用的硬件描述语言有Verilog HDL和VHDL。以后的教程中我们主要讲解如何使用Verilog HDL进行FPGA设计。设计输入方式有三种形式:IP核、原理图、HDL。IP核是实现一定功能的模块,可以形成一个项目。原理图是一种最直接的描述方式,在可编程芯片发展的早期应用比较广泛,它将所需的器件从元件库中调出来,画出原理图。HDL是利用文本描述设计,可以分为普通HDL和行为HDL。普通HDL有ABEL、CUR等 ,支持逻辑方程、真值表和状态机等表达方式, 主要用于简单的小型设计 。而在中大型工程中,主要使用行为HDL,其主流语言是Verilog HDL和VHDL 。这两种语言都是美国电气与电子工程师协会 (IEEE)的标准,其共同的突出特点有:语言与芯片工艺无关,利于自顶向下设计,便于模块的划分与移植,可移植性好,具有很强的逻辑描述和仿真功能,而且输入效率很高。3)功能仿真:这个步骤是在编译之前对用户所设计的电路进行逻辑功能验证,此时的仿真没有延迟信息,仅对初步的功能进行检测。仿真前,要先利用波形编辑器和HDL等建立波形文件和测试向量 (即将所关心的输入信号组合成序列),仿真结果将会生成报告文件和输出信号波形,从中便可以观察各个节点信号的变化。如果发现错误,则返回设计修改逻辑设计。4)逻辑综合:这个步骤是将高级抽象层次的语言描述转化成较低层次的电路结构。也就是说将硬件描述语言描述的电路逻辑转化成与门、或门、非门、触发器等基本逻辑单元的互连关系,也就是我们常说的门级网表。综合是创造性的转化过程,它不但能翻译我们的电路,还能够优化我们的电路,比如去除电路描述中冗余的电路结构,或者复用功能相同的电路结构。综合的目标和要求可以通过约束文件来指定,比如时序约束、面积约束、功耗约束等。5)前仿真:这个步骤也叫做综合后仿真,仿真时,把综合生成的标准延时文件反标注到综合仿真模型中去。因为综合后只能体现基本的逻辑门之间的互连关系,并不是实物电路,没有连线长度信息,所以前仿真只能评估门延时带来的影响,不能估计路径延时,前仿真结果和布线后实际情况还有一定的差距,并不十分准确。目前的综合工具较为成熟,一般的设计可以省略这一步。但如果布局布线后发现电路功能与设计意图不符,就需要回溯到前仿真来确定问题所在。6)实现与布局布线:这个步骤是将综合生成的逻辑网表配置到具体的FPGA芯片上,布局布线是其中最重要的过程。布局将逻辑网表中的硬件原语和底层单元合理地配置到芯片内部的固有硬件结构上,并且往往需要在速度最优和面积最优之间作出选择。布线根据布局的拓扑结构,利用芯片内部的各种连线资源,合理正确地连接各个元件。布局布线后就可以进行静态时序分析了,静态时序分析的方法是在布局布线后的实际电路中寻找寄存器和寄存器之间的最长路径延迟,通过最大延迟可以得出系统最大时钟速率。7)后仿真:这个步骤也称为时序仿真,是将布局布线的延时信息反标注到设计网表中来检测有无时序违规现象(即不满足时序约束条件或者器件固有的时序规则,如建立时间、保持时间等)。经过布局布线后,门与门之间的连线长度也确定了,所以后仿真包含的延迟信息最全,也最精确,能更好地反映芯片的实际工作情况。8)板级仿真与验证:这个步骤主要应用于高速电路设计中,对高速系统的信号完整性、电磁干扰等特征进行分析。板级仿真需要利用专业的软件工具和仪器设备来进行。9)芯片编程与调试:这个步骤是设计的最后一步,将EDA软件产生的数据文件(位数据流文件)下载到FPGA芯片中,进行实际的测试。芯片编程需要满足一定的条件,如编程电压、编程时序和编程算法等方面。调试时,需要利用逻辑分析仪、示波器等仪器设备来观察和分析芯片的工作状态,检查是否有功能错误或性能问题,如果有,就需要返回到前面的步骤进行修改和优化。四、FPGA的设计方法和技巧FPGA的设计方法有两种:自上而下和自下而上。自上而下是指从整体功能出发,逐步细化到各个模块,再实现每个模块的细节。这种方法有利于保持设计的一致性和完整性,但可能导致资源浪费和性能降低。自下而上是指从最基本的模块开始,逐步组合成复杂的功能,再整合到整体设计中。这种方法有利于优化资源和性能,但可能导致设计的复杂度和难度增加。无论采用哪种方法,都需要注意以下几个技巧:1)遵循良好的编码规范:编码规范是指一套约定俗成的编写HDL代码的规则和习惯,它可以提高代码的可读性、可维护性和可重用性,也可以避免一些常见的错误和问题。一些常用的编码规范有:使用有意义的变量名、注释和空格;使用一致的缩进和对齐方式;使用明确的赋值语句和运算符优先级;使用合理的信号类型和范围;使用同步复位和时钟边沿触发等。2)使用层次化和模块化的结构:层次化和模块化是指将一个复杂的设计分解为若干个相对简单的子模块,然后将这些子模块按照一定的逻辑关系连接起来,形成一个完整的设计。这样做可以提高设计的清晰度和可管理性,也可以方便地进行测试、修改和重用。一些常用的层次化和模块化的方法有:使用顶层模块、中间层模块和底层模块;使用总线、接口和协议;使用库、包和组件等。3)利用参数化和生成语句:参数化和生成语句是指使用一些特殊的语法或关键字来定义一些可变的参数或条件,然后根据这些参数或条件来生成不同的代码或结构。这样做可以提高代码的灵活性和通用性,也可以减少代码的冗余和重复。一些常用的参数化和生成语句有:使用generic、parameter、define等定义参数;使用for loop、generate、case等生成结构等。4)避免时序冒险和组合逻辑回路:时序冒险是指由于信号在不同路径上传输延迟不同,导致输出信号在一个时钟周期内发生多次跳变或错误变化的现象。组合逻辑回路是指由于信号在多个组合逻辑门之间形成环路,导致输出信号依赖于自身状态而不稳定或振荡的现象。这些现象都会影响FPGA的正确性和稳定性,甚至导致硬件损坏或故障。一些常用的避免时序冒险和组合逻辑回路的方法有:使用同步设计原则;使用触发器、锁存器、寄存器等存储元件;使用延迟器、滤波器、去抖动器等处理元件;使用状态机、计数器、定时器等控制元件等。5)使用有效的调试手段:调试是指在设计过程中检查和修正错误或问题的过程,它是保证FPGA正确工作的重要环节。调试可以分为软件调试和硬件调试两种。软件调试是指在仿真环境中使用一些工具或方法来观察和分析FPGA的运行情况,找出潜在的错误或问题。硬件调试是指在实际的硬件设备上使用一些工具或方法来观察和分析FPGA的运行情况,找出实际的错误或问题。一些常用的调试手段有:使用断点、单步执行、变量监视、波形显示等软件工具;使用示波器、逻辑分析仪、信号发生器等硬件工具;使用测试平台、测试向量、测试套件等测试方法等。五、FPGA技术研发趋势如今,FPGA技术依然在不断演进,主要从以下四个维度在不断突破研发瓶颈。首先,制程技术的进步:制程技术是影响FPGA性能、功耗、成本和可靠性的重要因素。随着制程技术的不断发展,FPGA可以采用更小的晶体管尺寸,从而提高集成度、降低功耗、缩小芯片面积、提高运行速度和信号完整性。目前,主流的FPGA厂商如赛灵思(Xilinx)和英特尔(Intel)已经推出了基于7nm和10nm工艺的FPGA产品,未来还有望进入5nm甚至3nm工艺。第二,系统级集成的需求:随着应用领域的不断拓展,FPGA需要与其他类型的芯片进行系统级集成,以提供更强大和更灵活的功能。例如,在人工智能、云计算、边缘计算等领域,FPGA需要与CPU、GPU、DSP、ASIC等芯片进行协同计算,以提高性能和效率。为了实现系统级集成,FPGA需要采用更先进的封装技术,如2.5D或3D堆叠技术,以实现高密度、高带宽和低延迟的互连。第三,平台化和可编程性的提升:为了满足不同应用场景和用户需求,FPGA需要提供更高层次的抽象和可编程性,以降低开发门槛和时间。例如,赛灵思推出了ACAP(Adaptive Compute Acceleration Platform)平台,它是一种新型的FPGA架构,可以通过软件工具和库来配置和优化不同类型的计算引擎,如逻辑、存储、DSP、AI等。ACAP平台可以实现更快速、更灵活、更智能的计算加速。第四,新兴应用领域的驱动:随着科技的进步和社会的发展,FPGA面临着新兴应用领域的挑战和机遇。例如,在5G通信、物联网、自动驾驶、医疗设备等领域,FPGA需要提供更高的带宽、更低的延迟、更强的安全性和更好的适应性。为了适应这些应用领域,FPGA需要不断创新和优化其架构、功能和接口。身为FPGA开发大军的一员,希望本文给你带来了或多或少的帮助。FPGA作为一种灵活、高效的数字电路解决方案,在各个领域发挥着越来越重要的作用。未来,我们可以期待更多更先进的FPGA应用出现,为我们的生活带来更多的改变和便利。
-
## 线上茶思屋介绍 加拿大多伦多异构编译器实验室线上茶思屋系列讲座主要围绕性能倍增、根技术创新等主题,通过邀请学术界知名学者和专家开展系列分享活动,探讨异构编程、编译优化、芯片协同、编程语言、程序分析、RichBin、安全计算、虚拟机、IDE大颗粒等前沿课题。 本期邀请到多伦多大学的 Paul Chow 教授为大家带来演讲,内容介绍如下。 ## AIgean: An Open Framework for Deploying Machine Learning on Heterogeneous Clusters ### 主讲人 多伦多大学 Paul Chow 教授,FIEEE,FEIC加拿大工程院院士 ### 讲座概要 AIgean, pronounced like the sea, is an open framework to build and deploy machine learning (ML) algorithms on a heterogeneous cluster of devices (CPUs and FPGAs). We present AIgean as a use case for our multi-FPGA deployment infrastructure: Galapagos. AIgean provides a full end-to-end multi-FPGA/CPU implementation of a neural network. The user supplies a high-level neural network description and our tool flow is responsible for the synthesizing of the individual layers, partitioning layers across different nodes as well as the bridging and routing required for these layers to communicate. If the user is an expert in a particular domain and would like to tinker with the implementation details of the neural network, we define a flexible implementation stack for ML that includes the layers of Applications & Algorithms, Cluster Deployment & Communication, and Hardware. The Cluster Deployment & Communication and Hardware leverages the Galapagos layer abstractions where the communication protocol is abstracted from the application and the hardware implementations are abstracted from the physical hardware being used. This allows the user to modify specific layers of abstraction without having to worry about components outside of their area of expertise. We demonstrate the effectiveness of AIgean with three use cases: a small network running on a single network-connected FPGA, an autoencoder running on three FPGAs, and ResNet-50 running across twelve FPGAs. ### 主讲人介绍  Paul Chow教授就职于多伦多大学爱德华·罗杰斯电气与计算机工程系,担任IEEE院士和加拿大工程院院士,主要研究方向是将FPGA嵌入计算设备,以便轻松部署应用程序。他特别关注在异构环境中大规模实现FPGA与CPU及其他设备无缝交互、设备对等、对应用程序透明等方面的研究。 ### 演讲视频 https://www.bilibili.com/video/BV1144y1H7vY/ --- 关注 **毕昇编译** 获取编译技术更多信息  添加小助手微信进入**Compiler SIG群**,Compiler SIG 每双周周二举行技术例会,同时有一个技术交流群讨论 GCC、LLVM 和 JDK 等相关编译技术。 
-
为了在半导体产业一轮一轮的洗牌中立于不败之地,越来越多的巨头开始抱团取暖。1 月 27 日,国家市场监管总局反垄断局发布公告称,自 2021 年 1 月 19 日,收到超威半导体公司(AMD)收购赛灵思公司(Xilinx)股权案的经营者集中反垄断申报之后,历经一年时间,在申请方补充好申报材料之后立案,通过审查,市场监管总局决定附加限制性条件批准此案。早前,美国、欧洲和英国监管机构亦已通过此项收购案。如果 AMD 能够成功将赛灵思纳入自己旗下,对双方而言都将是一个巨大的机遇,也将给全球半导体领域的竞争打开新格局。1、巨头抱团取暖为了在半导体产业一轮一轮的洗牌中立于不败之地,越来越多的巨头开始抱团取暖。202 0年 10 月,AMD 宣布拟以 350 亿美元换股方式收购赛灵思全部股权。AMD 于 1969 年在美国注册成立,是全球领先的微处理器厂商,1979 年、2015 年分别在纽约证券交易所、纳斯达克证券交易所上市,其 CPU、GPU、主板芯片组等产品覆盖计算机、通信和消费电子等各个领域。赛灵思于 1984 年在美国注册成立,是全球最大的可编程芯片(FPGA)厂商,1989 年在纳斯达克证券交易所上市,其研发的 FPGA 芯片、软件设计工具等产品也广泛覆盖人工智能、数据中心和自动驾驶等领域。AMD 收购赛灵思对双方而言都是一个双赢的结果,既可加速赛灵思向数据中心等领域的转型,也能使 AMD 产品组合更加多样化,从而实现双方产业布局和技术优势的互补。根据市场研究机构 IC Insights 估算,2021 年 AMD 营收同比增长 65%,约为 161 亿美元,而赛灵思 2021 年营收超过 30 亿美元(不到 40 亿),二者合并之后将进入全球前十大半导体公司之列,约排在第九位,位于同属芯片设计业的高通、英伟达和美国博通之后。国家市场监管总局表示,经评估后,认为申报方提交的附加限制性条件承诺方案,可减少并购交易对市场竞争的不利影响,因此决定在附加限制性条件的情况下,允许 AMD 与赛灵思的并购案。具体要求交易双方和集中后实体履行如下义务:向中国境内市场销售超微 CPU、超微 GPU 与赛灵思 FPGA 时,不得以任何方式强制进行搭售,或者附加任何其他不合理的交易条件;不得阻碍或限制客户单独购买或使用上述产品;不得在服务水准、价格、软体功能等方面歧视单独购买上述产品的客户。此前,美国、欧洲和英国监管机构亦已通过此项收购案。国家市场监管总局有条件批准 AMD 收购赛灵思,为全球半导体行业规模最大的交易之一扫清了道路。按照收购协议,交易完成后,AMD 股东将拥有合并后公司 74% 的股权,赛灵思股东拥有其余 26%。AMD 总裁兼首席执行官苏姿丰(Lisa Su)将继续作为收购后公司的首席执行官,赛灵思总裁兼首席执行官 Victor Peng 则将加盟 AMD 担任总裁职务,负责赛灵思业务和战略增长计划。据悉,新公司将拥有多达 1.3 万名工程技术人员,合并年研发投入 27 亿美元。2、FPGA 竞争格局生变事实上,此次 AMD 收购赛灵思,与 2015 年全球最大桌面与服务器处理器厂商英特尔收购全球第二大 FPGA 厂商 Altera 如出一辙。随着数据中心应用日益复杂,在软件定义系统潮流下,可编程逻辑器件 FPGA 在构建数据中心系统中发挥的作用越来越大,服务器处理器与 FPGA 的搭配,更易在数据中心应用中取得性能与灵活性兼具的优势。FPGA 即现场可编程门阵列芯片,顾名思义,这种可编程的芯片给了开发者更为灵活的开发空间,因此广泛应用在从消费电子到数据中心到 5G 通信,以及无人车等诸多前沿科技领域。虽然 FPGA 本身的市场规模并不大,但却是通往 5G 通信、数据中心、无人驾驶、国防等诸多千亿美元级别市场的钥匙。随着目前 5G 时代的进展以及 AI 的推进速度,FPGA 全球市场规模近年来稳步增长,根据Market Research Future 的预测,FPGA 全球市场规模在 2025 年有望达到约125.21 亿美元。根据 Market Research Future 的统计,2018 年全球最大的 FPGA 市场为亚太地区,因为下游数据中心、5G 和人工智能市场在未来的增长大部分集中在亚太地区,亚太地区在 FPGA 的需求上也将增长最快。到 2025 年,亚太地区在全球 FPGA 市场中的占比预计将会继续提高至 43.94%。其中,中国市场是亚太地区市场最主要的构成部分和增长引擎。目前,FPGA 市场主要由赛灵思和英特尔主导。2015 年,英特尔以 167 亿美元收购了 Altera,将后者的 FPGA 产品和自己的 CPU 搭配起来销售,以替代英伟达的 GPU。这次收购不仅可以帮助赛灵思在与英特尔的竞争中取得优势,也让 AMD 在数据中心市场配备更多弹药。收购完成后,AMD 将同时拥有 CPU+GPU 和 CPU+FPGA 的产品组合,直接补强在数据中心领域的核心竞争力,并籍此更广泛地接触工业、汽车等行业客户,进一步从英特尔手中竞争市场份额。过去几年,半导体市场一直在进行行业整合。英特尔、博通、高通等行业巨头都在大举收购,为未来业务进行战略布局。但受全球反垄断监管政策影响,并购难度日益加强。目前,英伟达 400 亿美元收购英国芯片公司 ARM 的交易正受到美国、英国、欧洲等监管机构的密切审查。
-
绑定弹性公网IP用户在使用加速云服务器过程中,需要通过弹性公网IP下载相关的开发工具。关于如何绑定弹性公网IP请参见为弹性云服务器申请和绑定弹性IP。说明: 如果加速云服务器在创建过程中已经绑定了弹性公网IP,则无需执行本节操作。下载开发套件用户购买FPGA加速云服务器后需要获取或更新FPGA开发套件,通过GitHub开源平台可以获取FPGA加速云服务器的FPGA开发套件,关于套件获取的具体操作请参见README中的“开发套件的下载”。安装和配置fisclient工具在进行AEI管理前,用户需要按照fisclient工具的README完成fisclient工具的安装和配置。fisclient工具的安装请参见“安装”章节。fisclient工具的配置请参见“配置”章节。
-
概述在开启您的FPGA开发之旅前,您需要登录华为云页面,按照指引完成FPGA加速云服务器的购买,具体购买方法请参见《购买弹性云服务器》。说明: 用户在使用FPGA加速云服务器时需要手动安装一些开发工具,这些工具会占用大量的磁盘空间。因此,用户在购买FPGA加速云服务器时,请确保选择的系统盘大小大于等于100GB,建议选择100GB。使用场景第一次使用或再次购买FPGA加速云服务器。关于登录对于Linux操作系统的FPGA加速云服务器,登录时请以SSH密码方式登录。具体操作,请参见密码方式登录Linux弹性云服务器(SSH方式)。
-
当前仅支持如下版本的操作系统:CentOS 7.3 64bit不支持规格变更。不支持迁移。不支持自动恢复功能。Fp1型、Fp1c型云服务器包含FPGA卡,关机后仍然收费。如果停止计费,需删除弹性云服务器。
-
FPGA云服务的硬件加速资源以池化的形式呈现,我们像分配CPU资源一样,按照您的需求分配最合适、最经济的FPGA资源。通过FPGA虚拟化技术、隔离技术和分布式技术,我们可以实现节点内FPGA资源的共享,而这一切对您的业务都是透明的,从而最大化满足您业务的硬件加速需求。
-
每个FPGA云服务器最大提供8片FPGA,每片FPGA包含约250万逻辑单元。支持PCIe 3.0 x16接口,吞吐量高达100Gbps;FPGA之间提供高达300Gbps的Mesh光互连网络;每片提供64GB的DDR4,接口速率高达2133MHz。让您的应用不再受限硬件配置。
-
FPGA云服务提供应用开发套件 (SDK)。SDK 包括应用示例、硬件抽象接口、加速器抽象接口、加速器驱动和runtime、版本管理工具等必备工具。通过加速器抽象接口实现硬件加速器和驱动的透明化,您的应用即可像调用软件函数库一样调用硬件加速器,让您方便快捷的开发基于硬件加速器的高性能应用。
-
FPGA云服务提供硬件开发套件 (HDK)。HDK 包括加速器示例、编码环境、仿真平台、自动化编译工具、代码加密和调试工具包等必备工具。您可以参照应用示例和用户开发指导手册,迅速开发和测试您的FPGA硬件加速器。
-
应用:视频处理、机器学习、基因组学研究、金融风险分析场景特点:适合密集计算、高并发、高带宽场景。适用场景:视频处理:图片自动分类识别、图片搜索、视频转码、实时渲染、互联网直播和AR/VR等视频应用,需要大量的实时计算能力,普通的云服务器难以满足性能需求,FPGA云服务器可以提供高性价比的视频解决方案,是视频类场景的理想选择。机器学习:机器学习中多层神经网络需要大量计算资源,其中训练过程需要处理海量的数据,推理过程则希望极低的时延。同时机器学习算法还在不断优化中, FPGA以其高并行计算、硬件可编程、低功耗、和低时延等优势,可针对不同算法动态编程设计最匹配的硬件电路,满足机器学习中海量计算和极低时延的要求。因此,FPGA在满足机器学习的硬件需求上提供极具吸引力的替代方案。基因组学研究:通过基因测序和分析、生物和医疗信息等海量数据的快速分析,可实现精准医疗;同时在药物研发、分子育种等领域都有海量数据的处理,该领域需要硬件加速来解决生物计算量的性能瓶颈。FPGA云服务器提供的强大的可编程的硬件计算能力可以很好满足海量生物数据快速计算的需求。金融风险分析:金融行业对计算能力、基于超低时延和高吞吐能力的及时响应有很高的要求,比如基于定价树模型的金融计算、高频金融交易、基金/证券交易算法、金融风险分析和决策、交易安全保证等,FPGA云服务通过可编程的硬件加速技术,可以针对各种场景的提供硬件加速解决方案,部分场景可以提供相比纯软件百倍的性能改善。
-
表1 高性能架构弹性云服务器的规格规格名称vCPU内存(GB)最大带宽/基准带宽(Gbps)最大收发包能力(万PPS)网卡多队列数FPGA虚拟化类型fp1.2xlarge.11888GB5/1.32021×VU9PKVMfp1.8xlarge.1132352GB10/56084×VU9PKVMfp1.16xlarge.1164704GB10/1010088×VU9PKVMfp1.8xlarge.832224GB10/56081×VU9PKVMfp1.16xlarge.864448GB10/1010082×VU9PKVM说明: 网络类型:10GbE表2 通用型架构弹性云服务器的规格规格名称vCPU内存(GB)最大带宽/基准带宽(Gbps)最大收发包能力(万PPS)网卡多队列数FPGA虚拟化类型fp1c.2xlarge.11888GB5/1.32021×VU9PKVMfp1c.8xlarge.1132352GB10/56084×VU9PKVMfp1c.16xlarge.1164704GB10/1010088×VU9PKVMfp1c.8xlarge.832224GB10/56081×VU9PKVMfp1c.16xlarge.864448GB10/1010082×VU9PKVM说明: 网络类型:10GbE
-
FPGA加速云服务器(FPGA Accelerated Cloud Server, FACS)提供FPGA开发和使用的工具及环境,让用户方便地开发FPGA加速器和部署基于FPGA加速的业务,为您提供易用、经济、敏捷和安全的FPGA云服务。FPGA加速云服务器包括两类:高性能架构基于DPDK的高性能交互框架,支持流计算模型,支持数据流并发,主要用于RTL开发场景,满足用户高带宽低时延的要求。通用型架构基于SDAccel的通用型交互框架,支持块计算模块,支持Xilinx SGDMA数据传输框架,主要用于高级语言开发或已有算法移植,满足用户快速上线的需求。
-
近年来,摩尔定律增势放缓,同样价格,每单位芯片面积的晶体管数量无法做到每隔18~24个月增加一倍。也就是说,基于通用CPU进行计算,每代产品的性能提升受到了极大的限制。然而,当前新兴领域,如人工智能,AR/VR,基因计算,以及高清,超高清视频,对计算力的诉求极高。计算密集型业务的快速增长和性能增速放缓的通用计算资源的GAP与日俱增。过去六十年,由摩尔定律主导的计算性能提升模式将不复存在。用户无法继续依赖通用计算力的性能提升来匹配自身的业务增长。以FPGA为代表的异构计算将在各个计算密集型的业务领域成为主流。
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签