-
新一代全高清视频会议终端,可提供双路1080P60极致高清画面和AAC-LD宽频语音,带来面对面沟通的体验;多个视角的图像同时传送,会议全景一览无余;丰富的视音频接口和Wi-Fi无线互联,可实现会议室的快速集成和部署,是行政会议、远程教育等视频会议应用的理想选择。更低带宽畅享极致高清最大支持1080p 60fps双流全高清超流畅视频,提供无可比拟的音视频质量;支持新一代VME和H.264 HP,带宽节省50%;新一代VME可改善灯光适应性、降低带宽消耗、提升图像清晰度、增强运动图像效果;内置麦克风,6m拾音距离、双声道宽频语音AAC-LD、独有的回声抵消和噪声抑制技术,提供高保真语音。多种特色功能,简单易用支持中英文语音呼叫,说出会场名称即可入会,简单方便;内置Wi-Fi模块,支持无线网络连接、无线MIC接入等,部署简洁;用户计算机和视讯终端之间IP可达,即可轻松实现数据共享;满足多会场同时进行高清数据共享,任意会场根据需要,随时调看的需求;人性化设计,一键实现召集会议。人性化设计,简单易用遥控器操控集成最常用按键,小巧简洁;终端LCD屏实时显示本地会场信息(IP地址、会议号码);3D遥控界面,分角色UI,操作简洁;一键入会,一键呼叫,简洁易用。
-
分享的主题包括三个部分1)华为云视频对视频行业发展趋势的一些看法,以及这些趋势对下一代视频编码技术提出的挑战;2)从标准角度来介绍下一代视频编码技术以及华为相关工作;3)从云视频应用角度来具体介绍华为云在视频编码技术上的一些实践和探索。 1. 视频行业趋势5G、云、AI已经成为ICT行业甚至是整个社会的发展趋势,促使整个视频行业需求和技术不断演进,推动整个视频行业不断升级。如图所示,视频生命周期的每个环节都在更新升级,包括视频生产、视频处理、视频传输和视频消费。· 视频生产:多源数据的采集,包括超高清、VR、自由视角、3D建模和视频渲染。· 视频处理:基于AI让视频处理更实时、智能和准确,包括各种编码方式。· 视频传输:超低时延的传输,云边协同等等。· 视频消费:智能终端的深度结合提供视频服务的最佳体验。视频行业本质是对媒体数据的处理,背后是算力、存储、网络、AI的支撑,同时视频行业又推动着5G、云、AI的不断前行,相辅相成! 视频演进带动了算力、存储、带宽需求的大幅增长。简单来看,视频分辨率越来越高,从高清到超高清再到8K/VR。算力增长 24倍,存储增长12倍,带宽增长 20倍。这些需求通过云,也只有通过云才能很好的满足,实现高质量的视频体验。云原生视频是行业趋势,视频将成为云的基础服务能力。 前面说的是行业的整体趋势,下面说一下具体场景。互联网视频发展已经历两个阶段,第一阶段从08年到13年,以长视频VOD、点播观看为热点;第二阶段,从13年到19年,也就是去年,其实还在延续,以直播、短视频为热点;第三阶段,也就是下一代会以什么为热点?我们认为因为5G、云、AI的推动,视频将进入实时互动、VR/AR时代。 互动视频方式从IM向实时音视频过渡。直播连麦,主播PK,直播带货,视频分发方式的升级,百毫秒级超低时延实时互动视频成为趋势。 VR/AR,360度视角带来沉浸式体验革命,用户从看视频向玩视频过渡,体验提升的同时,视频传输能力也从兆级向十兆甚至百兆级单流带宽提升。 RTC实时音视频会成为5G时代基础设施的核心控制点,RTC应用很广泛,它的市场年增长率是30%左右,而且这项技术不仅能赋能直播、游戏等泛娱乐行业,更能在在线医疗、教育、金融等大视频行业渗透。现有的实时音视频市场正处于爆发期,玩家很多,但由于它是非云厂商,难以持续发展。原因之一是它的技术门槛比较高,特别是像音视频编码或者整个RTC网络的构建,另一点是目前各家均采用私有协议的方式接入,各家互通、客户的自由切换都比较困难。在RTC视频业务产品上,我们认为音视频编码处理将是各家构建技术壁垒和性能差异化竞争力的关键之一。 另外一个应用场景就是Cloud VR,我们一直认为VR是5G技术发展下的关键场景。VR发展是一波三折的,但在目前来看,之前碰到的一些问题正在逐渐改善。从终端的角度来看,之前的终端很贵,但是目前千元终端机已经逐渐来临,而且体验也会越来越好。除了设备终端,VR此前还面临内容缺失的重大问题,而VR直播很大程度上缓解了内容缺乏的问题。 虽然困境在逐步改善,但VR目前还面临着新的问题。互联网VR业务很难形成商业闭环,主要原因在于VR业务带来了收入增加,但与此同时带宽增加更多,VR追求的高质量体验需要通过更高带宽来实现,高带宽势必会带来高成本,而高成本就会导致商业无法闭环。在这样的前提下,很多玩家都会通过降低体验来开展VR,比如说内容采用4K以下,码率采用10兆以下,终端采用卡片机来体验VR,虽然这样可以将VR的业务打通,但体验效果是很差的,也导致付费用户非常少,产业发展比较缓慢。所以在VR的发展上,我们认为通过视频压缩编码以降低带宽是关键,是可以帮助实现商业闭环的一个环节。 从前面讲述视频行业趋势不难看出,用户体验升级、视频产业升级、商业成本等驱动着视频全方位升级,分辨率从高清到8K,帧频从30帧到120帧,视场角从不到90度到360度,SDR到HDR等,这些参数升级推动视频压缩编码技术不断演进,追求压缩比是永恒不变的! 另外,前车之鉴,HEVC/H.265,其实是很优秀的编码技术,但因为前期不友好的专利政策,市场占有率一直不高13%。还好目前有所好转!整个行业急需压缩比更高、生态更完善、专利政策更合理的视频编码技术。 提升压缩比有两条路线,这也是各厂商正在做的。 标准技术路线,作为基础内核,H.266、AV1、AVS3、AI编码 非标技术路线,依赖基础标准,结合人眼感知特征,感知编码、内容编码、ROI编码 2. 下一代视频编码技术 下面将从这两个角度来介绍华为云视频在下一代视频编码技术上的一些工作。这些技术得力于华为2012媒体技术院全力支持。 2.1 下一代视频编码标准技术 从上图看出,下一代的视频编码标准大概分为三个阵营或者三个类型: 国际标准:由MPEG、VVC联合推动的像VVC/H.266还有EVC; 国内标准:国内标准组织正在推出或已经推出的AVS3的phase1、AVS3的phase2,两者主要差别在于AVS3的第1阶段标准瞄准H.266,第二阶段的标准则是瞄准未来,可能会加入一些智能编码的技术; 谷歌牵头的AOM联盟推出的AV1,是一个开源技术。 下一代的视频编码技术仍是采用传统的演进思路——在经典架构上做模块增强。在H.266CFP时,华为联合其他几家公司提了P41提案,在PSNR和MOS评估方面都是排名第一,这个提案也是后面基础。华为在VVC里的核心专利数量已属于第一阵营,这是一个了不起的成就,也说明了国内的视频压缩编码基础研究实际上不弱于欧美传统的公司。 上图是以VVC为例,对其新增的增强工具进行盘点。纵轴是每个工具的压缩收益,横轴是每个工具编解码复杂度,编码复杂度的权重可能会更高一点。VVC在块划分、帧内预测、帧间预测、熵编码、变换量化等多个模块上进行了增强,其中主要的增强是帧内、帧间预测、块划分、滤波的增强以及机器学习工具演进带来的收益。VVC暂时没有引入深度学习这一类编码工具。 图中还有三个用红圈标出来的工具,这是VVC中公认trade off比较好的三个工具点。蓝色的是ALF,这是大家比较熟悉的自适应环路滤波,其实它在H.265的时代就已经有了, H.266将它引入标准中;绿色的是仿射运动预测,这个主要是由华为提出的;橙色的是量化技术。 EVC标准的提出某种程度是因为H.265/H.266的专利政策不友好,有可能导致H.266的落地都比较困难。MPEG希望能通过一个新的专利友好的标准来推动落地,同时也促使改变H.266、H.265的专利授权政策。EVC由华为、三星、高通等共同提出推动,华为在这里面加入了很多技术。在标准立项时期望它比H.265的压缩性能提升20%,实测在4K娱乐视频上相比H.265压缩效率提升达30%以上,目前已经进入了最终的标准投票阶段。 AVS3是国内提出的标准,它的phase1是瞄准H.266标准的,并且在2019年3月份就已经制定完成率先推出,在2019年9月份,华为海思也同步推出了AVS3 8K的解码芯片,AVS3相对H.265性能提升了20%以上,并且针对娱乐视频和监控视频做了很多针对性的设计,性能上还可进一步提升。 H.266实际已经基本定稿,它的压缩效率在4K视频场景下相较于H.265能提升40%左右,其解码复杂度相对提升60%,目前看最大的问题还是专利政策不够透明,而且专利费可能比较高,推广节奏可能相对比较慢。 EVC也基本定稿,而且其压缩效率也能提升30%左右,解码复杂度相对H.265增加60%。其专利收费可能相对比较低,第二是他的专利收费比较透明和明确,目前主要依靠三星、华为、高通来做产业的推动和生态的构建。 AVS3在2019年3月份推出,在性能上还是有保证的,压缩效率能够提升25%,复杂度增加相对较低,其专利收费也是比较低的,正通过互联网等行业做产业的推动和生态构建,目前实际上有很多联盟和和公司正在做推动,我们也希望AVS3尽快落地。 表格中没有列举AV1的数据,这主要是因为它和其他三个标准不太一样,AV1开源软件实际上是瞄准商用化去做的,大家也比较清楚其压缩效率和解码复杂度。AV1有个很大的优势就是没有专利费,这是AOM联盟的承诺。在产业落地方面AV1做的很好,生态构建走的较前。 2.2 AI编码 下一代视频编码标准还有一个趋势就是AI编码,这一块实际上从HEVC、VVC标准制定就有提出,但因为考虑计算复杂度以及AI硬件普适性,都暂时搁置了。但这是个技术趋势。 AI编码包括两个演进思路,第一个是全新架构,类似于图像编码,实际上AI的图像编码已经取得了不错的成效,谷歌牵头的AI图像编码技术都已经得到了很好地应用,但针对视频中的应用还在探索过程中。所谓的全新架构,就是不用传统架构,视频进入黑盒后会得出一个压缩过的视频,这个视频可能没有块划分,也没有各种其他的方式,它的压缩效率会非常高,但这一切还处于研究的过程中。 另外一个思路是基于经典架构,对每个架构里的模块做增强。例如针对块划分、变换、矢量量化、帧内预测做不同的AI网络适应和增强。实际上华为也在做这方面的研究,未来可能会提出一些AI编码方面的论文或提案。并且我们认为AI编码的这两种思路,最终将是融合设计的过程,不会呈相互独立的状态。 3. 华为云视频应用和实践 3.1 云视频简介 上面简单介绍了下一代视频编码标准技术,下面介绍一下从实际商用及非标角度,介绍一下华为云视频在视频编码技术上的应用和实践。 首先介绍一下华为云视频,华为云视频是从2017年开始构建的,目前包括两大类业务,一种是比较传统的直播、点播、媒体处理以及监控业务,另一种是整个行业正在新晋的服务,比如RTC、VR/AR以及超高清制播。华为云视频面向很多的场景,例如娱乐直播、短视频、在线教育、企业直播、4K直播、4K制作等等,我们致力于帮助行业客户、伙伴、开发者、ISV快速上线应用,并帮他们构建差异化的竞争力,实现商业闭环。这里需要重点提一下RTC,RTC是华为云视频对下一代视频的理解并作出了实际的推动,针对RTC,我们重点构建超低时延、音视频质量等差异化竞争力。 3.2 视频编码技术 3.2.1 视频编码框架 结合今天的主题,下面重点讲解华为云视频在视频编码技术上的一些工作。这些技术得力于华为2012媒体技术院全力支持。上图比较直观地表达了这点。图中黄框表示了编码器的内核,所有的华为云视频编码的编码能力、编码服务都是基于编码内核。编码内核采用了一个标准的编码器,类似于前面提到的H.264、H.265、AVS3、H.266或者EVC这一类,在这个编码内核的基础上,我们面向不同的场景做了不同的编码技术的优化和实践。比如 面向RTC实时音视频场景,采用低时延编码技术;面向VR场景,采用FOV tile编码;面向多视角场景,采用空间云边协同编码;面向监控场景,采用智能语义编码;面向直播、点播,采用感知编码和画质增强等;另外,华为云视频借助鲲鹏、昇腾两大专有硬件,加速视频编转码效率。鲲鹏主要面向CPU这类计算,昇腾主要面向AI方面的加速。 3.2.2 标准编码内核 接下来分别介绍一下视频编码的技术,第一是编码内核,华为云在商用编码器上面也有很多的技术积累。比如说近几年在MSU的大赛上,HW265编码器连续两年获得多项测评的第1名,今年我们也会向MSU推出新的编码器。 3.2.3 高清低码 第二个技术是高清低码,高清低码目前在各个厂商或者商业领域里是大家比较默认的技术,也就是说在基于标准编码内核的基础上,能降低码率的同时保证主观质量没有下降,但实际上高清低码理论可行性是现有视频编码是基于香农定理,它的率失真模型都是连续的,但是人眼视觉模型是阶梯性非连续的,在这个阶梯上存在一个降码率的空间。 高清低码一般情况下包括三个模块,第一是基于人眼JND模型,就是说如何找出JND,第二是基于JND去做感知编码,第三就是通过感知编码来控制标准编码内核输出,在主观质量不变的情况下大幅降低码率。华为云视频在这方面做了很多的工作,目前针对不同的应用场景,能达到30~50%的码率降低。 高清低码技术现在也走到了一个瓶颈期,原有高清低码的考虑仅来源于编码与传输信道,随着AI技术的发展,是否还有进一步的发展空间?华为提出了一种新的思路:在原有的率失真模型上,加入一个接收端(解码端)复杂度的因子,也就是在发送端主动退化,把它通过时域或者空域的下采样变成一个相对数据量比较小的视频,这样做使得编码的码率相对更低,达到有效降低码率的目标。通过一些辅助信息再加上低码率、低分辨率的编码码流,在接收端通过AI技术进行超分、插帧或者是增强,将视频还原,如此整个链路上传输的码率会大幅下降,我们初步试验发现至少能降低60%以上的码率。 3.2.4 超低时延编码 RTC场景是我们面向下一代视频产业重点打造的服务能力,RTC场景下主要是超低时延的编码,我们提出了一个综合的超低时延方案,比如编码和渲染联合优化、编码的内核以及分层编码和信源信道协同等技术手段,面向不同的实时场景会做不同的组合或者应用,我们初步试验发现在1080P这种场景下进行编码和解码,整体的时延能达到十毫秒级别。 3.2.5 VR FOV编码 面向VR场景,特别是面向360°场景,我们提出来FOV TWS的编码技术。这个技术原理是将高分辨率的全景视频分片,多个FOV的小分片加上一路4K的背景流,这样4K终端的播放器就能通过相应的视角FOV分片和4K全景背景流实现8K VR全景视频播放,同时还能保证MTP,不会出现眩晕感。该技术已经写入OMAF的标准。整体体验上也得到了用户的认可。 3.2.6 智能语义编码 当面向监控场景的时候,我们提出了一种智能语义的编码,主要通过背景建模加上视频内容和运动分析,再加上端侧的一些实时超分、插帧来构建智能语义编码的方案。监控场景的画面往往有很多细节,各种机器分析的识别率不能降低,如果压的太狠,识别率可能就会下降。初步的原型结果显示能做到在人和机器的识别率都不降低的前提下,达到70%以上的码率节省。 3.2.7 空间视频云边协同编码 另外一个技术是空间视频编码,所谓空间视频就是是自由视角或多视角,这也是以后技术发展的一个方向。人们不再满足于一个固定视角视频观看,希望多视点或者自由视角的观看视频。在空间视频的编解码当中,我们提出一种云边协同编码,通过这种编码可以在边缘非常短的时间内按需动态的生成任意时刻的切换流,大幅减少一般方案中切换流的码率,初步试验发现至少能降低60%左右的带宽成本。 3.2.8 AI视频增强 视频质量、视频码率是视频产业最关键的两个指标。前面讲的技术,不管是标准的技术、还是非标的技术,都是追求在同等画质的前提下,如何降低码率。 硬币的另一面则是,在同等码率下,如何追求视频主观体验质量。我们在这方面也做了很多尝试,根据不同的场景特征,基于云端、终端AI能力,从分辨率、帧频动态范围等维度对视频进行修复、增强和重建。并且考虑真实场景中往往是包含多种混合失真的等因素,我们提出一种面向混合失真的多任务视频增强框架,能够很好地适应不同场景和不同需求。 以上内容介绍的是华为云视频在视频编解码上的一些实践和探索,希望能带给大家一些干货或者启发。
-
转载http://baijiahao.baidu.com/s?id=1675333014741805976“爷的青春结束了”——在校园BBS、百度贴吧与知乎微博等社交平台,“爷青结”俨然是今夏伊始十分流行的网络词汇。随着暑假临近尾声,同学们即将迎来新的开学季,大家纷纷高喊:“夏去秋来,爷青回”(爷的青春回来了)!而在青春的回忆中,你还记得曾经让你泪奔的那些影视片段吗?华为视频不仅联手三大合作伙伴打造了芒果专区、优酷专区和腾讯视频专区,保证终端用户无需切换app即可同时享受三大平台海量热门内容,近期更整合了十年爆款剧集推出了“十年 爷青回”特别企划,不仅催人泪目,更带动了微博#十年 爷青回#话题热度。截止目前,话题上线仅8天时间,华为视频#十年 爷青回#已斩获1.6亿次阅读与5.4万条讨论。对于年轻用户来说,华为视频“十年 爷青回”特别企划勾起了大家美好的青春回忆,引发了追剧怀旧的浪潮!直面年轻人的内心视界,华为视频承包你的青春华为视频拥有海量电影与电视剧内容,涵盖过去十年间的众多爆款剧集,让年轻人随时随地都能获取全覆盖+高画质的影视综内容,另一方面华为视频会针对重要时间节点开启主题企划。比如七月上线的“嘦青春,恋一夏”暑假企划就点燃了年轻人的青春,给大家带来了精彩纷呈的青春新视界。八月新上线的“十年 爷青回”特别企划,通过精心筛选的爆款内容直面年轻人内心的怀旧视界,自然引发了年轻群体的共鸣。电影也好,电视剧也罢,它们都是一种形而上的消费品,可以带给用户精神层面的愉悦和放松。华为视频 “十年 爷青回”特别企划不仅契合了年轻群体的精神需求,更成为他们自我探索、追逐美好时光的重要载体。 “十年 爷青回”借助微博社交媒体形成了广泛的转发和讨论,不少年轻人纷纷写出曾让自己感动的怀旧剧集,有教会自己成长的励志剧,也有带来爱的启蒙的偶像剧,更有带给自己快乐的喜剧。华为视频“十年 爷青回”特别企划既迎合了年轻人的兴趣文化和价值取向,又针对95后、00后这批青年人群实现了品牌的沟通与升维。精挑细选的爆款剧集,每一部都走进你的记忆深处华为视频“十年 爷青回”特别企划带你重温过去十年的爆款,还记得十年前是跟谁“一起又看流星雨”吗?这部2010年的青春偶像剧教会了你如何尊重友情与爱情,如今在华为视频重温一遍仍然泪点满满。“十年 爷青回”特别企划还推荐了2012年的爆款情景喜剧《爱情公寓3》、2013年火爆荧屏的古装大戏《陆贞传奇》、2014年带你仗剑走天涯的《古剑奇谭》、2015年教你责任、成长与取舍的《花千骨》、2016年陪你谈一场甜甜校园恋爱的《微微一笑很倾城》、2017年堪称“硬汉派”悬疑推理的《白夜追凶》以及2018年守望千年之恋的《香蜜沉沉烬如霜》等爆款佳剧。华为视频不仅陪伴每一位用户成长,也在适当的时候带你重回那些年的追剧时光,无论你为哪些角色或者CP真情实感过,都可以来华为视频重温过去十年的爆款剧集。青春不仅有温存的回忆,更充满了对新鲜事物的好奇。华为视频的海量内容正不断将丰富多彩的优质视听内容呈现给用户——华为视频引入芒果TV、优酷与腾讯视频的海量视频资源,打造了芒果专区、优酷专区和腾讯视频专区三大专区,为终端用户带来了更全面的追剧体验。在这里,可以观看正在热播的《以家之名》,感受三个经历过原生家庭伤痛的孩子组成的“非血缘关系”新家庭的喜怒哀乐;由宋佳、刘敏涛等领衔主演的都市情感悬疑剧《白色月光》即将于8月19日上线,看主人公张一和张鑫是如何突破层层谎言的包裹,最终找寻到真正的幸福;此外还有最新古装剧《且听凤鸣》周一至周三晚20点准时更新,看昔日天才少女凤舞是如何凭借智慧和勇气开启第二人生,并与君武一族圣子君临渊从重逢到相知。再到相恋。这个世界很大,这“视界”很广,华为视频“陪你看遍全视界”的精神内核打动了无数年轻人,海量丰富内容尽在一手掌握!不仅如此,为回馈广大终端用户,在情人节到来之际,华为视频特推出超钻套餐优惠活动, 8月21号至8月25号期间将上线七夕开卡福利,超钻套餐年卡超低惊喜价仅需580元(仅限购买一次)!用户开通华为视频超钻套餐后可畅快饱览华为视频、芒果TV、优酷和腾讯视频海量VIP精品内容,爆款影视剧与最潮酷的综艺节目看个痛快,无论新老用户都不妨抓住机会。继引入三大专区海量优质内容之后,华为视频再增设欢喜首映独播影院,《误杀》《吹哨人》《两只老虎》等热片让你大饱眼福;还有精选悬疑、犯罪、动作等类型电影的“诡案迷踪放映厅”,通过电影剧场模式带给你沉浸式观影体验;最近更添加VR专区带你“云游”世界,感受3D全景视频带来的震撼视效,进一步丰富了端内多元化内容。毫无疑问,华为视频懂年轻人、更懂影视内容,通过“十年 爷青回”特别企划这样有意义的线上活动,嫁接起与终端用户互动、沟通的桥梁。华为视频不仅满足年轻人对多元化视频内容的渴求,更愿意陪你在未来的日子继续看遍全视界!
W--wangzhiqiang
发表于2020-08-18 12:10:25
2020-08-18 12:10:25
最后回复
W--wangzhiqiang
2020-08-18 12:10:25
8862 0 -
每一次突发事件都考验着各行业的智慧和能力,2020年,当“云上生活”,“永远在线”成为新常态,人的能力、企业的能力在危机环境遭遇巨大挑战,比如很多企业的业务系统、内部会议系统出现没办法进行远程的访问和使用的情况。疫情给中国所有的政府和企业好好地上了一堂课:数字化如此重要,已经成为战胜疫情、恢复经济的刚需。云、AI、5G不断为政企数字化转型注入新动能,政企行业在被动融入时迅速调整管理方式并发现新的可能性。华为公司副总裁、华为云业务总裁郑叶来之前分享了一组数据:春节之后中国远程办公人数超过3亿,而2019年的数据是500万。2020年第一季度,华为云云主机、CDN、实时音视频和云会议等服务也都在爆发式增长。在这特殊时期,华为云实时音视频(RTC)能力从幕后走向台前并被重新理解认知。看似刚入局的行业新兵,却有30年的音视频技术积累、1186项全球音视频专利,华为云端云协同不断降低行业门槛。从疫情期间湖北火神山医院使用基于华为云实时音视频服务构建的华为云会议系统,到最近使用华为云会议系统举行的东盟十国峰会和中非特别抗疫峰会,华为云的音视频技术和能力正深入各行各业,通过全场景、全实时、全互动的服务提升企业效率。 入局RTC 拉高行业天花板 以往音视频在娱乐媒体、网络直播中应用频繁。2020年伊始,会议+直播+互动已经深入到在线课堂、远程医疗、企业办公、营销、安防监控等各行各业,音视频成为目前最好的联接方式,实时音视频服务(Real-Time Communication,简称RTC)的使用场景创新从未停息。在实时音视频的技术,持续在演进和发展过程中,业内有一个共识:做RTC很容易做好难,业务流程和技术架构因应用的差异化都是彼此割裂的,诸如直播、连麦、会议、监控各有各的网络架构,同时“一网多用”始终没有成型,更不要说像VR/AR这样的新兴应用拓展。 华为云联接与协同业务总裁薛浩 如今我们流行的娱乐直播,短视频,直播带货等场景使用CDN直播技术,当直播变成实时互动时,延迟问题会影响客户体验和业务升级。在华为云联接与协同业务总裁薛浩看来,RTC技术融入千行百业的不同场景必须跨过三大门槛,给客户全场景和全实时的音视频体验,让各行业在5G时代有更多的业务创新和更好的体验升级。一是音视频能力的积累。音视频不仅只有编码转码,需要有很多弱网环境,来自公网上的挑战和延迟需要服务商具备低码转高码,高码转低码等长时间的技术和场景积累。二是对于端的整合能力。薛浩认为,RTC其实是端和云的协同,所有的RTC服务首先完成端媒体流的采集,继而再加工进行转发。用户的使用端侧不仅五花八门,操作系统、芯片也各不相同,客户跨端应用比较频繁,服务商对于端持续的更迭和维护,是非常大的挑战。三是成本理解和网络资源。RTC本身是资源型的业务,对于计算资源和网络资源诉求极高,要共享网络和计算资源成本非常高,如何有效降低成本是所有服务商考虑的问题。通信行业起家,在运营商领域服务多年,华为积累了音视频能力,具备终端的覆盖和整合能力,SDK可适配更多终端,同时华为云CDN在全球已经有2500多个节点(国内2000多个),这些节点的网络和节点的算力、边缘的算力和能力可以充分共享,有效降低用户成本。把RTC的技术带到各行各业,拉高行业的天花板,让用户用得起用得好,华为云发布实时音视频服务,将30多年以来技术沉淀的集中释放,给客户全场景和全实时的音视频体验。 具体而言,华为云一方面要将软硬件的产品组合通过技术协同向行业端渗透,利用互联互通的特性更加深入业务层级,另一方面则是借助技术红利打造简洁高效可靠的人机交互体验,让沟通和协作不再受带宽、时延、丢包的困扰。 做大市场 加速RTC技术迭代 作为一种实时通信技术,RTC主要对音频/视频信号进行处理和传输,以前主要用在视频通信类业务上,现在众多视频有了新的场景需求,越来越多的客户开始需要音视频会议的能力。就拿在线会议来说,随着高并发大流量、多终端的发展,以前独立的会议架构慢慢重构,疫情期间的发展,双向互动要求提高,要满足直播互动场景,必须要对接CDN和RTN两个网络,通过合流、旁路直播的方式来满足场景需要,多个环节,层层分发,时延至少需要3s以上。 华为云新一代RTC,可以实现一套网络支撑全场景业务,通过上下行流量融合处理,实现多业务互联互通,灵活流转。一张网融合,可以让客户的资源效率提升30%,运维效率提升50%。与即时通讯时代的音视频不同,现在的音视频服务需要直播、互动、交互等可以灵活组合切换,华为不断提升行业天花板,加速RTC技术迭代,将中心式、树状结构、层层分发的模式,改变为网状结构,去中心化,基于边缘节点部署,就近接入,通过实时监控和智能调度,端到端选择最佳路由,可以实现实时观看(时延<1s)、实时互动(时延<200毫秒、实时操作(时延<50毫秒),充分满足业务需要。在薛浩看来,未来AI技术在音视频媒体网络中将会持续大规模应用,持续推动行业发展,与此同时,VR和AR的技术会基于RTC实时的媒体网络,快速发展起来,未来有很多可能,但是每一种可能都需要大规模技术、长期的投入。华为已经做好准备把行业的技术门槛降低,面向未来,持续进行核心技术的投入和布局,华为云实时音视频服务可以提供包括智能感知编码、SVC分层可伸缩编码等多项技术,提升编解码效率,以及较强的网络适应性技术,加速RTC技术迭代,让RTC成为华为云的基础业务,把音视频会议的能力推向行业化。目前,基于实时音视频服务构建的华为云会议,在技术、体验和业务形态上得到全面升级,已服务于50多家国家级/省市级政府单位的智慧政务、疫情防控和指挥调度,支持了5000+学校的在线教育和全球超过1万家医疗机构,并创新了云签约(支撑了2000亿签约金额)、云招聘(同人民日报提供了50万工作岗位)等新业态场景。 协作创新 让客户、伙伴实现价值增值“向上捅破天,向下扎到根”是华为内部的名言,具体到RTC服务领域,薛浩这样总结:向上捅破天“就是要把行业的天花板抬升,扩大整个行业空间,“向下扎到根”就是要用算法、专利等核心技术支撑行业的天花板抬升。在薛浩看来,在RTC技术的演进和发展过程中,华为云扮演的角色是服务提供商,华为并不去服务全行业,而是将基础能力做到极致,不断降低技术门槛,让音视频产品更加好用,成本更低,质量更好,使得音视频能力变成华为云上黑土地,合作伙伴可以站在华为的肩膀上,获得来自技术和市场方面的直接助力,支持合作伙伴在行业场景中创新发展。
-
2020年这场肆虐全球的新冠疫情让很多企业刷新了自己对数字化的认识。正如 “大潮褪去,才知道谁在裸泳”,疫情来势汹汹之时,企业数字化水平高下立分。有的企业之前一直自豪于斥重资打造高科技会议室,但在员工纷纷居家隔离时才发现,会议室再高科技炫酷,人到不了现场也枉然,内部会议系统根本不支持外部远程接入。还有的企业自诩数字化转型十分成功,但是各种业务系统无法在外部登录使用,协同办公陷入停滞状态,所谓的数字化也只是“办公室里的数字化”罢了。与此同时,随着在线教育、远程医疗、视频会议的火爆,在企业纷纷自省未来数字化建设方向的当下,由于视频业务可以打破时空局限,提升办公效率,在疫情期间异军突起,也成为越来越多企业增加投入的重点方向之一。遗憾的是,成本高昂、延迟卡顿导致用户体验差、网络不稳定、安全存隐患这些因素影响了视频服务成长的速度。在华为云TechWave音视频专题日上,华为云联接与协同业务总裁薛浩携华为云精心打造的实时音视频服务(Real-Time Communication)重装亮相。延续着华为公司一直以来的“技术流做派”,华为云的实时音视频服务不仅凭借技术手段一一击破发展桎梏,而且还将音视频的服务水准再提升到一个新高度。与常规较劲,华为云要做不一样的实时音视频服务华为云做实时音视频服务其实并不太令人意外。想想看,华为有海量的手机用户,PC平板产品,还有针对企业的专业智慧屏,在终端侧其实已经有了很大优势。而在网络传输环节,通信起家的华为多年的ICT技术底蕴更不必多说,据说已经拥有1186件音视频算法专利。到了系统环节,华为本身就在做操作系统和芯片,对于移动端的功耗和网络抖动,华为更是有很多专利和算法。 但事实上,华为在做实时音视频服务时,面临的挑战还真不小,最大的原因就是华为要做的不是普通水准的音视频服务,而是要做突破性能极限,用技术让性能开发到极致的音视频服务。举个例子,在视频业界,画面延时3秒是再普通不过的事了,做得好的服务商可以将延时卡顿降低到200毫秒,而华为云一上来就和业界“常规”较劲,50毫秒的延时能不能做到?同样都是360P的流,华为云能不能体现出1080P的画质和效果?到了弱网环境,传统服务商提供的画面可能就卡顿了,华为云能不能流畅地将画面播出来? 华为云联接与协同业务总裁薛浩透露,延迟和大流量并发是华为实时音视频服务面临的最大挑战。对于实时音视频服务而言,网络架构应该是一个去中心化的自适应网状结构,因为去中心化,所以边缘侧要更多更强。华为云在全球拥有2500多个CDN节点,这些节点的网络资源和算力资源都可以被看作是华为云在边缘的算力,也极大地降低了成本。最终华为云构建一个虚拟的网络中心和虚拟的边缘,业务开始转发时,这个云端节点就是中心,接收视频流时,这个节点就是边缘。灵活的网络架构再结合华为云在容器、IaaS、边缘算法、端侧SDK的能力,不仅保障了实时音视频服务可以拥有更低延迟,更低成本这些关键能力,还可以实现网络质量的灵活调度。例如,对于免费用户,华为云可以提供低成本的音视频服务,对于VIP用户,华为云就可以提供高质量的音视频服务,用户自由选择。 全新互动实时音视频体验薛浩总结到,华为云打造的是基于视频流融合,统一的一张网,支持所有的场景业务。据了解,华为云实时音视频服务不仅可以实现播放观看、连麦互动、实时交互等业务场景天然互通,无缝流转,而且面对千人互动,亿级并发这样的高并发场景也毫无压力。 那么凝聚了华为众多领域黑科技的华为云实时音视频究竟给用户带来什么样的体验呢?概括说,这是一次全新的互动实时音视频体验,2020年在社交娱乐、在线教育、云会议行业的用户,已经率先感受到了它的魅力。 以在线教育场景为例,传统的教育场景就是老师通过视频授课,讲的内容有没有被学生理解,学生在讲课过程中有没有哪些疑问都无从得知。但是通过华为云实时音视频服务,在线教育机构可以实现视频教学过程中的双向互动,学生可以立刻“哪里不会点哪里”,老师也可以及时根据学生们的反馈调整教学重点。更重要的是,华为云让这样的双向端到端互动,时延远远小于200毫秒,实时操作的指令响应时长甚至小于30毫秒。 对于用户们最为看重的视频质量,华为云音视频服务也足够令人惊喜。4K/8K超高清画面,不管是在运动的汽车、高铁,还是在隧道、地下室依然流畅不卡顿,不花屏。尤其值得一提的是,在弱网环境下,华为云实时音视频支持在50%视频抗丢包,80%音频抗丢包情况下,依然可以保持流畅的视频和通话。 如果仅仅做到这一步,那怎么能叫做“追求极致”呢?华为云实时音视频服务还融入了AI媒体处理能力,可以实现美颜、降噪、背景虚化/替换,实时语音翻译和字幕,带来的绝对是让消费者们都忍不住尖叫的完美体验。更别提业界最高等级的安全能力,提供多重安全认证,5G+专线双平面高规格保障,全程媒体流加密技术,带来安全可靠的音视频服务。 不忘初心,以开放心态推动行业进步当传统的CDN架构渐渐演变成主打边缘的去中心化网络架构,实时音视频服务的发展仍只是刚刚起步。对于华为云而言,目前解决的是在接入侧的问题,但端到端属性的音视频服务是一个长长的链条,5G只是解决了两端的接入,中间的骨干网络还需要重新适配,这是一个需要持续发展持续演进的过程,需要全行业的努力。 薛浩强调,因为华为一直坚持“自己做的降落伞自己先跳”,所以在实时音视频服务不断成熟完善的过程中,华为云已经尝到了技术红利。如今华为云希望能够将自己积累的技术能力反馈给行业,用更低的成本,更低的技术门槛和更高的用户体验来推动行业进步。这个初心就使得华为选择提供开放的音视频服务,因为解决行业的问题仅仅依靠华为云自己的力量是不够的,要将音视频产业做大才是当务之急。华为云希望有更多行业的ISV、头部客户来使用华为云的能力,提升音视频业务的品质,从而赢得商业成功。
-
8月5日,华为云举办TechWave音视频专题日,深度阐述华为云RTC实时音视频服务和华为云会议,爱学习教育集团、成都索贝数码科技有限公司分享了基于华为云RTC的教育、直播场景应用实践,多方共同探讨音视频前沿创新技术,以及技术如何推动音视频行业智能升级。华为云联接与协同业务总裁薛浩表示:“华为在音视频领域已经耕耘了30多年,拥有多达1000+件音视频算法专利。在视频编解码、网络传输分发等积累了深厚的技术实力;同时结合我们在5G、IT基础设施、智能终端等领域的领先优势,华为云推出了全新的实时音视频服务,希望帮助音视频行业在5G时代实现更好的视频业务体验,更多业务创新,一起享受数字化技术带给大家的便利。”音视频黑科技,带来全新互动实时音视频体验 当前受技术和资源等限制,视频的发展存在三大挑战:第一,场景割裂,直播、互动、会议等场景各自有一套网络,导致问题定界困难,问题修复周期长;第二,体验不佳,直播主播与观众之间秒级以上时差,存在网络抖动、卡顿、花屏等问题;第三,成本高昂,限制了应用场景普及。 华为云实时音视频服务(Real-Time Communication)凭借在视频业务领域长期技术积累,快速为行业提供高并发、低延迟、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务,适用于在线教育、云会议、社交文娱等场景。 华为云视频云总监陆振宇表示:“华为云实时音视频服务核心亮点是超低时延、一网原生、千人互动。” l全场景、一张网:基于视频流融合,统一的一张网支持所有的场景业务,不再旁路直推CDN,一套SDK实现互动+超大规模直播,播放观看、连麦互动、实时交互等业务场景天然互通,无缝流转,观众随时上麦,参与互动,支持千人互动、亿级并发。 l全实时、低延迟:实时观看,播放时延<200ms;实时互动,双向端到端时延<200ms;实时操作,指令响应时长<30ms。 l高质量、强稳定:超高的视频质量,4K/8K超高清;超强的网络适应性技术,不管是在运动的汽车、高铁,还是在隧道、地下室等弱网环境下,华为云实时音视频支持在50%视频丢包,80%音频丢包情况下依然可以保持流畅的视频和通话,不卡顿,不花屏。 l带宽成本更优:华为云实时音视频服务具有业界领先的音视频编解码技术,连续两年获得MSU世界编码大赛冠军,提供最先进的智能感知编码、SVC分层可伸缩编码等多项技术,提升编解码效率,实现同等画质30%-40%的码率节省。 l更智能:AI媒体处理能力,可以实现美颜、降噪、背景虚化/替换,实时翻译等,带来更智能的音视频体验。 赋能应用,助力行业创新升级华为云会议首席产品经理黄超在会上介绍了基于实时音视频服务构建的华为云会议,在技术、体验和业务形态上得到全面升级。华为云会议能提供专业的音视频通信体验,在弱网环境下也能顺畅沟通,支持千人互动,百万人观看的超大并发容量,无线投屏,白板共享,多人标注,实时翻译,自动纪要等,带来更加自然交互的文档和数据协作。黄超表示:“在网络传输上,我们做了高清低带宽的技术创新,支持视频50%的抗丢包、音频80%抗丢包;移动会议体验上,我们是业界唯一一家做到720P视频会议的厂商,且功耗能处在很低的水平;在数据会议上,我们支持H265/4K,细节还原度和和时延保持和本地一致的体验。同时,华为也在AR/VR会议上进行创新,且有望被大规模普及;另外,我们正在基于RTC网络做会议和直播的融合,比如万人直播互动。”爱学习教育集团CTO郭杏荣在《基于RTC的教育OMO发展和创新》演讲中表示,爱学习基于华为RTC构建的超低延迟线上互动课堂和基于华为云音视频实时传输的网络,具备推流、入网对抗、平台互通和录制的能力,从而进行全终端覆盖。索贝泛媒体事业部副总分享了《下一代互动直播业务分析与展望》演讲,他表示基于华为云RTC,索贝打造了多个音视频产品,形成了面向新闻、教育、综艺等全场景直播互动解决方案,广泛服务于中央台、湖南台、北京台等,在疫情期间打造无导演、无摄像、无演播厅的三无综艺。未来,华为云实时音视频服务将继续发挥云、AI和5G的协同优势,把技术积累开放出来,通过全栈技术创新,与伙伴一起使能千行百业,驱动全行业智能化升级。
-
那个MPD内容举个例子:<?xml version="1.0" encoding="utf-8"?><!-- Created with Broadpeak BkS350 Origin Packager (version=1.10.12-18737) --><MPD xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="urn:mpeg:dash:schema:mpd:2011" xmlns:cenc="urn:mpeg:cenc:2013" xsi:schemaLocation="urn:mpeg:dash:schema:mpd:2011 http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-DASH_schema_files/DASH-MPD.xsd" type="dynamic" availabilityStartTime="1970-01-01T00:00:00Z" publishTime="2020-08-07T12:23:37.803894Z" minimumUpdatePeriod="PT8S" timeShiftBufferDepth="PT24S" maxSegmentDuration="PT8S" minBufferTime="PT8S" profiles="urn:mpeg:dash:profile:isoff-live:2011,urn:com:dashif:dash264"><Period id="1" start="PT0S"><EventStream schemeIdUri="urn:de:dtag:eit:2017" value="18" timescale="10000000"><Event presentationTime="15968027365242607" duration="31550000000" id="2138119006" contentEncoding="base64">RVZFTlRJRD0yNUY0LFZFUlNJT049MTUsRkxBRz0wLFNUQVJUVElNRT1FNkJDMTE1OTU3LERVUkFUSU9OPTUyMzUsU1RBVFVTPTQsREVTQ180RD02NDY1NzUwRDQ4NjE3NzYxNjk2OTIwNDY2OTc2NjUyRDMwNDIwNTQyNjU3MjY1Njk3NDIwNjZGQzcyMjA2NTY5NkUyMDUzNzA2OTY1NkMzRjhBNDM3MjY5NkQ2NTJENTM2NTcyNjk2NTJDMjA1NTUzNDEyMDMyMzAzMTM2OEE0MTZDNzQ2NTcyNzM2NjcyNjU2OTY3NjE2MjY1M0EyMDYxNjIyMDMxMzIsREVTQ19CQj0xNyxERVNDX0JDPTU3</Event></EventStream><AdaptationSet id="1" group="1" contentType="audio" segmentAlignment="true" audioSamplingRate="48000" mimeType="audio/mp4" codecs="mp4a.40.2" startWithSAP="1"><AudioChannelConfiguration schemeIdUri="urn:mpeg:dash:23003:3:audio_channel_configuration:2011" value="2"></AudioChannelConfiguration><!-- Common Encryption --><ContentProtection xmlns="urn:mpeg:dash:schema:mpd:2011" xmlns:cenc="urn:mpeg:cenc:2013" schemeIdUri="urn:mpeg:dash:mp4protection:2011" value="cenc" cenc:default_KID="C8EFFF27-6E1A-D9E6-693F-3E0B64C8EFEC"></ContentProtection><!-- PlayReady --><ContentProtection xmlns="urn:mpeg:dash:schema:mpd:2011" schemeIdUri="urn:uuid:9A04F079-9840-4286-AB92-E65BE0885F95" value="MSPR 2.0"></ContentProtection><!-- Widevine --><ContentProtection xmlns="urn:mpeg:dash:schema:mpd:2011" schemeIdUri="urn:uuid:EDEF8BA9-79D6-4ACE-A3C8-27DCD51D21ED"></ContentProtection><InbandEventStream schemeIdUri="urn:de:dtag:eit:2017" value="18"></InbandEventStream><Role schemeIdUri="urn:mpeg:dash:role:2011" value="main"/><SegmentTemplate timescale="48000" initialization="KabelEins_SD-$RepresentationID$.dash" media="KabelEins_SD-$RepresentationID$-$Time$.dash"><!-- 2020-08-07T12:23:04.540250Z / 1596802984 - 2020-08-07T12:23:28.540250Z --><SegmentTimeline><S t="76646543257932" d="384000" r="2"/></SegmentTimeline></SegmentTemplate><Representation id="audio_129713_deu=129200" bandwidth="129200"></Representation></AdaptationSet><AdaptationSet id="2" group="2" contentType="video" par="16:9" minBandwidth="576400" maxBandwidth="2276800" maxWidth="960" maxHeight="540" minFrameRate="25" maxFrameRate="50" segmentAlignment="true" sar="1:1" mimeType="video/mp4" startWithSAP="1"><!-- Common Encryption --><ContentProtection xmlns="urn:mpeg:dash:schema:mpd:2011" xmlns:cenc="urn:mpeg:cenc:2013" schemeIdUri="urn:mpeg:dash:mp4protection:2011" value="cenc" cenc:default_KID="C8EFFF27-6E1A-D9E6-693F-3E0B64C8EFEC"></ContentProtection><!-- PlayReady --><ContentProtection xmlns="urn:mpeg:dash:schema:mpd:2011" schemeIdUri="urn:uuid:9A04F079-9840-4286-AB92-E65BE0885F95" value="MSPR 2.0"></ContentProtection><!-- Widevine --><ContentProtection xmlns="urn:mpeg:dash:schema:mpd:2011" schemeIdUri="urn:uuid:EDEF8BA9-79D6-4ACE-A3C8-27DCD51D21ED"></ContentProtection><SupplementalProperty schemeIdUri="urn:mpeg:mpegB:cicp:ColourPrimaries" value="5"></SupplementalProperty><SupplementalProperty schemeIdUri="urn:mpeg:mpegB:cicp:TransferCharacteristics" value="5"></SupplementalProperty><SupplementalProperty schemeIdUri="urn:mpeg:mpegB:cicp:MatrixCoefficients" value="5"></SupplementalProperty><InbandEventStream schemeIdUri="urn:de:dtag:eit:2017" value="18"></InbandEventStream><Role schemeIdUri="urn:mpeg:dash:role:2011" value="main"/><SegmentTemplate timescale="600" initialization="KabelEins_SD-$RepresentationID$.dash" media="KabelEins_SD-$RepresentationID$-$Time$.dash"><!-- 2020-08-07T12:23:04.523333Z / 1596802984 - 2020-08-07T12:23:36.523333Z --><SegmentTimeline><S t="958081790714" d="4800" r="3"/></SegmentTimeline></SegmentTemplate><Representation id="video=576400" bandwidth="576400" width="480" height="270" frameRate="25" codecs="avc1.640015" scanType="progressive"></Representation><Representation id="video=1138400" bandwidth="1138400" width="640" height="360" frameRate="25" codecs="avc1.64001E" scanType="progressive"></Representation><Representation id="video=2276800" bandwidth="2276800" width="960" height="540" frameRate="50" codecs="avc1.64001F" scanType="progressive"></Representation></AdaptationSet></Period><UTCTiming schemeIdUri="urn:mpeg:dash:utc:http-iso:2014" value="https://time.akamai.com/?iso"/>蓝色部分是EIT信息,base64解密之后息的是:EVENTID=25F4,VERSION=15,FLAG=0,STARTTIME=E6BC115957,DURATION=5235,STATUS=4,DESC_4D=6465750D48617761696920466976652D3042054265726569742066FC722065696E20537069656C3F8A4372696D652D53657269652C2055534120323031368A416C7465727366726569676162653A206162203132,DESC_BB=17,DESC_BC=57 红色部分是加密信息,里面有playready 和 widevine 加密default_KID="C8EFFF27-6E1A-D9E6-693F-3E0B64C8EFEC" kid信息。紫色部分是音频分片信息 绿色是视频信息来看音频信息:<SegmentTemplate timescale="48000" initialization="KabelEins_SD-$RepresentationID$.dash" media="KabelEins_SD-$RepresentationID$-$Time$.dash"><!-- 2020-08-07T12:23:04.540250Z / 1596802984 - 2020-08-07T12:23:28.540250Z --><SegmentTimeline><S t="76646543257932" d="384000" r="2"/></SegmentTimeline></SegmentTemplate><Representation id="audio_129713_deu=129200" bandwidth="129200"></Representation>timescale 时间精度,也就是1秒的分辨率initialization 初始化分片格式 KabelEins_SD-$RepresentationID$.dash 根据后面的RepresentationID audio_129713_deu=129200可知道该音频的初始化分片为 KabelEins_SD-audio_129713_deu=129200.dash media 媒体文件名称KabelEins_SD-$RepresentationID$-$Time$.dash 根据后面的RepresentationID audio_129713_deu=129200和 SegmentTimeline 值可以知道实际分片:<SegmentTimeline><S t="76646543257932" d="384000" r="2"/></SegmentTimeline>t 开始时间 d duration 实际分片时间是 d/timscale = 8s ,r repeat ,那么当前mpd文件 有三个分片 time 为:76646543257932/76646543257932+384000=76646543641932/76646543257932+384000+384000=76646544025932KabelEins_SD-audio_129713_deu=129200-76646543257932.dashKabelEins_SD-audio_129713_deu=129200-76646543641932.dashKabelEins_SD-audio_129713_deu=129200-76646544025932.dash同理可以推出视频信息,那么针对该MPD内容我们可以得出如下的信息:1.dash流里有eit信息2.dash流为加密流含有两种加密 playready 和 widevine3.音频流只有一个格式分片 初始化分片(主要用于解码器预载)KabelEins_SD-audio_129713_deu=129200.dash 音频分片有三个 KabelEins_SD-audio_129713_deu=129200-76646543257932.dash/KabelEins_SD-audio_129713_deu=129200-76646543641932.dash/KabelEins_SD-audio_129713_deu=129200-76646544025932.dash 每个分片时长8s4.视频流有多个带宽,分片时长为8s :初始化分片 KabelEins_SD-video=576400.dash 分片信息 KabelEins_SD-video=576400-958081790714.dash/KabelEins_SD-video=576400-958081795514.dash/KabelEins_SD-video=576400-958081800314.dash/KabelEins_SD-video=576400-958081805114.dash/KabelEins_SD-video=576400-958081809914.dash初始化分片 KabelEins_SD-video=1138400.dash 分片信息 KabelEins_SD-video=1138400-958081790714.dash/KabelEins_SD-video=1138400-958081795514.dash/KabelEins_SD-video=1138400-958081800314.dash/KabelEins_SD-video=1138400-958081805114.dash /KabelEins_SD-video=576400-958081809914.dash初始化分片 KabelEins_SD-video=2276800.dash 分片信息 KabelEins_SD-video=2276800-958081790714.dash/KabelEins_SD-video=2276800-958081795514.dash/KabelEins_SD-video=2276800-958081800314.dash/KabelEins_SD-video=2276800-958081805114.dash/KabelEins_SD-video=576400-958081809914.dash
-
重灾疫情下,全民线上使得“非接触”式概念火了,而RTC(实时音视频)技术则是支持所有线上非接触式实时互动场景的基石。作为全球领先的ICT基础设施和智能终端提供商的华为,8月5日,华为云音视频专题日分享了在线课堂、视频会议等RTC技术在各行业的广泛应用;解析高并发、低延时等RTC技术要点、难点,并通分享了华为云RTC“黑科技”的独到之处。全民开启“非接触式”,华为云RTC技术赋能全行业正如 “大潮褪去,才知道谁在裸泳”,疫情来势汹汹之时,企业数字化水平高下立分。根据艾媒咨询的数据显示,2020年春节期间,中国有超过3亿人远程办公,企业规模超过1800万家;除此之外,数据显示2020年疫情期间在线复课将覆盖包括学生教职工在内近3亿人。而对于一场全民线上的大爆发,需求集中的在线教育和远程办公只是非接触式经济的冰山一角,RTC技术的发展已经让“非接触”的线上实时互动渗透到学习、生活、工作、娱乐的各个领域。在此次分享会上,华为云视频云总监陆振宇分享了华为RTC技术在各行业场景的实际应用和覆盖,包括在社交、教育、金融、医疗、企业协作等众多行场景的实践。陆振宇介绍,疫情期间在政务会议场景方面,华为云已服务50多家国家级/省市级政府单位的智慧政务、疫情防控和指挥调度,同时,华为云支持了5000+学校的在线教育和全球超过1万家医疗机构。针对收疫情波及最大的社会企业,华为云创新了云签约(支撑了2000亿签约金额)、云招聘(同人民日报提供了50万工作岗位)等新业态场景。相较于其他的服务厂商,华为云在诸多场景应用的成绩着实亮眼。万物皆可线上化,但实时互动仍有技术挑战在各行业非接触式互动场景中,对RTC要求最高的就是紧急服务和医疗,其次是办公和教育,再是社交。一旦出现延迟、卡顿、不清晰等质量问题,医疗急救、办公、教育、直播这种非常强调医患之间、员工之间、主播和用户之间、老师和学生之间实时互动交流的场景,体验就大受影响,甚至根本没有办法顺畅进行。陆振宇认为,从今天RTC发展来看,当前技术和资源都受限制,视频的发展存在挑战。他认为,直播、互动、会议等场景各自有一套网络,场景割裂导致问题定界困难,问题修复周期长;其次,绝大多数不能保证实时互动,直播主播与观众之间存在秒级以上时差,网络抖动、卡顿、花屏等问题直接影响用户体验;第三,成本高昂,限制了应用场景普及。可见,实时音视频的技术还没达到我们期望的技术顶点,如端到端的延迟,对不同手机终端、SDK的适配,以及网络可靠性和安全性,这面临的是成堆的技术问题需要解决。突破重围,华为云RCT如何成为音视频行业黑马?疫情爆发初期,视频会议和在线直播课面临井喷式涌入,许多平台未能扛住压力,出现卡顿、崩溃。据了解,华为在音视频领域已经耕耘了30多年,在视频编解码、网络传输分发等积累了深厚的技术实力,成立至今已拥有多达1000+件音视频算法专利。凭借在视频业务领域长期技术积累,快速为行业提供高并发、低延迟、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务,适用于在线教育、云会议、社交文娱等多场景应用。在线教育场景中,爱学习集团在线课堂基于华为RTC构建的超低延迟线上互动课堂和基于华为云音视频实时传输的网络,在此次疫情中【扛住】了压力,避免了全网流量冲击事故,实现了推流、入网对抗、平台互通录制的能力,完成全终端覆盖。与此同时,基于音视频服务构建的华为云会议,在技术、体验和业务形态上得到全面升级。在网络传输上传输层面,华为做了高清低带宽的技术创新,支持抗视频50%丢包、抗音频80%丢包;移动会议体验层面,华为云会议是业界唯一提供720P视频会议的厂商,且功耗能处在很低的水平;在数据会议上层面,华为云会议支持H265/4K,细节还原度和和时延保持和本地一致的体验。作为实时音视频专业技术服务商,华为的专业性优势也在特殊时期凸显出来。此外,超强的网络适应性技术,不管是在运动的汽车、高铁,还是在隧道、地下室等弱网环境,华为云会议都能提供专业的音视频通信体验,支持千人互动,百万人观看的超大并发容量,无线投屏,白板共享,多人标注,实时翻译,自动纪要等,带来更加自然交互的文档和数据协作。任何技术的发展和应用,不能单靠一家单打独斗,行业的壮大和进步必须依靠赛道内所有玩家共同努力,并最终把蛋糕做大。在行业标准制定上,华为云希望可以和行业伙伴一起制定一个世界领先的行业标准,同时可以去牵引整个行业对它的投入和发展。未来随着以华为为代表的实时音视频技术服务商更专业的研究和不断的努力,以及5G时代的来临,华为RTC将在帮毫无感知的情况下帮助用户顺畅的沟通、互动和决策,成为像水和空气一样,基础、普及的能力。
-
音视频能力作为华为云黑土地的一部分,使能各行各业孵化出更多创新音视频服务,推动数字化转型。 2020年,一场突如起来的疫情打乱了人们的生活、工作节奏,大大激发了各行各业对数字化、在线化、智能化的需求, “云上生活”,“永远在线”成为新常态。在线办公、在线会议、在线直播……“万物皆可线上化”似乎在一夜间成为了现实。 1全民线上化,RTC技术方兴未艾岁月静好的背后,是有人为你负重前行。其实,技术服务也一样,当大家随心所欲的享受线上经济的时候,背后都依赖于一项关键性技术——RTC(实时音视频:Real-time Communication)。此项技术是支持几乎所有非接触式在线实时互相场景背后的关键先生,却鲜为人知,借此很多线上场景可以实现实时的音视频通话,并快速渗透到我们生活、学习、工作和娱乐等各个领域。如疫情防控期间为了停课不停学的师生们开始尝鲜直播授课,企业远程复工期间所急需的视频会议,个体小商户为积极自救依赖的直播带货,以及为减少感染风险而大规模应用的远程医疗……这些场景都离不开RTC。艾媒咨询数据显示,今年春节期间,中国有超过3亿人远程办公,企业规模超过1800万家;疫情期间直播授课覆盖了近3亿的全国师生。经历此次疫情,让RTC这个原先大众并不熟悉的技术一下子变成了一项与5G、AI等齐名的热词。可以说,通过这些令人印象深刻的在线场景,人们第一次认识到了RTC技术的威力和效用。云,AI,5G加持的音视频网络将全面升级视频体验,华为云联接与协同业务总裁薛浩透露,RTC给各行各业带来了实际效率的提升,大家要么已经用了RTC,要么在用RTC的路上。2非接触经济火了,但RTC仍存技术挑战尽管RTC技术或将迎来高速普及的拐点,但任何一项技术的发展应用,都不可能一蹴而就,RTC技术也不例外,都需要一个循序渐进的完善过程。在这个过程中,存在着很大的技术门槛和发展瓶颈,薛浩认为,从今天RTC发展来看,首先是一个成本问题,包括会议成本都比较高,只有这些成本能够降到让各行各业和普遍大众都能接受的程度,这样的话才能百花齐放,各个行业的应用就可以发挥它自己行业的优势,有更多的应用场景可以展现出来。他认为,“实时音视频的技术还没达到我们期望的技术顶点,如端到端的延迟,对不同手机终端、SDK的适配,以及网络可靠性和安全性,这些问题制约了行业的发展。”如我们今天看到的虎牙、斗鱼、抖音等APP直播带货等,这些应用都使用了CDN直播技术,但有时连麦、有时互动,会存在延迟的问题,并且没办法做到多人互动,在体验上是割裂的。“这个过程中,你要从直播变成实时互动,就得再加进去,用户体验很差。”薛浩表示,我们希望下一代实时音视频的网络,它可以变成一张网络,无论是直播也好,还是互动也好,体验上不要割裂,它是一致的。据薛浩透露,现在行业对于延迟等都没有一个统一的标准,处于五花八门的状态,这对于开发者及用户来说,都会产生很大的困扰。比如在RTC实时音视频的体验标准的定义上,端到端延迟到底是500毫秒,还是200毫秒,目前都没有一个清晰的标准。3打造音视频领域黑土地,使能全行业创新成本太高、标准不统一、开发者难适用,还有延迟的问题等,不一而足,这是目前整个行业面临的技术挑战。那么,作为领先的ICT基础设施和智能终端提供商的华为,以及华为云在这个过程中扮演什么样的角色呢?要如何破解这些行业难题?据薛浩透露,在这个过程当中,华为云扮演的始终是服务提供商的角色,要让RTC技术更好用,让成本更低,让服务质量更好。从定位上来看,华为是一个技术公司,希望通过华为技术的努力推动行业的进步,把这个技术的门槛降低,大家用得起,同时把体验和服务质量提升,拉高行业的天花板,让更多的人能得到优质的和比较理想的服务 同时他也希望RTC互动的成本,能够跟现在的直播在一个水平线上,这是华为去做实时音视频这个产品服务的初心,能真正推动这个业务,从一个增值业务,变成一个技术业务,变成一个云上的基础服务。大家都能用得起,而且用得好。“自己的狗粮自己吃。”据薛浩介绍,从具体做法上来看,华为做RTC首先是从华为内部开始。如华为畅连,目前有一亿多的终端用户在使用畅连业务,这个就是从华为内部孵化出最初的种子用户。在这个基础上,华为云会议服务也是基于RTC去做的。薛浩透露,通过华为内部的锤炼,把这个产品和服务先做好,让大家去使用。目前来看,华为RTC技术已经很成熟了。据介绍,华为云RTC可提供高质量,低成本的实时音视频服务,实现“全场景,一张网,低时延,全融合。”所谓“全场景、一张网”的使用体验,值得是在互联网场景的直播、连麦以及政企场景的会议、监控等等服务,全部可以在一张网络上承载,实现全场景覆盖。另外,华为的实时音视频服务可以在双端实时互动、会议多会场多流等复杂场景中,实现低于200毫秒的时延,并且操作指令从发出到完成间隔低于30毫秒。在50%视频丢包,80%音频丢包情况下依然可以保持流畅的视频和通话,还可以保证画面不卡顿,不花屏。同时,华为云的音视频编解码技术,连续两年获得MSU世界编码大赛冠军,提供先进的智能感知编码、SVC分层可伸缩编码等多项技术,提升编解码效率,在同等画质的条件下节省30%-40%的码率。“我们希望和大家联合起来,把市场做大,把真正的RTC实时音视频迭代把它加快。”作为RTC服务提供商的华为云,也需要使能全行业共同创新。毕竟任何技术的发展和应用,不能单靠一家单打独斗,行业的壮大和进步必须依靠赛道内所有玩家共同努力,最终把蛋糕做大。在行业标准制定上,华为云希望可以和行业伙伴一起制定一个世界领先的行业标准,同时可以去牵引整个行业对它的投入和发展。薛浩表示,华为云希望培养一些合作伙伴,使用华为RTC服务来开发自己的应用,把实时音视频行业做大,让更多的应用可以供大家使用。
-
深受全球疫情影响,在线会议、在线教育等全民云上作业,催化RTC技术不断迭代升级,面对突然暴增的流量,现有平台、企业的技术已然无法满足,但构建一套音视频系统,对企业、平台来说绝非易事。 拿视频举例,视频业务主要围绕着点播、直播以及互动直播展开。点播的典型应用为视频网站、短视频,而游戏直播、秀场直播是直播的典型应用,互动直播在直播的基础上增添了双向互动功能。从技术层面看,点播需要通过云端服务器将视频转换为标准格式,再根据用户的带宽适配不同码率的视频文件,保证视频的高清、流畅性。而直播对延时和首屏时间(浏览器显示第一屏页面所消耗的时间)等指标的要求更严格,也对高并发(系统能够同时并行处理很多请求)和弱网环境下的稳定性有着更高考量。互动直播支持用户的双向交流,所以对延时的宽容度更低,带宽和编解码压力也是三种形式中的。 由此可以看出,视频系统对技术的要求并不低。而且,就算企业投入大量金钱自己搭建系统,也难以避免卡顿、延时问题。各家也需要根据自身业务情况进行二次开发,这其中所付出的人力、金钱成本对许多公司来说压力不小。 纵观目前涉及RTC市场的云服务厂商,各家在基础功能上差距不明显,企业对技术指标的微小差距也不再敏感,这意味着各家云服务厂商正面临着同质化竞争的行业格局。这就要求云服务厂商在提供稳定技术的同时,为客户带来更多附加价值。 8月5日,华为云联接与协同业务总裁薛浩在“华为云TechWave音视频专题日”上,围绕“5G、云、AI加持的下一代音视频网络,激发千行百业创新”主题与行业嘉宾进行高端对话。薛浩表示,华为云实时音视频将30多年的技术积累开放出来,希望帮助业界在5G时代实现更好的视频业务体验,为客户带来更多业务创新。 华为云实时音视频服务,带来全新互动实时音视频体验 华为云实时音视频服务(Real-Time Communication)凭借在视频业务领域长期技术积累,快速为行业提供高并发、低延迟、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务,适用于在线教育、云会议、社交文娱等场景。 华为云联接与协同业务总裁薛浩表示:华为云实时音视频服务具有业界的音视频编解码技术,可以提供包括智能感知编码、SVC分层可伸缩编码等多项技术,提升编解码效率;超强的网络适应性技术,支持在50%视频丢包,80%音频丢包情况下依然可以保持流畅的视频和通话;AI媒体处理能力,可以实现美颜、降噪、背景虚化/替换,实时翻译等,带来更智能的音视频体验。华为云实时音视频服务,一张网支撑全场景业务,低时延带来体验,支撑各行业业务升级。 重塑工作体验和效率 华为RTC云会议在线升级 基于实时音视频服务构建的华为云会议,在技术、体验和业务形态上得到全面升级。华为云会议能提供专业的音视频通信体验, 4K超高清数据实时共享,1080p高清晰度视频通信,200毫秒超低时延,在弱网环境下也能顺畅沟通,支持千人互动,百万人观看的超大并发容量。业界等级的安全可靠,多重安全认证,5G+专线双平面高规格保障,全程媒体流加密技术,带来安全可靠的会议服务。 端云结合,全场景多屏互动 华为云会议服务,与端侧硬件深度结合,提供全场景多屏互动体验。无论你在会议室、办公室还是在家里,还是在路上,随时随地都可接入会议,与团队进行互动交流。华为企业智慧屏与华为云会议服务天然结合,在高清视频质量、白板智能协作和智能投屏等方面给大家提供更加优质的体验。 截止目前,华为云会议已服务于50多家/省市级政府单位的智慧政务、疫情防控和指挥调度,支持了5000+学校的在线教育和全球超过1万家医疗机构,并创新了云签约(支撑了2000亿签约金额)、云招聘(同人民日报提供了50万工作岗位)等新业态场景。 随着5G、AI和云计算的不断升级,RTC在许多行业和场景的优势逐渐凸显,比如云游戏所代表的云端协同应用。同样的,其他技术会为RTC带来更好的体验,甚至全新的交互体验。未来三到五年内,国内RTC将会达到几百亿市场规模,甚至可能比海外市场发展的要更快一些。而华为要做的是将整个行业天花板捅上去,通过持续加大核心的技术投入,包括算法、芯片、专利等,不断支撑行业天花板抬升,让整个RTC行业有更大的空间。
-
深受全球疫情影响,在线会议、在线教育等全民云上作业,催化RTC技术不断迭代升级,面对突然暴增的流量,现有平台、企业的技术已然无法满足,但构建一套音视频系统,对企业、平台来说绝非易事。拿视频举例,视频业务主要围绕着点播、直播以及互动直播展开。点播的典型应用为视频网站、短视频,而游戏直播、秀场直播是直播的典型应用,互动直播在直播的基础上增添了双向互动功能。从技术层面看,点播需要通过云端服务器将视频转换为标准格式,再根据用户的带宽适配不同码率的视频文件,保证视频的高清、流畅性。而直播对延时和首屏时间(浏览器显示第一屏页面所消耗的时间)等指标的要求更严格,也对高并发(系统能够同时并行处理很多请求)和弱网环境下的稳定性有着更高考量。互动直播支持用户的双向交流,所以对延时的宽容度更低,带宽和编解码压力也是三种形式中最大的。由此可以看出,视频系统对技术的要求并不低。而且,就算企业投入大量金钱自己搭建系统,也难以避免卡顿、延时问题。各家也需要根据自身业务情况进行二次开发,这其中所付出的人力、金钱成本对许多公司来说压力不小。纵观目前涉及RTC市场的云服务厂商,各家在基础功能上差距不明显,企业对技术指标的微小差距也不再敏感,这意味着各家云服务厂商正面临着同质化竞争的行业格局。这就要求云服务厂商在提供稳定技术的同时,为客户带来更多附加价值。8月5日,华为云联接与协同业务总裁薛浩在“华为云TechWave音视频专题日”上,围绕“5G、云、AI加持的下一代音视频网络,激发千行百业创新”主题与行业嘉宾进行高端对话。薛浩表示,华为云实时音视频将30多年的技术积累开放出来,希望帮助业界在5G时代实现更好的视频业务体验,为客户带来更多业务创新。华为云实时音视频服务,带来全新互动实时音视频体验华为云实时音视频服务(Real-Time Communication)凭借在视频业务领域长期技术积累,快速为行业提供高并发、低延迟、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务,适用于在线教育、云会议、社交文娱等场景。华为云联接与协同业务总裁薛浩表示:华为云实时音视频服务具有业界领先的音视频编解码技术,可以提供包括智能感知编码、SVC分层可伸缩编码等多项技术,提升编解码效率;超强的网络适应性技术,支持在50%视频丢包,80%音频丢包情况下依然可以保持流畅的视频和通话;AI媒体处理能力,可以实现美颜、降噪、背景虚化/替换,实时翻译等,带来更智能的音视频体验。华为云实时音视频服务,一张网支撑全场景业务,低时延带来极致体验,支撑各行业业务升级。重塑工作体验和效率 华为RTC云会议在线升级基于实时音视频服务构建的华为云会议,在技术、体验和业务形态上得到全面升级。华为云会议能提供专业的音视频通信体验, 4K超高清数据实时共享,1080p高清晰度视频通信,200毫秒超低时延,在弱网环境下也能顺畅沟通,支持千人互动,百万人观看的超大并发容量。业界最高等级的安全可靠,多重安全认证,5G+专线双平面高规格保障,全程媒体流加密技术,带来安全可靠的会议服务。端云结合,全场景多屏互动华为云会议服务,与端侧硬件深度结合,提供全场景多屏互动体验。无论你在会议室、办公室还是在家里,还是在路上,随时随地都可接入会议,与团队进行互动交流。华为企业智慧屏与华为云会议服务天然结合,在高清视频质量、白板智能协作和智能投屏等方面给大家提供更加优质的体验。截止目前,华为云会议已服务于50多家国家级/省市级政府单位的智慧政务、疫情防控和指挥调度,支持了5000+学校的在线教育和全球超过1万家医疗机构,并创新了云签约(支撑了2000亿签约金额)、云招聘(同人民日报提供了50万工作岗位)等新业态场景。随着5G、AI和云计算的不断升级,RTC在许多行业和场景的优势逐渐凸显,比如云游戏所代表的云端协同应用。同样的,其他技术会为RTC带来更好的体验,甚至全新的交互体验。未来三到五年内,国内RTC将会达到几百亿市场规模,甚至可能比海外市场发展的要更快一些。而华为要做的是将整个行业天花板捅上去,通过持续加大核心的技术投入,包括算法、芯片、专利等,不断支撑行业天花板抬升,让整个RTC行业有更大的空间。 来源:快科技
-
从2013年第一家专注在RTC as a Service的公司成立,到现在RTC市场才历经七年时间。然而,相对于公有云市场而言,RTC这个垂直品类虽然“占地稀薄”,但却是兵家必争之地。 七年时间里,包括几大“巨头”在内的众多云服务厂商开始在多媒体业务投入重兵。早在2019年底,LiveVideoStack探访了华为位于东莞的研发中心,这家通信巨头开始全力发力RTC了。 受到全球疫情的影响,原本竞争激烈的RTC市场,突然被点燃了。从在线教育到视频会议,从直播带货到视频监控,几乎所有RTC服务都实现了几倍到几十倍增长。疫情常态化之后,像华为这样巨头厂商的大玩家的优势尽显。以华为为例,依靠在全球的基础设施和30多年ICT技术领域的深耕与沉淀,华为RTC在疫情期间很快打开了局面。据了解,基于华为云RTC的华为云会议已服务于50多家国家级/省市级政府单位的智慧政务、疫情防控和指挥调度,支持了5000+学校的在线教育和全球超过1万家医疗机构,并创新了云签约(支撑了2000亿签约金额)、云招聘(同人民日报提供了50万工作岗位)等新业态场景。“我们增长地比较快,一方面是我们会议的服务,用户量起来了;另一方面,RTC是7月发布的,目前已经有一些种子用户在发展,同时还有直播,直播业务涨了几十倍。”华为云联接与协同业务总裁薛浩说。 与此同时,华为RTC制定了符合自身特点的发展路线。对于华为来讲,首先服务的是行业大B和ISV。通过成熟的ISV伙伴,重点抓住各行业中的大B用户。通过ISV,华为可以把RTC能力交付到各个行业和场景。以教育为例,“教室、教室管理,白板等一系列的增值应用,并不是华为目前擅长的,我们更擅长的是把底下的能力做好,做到极致。我们希望在自己的优势领域做得更好,大家互相有分工和协作,让ISV可以在它的行业里面做的更深”,薛浩说。 另外,华为在标准、协议层、算法方面有深厚的积累,能力穿透软件、操作系统、驱动,直至芯片设计。而RTC服务质量与上述各个层面和领域相关,要实现极致的优化和用户体验,就不能有明显的短板。从这个角度看,华为在RTC领域属于深度玩家。但在整个RTC生态的玩家中,像华为这样拥有端到端、底层硬件到上层应用、从软件到硬件的系统级公司并不多,因此华为对于行业的影响也举足轻重。 随着5G入世,AI和云计算的不断升级,RTC在许多行业和场景都有可观的前景,比如云游戏所代表的云端协同应用。同样的,其他技术会为RTC带来更好的体验,甚至全新的交互体验。未来三到五年内,国内RTC将会达到几百亿市场规模,甚至可能比海外市场发展的要更快一些。而华为要做的是将整个行业天花板捅上去,通过持续加大核心的技术投入,包括算法、芯片、专利等,不断支撑行业天花板抬升,让整个RTC行业有更大的空间。“通过我们把RTC的技术带到各行各业,让大家能够用得起用得好,这也是我们自己的初心。”薛浩说
-
-
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签