• [技术干货] 【DTSE Tech Talk 精选问答】NO.74丨华为云MetaStudio数字人,助力行业数字化业务创新
    Q:与其他类似数字人产品相比,华为云 MetaStudio 数字人在推动行业数字化业务创新方面的核心竞争力是什么?A:基于华为云底层海量算力基础设施和自研数字人大模型,在数字人生产效率、口型匹配度、表情动作自然性以及智能化等方面都有一定优势Q:数字人直播与传统直播相比有何不同?A:可以24h不间断直播,直播话术更专业,丰富Q:MetaStudio数字人服务对带宽有什么要求?A:直播和交互对带宽有一定要求,1080p分辨率需要至少10mbps以上的上行带宽。Q:如何保证数字人的数据安全和隐私保护?A:注册版权;添加数字水印等等Q:数字人可以实现用户实时交互吗A:接上大脑可以实现实时交互Q:华为云MetaStudio的学习难度怎么样,适合哪些职业人群?对于非技术人员有必要学习华为云MetaStudio的使用吗A:学习难度底,华为云提供详细指导说明,适合有制作视频需求的人群,比如老师,营销行业等Q:从技术架构角度看,华为云 MetaStudio 数字人是怎样支撑起行业多样化的数字化业务创新需求的?A:基于华为云底座,提供核心能力的标准API和SDK,结合行业的定制化需求通过和行业伙伴联合打造Q:数字人技术如何帮助企业实现数字化转型?A:从企业内外部的营销范式、视频生成方式、直播形态等等,都可以用数字人实现,降本增效Q:华为云MetaStudio数字人如何预防使用者通过技术实现一些可能涉嫌违法行为呢A:实名制制作数字人,工信部备案,视频水印等Q:华为云 MetaStudio 数字人如何与新兴技术(如人工智能、大数据等)结合,进一步推动行业数字化业务创新?A:数字人的底层都是AI-Native,在直播和交互场景下和LLM等大模型结合提供智能互动能力Q:数字人在直播行业,怎么实现用户交互呢A:问答库设置,弹幕捕捉问题,触发自动回答Q:数字人技术在客户服务中如何提升体验?A:通过实时交互数字人,接入基础大模型,行业大模型对客户的问题进行专业的回答Q:MetaStudio上如何优化数字人的语言泛化能力?A:通过华为云的语音大模型进行的语言泛化Q:华为云MetaStudio数字人服务如何支持企业的定制化需求?A:通过API支持Q:MetaStudio在多模态AI平台中如何整合不同的技术?A:通过多模态学习,如文本、图像、语音等,使模型能够自动发现不同模态之间的关联和互补信息,从而实现更全面、准确的理解和生成 。Q:华为云MetaStudio数字人在未来的发展趋势是什么?A:更加拟人,更聪明,成本更低Q:MetaStudio在数字化业务创新中扮演什么角色?A:从企业内外部的营销范式、视频生成方式、直播形态等等,都可以用数字人实现,降本增效Q:有哪些具体的行业案例可以展示华为云MetaStudio数字人的应用效果?A:政务大厅,徐福记直播,美宜佳的无人门店Q:华为云MetaStudio数字人对操作系统有要求吗?A:没有要求,metastudio是网页平台Q:MetaStudio在安全和稳定性方面有哪些措施?A:制作数字人需要实名制,并进行工信部备案,华为训练完成会及时删除客户Q:MetaStudio如何提升数字人的真实性和自然性?A:拍摄的训练视频质量高,华为的数字人大模型不断优化Q:MetaStudio在云底座算力资源方面有哪些优势?A:基于华为云底层海量昇腾算力基础设施Q:MetaStudio数字人如何快速适应不同行业的需求?A:与生态伙伴合作,探索更多的行业应用场景Q:MetaStudio如何支持多语言和多场景建模?A:通过语音大模型泛化支持多语言,场景搭建客户自己构建Q:华为云MetaStudio在建筑行业有哪些潜在的应用场景和价值?A:华为数字人目前在建筑行业没有案例,期待和伙伴探索出建筑行业的应用场景落地Q:数字人的人像是虚拟生成的吗?商用是否存在肖像版权等问题A:数字人属于生成式范畴,版权属于客户Q:如何将数字人技术与其他新兴技术如区块链、5G、物联网等相结合应用?A:数字人是一个基础性应用,作为各个行业的底座型技术。如在5G场景下,结合通话、彩铃等业务,提供将真人照片转成风格化数字人及驱动成视频等Q:在为不同行业定制数字人形象和交互行为时,如何平衡个性化需求与底层模型的通用性?A:通用大模型+行业大模型Q:华为云 MetaStudio 数字人在教育、医疗、文旅等其他行业还有哪些潜在的应用场景和价值?A:教培行业的视频制作,医疗视频科普,医院大厅的数字人客服问答,数字人心理咨询师,文旅数字人导游Q:那有效期一年是什么意思?A:购买资源,一年之内使用Q:平台的数字人模型、背景图片、音色等资产库的丰富程度如何?是否会定期更新以满足不同场景和风格的创作需求?用户是否可以上传自己的素材来丰富资产库 ?A:华为云会不断丰富内置模型,建议开发者使用时根据自己的需求上传素材Q:如何使用华为云MetaStudio数字人产品进行人物表情和动作的绑定?A:当前主要是2D数字人,不提供3D是最人的表情、动作绑定原子能力Q:与其他数字人制作平台相比,非专业人员也能够快速上手制作出高质量的数字人内容 ?A:可以的Q:客户在一年以后要付费A:不需要Q:客户不能永久使用A:可以永久使用Q:官网的很多项目都是有效期是一年;没有永久的,不能永久使用A:有效期一年是指一年内使用,数字人模型训练完是永久使用Q:MetaStudio是怎么确保数字人解决方案可以在不同平台上保持一致性和高性能表现的?A:MetaStudio是标准云服务,算力基于华为云基础设施,只要调用标准API,不同平台之间差别不大Q:直播如何保障品牌话术和形象的统一,怎么实现多流种克隆?A:企业统一数字人形象及话术Q:大模型如何更好地应用于图像识别和目标检测任务?A:暂不涉及这块业务,可咨询华为云EI相关产品Q: 智能交互业务媒体流如何应对防火墙限制?A:当前以公有云、公网应用为主。Q:数字人如何进行情绪设定和情感表达?A:一方面通过形象表情和动作,根据文本语义匹配相应的姿态。一方面通过语音,根据语音匹配不同的情感Q:每介绍一个产品是不是都要重新录制视频并上传平台?A:不需要录制,需要在metastudio平台上制作Q:支持走动、侧身、持物、实景这些复杂场景的建模吗,云底座算力需要做选型吗?A:支持。底座不需要选型,MetaStudio已经封装好,只需调用MetaStudio服务即可。Q:MetaStudio数字人如何实现多语言适配?形象如何做到真实自然?A:基于华为云自研的数字人大模型及语音大模型Q:可以引入企业自建的大模型和知识库吗?如何保证数据安全和隐私?A:可以,华为训练完成后会及时删除客户数据 Q:华为云 MetaStudio 数字人在哪些具体行业已经取得了显著的数字化业务创新成果?A:零售行业,教培行业,客服等等Q:MetaStudio数字人如何进行实时渲染和推流?目前支持哪些AI能力的接入?A:2D数字人当前主要是AI推理,在直播场景中有推流到第三方直播平台,如通过rtmp模式等。当前数字人训练、推理都是基于AI实现。Q:数字人模型的形象和声音可以定制吗?支持按租户对接吗A:可以的Q:华为云MetaStudio数字人产品如何支持多人协同创作?A:console控制台分配权限就行Q:在使用华为云 MetaStudio 制作数字人时,能够在多大程度上对数字人的外貌特征、性格特点、语言风格等进行个性化定制?A:基本上和真人拍摄视频分辨不出来Q:MetaStudio数字人的生成主要有哪些过程?A:客户拍摄视频、华为训练,3天交付Q:语音驱动数字人是如何实现的?交互时延怎么样A:基于生成对抗网络和多模态输入的高精度口型驱动技术。当前交互时延2秒左右Q:虚拟主播可以根据观众问题个性化推荐商品吗?基于什么原理?A:可以,设置问答库,弹幕捕捉触发Q: 数字人可以用于制作动漫吗A:目前有视频转动漫的技术Q:可以一次性快速对接H5、小程序、安卓、IOS等主流平台吗?A:可以Q:华为云MetaStudio数字人的主要应用场景有哪些?A:智能客服,直播电商,教培行业等等Q:如何实现数字人的跨平台应用和集成?A:通过API集成Q:MetaStudio数字人的口型匹配准确率目前有多少?A:95%以上Q:在处理大规模数字人并发交互的场景下,华为云 MetaStudio 数字人如何保证系统的稳定性和低延迟?A:我们的卡多Q:一次付费费用是多少呢?后续有版本升级吗?版本升级了还要续费吗?A:Flexus数字人999元套餐,无需续费,详情见官网:cid:link_0Q:华为云对于虚拟数字人主播的版权和肖像权如何保护?A:版权和肖像权属于客户,华为训练后会及时删除Q:华为云 MetaStudio 平台的盘古媒体大模型和媒体引擎是如何实现音频、视频、图形、图像等多模态的融合与交互的?A:统一的模型架构与预训练,多模态特征提取与表示,跨模态生成与转换等Q:MetaStudio数字人如何帮助行业实现数字化转型?A:从企业内外部的营销范式、视频生成方式、直播形态等等,都可以用数字人实现,降本增效Q:租赁或者买断A:数字人制作成功后属于客户资产,一次性付费,永久使用,视频制作按需购买Q:怎么提升数字人的交互反应能力?A:不断的训练大模型,提供足够的算力及网络Q:这个Meta Studio平台后期是收费的吗?收费形式是怎样的A:具体参考官网:cid:link_0Q:请问下在电商场景下如果回答用户的问题,存在多大的延迟呢?A:问答库设置,弹幕捕捉问题,触发自动回答,延迟2-5sQ:华为云数字人有哪些成功落地的案例,有失败的案例吗A:成功案例:万兴数字人出海等Q:数字人在不同应用场景下的通用性和定制化之间怎么找到一个平衡点平衡点?A:根据客户应用需求,需要通用的用通用的,需要定制的用定制的Q:戴眼镜应该可以吧?A:可以的Q:MetaEngine 云渲染的 AI 加速技术是如何提升渲染效率的?与传统的渲染技术相比,它在数字人呈现的流畅自然度方面有哪些显著优势?A:以推代算,速度更快,效率高Q:引入数字员工后工作表现怎么评估,是否要参考实体人的标准?A:目前数字人直播GMV达到真人的30%左右,具体场景具体评估Q: 部分浏览器提交 H265 训练视频失败如何处理?A:根据训练失败原因重新更改提交,或者提工单Q:华为云数字人有什么优势A:基于华为云底层海量算力基础设施和自研数字人大模型,在数字人生产效率、口型匹配度、表情动作自然性以及智能化等方面都有一定优势Q:请问下老师,这个数字人的人像是完全虚拟生成的吗?商用会不会存在侵权问题?A:数字人属于生成式范畴,版权属于客户,数字人训练需要提交授权书及身份证,2D数字人的授权是公司与员工之间的协议,与华为无关Q:做一个和自己相仿的数字人,后期如何用于其它场景,比如介绍其它产品A:视频制作功能就可以实现Q:企业对于制作过的数字人怎么标准化和模块化,可以形成固定资产吗?A:是企业的资产Q:老师,请问 在为不同行业定制数字人形象和交互行为时,如何平衡个性化需求与底层模型的通用性?谢谢!A:个性化需求会叠加相关行业的大模型,或者训练公司的知识库Q:做一个和自己相仿的数字人对硬件设备有要求吗?需要动捕么?A:不需要硬件设备,不需要动捕,拍摄5min视频就OKQ:数字人能模拟人类对自然语言的反应和思考流程吗?A:表情语言上会模仿Q:具体是如何实现精准的面部特征点识别、基础模型匹配和精细调整等多个步骤的 ?A:基于华为云底层海量算力基础设施和自研数字人大模型,在数字人生产效率、口型匹配度、表情动作自然性以及智能化等方面都有一定优势Q:与其他类似的数字人产品相比,华为云 MetaStudio 数字人如何在助力行业数字化业务创新方面脱颖而出?A:基于华为云底层海量算力基础设施和自研数字人大模型,在数字人生产效率、口型匹配度、表情动作自然性以及智能化等方面都有一定优势
  • [技术干货] MoneyPrinterTurbo,利用AI大模型,一键生成高清短视频。
    方案介绍随着AI的迅速发展,自从 OpenAI 发布 Sora 文本生成视频模型后,文本生成视频的 AI 技术引起了无数圈内圈外人士的关注和实验。该解决方案基于MoneyPrinter,为你提供一个文本生成短视频的WebUI应用。只需输入视频主题或关键词,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,最后合成一个高清的短视频。开始使用步骤 1 访问该促销活动购买页面,按照如下配置完成AI生成短视频服务器的部署。步骤 2 登录弹性云服务器控制台。使用Linux连接工具登录服务器,或者在控制台单击“远程登录”(建议使用远程连接工具,后续使用过程中需要下载短视频文件)。步骤 3 等待15分钟左右,进入服务器后,查看环境部署日志。输入命令:tail -f /tmp/install-MoneyPrinter-baseENV.log,如下图所示则表示基础环境部署成功(使用Ctrl+C按键即可退出查看日志界面)。步骤 4 修改配置文件,路径为“/home/project/MoneyPrinterTurbo/config.toml”。按照 config.toml 文件中的说明,配置好 pexels_api_keys 和 llm_provider(默认moonshot)相关的 API Key。获取方式请参考https://www.pexels.com/api/(pexels_api_key)和https://platform.moonshot.cn/console/api-keys(moonshot_api_key)。​步骤 5 输入命令:vim /home/project/MoneyPrinterTurbo/config.toml,按下键盘i键,修改pexels_api_keys和moonshot_api_key的值,在键盘按下Esc,输入“:wq”保存。步骤 6 预启动服务。输入如下命令:conda activate MoneyPrinterTurbocd /home/project/MoneyPrinterTurbo/bash webui.sh执行后,输入邮箱地址,即可启动服务。步骤 7 使用Ctrl + C停止服务,使用后台方式启动服务。输入以下命令:conda activate MoneyPrinterTurbocd /home/project/MoneyPrinterTurbo/bash webui.sh > /home/project/MoneyPrinterTurbo/webui.log 2>&1 &步骤 8 登录弹性云服务器控制台。选择购买的服务器,单击服务器名称进入详细页面,在新页面单击“安全组”。步骤 9 单击“配置规则”,选择“入方向规则”。步骤 10 单击“复制”,修改放通8501端口。步骤 11 打开浏览器,输入http://EIP:8501,即可访问WebUI界面。步骤 12 给定一个关键词,使用AI自动生成视频文案。步骤 13 根据页面提示及自身需要,选改参数设置,单击“生成视频”,等待视频自动生成。步骤 14 下拉页面,可以查看当前任务生成的日志。待出现“视频生成完成”,可直接下拉页面,查看或下载生成的视频。常见问题问题一:Read time out. 因为网络波动影响,可能会有视频素材下载失败,报错如下:解决办法:终止此次任务,单击前端页面“stop”停止此次任务。刷新页面,重新发起任务。
  • [技术干货] SunoV3 秒生爆款歌曲!如何快速下载。
    方案介绍随着AI的迅速发展,音乐ChatGPT时刻到来临,通过Suno V3秒生爆款歌曲,仅用几秒的时间,便可以创作出2分钟的完整歌曲。该文档为您提供了一个Suno音乐下载站,帮助您把创作的音乐下载到本地。开始使用步骤1 在浏览器访问Suno生成的音乐官网,即可免费创作多种风格流派歌曲,还能唱出来。步骤2 在Suno主页中的Explore,有一个AI生成歌曲的排行榜,可在线听音乐。步骤3 在Suno主页中的Create,在Song Description中输入要创作的内容,单击“Create”。单击分享按钮,获取下载链接。步骤4 访问该促销活动购买页面,按照如下配置完成Suno下载服务器的部署。步骤5 登录弹性云服务器控制台,获取步骤四创建的弹性服务器公网IP。在浏览器访问:http://弹性公网IP:80,即可访问Suno音乐下载站。步骤6 将步骤3获取的下载链接粘贴到输入框,单击“Download”即可下载到本地。
  • [热门活动] “AIGC赋能数字内容生产”——用技术提升内容供给侧的丰富度,助力企业降本增效
    HCDG(Huawei Cloud Developer Group 华为云开发者社区组织),是基于城市圈和技术圈,由开发者核心组自发开展的开放、创新、多元的社区技术交流组织。致力于帮助开发者学习提升、互动交流、挖掘合作,推动技术应用与本地产业结合、数智化转型和开发者文化发展。2023年10月27日,由华为云开发者联盟携手华为(北京)虚拟现实创新中心和HCDG北京核心组共同举办的“AIGC赋能数字内容生产”交流会在中关村虚拟现实产业园顺利举办。本次活动邀请到了虚拟现实领域的业界大咖、行业技术专家,以及众多优秀的企业家和开发者一起,共同探讨在AIGC兴起的大背景下,数字内容产业的发展趋势,了解市场的前沿信息,解析行业技术解决方案,共享蓬勃发展的产业生态。▲ 华为(北京)虚拟现实创新中心 张浩华为(北京)虚拟现实创新中心经理张浩介绍到,创新中心成立于2021年年底,由石景山政府与华为组建团队联合运营,依托华为在技术、品牌、产业链资源、人才培养方面的优势,创新中心一是通过联合企业打造标杆项目,推进创新应用场景落地。二是持续开放ICT人才培养能力,协同高校开展专业人才培养工作。三是定期举办峰会论坛等大型活动,构建产业特色品牌。四是联合区内外的虚拟现实企业打造生态聚合体,助力区域的虚拟现实产业发展。重塑内容生产力探索行业前沿技术▲ 华为云媒体服务产品部专家 王菊生本次活动有幸邀请到了华为云媒体服务产品部专家王菊生,他介绍到AIGC被认为是继专业生成内容(PGC)和用户生成内容(UGC)之后,利用人工智能技术自动生成内容的新型生产方式。依托华为云基础设施,通过华为云提供两大类媒体服务,赋能内容开发者和应用开发者。通过AIGC生成视频、生成数字人、数字空间,分钟级快速生成内容,为整个内容生产带来新的变革。其中,AIGC生成视频,通过CG和CV技术的融合,通过CV识别人的动作,驱动CG生成的3D模型,并自动适配周围环境和光线等,通过AIGC生成新的视频。AIGC还可以生成数字空间,基于Nerf的数字空间重建技术,对于100平米空间,1个手机10分钟就可以完成扫描,用普通的电脑和消费级显卡就能实时浏览,还能二次编辑。可以广泛应用于企业展厅、工厂生产车间、博物馆、室外旅游景点等场景,实现物理世界的数字孪生。华为云希望通过打造两个核心产品:华为云MetaEngine图形引擎和盘古数字大模型,以及Studio一站式制作、协同桌面、云渲染、 AIGC等一系列的服务,与伙伴和客户一起共建AIGC时代的媒体基础设施。“一体三核”推动AI大模型与空间计算应用加速落地▲ 北京虚拟动点科技有限公司 贾国耀本次活动特别邀请到企业代表——北京虚拟动点科技有限公司动作捕捉技术主管贾国耀,他表示,虚拟动点作为利亚德集团旗下元宇宙板块领军企业,为元宇宙行业的发展提供了技术驱动作用。虚拟动点以AI赋能,自2017年起,在“空间定位”“空间计算”领域已经深耕多年,沉淀了包括光学计算、惯性计算、无标记点识别计算等多项空间计算的算法技术,实现了包括肢体、手势、表情等多种人体空间计算场景应用,以及体积面积、位置关系、形态大小等物体空间计算场景应用。未来虚拟动点将以“一体三核”作为发展战略,即以空间计算为战略主体,以AI大模型、硬件设备、空间数据为三大核心,构建不断提升的业务能力,推动虚拟动点在AI时代阔步前行。感知虚拟制作推动影视作品完成一站式输出▲ 北京天图万境科技有限公司 图拉古本次活动特别邀请到HCDE专家、企业代表——北京天图万境科技有限公司创始人、导演图拉古亲临现场,他以AI感知虚拟制作为主题进行了分享。他介绍,天图万境发布的感知虚拟制作,是通过人工智能进行空间计算和数字修复,将绿幕拍摄后的内容导入引擎中,通过引擎的空间计算,把绿幕拍摄的二维影像还原成三维图像,并通过数字渲染将三维图像渲染出来。在传统方式中,空间深度的计算,可以使用激光雷达,或用双目摄影机,甚至可以使用连续的单目帧进行后期求解。而天图万境的感知虚拟制作,实现了仅通过一台摄影机,即可在引擎中实现“实时、4K、60帧稳定的空间深度还原”,无需购买任何的深度传感器。这一过程对应的是从物理世界到数字世界的变迁,可以对标胶片到数码时代的跨越。最后环节,华为云专家、HCDG核心组与现场企业开发者们围绕AIGC的技术应用进行热情讨论。现场针对企业及开发者提出的在不同业务场景下面临的创新技术应用困境,华为云专家分别从技术和商业的创新视角进行深入分析与解答。本次活动也安排了中关村虚拟现实展示中心参观体验环节,带领企业家与开发者们体验了石景山区众多虚拟现实企业的产品及解决方案。参会的专家、企业代表们与开发者们结合产业发展现状及未来趋势各抒己见、积极分享观点,为未来共同打造密切合作的产业生态氛围奠定良好基础,携手共创智能化数字内容生产新时代!HCDG城市行活动接下来将在佛山、成都、厦门、大连、天津等开发者核心城市相继落地。华为云也将继续携手各城市HCDG核心组与广大企业及开发者,共建产业新生态,为企业及开发者提供“新技术、新体验、新机会”全方位支撑,欢迎加入HCDG(华为云开发者社区组织)。了解更多本地圈层资讯:微信公众号搜索“华为云开发者联盟”,回复“北京HCDG”
  • [公告] 【获奖公示】10.18号直播 / DTSE Tech Talk丨NO.45:华为云数字人赋能千行百业,共享AIGC新机遇
    中奖结果公示感谢各位小伙伴参与本次活动,欢迎关注华为云DTSE Tech Talk 技术直播更多活动~本次活动获奖名单如下:账号名 奖项名称 奖品名称hw81541353 优质提问 华为云定制U型按摩枕hw081993541 优质提问 华为云定制U型按摩枕/ 官网抽奖华为云定制短袖T恤 linghz666 官网抽奖 华为云定制短袖T恤hid_ga_ud2jqxs6fi8w 官网抽奖华为云定制短袖T恤/ 官网抽奖华为云定制保温杯hid_du7upu3-7oy_kgn 微信抽奖 华为云定制礼品hid_3-qrx6emi4jzh1g 微信抽奖 华为云定制礼品hid_hi6lf-ciwvtvx8a 微信抽奖 华为云定制礼品yizhangl 问卷抽奖华为云定制保温杯hid_a0211e-bd-x__sw 问卷分享 华为云定制棒球帽hid__cn8cjapw6ba12c 论坛提问奖 华为云定制POLO衫