- 强大的视频抠图 (RVM)RVM 专为强大的人类视频抠图而设计。与将帧作为独立图像处理的现有神经模型不同,RVM 使用循环神经网络来处理具有时间记忆的视频。RVM 可以在任何视频上实时执行抠图,无需额外输入。它在 Nvidia GTX 1080 Ti GPU 上实现了4K 76FPS和HD 104FPS。论文:Robust High-Resolution Video Matting wit... 强大的视频抠图 (RVM)RVM 专为强大的人类视频抠图而设计。与将帧作为独立图像处理的现有神经模型不同,RVM 使用循环神经网络来处理具有时间记忆的视频。RVM 可以在任何视频上实时执行抠图,无需额外输入。它在 Nvidia GTX 1080 Ti GPU 上实现了4K 76FPS和HD 104FPS。论文:Robust High-Resolution Video Matting wit...
- 今天分享一个在华为云搭建一个即开即用的更换表强的H5应用的教程 部署我们的华为云ECS配置如下: 安装各种环境依赖首先我们安装anaconda,(注意最后一步选yes,初始化bash的conda)wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2022.10-Linux-x86_64.shbash An... 今天分享一个在华为云搭建一个即开即用的更换表强的H5应用的教程 部署我们的华为云ECS配置如下: 安装各种环境依赖首先我们安装anaconda,(注意最后一步选yes,初始化bash的conda)wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2022.10-Linux-x86_64.shbash An...
- 高保真图像编辑注意:本案例必须使用GPU运行,请查看《ModelArts JupyterLab 硬件规格使用指南》了解切换硬件规格的方法High-Fidelity GAN Inversion for Image Attribute Editing (CVPR 2022)https://tengfei-wang.github.io/HFGI/ 1 下载代码和数据import os impor... 高保真图像编辑注意:本案例必须使用GPU运行,请查看《ModelArts JupyterLab 硬件规格使用指南》了解切换硬件规格的方法High-Fidelity GAN Inversion for Image Attribute Editing (CVPR 2022)https://tengfei-wang.github.io/HFGI/ 1 下载代码和数据import os impor...
- CTPN+CRNN 算法端到端实现文字识别 OCR介绍光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。发展时间较长,使用很普遍。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。 文本区域... CTPN+CRNN 算法端到端实现文字识别 OCR介绍光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。发展时间较长,使用很普遍。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。 文本区域...
- 字符序列检测——CRNN模型在本案例中,我们将学习深度学习中的OCR(Optical Character Recognition)光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现,所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。本案例中介绍的模型CRNN就是一种字符识别模型,它... 字符序列检测——CRNN模型在本案例中,我们将学习深度学习中的OCR(Optical Character Recognition)光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现,所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。本案例中介绍的模型CRNN就是一种字符识别模型,它...
- 文本检测——CTPN模型在本案例中,我们将继续学习深度学习中的OCR(Optical Character Recognition)光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现,所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。本案例中介绍的模型CTPN就是一种文本检测模型,它... 文本检测——CTPN模型在本案例中,我们将继续学习深度学习中的OCR(Optical Character Recognition)光学字符识别技术。OCR作为计算机视觉中较早使用深度学习技术的领域,有很多优秀的模型出现,所以通过此案例我们来学习深度学习下的OCR技术。普遍的深度学习下的OCR技术将文字识别过程分为:文本区域检测以及字符识别。本案例中介绍的模型CTPN就是一种文本检测模型,它...
- 1. 指导用户熟悉华为云企业级AI应用开发专业套件 ModelArts Pro 2. 在自然语言处理套件中构建应用,并进行模型训练及评估 3. 在ModelArts Pro中将文本分类模型部署为在线服务 4. 在本地网页端调用该在线服务,输入文本评论,实现评论的情感分类 1. 指导用户熟悉华为云企业级AI应用开发专业套件 ModelArts Pro 2. 在自然语言处理套件中构建应用,并进行模型训练及评估 3. 在ModelArts Pro中将文本分类模型部署为在线服务 4. 在本地网页端调用该在线服务,输入文本评论,实现评论的情感分类
- An Effective Loss Function for Generating 3D Models from Single 2D Image without Rendering论文地址:https://arxiv.org/abs/2103.03390 论文提出了一种新颖的有效损失函数,用于评估重建的 3D 点云的投影覆盖地面实况对象轮廓的程度。然后使用 Poisson Surface R... An Effective Loss Function for Generating 3D Models from Single 2D Image without Rendering论文地址:https://arxiv.org/abs/2103.03390 论文提出了一种新颖的有效损失函数,用于评估重建的 3D 点云的投影覆盖地面实况对象轮廓的程度。然后使用 Poisson Surface R...
- 人脸到动漫脸的转换与控制一种稳定、可控、多样化的图像到图像转换(也适用于视频!)使用方法:点击上方菜单,选择 Run(运行) - Run All Cells(运行所有) 第一步 准备代码环境import os! wget https://obs-aigallery-zc.obs.cn-north-4.myhuaweicloud.com/clf/code/GANsNRoses.zipos.s... 人脸到动漫脸的转换与控制一种稳定、可控、多样化的图像到图像转换(也适用于视频!)使用方法:点击上方菜单,选择 Run(运行) - Run All Cells(运行所有) 第一步 准备代码环境import os! wget https://obs-aigallery-zc.obs.cn-north-4.myhuaweicloud.com/clf/code/GANsNRoses.zipos.s...
- OpenPose人体姿态识别OpenPose人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以caffe为框架开发的开源库。可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,基于它的实例如雨后春笋般涌现。人体姿态估计技术在体育健身、动作采集、3D试衣、舆情监测等领域具有广阔的应用... OpenPose人体姿态识别OpenPose人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以caffe为框架开发的开源库。可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,基于它的实例如雨后春笋般涌现。人体姿态估计技术在体育健身、动作采集、3D试衣、舆情监测等领域具有广阔的应用...
- CenterNet-Hourglass (物体检测/Pytorch)目标检测常采用Anchor的方法来获取物体可能存在的位置,再对该位置进行分类,这样的做法耗时、低效,同时需要后处理(比如NMS)。CenterNet将目标看成一个点,即目标bounding box的中心点,整个问题转变成了关键点估计问题,其他目标属性,比如尺寸、3D位置、方向和姿态等都以估计的中心点为基准进行参数回归。本案... CenterNet-Hourglass (物体检测/Pytorch)目标检测常采用Anchor的方法来获取物体可能存在的位置,再对该位置进行分类,这样的做法耗时、低效,同时需要后处理(比如NMS)。CenterNet将目标看成一个点,即目标bounding box的中心点,整个问题转变成了关键点估计问题,其他目标属性,比如尺寸、3D位置、方向和姿态等都以估计的中心点为基准进行参数回归。本案...
- 这个 notebook 基于预印本论文「Castle in the Sky: Dynamic Sky Replacement and Harmonization in Videos, arXiv:2010.11800.」提供了最基本的视频天空替换的可复现例子。项目首页 | GitHub | 预印本框架使用的是:PyTorch1.4硬件用的是:GPU: 1*P100|CPU: 8核 64GB ... 这个 notebook 基于预印本论文「Castle in the Sky: Dynamic Sky Replacement and Harmonization in Videos, arXiv:2010.11800.」提供了最基本的视频天空替换的可复现例子。项目首页 | GitHub | 预印本框架使用的是:PyTorch1.4硬件用的是:GPU: 1*P100|CPU: 8核 64GB ...
- CycleGAN是图像转换的代表作,样本数据无需配对即可实现转换。例如斑马转换成马、将模特转换成卡通人物等。CycleGAN特点就是通过一个循环,首先将图像从一个域转换到另一个域,然后,再转回来,如果两次转换都很精准的话,那么,转换后的图像应该与输入的图像基本一致。通过这样的的一个循环,CycleGAN将转换前后图片的配对,类似于有监督学习,提升了转换效果。 CycleGAN是图像转换的代表作,样本数据无需配对即可实现转换。例如斑马转换成马、将模特转换成卡通人物等。CycleGAN特点就是通过一个循环,首先将图像从一个域转换到另一个域,然后,再转回来,如果两次转换都很精准的话,那么,转换后的图像应该与输入的图像基本一致。通过这样的的一个循环,CycleGAN将转换前后图片的配对,类似于有监督学习,提升了转换效果。
- pix2pix论文链接: https://arxiv.org/abs/1611.07004图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片,比如灰度图、梯度图、彩色图之间的转换等。通常每一种问题都使用特定的算法(如:使用CNN来解决图像转换问题时,要根据每个问题设定一个特定的loss function 来让CNN去优化,而一般的方法都是训练CNN去缩小输入跟输出的欧氏距离,但... pix2pix论文链接: https://arxiv.org/abs/1611.07004图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片,比如灰度图、梯度图、彩色图之间的转换等。通常每一种问题都使用特定的算法(如:使用CNN来解决图像转换问题时,要根据每个问题设定一个特定的loss function 来让CNN去优化,而一般的方法都是训练CNN去缩小输入跟输出的欧氏距离,但...
- ACGAN的全称叫Auxiliary Classifier Generative Adversarial Network,翻译成汉语的意思就是带辅助分类器的GAN,其实他的思想和昨天说到的CGAN很想,也是利用label的信息作为噪声的输入的条件概率,但是相比较于CGAN,ACGAN在设计上更为巧妙,本案例介绍如何通过ACGN实现动漫头像自动生成。 ACGAN的全称叫Auxiliary Classifier Generative Adversarial Network,翻译成汉语的意思就是带辅助分类器的GAN,其实他的思想和昨天说到的CGAN很想,也是利用label的信息作为噪声的输入的条件概率,但是相比较于CGAN,ACGAN在设计上更为巧妙,本案例介绍如何通过ACGN实现动漫头像自动生成。
上滑加载中
推荐直播
-
华为云云原生FinOps解决方案,为您释放云原生最大价值
2024/04/24 周三 16:30-18:00
Roc 华为云云原生DTSE技术布道师
还在对CCE集群成本评估感到束手无策?还在担心不合理的K8s集群资源申请和过度浪费?华为云容器服务CCE全新上线云原生FinOps中心,为用户提供多维度集群成本可视化,结合智能规格推荐、混部、超卖等成本优化手段,助力客户降本增效,释放云原生最大价值。
回顾中 -
鲲鹏开发者创享日·江苏站暨数字技术创新应用峰会
2024/04/25 周四 09:30-16:00
鲲鹏专家团
这是华为推出的旨在和众多技术大牛、行业大咖一同探讨最前沿的技术思考,分享最纯粹的技术经验,进行最真实的动手体验,为开发者提供一个深度探讨与交流的平台。
回顾中
热门标签