• [热门活动] AI作诗
    【AI作诗】案例链接:https://developer.huaweicloud.com/develop/aigallery/notebook/detail?id=60658dee-1052-4d26-aacd-9ab5828f0ac4 参与步骤:1、按照【案例链接】的步骤指导运行案例;2、在最后一步输入想要创作诗的第一个字,并运行代码;3、将创作后的诗截图(如下图所示)到本帖评论区,即完成案例体验;
  • [热门活动] 中英机器翻译
    【中英机器翻译】案例链接:https://developer.huaweicloud.com/develop/aigallery/notebook/detail?id=7e8663ce-5510-4eeb-a57e-b56322fe9449参与步骤: 1、按照【案例链接】的基础上进行优化和训练; 2、将运行后的翻译效果截图到本帖评论区,即完成任务;
  • [行业资讯] 谷歌I/O大会上的这8款新品,个人用户最为关注
    导语:谷歌在I/O开发者大会上发布了多款创新的硬件产品和软件服务。田姗姗 | 作者 砺石科技 | 出品5月12日,一年一度的谷歌I/O开发者大会在美国旧金山山景城举行。这是近年来谷歌内容最丰富的一次发布会,吸引了全球广大科技爱好者们的关注。今年大会采用了线下+线上的形式,现场有少数观众。在2个多小时的大会里,谷歌CEO皮查伊介绍了包括AR眼镜、平板电脑、降噪耳机等5款硬件产品,十多个涉及底层技术、AI应用、安卓系统等多个领域的更新。其中,砺石科技总结了8款个人用户最关注的产品与新功能。1-更实用的谷歌AR眼镜皮查伊在大会上演示了一段2分钟的视频,介绍了一个正在研发中的谷歌AR眼镜。视频里的主角是一对母女,母亲只会说普通话,而女儿说的是英文。母亲戴上AR眼镜后,AR眼镜便可以将女儿说的话实时记录并翻译成中文,以字幕的方式出现在母亲的视野中。另外,这款AR眼镜还能够翻译美国手语 (ASL)。与2013年谷歌发布的第一款AR眼镜相比,这款AR眼镜更加实用。皮查伊在介绍设计这款AR眼镜的实用场景时说,“语言是彼此联系的基础。然而,理解说不同语言的人,或者如果你是聋子或听力障碍者,试图跟上对话可能是一个真正的挑战”,“让我们看看我们在翻译和转录方面取得的进步,并将我们的早期原型产品之一交付给用户使用时会发生什么。”目前该AR眼镜的更多产品功能、定价以及发布日期等信息尚未确定。2-回归的平板电脑谷歌将于2023年推出一款平板电脑新产品Pixel Tablet。这款Pixel平板电脑将搭载 Android系统,并使用谷歌定制的、已在其智能手机Pixel 6中使用的Tensor处理器。目前,谷歌布局了智能手机、平板电脑、智能降噪耳机Pixel Buds与智能手表Pixel Watch等多款智能硬件设备,已经形成了一个多终端互联的智能硬件生态体系。3-智能手机上新谷歌在发布会上推出了智能手机新产品Pixel 6A,配备1200万像素主摄像头和广角摄像头,搭载与Pixel 6和Pixel 6 Pro相同的Tensor处理器,预装Android 13手机操作系统。售价449美元,将于7月21日开启预购,7月28日正式发售。同时,谷歌还预告了下一代旗舰手机Pixel 7和Pixel 7 Pro,但并没有公布价格和发布日期等细节。据悉,Pixel 7和Pixel 7 Pro将运行Android 13系统,并使用第二代谷歌定制的Tensor芯片。4-智能手表谷歌宣布今年秋季将发布被外界期待已久的智能手表产品Pixel Watch。这款手表可以在Google的Wear OS智能手表系统上运行,并包含一些Fitbit健康追踪功能。谷歌没有公布价格,但表示其将作为高端产品出售。5-高性价比的蓝牙降噪耳机今年谷歌推出了TWS(真无线蓝牙耳机)产品Pixel Buds Pro,其内部采用谷歌开发的6核心音频处理芯片,售价为199美元,比苹果同类型的蓝牙降噪耳机便宜了近一半。该产品最大特点在于支持了主动降噪功能,并搭载了音频处理系统;续航方面,单次使用时间为11小时,开启降噪时为7小时。6-新加入24种语言的谷歌翻译为了更好地服务全球的用户,谷歌在其翻译功能中新增了24种语言,包括一些少数种族或者原住民的语言,比如一种美洲土著使用的语言。谷歌还将机器学习引入了翻译功能,摆脱传统的对照式翻译的模式。7-更注重隐私保护Android 13谷歌公布了Android 13 Beta 2第二个公开测试版,增加了多项更注重用户隐私保护的新功能和用户控件。首先,在Android 13 Beta 2上,用户可以更好地控制共享的个人信息,以及更详细地控制应用程序可以访问的文件。用户还可以控制两个新类别的访问权限:照片和视频,以及音乐和音频。Android 13还推出了一个新选项:让用户可以选择要授予应用访问权限的确切照片或视频,不必共享整个媒体库。在Android 13 Beta 2系统中,语言偏好也可以进行个性化配置。用户将能够为每个应用程序选择不同的语言。例如,用户可能在社交媒体中喜欢使用一种语言,但经常使用另一种语言进行银行业务,Android 13可以让你像在现实生活中一样流畅地切换不同的语言。8-沉浸式地图谷歌推出了一种新的地图模式:沉浸式地图,应用了3D航拍、AI智能等技术,以此来确保导航、搜索等功能的准确性。在沉浸式地图模式下,用户在去一个地方之前就可以更真实地看清目的地的实时状态,可以从上方俯瞰全景,也可以下降到具体的建筑和街道察看细节,还可以实时查看地段的繁忙度和交通信息。据悉,沉浸式地图模式将在今年推出,并支持Android和iOS,但目前只适用于旧金山、纽约、洛杉矶、伦敦和东京等少数地区,更多地区将在后续推出。 另外,谷歌还公布了其地图应用的最新数据:已在全球范围内绘制超16亿座建筑物和6000万公里的道路。— END —       原文标题 : 谷歌I/O大会上的这8款新品,个人用户最为关注
  • [其他] 人工智能-自然语言处理
    早在20世纪50年代,随着电子计算机的出现,产生了许多自然语言处理的任务需求,其中最典型的就是机器翻译。当时存在两派不同的自然语言处理方法:**基于规则方法的符号派**和**基于概率方法的随机派**。受限于当时的数据和算力,随机派**无法发挥出全部的功力**,使得符号派的研究略占上风。体现到翻译上,人们认为机器翻译的过程是在解读密码,试图通过查询词典来实现逐词翻译,这种方式产出的翻译效果不佳、难以实用。当时的一些成果包括1959年宾夕法尼亚大学研制成功的TDAP系统(Transformation and Discourse Analysis Project,最早的、完整的英语自动剖析系统)、布朗美国英语语料库的建立等。IBM701计算机进行了世界上第一次机器翻译试验,将几个简单的俄语句子翻译成了英文。在这之后,苏联、英国、日本等国家也陆续进行了机器翻译试验。1966年,美国科学院的语言自动处理咨询委员会(ALPAC)发布了一篇题为《语言与机器》的研究报告,报告全面否定了机器翻译的可行性,认为机器翻译不足以克服现有困难,难以投人使用。这篇报告浇灭了之前的机器翻译热潮,许多国家开始削减这方面的经费投人,许多相关研究被迫暂停,自然语言研究陷人低谷。 许多研究者痛定思痛,意识到两种语言间的差异不仅体现在词汇上,还体现在**句法结构**的差异上,为了提升译文的可读性,应该加强语言模型和语义分析的研究。里程碑事件出现在1976年,加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发了名为TAUM-METEO的机器翻译系统,提供天气预报服务。这个系统每小时可以翻译6万-30万个词,每天可翻译1000-2000篇气象资料,并能够通过电视、报纸立即公布。在这之后,欧盟、日本也纷纷开始研究多语言机器翻译系统,但并未取得预期的成效。 到了90年代,自然语言处理进人了发展繁荣期。随着计算机的计算速度和存储量大幅增加、**大规模真实文本的积累产生,以及被互联网发展激发出的、以网页搜索为代表的基于自然语言的信息检索和抽取需求出现,人们对自然语言处理的热情空前高涨**。在传统的基于规则的处理技术中,人们引人了更多数据驱动的统计方法,将自然语言处理的研究推向了一个新高度。除了机器翻译之外,网页搜索、语音交互、对话机器人等领域都有自然语言处理的功劳。 进人2010年以后,基于大数据和浅层、深层学习技术,自然语言处理的效果得到了进一步优化。机器翻译的效果进一步提升,出现了专门的智能翻译产品。对话交互能力被应用在客服机器人、智能助手等产品中。 这一时期的一个重要里程碑事件是IBM研发的Watson系统参加**综艺问答**节目Joepardy。比赛中Watson没有联网,但依靠4TB磁盘内200万页结构化和非结构化的信息,成功战胜了人类选手取得冠军,向世界展现了自然语言处理技术的实力。机器翻译方面,谷歌推出的神经网络机器翻译(GNMT)相比传统的基于词组的机器翻译(PBMT),英语到西班牙语的错误率下降了87%,英文到中文的错误率下降了58%,取得了非常强劲的提升。 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20225/22/1653208135085416118.png)
  • [技术干货] 关于Pycharm配置翻译插件Translation报错更新TTK失败不能使用的问题
    解决IDEA翻译插件Translation报错更新TTK失败不能使用有好久一段时间没有用idea的插件Translation,升级后使用翻译,竟然翻译失败。。。网上搜索无数办法都没有效果:1、卸载了以后重新装但是没用;无效!2、Translation配置问题去取消勾选项,还是无效!还是无效,其实勾选不勾选都用一样3、修改Hots文件;还是无效!【修改C:\Windows\System32\drivers\etc 下hosts文件, 添加203.208.40.66 translate.google.com203.208.40.66 translate.googleapis.com此方法解决谷歌浏览器网页翻译失败问题, 将国外域名的IP解析成国内翻译网站的IP,仅供参考!本人无效】最终解决方法:修改本机IPv4的IP地址 为自动获取 成功;
  • [其他] NLP(自然语言处理)技术简介
    处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。分类及国内概况按照技术实现难度的不同,这类系统可以分成简单匹配式、模糊匹配式和段落理解式三种类型。简单匹配式辅导答疑系统主要通过简单的关键字匹配技术来实现对学生提出问题与答案库中相关应答条目的匹配,从而做到自动回答问题或进行相关辅导。模糊匹配式辅导答疑系统则在此基础上増加了同义词和反义词的匹配。这样,即使学生所提问题中按原来的关键字在答案库中找不到直接匹配的答案,但是假若与该关键字同义或反义的词能够匹配则仍可在答案库中找到相关的应答条目。段落理解式辅导答疑系统是最理想的、也是真正智能化的辅导答疑系统(简单匹配式和模糊匹配式,严格说只能称之为“自动辅导答疑系统”而非“智能辅导答疑系统”)。但是由于这种系统涉及自然语言的段落理解,对于汉语来说,这种理解涉及自动分词、词性分析、句法分析和语义分析等NLP领域的多种复杂技术,所以实现难度很大。迄今为止,在国内的网络教学中还没有一个实用化的、能真正实现汉语段落理解的智能辅导答疑系统。但是在我国有些大学的人工智能实验室或中文信息处理实验室中,已有少数研究人员正在研发这类系统的实验原型。相信在不久的将来,就会有这一类的实用性智能系统问世。这是优质网络课程的重要研究方向之一。现实应用领域机器翻译机器翻译因其效率高、成本低满足了全球各国多语言信息快速翻译的需求。机器翻译属于自然语言信息处理的一个分支,能够将一种自然语言自动生成另一种自然语言又无需人类帮助的计算机系统。目前,谷歌翻译、百度翻译、搜狗翻译等人工智能行业巨头推出的翻译平台逐渐凭借其翻译过程的高效性和准确性占据了翻译行业的主导地位。自动问答传统的搜索引擎技术已经不能满足人们越来越高的需求,而自动问答技术成为了解决这一问题的有效手段。自动问答是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务,在回答用户问题时,首先要正确理解用户所提出的问题,抽取其中关键的信息,在已有的语料库或者知识库中进行检索、匹配,将获取的答案反馈给用户。打击垃圾邮件当前,垃圾邮件过滤器已成为抵御垃圾邮件问题的第一道防线。不过,有许多人在使用电子邮件时遇到过这些问题:不需要的电子邮件仍然被接收,或者重要的电子邮件被过滤掉。事实上,判断一封邮件是否是垃圾邮件,首先用到的方法是“关键词过滤”,如果邮件存在常见的垃圾邮件关键词,就判定为垃圾邮件。但这种方法效果很不理想,一是正常邮件中也可能有这些关键词,非常容易误判,二是将关键词进行变形,就很容易规避关键词过滤。自然语言处理通过分析邮件中的文本内容,能够相对准确地判断邮件是否为垃圾邮件。目前,贝叶斯(Bayesian)垃圾邮件过滤是备受关注的技术之一,它通过学习大量的垃圾邮件和非垃圾邮件,收集邮件中的特征词生成垃圾词库和非垃圾词库,然后根据这些词库的统计频数计算邮件属于垃圾邮件的概率,以此来进行判定。文本情感分析情感分析作为一种常见的自然语言处理方法的应用,可以让我们能够从大量数据中识别和吸收相关信息,而且还可以理解更深层次的含义。比如,企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息等。信息提取金融市场中的许多重要决策正日益脱离人类的监督和控制。算法交易正变得越来越流行,这是一种完全由技术控制的金融投资形式。但是,这些财务决策中的许多都受到新闻的影响。因此,自然语言处理的一个主要任务是获取这些明文公告,并以一种可被纳入算法交易决策的格式提取相关信息。例如,公司之间合并的消息可能会对交易决策产生重大影响,将合并细节(包括参与者、收购价格)纳入到交易算法中,这或将带来数百万美元的利润影响。内容参考百度百科
  • [赛事资讯] 【顶会竞赛】2022 NAACL同传Workshop:千言 - 机器同传
    比赛背景 Background同声传译结合了机器翻译(MT)、自动语音识别(ASR)和文本语音合成(TTS)等人工智能技术,在国际会议、商务谈判、新闻发言、法律诉讼和医学交流等众多场景都有广泛的应用,已发展成为一个前沿的研究领域。作为一个新兴的跨学科领域,同声传译未来将面临更多挑战。Simultaneous translation, which performs translation concurrently with the source speech, is widely useful in many scenarios such as international conferences, business negotiations, press releases, legal proceedings and medical communications. It combines the AI technologies of machine translation (MT), automatic speech recognition (ASR) and text-to-speech synthesis (TTS),and is becoming a cutting-edge research field. As an emerging interdisciplinary field, Simultaneous translation will face more challenges in the future.为了促进同声传译的发展,在ACL2020和NAACL2021顶会上,百度领衔并联合Google、Facebook、清华大学、华为等顶尖机构和高校成功地举办了第一届和第二界同声传译研讨会,共邀请到10位主讲嘉宾,吸引了194名注册参与者。研讨会上同期发布的汉英同声翻译竞赛任务,共吸引了525名参赛者。该竞赛任务为参赛者提供了开放数据集:百度语音翻译语料库(BSTC),涵盖了信息技术、经济、文化、生物、艺术等多个领域的专题演讲。In order to promote the development of simultaneous interpretation, Baidu, together with Google, Facebook, Tsinghua University, Huawei and other top institutions and universities, successfully held the first and second automatic simultaneous translation workshop at ACL2020 and NAACL2021, which invited 10 keynote speakers and attracted 194 registered participants. A total of 525 participants participated in the competition. The competition task provides the participants with an open data set: Baidu speech translation corpus (BSTC), which covers the thematic speeches in the fields of information technology, economy, culture, biology, art and so on.为了进一步推动机器同传技术的发展,在NAACL 2022顶会上,汇集了机器翻译、语音处理和人类口译领域的众多研究人员和实践者,共同讨论同声传译的最新进展和当下面临的突出挑战,包括:To further promote the development of simultaneous translation, we will host the 3rd automatic simultaneous translation workshop at NAACL2022, brings together many researchers and practitioners in the field of machine translation, speech processing, and human interpretation to discuss the latest progresses and current challenges, including:· 同声传译范式: 在传统流水线(ASR-MT-TTS)或端到端(语音语音)框架下,如何构建高质量、低延迟的同传系统;· 数据资源: 如何高效运用训练同声翻译系统的大型高质量语料库;· 评价方法: 如何评价翻译质量和如何选取时间延迟指标;· 计算机辅助口译(CAI): 如何尽快提高人工翻译的效率和质量。· Simultaneous translation paradigms: traditional pipeline (ASR-MT-TTS) or end-to-end (speech-speech);· Data resources: large and high-quality corpora for training simultaneous translation systems.· Evaluation methods: metrics to evaluate the translation quality and time latency;· Computer Aided Interpretation (CAI): improve the efficiency and quality of human interpreters.参赛对象及要求 Participants and Requirements参赛对象 Participants本次竞赛面向全社会开放,不限年龄、身份、国籍,相关领域的个人、高等院校、科研机构、企业单位、初创团队等均可报名参赛。大赛主办单位中有机会提前接触赛题和数据的人员不得参加比赛,其他员工可以参与比赛排名,但不可领取任何奖项。This competition is opened to the whole society, and has no restriction on age, identity and nationality. Individuals, institutions of higher learning, research institutions, enterprises and start-up teams in related fields can register for this competition. Those who have access to the task and data in advance cannot participate in the competition. Other employees can participate in the ranking of the competition but cannot receive any award.参赛要求 Requirements支持以个人或团队形式参赛,每个参赛队伍人数最多不超过5人,允许跨单位自由组队,但每人只能参加一支队伍。Individual or team participation is supported. The maximum number of participants in each team is 5. Cross-unit team is allowed, but each person can only join one team.了解详情:https://aistudio.baidu.com/aistudio/competition/detail/148/0/introduction
  • [技术干货] ADC2.0技术案例集--基础编排
    主题社区昵称查看链接ADC2.0服务、校验器、翻译器脚本写法指导hwx868983查看详情ADC2.0 Excel自定义导出gala查看详情FAQ模拟演练一:时间校验hwx868983查看详情ADC2.0如何创建机机账号及机机角色仲岳查看详情ADC2.0逻辑流调用CSE接口操作定时器起啥名字呢查看详情ADC2.0 模型归档指导文档gala查看详情2.0Excel导出如何实现国际化dc_241940366查看详情ADC2.0--服务和页面文本类型字段简单正则校验blue eye查看详情ADC2.0如何在逻辑流脚本中调用GDE接口文档中的接口Robin23查看详情2.0自定义资产对接1.5APP数据包功能owlcity查看详情adc2.0--脚本服务如何调用API Fabric发布的接口blue eye查看详情如何给模块里面的服务添加权限blue eye查看详情 ADC2.0配置分库及租户额外数据源gala查看详情如何获取上传文件的文件名blue eye查看详情ADC2.0服务脚本创建定时任务 owlcity查看详情通过服务配置页面的模糊搜索功能淡墨查看详情ADC2.0中没有管理员权限,如何将开发态配置的菜单,配置权限到运行态淡墨查看详情ADC2.0根据模型名查询数据库表数据Robin23查看详情2.0运行脚本调用出站rest接口如何获取公共参数配置参数blue eye查看详情2.0平台触发器--调用服务使用说明blue eye查看详情平台数据导出任务接口如何使用blue eye查看详情触发器----模型数据操作Robin23查看详情单步调试服务gala查看详情ADC2.0-邮件、短信功能配置使用owlcity查看详情ADC2.0平台服务如何注册到API目录并使用blue eye查看详情ADC2.0模型继承能力说明owlcity查看详情2.0配置通用作业高级功能---定时器owlcity查看详情ADC2.0Excel多表数据的导入导出gala查看详情ADC2.0附件翻译器如何使用blue eye查看详情ADC2.0--如何创建子菜单blue eye查看详情ADC2.0通用作业基础功能配置-权限配置yd_aabb查看详情ADC2.0如何配置逻辑流异常恢复功能yd_aabb查看详情ADC2.0批量服务的使用及配置gala查看详情ADC2.0----机机账号的创建和使用Robin23查看详情ADC2.0如何在逻辑流中调用指令今天不上火查看详情ADC2.0配置通用作业高级功能---定时器今天不上火查看详情从字符串中取出特定的某个字符串(使用正则表达式获取)花开谁折查看详情adc2.0如何通过翻译器解析txt附件花开谁折查看详情ADC2.0-邮件、短信功能配置使用Robin23查看详情ADC2.0Excel多表数据的导入导出Margie1查看详情2.0版本能否连接外部数据库arkira查看详情ADC2.0----脚本服务调用出站soap接口Margie1查看详情ADC2.0创建数据源模型Robin23查看详情脚本如何实现调用流程?特大柠檬查看详情
  • [技术干货] 如何配置智慧园区设施云页面的语言切换开关
    设置默认语言用开发者账号登录AppCube平台。选择“管理>用户管理>公司配置>公司信息”,将默认语言设置为“中文”,单击“保存”。如图1所示。图1 设置默认语言选择“管理>系统管理>系统参数”。修改系统参数“DefaultLanguage”。单击参数名称进入系统参数详情页面。单击“值”后面的“”,修改参数默认值。参数默认值为“zh_CN”中文,如果不是请修改为“zh_CN”,单击“保存”。如图2所示。图2 修改默认语言为中文设置是否显示语言切换模块用开发者账号登录AppCube平台。选择“管理>系统管理>系统参数”。修改系统参数“UnifiedPortal_Mainframe_IsAllowSwitchLanguage”。单击参数名称进入系统参数详情页面。单击“值”后面的“”,修改参数默认值。参数默认值为“是”,即需要显示语言切换模块,如果不需要展示请将默认值修改为“否”。单击“保存”。设置为“否”后,如下图中的语言切换模块将不再显示,如图3所示。图3 语言切换模块检查翻译工作台配置切换多语言是需要确保对应的语言在翻译工台中已配置,否则IOC平台语言切换时界面无法显示对应的语言。检查步骤如下:用开发者账号登录AppCube平台。搜索菜单“翻译工作台”,进入翻译工作台配置页面。检查操作栏支持切换的语言开关键是否打开,如图4所示。园区业务目前支持中英文切换,需将中英文开关键都打开。图4 翻译工作台页面
  • [其他] NLP目标与其解决的5个基本问题
    NLP是什么?交叉学科: Computer Science,Artificial Intelligence and Computational Linguistics目标:解决计算机和人类((自然)语言的交互问题,尤其是自动处理大规模自然语言语料难点:语言本身复杂、语境相关、抽象概念联想、软硬件技术限制,等等.NLP解决的5个基本问题(摘自李航老师的总结)分类: assigning a label to a string匹配:matching two strings翻译:transforming one string to another·结构化预测:mapping string to structure马氏决策过程:deciding next state given previous state and action自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,包括:1.句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧。2.信息抽取:从给定文本中抽取重要的信息,比如,时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。涉及到实体识别、时间抽取、因果关系抽取等关键技术。3.文本挖掘(或者文本数据挖掘):包括文本聚类、分类、信息抽取、摘要、情感分析以及对挖掘的信息和知识的可视化、交互式的表达界面。目前主流的技术都是基于统计机器学习的。4.机器翻译:把输入的源语言文本通过自动翻译获得另外一种语言的文本。根据输入媒介不同,可以细分为文本翻译、语音翻译、手语翻译、图形翻译等。机器翻译从最早的基于规则的方法到二十年前的基于统计的方法,再到今天的基于神经网络(编码-解码)的方法,逐渐形成了一套比较严谨的方法体系。5.信息检索:对大规模的文档进行索引。可简单对文档中的词汇,赋之以不同的权重来建立索引,也可利用1、2、3的技术来建立更加深层的索引。在查询的时候,对输入的查询表达式比如一个检索词或者一个句子进行分析,然后在索引里面查找匹配的候选文档,再根据一个排序机制把候选文档排序,最后输出排序得分最高的文档。6.问答系统: 对一个自然语言表达的问题,由问答系统给出一个精准的答案。需要对自然语言查询语句进行某种程度的语义分析,包括实体链接、关系识别,形成逻辑表达式,然后到知识库中查找可能的候选答案并通过一个排序机制找出最佳的答案。7.对话系统:系统通过一系列的对话,跟用户进行聊天、回答、完成某一项任务。涉及到用户意图理解、通用聊天引擎、问答引擎、对话管理等技术。此外,为了体现上下文相关,要具备多轮对话能力。同时,为了体现个性化,要开发用户画像以及基于用户画像的个性化回复。摘自  国际计算语言学协会(ACL)候任主席、NLP 领域资深研究者、MSRA副院长周明
  • [技术干货] ADC2.0服务、校验器、翻译器脚本写法指导
    1.    服务脚本基本写法:参考如下:let requestBody = {};……………………………………………………………………...(1)requestBody.order_id = _message.order_id;……………………………………………...(2)let response = ServiceInvoker.post("/adc-bpm/rest/v1/order/order-detail", requestBody);(3)console.log("1234");………………………………………………………………………(4)return response;……………………………………………………………………………(5)具体解析:创建一个服务对象(服务的参数是以对象传入的);接受传过来的参数;调用服务;打印日志;脚本返回。2.    校验器脚本基本写法参考如下:let start = _context.parentValue.start;………………………………………………… (1)if(start < 0){    throw new ScriptError(new ErrorCode('20001010',[]));…………………………(2)}具体解析:获取需要校验的参数信息;如果校验不通过,抛出的错误码异常3.    翻译器脚本基本写法:参考如下:let order_id = _context.parentValue.order_id;……………………………………….(1)if(order_id == 1){    return "tt11-20220128-00000002";……………………………………………(2)}else{    return order_id;}具体解析:获取需要翻译的参数;返回翻译好的值。
  • [页面编排] ADC2.0上怎么在出参配置的翻译器中,取到入参配置里面的参数?
    【操作步骤&问题现象】环境地址:https://adcdev-sh.gde.huawei.com
  • [指令翻译工具] 动态二进制翻译——无源码应用迁移利器
    在数字化背景下,算力多样性发展已成为必然。作为多样性计算的典型代表,越来越多的开发者加入鲲鹏产业生态,基于鲲鹏平台进行应用的迁移和开发。在应用软件迁移过程中,存在部分存量现网应用软件只有x86/ARM32版本二进制工具包,且无源码可供移植的问题,导致无法直接在鲲鹏平台上运行。针对这一问题,ExaGear实现“低损耗”、“零成本”的无源码快速迁移,使得Linux x86/ARM32应用无需重新编译即可运行在鲲鹏平台上。ExaGear是什么?ExaGear是华为自主可控的动态二进制翻译软件,在运行时将待迁移Guest应用的x86(32/64-bit)或ARM32指令翻译成ARM64指令,并模拟Guest应用调用的操作系统API,使得Linux x86(32/64-bit)或ARM32的程序可运行在鲲鹏平台上,实现低成本、快速迁移到ARM64服务器。其翻译过程准确、稳定、高效,为当前无源码的商用软件运行于ARM64平台上铺平了最后一公里道路。图1 ExaGear在鲲鹏上翻译运行二进制程序ExaGear有哪些优势?1 一键式快速安装,支持多种部署方式ExaGear的安装和部署过程简单,一键即可完成,安装完成后,进入ExaGear环境,尤如在原生x86环境操作一样。ExaGear始终运行于Linux用户态,不对操作系统的运行产生干扰。以编译技术作为依托,ExaGear基于IR中间表示层做中端优化,既有支持多指令集的前端模块(如x86_32、x86_64、ARM32等),也有支持多指令集的后端模块(如ARM64、RISC-V等)。当前,ExaGear支持CentOS、openEuler、Ubuntu、安卓等主流操作系统,及容器相关的部署。后续版本根据市场需求可以适配更多的操作系统平台。图2 ExaGear的各种部署形态2 代码 “0”修改,最小化业务迁移成本无需改造源码,直接在ExaGear环境中部署x86软件,即可完成迁移,迁移周期短,业务连续性好。翻译过程遵循指令集标准规格以及Linux操作系统调用标准规格进行转换,在最底层完成业务执行,避免软件跨平台源码移植引入的额外bug,整体迁移过程兼容性好,稳定性有保障。3 性能领先,翻译性能极致优化在通用的编译框架基础上,ExaGear采用了“边翻译边执行+二级优化”的策略,在不影响业务流畅度的前提下,利用Guest程序在运行过程中表现出来的热点特征,针对热点执行路径极致优化,从而达到相对纯粹静态编译更优的翻译结果。图3 ExaGear工作流程图通过Benchmark对比评测x86的程序经过ExaGear指令翻译后的性能与原生AArch64的程序性能,当前在二级优化开启的情况下已经达到AArch64 Native的80%+能力,部分测试项甚至超越了原生应用的表现。随着技术的不断演进与优化,HPC等典型场景的性能损耗会进一步压缩。图4 ExaGear性能数据ExaGear主要用于哪些场景?ExaGear解决了用户将原有平台的软件系统迁移到鲲鹏平台时遇到的痛点问题。在迁移过程中,用户业务按重要性差异,往往可分为三类:无源码业务、有源码的非关键业务和有源码的关键业务。行业相关的无源码商业软件。这类软件只有二进制、没有源码,在行业内又有相当的影响力。在这样的场景下,需要ExaGear动态二进制翻译技术保障顺利完成迁移。有源码的非关键业务。使用频率低、对性能不敏感。对于这部分业务,客户就可以利用ExaGear完成动态的二进制翻译,使存量业务应用不需要通过代码移植,就可以直接运行在鲲鹏平台上。这一过程省却了大量的移植或优化源代码所需的人力和时间,而且没有因移植代码而引入额外的稳定性隐患。性能敏感且有源码的关键业务。建议通过手工的代码移植和性能优化完成迁移,达到最优的性能预期。ExaGear利用动态二进制翻译技术,结合动态二进制优化能力,能够稳定支持无源码的x86和ARM32存量业务运行在鲲鹏平台上,并且适于部署的场景广泛,既可以直接部署于操作系统,也可以部署于容器中,甚至是在ExaGear中再部署容器,能够在无源码的情况下屏蔽底层平台差异,低成本解决应用的平滑迁移,释放鲲鹏平台澎湃算力。想了解更多关于ExaGear的产品知识,欢迎各位开发者访问ExaGear产品页,还可以添加如下小助手微信进入Compiler SIG交流群与大家进行互动交流。原文转载自毕昇编译——通过动态二进制翻译快速迁移无源码应用关注 毕昇编译 获取编译技术更多信息
  • [技术干货] 鲲鹏 DevKit 通过动态二进制翻译快速迁移无源码应用
    在数字化背景下,算力多样性发展已成为必然。作为多样性计算的典型代表,越来越多的开发者加入鲲鹏产业生态,基于鲲鹏平台进行应用的迁移和开发。在应用软件迁移过程中,存在部分存量现网应用软件只有x86/ARM32版本二进制工具包,且无源码可供移植的问题,导致无法直接在鲲鹏平台上运行。 针对这一问题,**鲲鹏开发套件DevKit提供动态二进制指令翻译软件ExaGear,实现“低损耗”、“零成本”的无源码快速迁移,使得Linux x86/ARM32应用无需重新编译即可运行在鲲鹏平台上。** **ExaGear是什么?** ExaGear是华为自主创新的动态二进制翻译软件,在运行时将待迁移Guest应用的x86(32/64-bit)或ARM32指令翻译成ARM64指令,并模拟Guest应用调用的操作系统API,使得Linux x86(32/64-bit)或ARM32的程序可运行在鲲鹏平台上,实现**低成本、快速迁移**到ARM64服务器。 其翻译过程准确、稳定、高效,为当前无源码的商用软件运行于ARM64平台上铺平了最后一公里道路。 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20222/16/1645019467525329202.png) **ExaGear有哪些优势?** **1** **一键式快速安装,支持多种部署方式** ExaGear的安装和部署过程简单,一键即可完成,安装完成后,进入ExaGear环境,尤如在原生x86环境操作一样。ExaGear始终运行于Linux用户态,不对操作系统的运行产生干扰。 以编译技术作为依托,ExaGear基于IR中间表示层做中端优化,既有支持多指令集的前端模块(如x86_32、x86_64、ARM32等),也有支持多指令集的后端模块(如ARM64、RISC-V等)。 当前,ExaGear支持CentOS、openEuler、Ubuntu、安卓等主流操作系统,及容器相关的部署。后续版本根据市场需求可以适配更多的操作系统平台。 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20222/16/1645019541525329815.png) **代码 “0”修改,最小化业务迁移成本** 无需改造源码,直接在ExaGear环境中部署x86软件,即可完成迁移,迁移周期短,业务连续性好。翻译过程遵循指令集标准规格以及Linux操作系统调用标准规格进行转换,在最底层完成业务执行,避免软件跨平台源码移植引入的额外bug,整体迁移过程兼容性好,稳定性有保障。 3 **性能领先,翻译性能极致优化** 在通用的编译框架基础上,ExaGear采用了“边翻译边执行+二级优化”的策略,在不影响业务流畅度的前提下,利用Guest程序在运行过程中表现出来的热点特征,针对热点执行路径极致优化,从而达到相对纯粹静态编译更优的翻译结果。 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20222/16/1645019573820922282.png) 通过Benchmark对比评测x86的程序经过ExaGear指令翻译后的性能与原生AArch64的程序性能,当前在二级优化开启的情况下已经达到AArch64 Native的80%+能力,部分测试项甚至超越了原生应用的表现。随着技术的不断演进与优化,HPC等典型场景的性能损耗会进一步压缩。 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20222/16/1645019588887108286.png) **ExaGear主要用于哪些场景?** ExaGear解决了用户将原有平台的软件系统迁移到鲲鹏平台时遇到的痛点问题。在迁移过程中,用户业务按重要性差异,往往可分为三类:**无源码业务、有源码的非关键业务和有源码的关键业务**。 - **行业相关的无源码商业软件。**这类软件只有二进制、没有源码,在行业内又有相当的影响力。在这样的场景下,需要ExaGear动态二进制翻译技术保障顺利完成迁移。 - **有源码的非关键业务。**使用频率低、对性能不敏感。对于这部分业务,客户就可以利用ExaGear完成动态的二进制翻译,使存量业务应用不需要通过代码移植,就可以直接运行在鲲鹏平台上。这一过程省却了大量的移植或优化源代码所需的人力和时间,而且没有因移植代码而引入额外的稳定性隐患。 - **性能敏感且有源码的关键业务。**建议通过手工的代码移植和性能优化完成迁移,达到最优的性能预期。 ExaGear利用动态二进制翻译技术,结合动态二进制优化能力,能够稳定支持无源码的x86和ARM32存量业务运行在鲲鹏平台上,并且适于部署的场景广泛,既可以直接部署于操作系统,也可以部署于容器中,甚至是在ExaGear中再部署容器,能够在无源码的情况下屏蔽底层平台差异,低成本解决应用的平滑迁移,释放鲲鹏平台澎湃算力。 **直播预告** 除了无源码迁移场景,鲲鹏DevKit还提供代码迁移、编译调试、性能分析、系统诊断等丰富的工具套件,支撑有源码的无忧迁移和鲲鹏原生应用开发,充分利用鲲鹏架构的优势,最大化提升软件的运行性能。 **2月23日19:00-20:30** **鲲鹏DevKit新版本推介会** **直播****解读** **DevKit2.0的新版本特性****及关键技术** **欢迎报名观看** ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/20222/16/1645019643723584150.png) 转自 华为云公众号
  • [新手课堂] 奇迹再现!
    今天是2022年2月2日,大年初二新春佳节,华为云携手伙伴邀您观看如何用科技,创奇迹,1+1>2新的一年,祝您好事成双,奇迹多多!来自无声世界的“新声”春节的深圳街头难得安静但对于佩佩来说,远没有之前的世界“安静”她是听障人士,无声世界隔绝了感官也拒绝了她与正常世界的交流华为云携手长沙千博信息技术有限公司打造智能手语双向服务系统能把语音快速准确翻译成文字也能把文字准确翻译成3D手语动画只需在手机里下载该系统APP听障人士与健听人就能实现双向无障碍交流 可以看见的“舌尖”安全民以食为天,过年更是要“上天”但每年大量的食品安全问题就算号称绿色有机的农产品滥用添加、假冒伪劣、重金属含量超标等也时有发生,让英子每每“食”难安心华为云联合浙江数秦科技有限公司推出数秦科技数字农业平台  将AIoT技术、区块链与农业生产技术深度融合不但农产品种植、加工、流通等环节有据可查而且帮助农户对作物生长环境、病虫害等进行监测农民种得安心,消费者吃得放心提前上映的贺岁片春节贺岁大片轮番看各种特效狂拽酷炫吊炸天露露不禁感慨,以前好久才能有一部经典现在各种档五花八门看到眼花缭乱华为云携手赞奇科技等影视巨头为《长津湖之水门桥》等爆火电影“开发”特效神器云渲染平台90分钟的3D电影渲染以前6个月,现在只用2周效率搞上去,上映时间自然往前排把心放到肚子里过年难得回家,阿杰仔细了解了爸妈的日常起居二老年纪大了,身体难免有欠佳的时候家里各种药少不得也要准备以前因为药品安全问题心总是提在嗓子眼但现在,心可以完全放到肚子里华为云联合伙伴推进医药追溯服务平台,通过该系统能清晰了解药品生产、流通等全过程追溯信息药品来源透明安全,远方的孩子也能安心轻松到手的拜年礼又是一年走亲访戚的日子芳芳早早就在自家线上商城选好了拜年礼而且给亲戚朋友都派发了特殊商城优惠券以前以为有个自己的网站千难万难万万没想到会这么简单华为云携手上海美橙科技信息发展有限公司打造精品云速建站服务60+行业 、3000+精品模板不用懂代码, PPT式拖拽编辑就能快速搭建好自己的网站每根睫毛都能看清楚大年初二,雯雯终于有空回娘家吃完饭跟妈妈边看电视边聊天以前只有大制作才不会糊现在,连综艺节目里嘉宾们都纤毫毕现华为云联合芒果TV打造“光芒”4K云制播系统首次将4K云制播技术应用于大型综艺不仅让节目更能还原现场效果画面更清晰到每根睫毛都能看清楚看到这里的你是否也想起生活中那些因为科技,所以奇迹的暖心故事呢?转自华为云公众号