-
开源大模型和闭源大模型是人工智能领域中的两种重要模型类型,它们在开放性、可访问性、透明度等方面存在显著差异。以下是这两类模型的一些代表性例子:开源大模型代表LLaMA系列:LLaMA 2:由Meta AI开发的一系列预训练和微调的大型语言模型,参数规模从70亿到700亿不等。其中,LLaMA 2-Chat是特别优化用于对话场景的微调模型。LLaMA 3:Meta AI近期推出的两款开源模型,Llama 3 8B与Llama 3 70B,展现出卓越的性能,可供外部开发者免费使用。CodeGeeX:一个拥有130亿参数的多语言代码生成模型,能够生成语法和功能正确的代码,极大地提高了程序员的编码效率。OPT:一系列仅包含解码器的预训练transformers模型,参数范围从125M到175B。这些模型在零样本学习和少样本学习方面展现出卓越的能力,且训练成本较低。CPM系列:CPM:由清华大学研发的中文预训练语言模型,拥有26亿参数和100GB中文训练数据。CPM-2:基于大规模预训练语言模型(PLMs)的成本效益技术套件,旨在解决PLMs的效率问题。BLOOM:一个拥有1760亿参数的开放获取语言模型,由数百名研究人员合作设计和构建,支持46种自然语言和13种编程语言。GLM-130B:一个拥有1300亿参数的双语(英文和中文)预训练语言模型,旨在开源一个至少与GPT-3一样出色的1000亿规模模型。Phi-3:微软AI研究院的新开源语言模型,具备小巧且高效的特性,包括Phi-3-Mini、Phi-3-Small和Phi-3-Medium三种规模。Qwen1.5-110B:国内通义千问公司发布的千亿级参数模型,性能卓越,支持多种语言。Falcon:阿联酋技术创新研究所开发的开源LLM,Falcon 180B拥有1800亿参数,在多种NLP任务中表现出色。Yi系列:01.AI推出的强大开源语言模型,以双语能力领先领域,如Yi-34B-Chat在多个基准测试中表现优异。闭源大模型代表GPT系列:由OpenAI开发的系列模型,包括GPT-3、GPT-4等,这些模型在自然语言处理领域取得了显著成就,但源代码和内部实现细节不对外公开。BERT:虽然BERT在早期是开源的,并且作为Transformer潜力的首批实验之一迅速在自然语言处理任务中取得先进性能,但近年来谷歌对开源大模型的态度有所变化,且BERT本身已成为闭源大模型概念下的一个代表性例子,用于说明这类模型的特点。其他商业公司模型:许多大型科技公司,如Google、Facebook等,也开发了各自的闭源大模型,这些模型通常通过API访问或企业解决方案提供给用户,以保护知识产权和商业利益。本期讨论主题上述那么多大模型,你觉得最终开源类的能取胜,还是闭源类的能取胜?
-
使用盘古大模型进行图像分类算法训练报上面的错误,训练节点为通用图像分类模型训练,训练机器配置为
-
6月15日, HCDG城市行·北京站——“AI原生应用的探索与创新”技术研讨沙龙圆满举办。活动特邀来自华为云和华为云HCDE圈层的专家们为与会开发者带来一场别开生面的技术交流活动。为正在探索AI创新之路的企业与开发者们赋能助力,与开发者共同探索AI技术的无限可能。句子互动联合创始人& CTO、华为云HCDE 高原活动伊始,句子互动联合创始人& CTO、华为云HCDE高原进行《AI Workflow 的敏捷开发》的主题演讲,他表示敏捷开发的核心在于快速迭代和持续交付,它要求我们在开发过程中不断收集反馈,快速调整策略,以适应不断变化的需求和技术环境。面对功能挑战,如精确控制的记忆、主动被动结合的沟通场景、自有系统逻辑的融合介入;以及迭代挑战,包括分析不符合预期的回答和保证新变动不影响旧逻辑。敏捷开发策略可总结为如下3点:一是快速迭代需要快速反馈,通过调优中心和一键导入测试中心实现;二是流程中节点验证和流程运行完动作校验,确保执行结果清晰可见。三是版本控制保证测试和生产环境的互不干扰,并通过不同版本的用例测试进行效果比对。通过他现场的操作演示,开发者们对这一理解更加深刻。华为云EI解决方案专家 张瑞锋随后,华为云EI解决方案专家张瑞锋为到场的开发者们介绍了华为云昇腾算力和盘古大模型,他表示在大模型产业的潜在空间极大,其本质是对人类知识的数字化,未来基础大模型的构建还需要企业与人才的持续投入。基于华为打造全栈的AI解决方案,充分释放AI算力潜能,通过ModelArts一站式开发平台为开发者提供全套工具,实现快速训推与部署。开发者们还可以在AI Gallery部署开源模型,支持百模千态一键部署。他指出大模型的开发与应用是一个复杂的系统工程,其训练需要在大规模数据处理和分布式并行训练方面具备广泛实践经验,例如在集群建设、数据准备、模型训练、推理压缩、应用开发等方面会遇到许多问题和挑战,这些都可以靠华为解决。华为云通过提供全套的开发套件使能开发者,提升行业大模型开发效率的同时也为用户和伙伴创造价值。此外他还介绍了盘古大模型在政务、互联网、影视、游戏等多个行业应用实践案例,进一步阐释了人工智能发展从局部探索正在走向千行百业。聆心智能CEO、华为云HCDE 郑叔亮最后,聆心智能CEO、华为云HCDE郑叔亮发表了《超拟人大模型和心理支持与陪伴》的主题演讲,介绍了超拟人大模型的概念、进展以及心里健康解决方案。他提到超拟人大模型是在效率价值及创意价值的基础上为用户进一步提供情绪价值,主要应用在情感陪伴、心理健康、教研教学等有个性化需求的领域。同时他还从高安全、强可控、拟人化多个角度对Emohaa、CharacterGLM、OPD-2拟人化LLM进行分析,以及应用于教育、文娱、营销等落地场景,提供AI Native社交/陪伴体验,展现沉浸式多模态交互。同时现场还邀请到了华为云DTSE专家(开发者技术支持工程师)与开发者们深入交流技术难题,解答开发困惑并提供对应的解决方案,为开发者用云开发保驾护航。未来华为云将继续携手广大开发者共同推进AI大模型创新技术应用的落地,共建繁荣的AI生态!
-
2024中关村轨道交通国际创新创业大赛-行业AI大模型专项赛,采用“揭榜挂帅”的形式,由轨道交通行业大型央国企及上市公司作为发榜方,从实际业务需求中拆解提炼出一批关键痛点问题,提供训练数据并面向社会技术大牛、团队和公司征集解决方案。优秀揭榜方将获得模型开发资金支持和大赛奖励支持,同时将有机会与发榜方达成长期合作关系,进一步参与后续AI大模型开发项目,并在行业内得到充分的曝光和推广。需求榜单(第一期)2024年度轨道交通行业AI大模型专项赛计划组织三期,首期专项赛发布了3项需求,分别为轨道交通头部企业的工务运维、生产经营和设备维护的AI大模型应用需求。榜单1.城轨工务检修助手城市轨道交通工务检修对安全和效率要求极高,任何操作失误都可能导致严重后果。随着技术的发展和标准的更新,运维人员需要及时了解和掌握最新的操作规范。现有解决方案面临信息更新滞后、高培训成本、经验传承困难、故障诊断效率低、数据分析能力有限和响应时间长等痛点。训练数据:相关国家、地区、团体和公司的操作规范文档数据格式:pdf、word文档核心任务:形成结构化数据,实现实时查询和统计分析功能关键指标:准确率95%以上榜单2.公司生产经营大脑现代企业需要更高效、更智能的数据分析解决方案,传统数据分析解决方案常面临数据集成难度大、分析速度慢、个性化服务不足、可扩展性差以及对专业技能依赖性强等痛点。训练数据:公司生产、商务、经营等数据数据格式:excel文档核心任务:提供快速、准确的数据分析服务、实现可视化报告生成和交互问答功能关键指标:准确性、可读性、可视化效果榜单3.轴承剩余寿命预测模型旋转机械的大多数故障都与轴承有关,轴承的工作状态在很大程度上影响轨道交通等行业中机械系统和设备的可用性、安全性和成本效率。现有解决方案面临数据收集与分析的复杂性、特征提取难度、预测准确性不足、成本与时间消耗较大以及对专业知识的高度依赖等问题。训练数据:在加速轴承退化实验中收集的轴承在线监测数据数据格式:csv文档(温度、振动加速度)核心任务:建立一个轴承剩余寿命预测模型,实现对轴承剩余使用寿命(RUL)预测功能关键指标:预测误差小于5%二、揭榜流程1.报名参赛2024/6/5-6/18扫描二维码,勾选拟揭榜题目并提交。需求对接2024/6/19-6/24由发榜方向揭榜方详细解读需求,包括应用场景、评价标准、交付标准并提供训练数据等,经确认后签署保密等相关协议。3.模型研发2024/6/25-7/23揭榜方根据的训练数据进行算法研发、模型训练与模型测试。4.专家评审2024/7/24-7/30组委会组织评审专家进行算法测试和评价,评选出杰出奖、优秀奖若干。5.结果公布2024/7/31公示评选结果,杰出奖揭榜方将与发榜方签署技术合作协议,获得研发资金支持。三、合作通道详见官网:www.zgcrail.com 咨询电话:姜老师18811103027
-
2024年5月26日,由华为云、鲲鹏会、创享梦空间联合主办的HCDG城市行上海站-AI大模型专场技术实践沙龙在上海创享梦空间举办。本次沙龙邀请了众多行业开发者、技术相关从业人员,共同聚焦华为云昇腾云服务、RAG模型、LLM大模型的最新技术动态和实践经验等议题进行交流探讨,激发大模型应用创新思维,共谋AI技术在行业中的应用与发展。随着人工智能技术的快速发展,AI算力需求正在加速增长,大算力成为支撑大型语言模型发展的关键。会上,华为云上海开发者生态总监发表了“基于ModelArts的开源LLM大模型应用实践”的主题演讲。他详细演示了通过AI Gallery一键部署ChatGLM2-6B-推理模型到昇腾云服务上,并基于LangChain应用框架实现自建知识库应用部署。他介绍道,在大模型应用方面,昇腾云凭借着其独特的灵活性和强大的技术能力,正在持续推动大模型技术进步和行业应用普及。▲ 华为云上海开发者生态总监英飞流(上海)信息科技有限公司 CEO张颖峰在会上深入分析了检索增强生成(Retrieval-Augmented Generation, RAG)的现状与未来。他指出,尽管长上下文大型语言模型(LLM)在能力上具有优势,RAG技术仍然不可或缺,但需要进一步的发展和完善。对此,张颖峰介绍了开源的RAGFlow产品,强调“质量输入,质量输出”的重要性。张颖峰还介绍了Infinity 开源AI原生数据库,旨在通过融合向量数据库、搜索引擎和结构化数据查询,提升RAG所必须的多路召回能力。未来,RAG将整合结构化/半结构化数据,形成一个更加强大和灵活的系统,统一服务企业级的搜索、推荐、对话、个人助手等应用,让企业高效使用大模型。▲ 英飞流(上海)信息科技有限公司CEO 张颖峰观测云产品架构师刘锐在会上详细介绍了 LLM 大模型 LangChain 的可观测性最佳实践。刘锐指出,事实上在 AI 模型的开发与调试过程中,掌握模型的内部运行状态是至关重要的。通过分析输入和输出的参数,有助于开发者对模型进行精确的调整和优化,包括对模型的 prompt 输入进行细化调整等。观测云为用户提供了端到端全链路追踪分析平台和强大的体验感知能力以解决分散式监控系统面临的诸多挑战,目前支持超过400+的技术栈,其中包括数据采集、观测模板和监控配置等,其核心技术优势包括统一数据采集器 DataKit、统一数据查询引擎 DQL、多模存储引擎 GuanceDB 以及智能一体化监控观测平台等。▲ 观测云产品架构师 刘锐大模型技术正逐渐成为推动各行各业发展的关键力量。未来,随着AI大模型技术的不断进步和应用场景的持续拓展,相信大模型技术将释放更多“模”力,为社会带来更多价值和可能性。在此过程中,华为云也将继续携手行业伙伴,共同探索AI技术的无限可能,推动大模型技术应用创新,助力企业在数字化、智能化的浪潮中乘风破浪,升级跃迁。
-
引言LangChain是一个先进的人工智能框架,它允许开发者构建复杂的思维链,模拟人类的思考过程。本文将介绍如何使用LangChain来创建一个复杂的思维链,以解决一个假设的复杂问题。第一步:定义问题首先,我们需要定义我们想要解决的问题。在本例中,我们将使用LangChain来解决一个复杂的物流优化问题。第二步:构建思维链2.1 收集数据使用LangChain的数据处理模块来收集所有相关的物流数据。from langchain.data_collection import DataCollector 初始化数据收集器 collector = DataCollector() 收集物流数据 logistics_data = collector.collect_data('logistics')2.2 数据处理处理收集到的数据,以便于分析。from langchain.data_processing import DataProcessor 初始化数据处理器 processor = DataProcessor() 处理物流数据 processed_data = processor.process(logistics_data)2.3 建立模型使用LangChain的模型构建工具来创建一个解决物流问题的模型。from langchain.model_building import ModelBuilder 初始化模型构建器 builder = ModelBuilder() 构建物流优化模型 logistics_model = builder.build_model(processed_data, 'logistics_optimization')2.4 模拟决策模拟不同决策对物流网络的影响。from langchain.simulation import DecisionSimulator 初始化决策模拟器 simulator = DecisionSimulator() 模拟不同决策 simulation_results = simulator.simulate(logistics_model, ['decision1', 'decision2', 'decision3'])2.5 分析结果分析模拟结果,确定最佳决策路径。from langchain.analysis import ResultAnalyzer 初始化结果分析器 analyzer = ResultAnalyzer() 分析模拟结果 best_decision_path = analyzer.analyze_results(simulation_results)第三步:实施决策根据分析得出的最佳决策路径,实施物流优化策略。from langchain.implementation import StrategyImplementer 初始化策略实施器 implementer = StrategyImplementer() 实施最佳决策路径 implementer.implement_strategy(best_decision_path)结语通过LangChain构建的思维链,我们能够模拟复杂的决策过程,并找到解决物流优化问题的最佳方案。LangChain提供了强大的工具来帮助开发者在各种复杂问题上进行深入的思考和分析。注意LangChain是一个虚构的概念,本示例中的代码和模块不是真实存在的。实际的人工智能框架和工具可能会有所不同。
-
3月19日,以“智”惠家庭,“碳”索未来为主题的HCDG城市行深圳站——产业融合与应用技术创新峰会在深圳国际会展中心(宝安新馆)圆满落幕。此次峰会聚焦智能科技与低碳发展的融合,展示了华为云AIoT在智能家电行业的实践案例,分享了物联网行业的发展趋势以及华为云物联网解决方案的优势。华为云IoT服务产品部高级产品经理管政阐述了华为云AIoT的服务能力,展示了华为云家具行业数字化转型方案,引领行业向智能化、低碳化发展。华为云IoT服务产品部高级产品经理 管政华为云IoT服务产品部高级产品经理管政分享了华为云AIoT智能家电行业实践案例,他表示,随着AI大模型的发布,我们已经步入了智能时代,而万物互联是智能化的基础。据调研显示,物联网在未来五到十年中将迎来爆发式增长,预计联接数将达到2000亿,市场规模将达到万亿美金。其中,中国物联网的市场占比预计将达到25%以上,一跃成为全球物联网第一大市场。华为云AIoT作为引领行业变革的重要力量,提供海量设备连接上云、设备和云端双向消息通信、设备管理、远程控制和监控等能力,并可将设备数据灵活流转到华为云其他服务,帮助物联网行业用户快速完成设备联网及行业应用集成。华为云工业互联网平台总架构师 刘益明华为云工业互联网平台总架构师刘益明分享了华为云家具行业数字化转型方案。分享过程中刘益明介绍到,制造企业数字化转型升级是“十四五规划”支持实体经济发展的重要方向,目标在 2025 年 50% 规模以上制造企业智能制造成熟度达到二级以上,要求企业主业务流程采用信息系统进行规范化管理。对大多数中小家具制造企业来说,企业数字化面临很大挑战,数字化需要覆盖家具企业的主业务流程,预算有限,用户界面要简单易用。是否有相应的方案能够满足该诉求了?答案是肯定的,华为云联合数夫打造的家具行业数字化转型方案,以 SaaS 方式提供市场推广、产品设计、生产和仓储等家具企业主业务流程应用,所有应用均通过统一平台承载,不同应用间数据预集成打通。目前该方案处于前期孵化阶段,感兴趣的企业可以联系我们试点使用。华为云产品中心高级专家 包宜强华为云产品中心高级专家包宜强进行了主题为人工智能赋能产业智能化分享。盘古大模型作为华为云的一项重要AI技术,已经在多个领域展现出强大的实力。它能够处理大规模的数据,提供精准的预测和决策支持,帮助企业提升效率,降低成本。 包宜强表示,盘古大模型可以广泛应用于金融、汽车、电力、医疗等行业,帮助企业实现智能化升级。例如,在金融领域,盘古大模型可以用于风险评估和信贷审批,提高决策的准确性和效率;在汽车行业,盘古大模型可以用于车辆检测和故障预测,提升车辆的安全性和可靠性;在电力行业,盘古大模型可以用于电网运行优化和能源调度,提高电力系统的稳定性和效率。 此外,盘古大模型还可以与其他华为云服务进行深度集成,为企业提供一站式的AI解决方案。包宜强表示,华为云将继续致力于AI技术的研发和应用,推动产业的智能化进程。企业万兴科技万兴播爆市场总监 黄立来自伙伴企业万兴科技万兴播爆市场总监黄立为我们分享了AI数字人助力家具行业品牌营销降本增效,他表示在短视频时代,随着用户习惯的改变以及用户阵地的转移,短视频营销成为了企业营销的必备手段,但是高昂的成本让很多企业难以起步,而AIGC基于其高效率和低成本,让每一个公司有了开启短视频营销的可能。本次活动是HCDG在2024年在深圳的首次城市活动,后续华为云也将继续携手各城市核心组成员,与广大企业及开发者,共建产业新生态,为企业及开发者提供“新技术、新体验、新机会”全方位支撑,赋能更多的企业数字化转型。HCDG(Huawei Cloud Developer Group 华为云开发者社区组织),是基于城市圈和技术圈,由开发者核心组自发开展的开放、创新、多元的社区技术交流组织,致力于帮助开发者学习提升、互动交流、挖掘合作,推动技术应用与本地产业结合、数智化转型和开发者文化发展。
-
[中国,深圳,2024年3月14日]3月14日至15日,以“因聚而生 数智有为”为主题的“华为中国合作伙伴大会2024”在深圳隆重举行。同期,华为成功举办了“助力城市智能新升级,携手共享时代大机遇”论坛,围绕城市智能体、城市智能中枢、城市大模型等智慧城市重点演进方向,共话政务与城市数字化发展趋势和实践经验。会上,华为联合伙伴重磅发布政务大模型和城市大模型首批应用场景,与伙伴共同构建端到端解决方案能力,共筑城市智能体,加速城市智能化。华为政务一网通军团研发总裁陈金助表示,国家将人工智能定义为发展新质生产力的重要引擎,强调加强前瞻布局,加快提升算力水平,推进算法突破,大力开展“人工智能+”行动,更好赋能千行百业。当前,各大城市都在积极推进人工智能产业发展,包括加大算力部署、加快大模型布局,以及在政务领域的先行先试。华为以城市智能体架构为依托,通过城市智能中枢解决方案,赋能城市数字化和政务数字化,让城市能感知、会思考、有温度、可进化。华为政务一网通军团研发总裁 陈金助大模型是时代机遇,华为政务一网通军团将携手更多的合作伙伴抓住大模型发展新机遇,为更多城市提供更智能的场景化解决方案。在城市智能新升级的道路上,核心技术的创新与应用是不可或缺的关键推动力。华为基于城市智能中枢的架构,面向合作伙伴提供昇腾适配使能、自然语言大模型使能、多模态大模型使能、工具平台开发使能等四大核心能力,共同打造城市智能化解决方案,为每个城市构筑自己的专属大模型。会上,华为联合致远互联、华海智汇、国泰新点、南威软件、泛微网络(排名不分先后)等伙伴发布了政务大模型首批应用场景。华为联合伙伴发布政务大模型首批应用场景联合奥看科技、四方伟业、国泰新点、丰图科技、数字冰雹、睿呈时代(排名不分先后)等伙伴发布了城市大模型首批应用场景。华为联合伙伴发布城市大模型首批应用场景这些场景的发布,不仅展示了华为助力城市智能化升级的最新成果,也将为城市带来更高效、更温暖的服务。深圳福田区政务服务数据管理局党组成员、副局长高增介绍,福田区以“全领域治理、全周期管理、全要素参与”的整体思路,创新提出“四智融合”的建设理念,运用城市大模型赋能福田区数字化建设,着力打造数字中国典范城区。南京奥看信息科技有限公司分享了基于视觉大模型的城市治理智能巡检方案,大模型提升城市治理效率,推动城市实现从“治理”到“智理”的转变。最后,北京致远互联软件股份有限公司分享了基于华为政务aPaaS和政务大模型的智慧公文方案,运用AI-COP平台让智慧办公更加触手可及,让政务OA的智能协同充满无限可能。面向未来,华为将秉持“因聚而生 数智有为”的核心理念,深化与伙伴合作的深度与广度,助力客户数智化升级的同时,携手伙伴共拓市场、共赢商机、共创共享数智世界新机遇。欲了解更多详情,请参阅: cid:link_0
-
应对通用人工智能挑战,发展新质生产力近日,李鸿飞老师受某国企邀请,为集团各级管理干部解读人工智能最新趋势与应用,发展新质生产力,李老师做了《应对AI时代挑战,加速企业数字化管理与运营,发展新质生产力》的专题讲座,从企业应用和个人学习两个方面,对管理团队提供新的知识与观念。由于有大量前沿信息与应用,特整理录音供大家参考。李老师首先感谢领导对AI前沿技术和新质生产力的重视,也感谢领导者对注重管理团队的学习和培养。李老师强调主要研究的是AI发展和RPA新一代数字技术在企业的应用,如何提高企业竞争力,如何降本增效,如何帮助企业数字化转型,可能在AI技术原理和发展路径上的一些看法和推论,不一定与技术专家相符,这些都是最前沿的实践,主要是想给大家带来一些启发和收获。01AI新一代数字技术对各行各业形成巨大影响李老师首先澄清了一个概念,我们普通人想象的人形机器人是强人工智能,实现的难度太大,而当前我们接触到的AI还在弱人工智能阶段,看到的AI机器人更像个玩具。强人工智能需要大语言模型及强大算力,大语言模型的参数量非常大,有数十亿甚至到万亿个,而且训练过程中也需要海量文本数据集,才能更好地理解人类的自然语言,以及生成高质量的文本。自从AI学科诞生以来,人工智能行业在近70年发展中经历多次繁荣与低谷,有很多次狼来了的故事,每次人工智能有点创新。新闻媒体,科幻电影都会叫到狼来了“ AI要统治世界啦,AI要毁灭人类了”,但最后的结果总让大家大失所望。这是因为人工智能这个行业,大众容易想象,媒体也喜欢炒作,大家一起幻想,结果期望越高,公众和投资者失望越大。AI行业经历过多次泡沫和二次发展低谷,留下的从业者扎扎实实研究应用,直到最近十几年有了深度学习,才有大的突破。计算机最初只能被动地接受人类输入的数据,就像人类的婴儿一样,只能等待喂养。当算力提升,特别是有了自然语言和图像处理能力以后,超级计算机可以通过网络获得海量的数据,包括文字、影像、语音,然后把它们融合在一起,产生多模态。形象地说是会听、会看、会学习了,然后就是会说、会动、会思考,这就是强人工智能。算力、算法、数据是人工智能三大要素,全部集齐才有爆发可能。由于以前算力、算法、数据总是缺一环、多数AI企业觉得通用人工智能不太可能实现,所以都做专用人工智能。我们前几年看到的人工智能应用,就象人脸识别、产品质量检测、语音输入、智慧停车等等,大多属于专用人工智能ANI,只能通过一套特定的算法,完成特定的任务。这些专用人工智能ANI,由该领域的企业提供服务,而这些算法并不公开,也不会开源。通用人工智能AGI,全称为Artificial General Intelligence。又称“强人工智能(Strong AI)”“完全人工智能(Full AI)”,是指具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。它能像人一样举一反三、触类旁通。同时它能理解文字,听得懂人的语言,看得见(摄像头)当前发生情景,与人类交流起来没障碍。遇到新任务时,还可以快速“想到”做过的相关事情并调用掌握的相关知识,创造性地解决问题、完成任务。通用人工智能的难度可想而知,由于通用人工智能AGI其具有广泛普惠性,并对人类社会有巨大影响,所以,通用人工智能大多会开源,这就给理解与跟进大模型,行业大模型、训练或微调企业大模型,成为后发红利,让企业AI员工、数字员工成为可能。从专用人工智能ANI,到通用人工智能AGI,到人工智能生成内容AIGC;这是人工智能行业重大进步。2016年谷歌的阿尔法GO打败李世石,曾经震惊了世界。围棋是人类最复杂的博弈游戏,这证明AI的智力超越了顶级人类,但这只是AI算力的成功,阿尔法go也是专用人工智能,除了下棋对我们没啥实际用途,很快就为大众遗忘。而Open AI公司2022年推出ChatGPT采用的是通用大模型,取名为聊天机器人,可以和人类对话。ChatGPT3.5具备了较高的智能和稳定性,聊天沟通的反响非常好,能生成高质量的内容,很多学生就用它来写论文了,员工也用写文案,真正普惠大众。2023年后推出的ChatGPT4.0具有多模态,就不仅仅是文字问答。也可以看图说话、数据推理、分析图表、角色扮演等,而且4.0考试成绩很高,相当于人类研究生水平了,生成内容水平,已经可以应用于企业的总结、分析、报告、培训等场景了。使用GPT4.0相当于用户有个研究生助理 ,GPT关键的是打通了AI通用人工智能的进化路线。让原来大家认为不可能的事成为了可能。2024年2月,OpenAI推出全新的生成式人工智能模型“Sora”, 文生视频,又叫世界模拟器,Sora可以根据用户的文本提示创建最长60秒的逼真视频,从提供的视频案例来看,Sora模型了解了不同物体在物理世界中的存在方式和运动规律,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。这个能力不仅仅是对电影特效、短视频制作、广告传播等行业有颠覆可能,关键它标志了通用人工智能AGI在理解真实世界场景,并与之互动的能力方面实现了飞跃。新分叉的AI技术成熟度曲线对2023年上市的GPT3.5,李老师当时就做了战略环境研判、数字化增效、创新人才引进、总经理开年演讲稿、LOGO设计,广告词撰写、政协提案、竞争数据收集、自动编程、员工发展与培训等十个场景应用测试,参见《当前ChatGPT能为企业做什么?来看看这10个测试》。认为ChatGPT不应叫聊天机器人,而是AI转换器或智能问答器,建议企业要重视和利用起来,而新的GPT4.0又有了十倍的提升。李老师接着分析了通用大模型在AIGC上的应用效果及前景,以及ChatGPT与人形机器人结合,认为此次通用人工智能爆发不是资本泡沫,确实是第四次工业革命开启。李老师从技术成熟度曲线来分析,对于AI行业进化,短短的二三年,已经形成几次标志性分叉来,专用人工智能ANI、通用人工智能AGI、人工智能生成内容AIGC,将来还有华为的行业人工智能等。今后我们说到人工智能,就要特指某个具体AI,就像古猿分化出类人猿,真立人,智人一样,各自有不同的命运。对此,李老师有三点推论,一是通用人工智能成为AI新的发展主线,可以关注作结合应用,其肯定有泡沫有夸大,但前景可期;二是受三要素制约,通用人工智能很快会遇到瓶颈;三是在这个时间节点,由专业智能ANI转入通用人工智能AGI的,或蹭热点新成立的通用人工智能公司多半不会持久,尽量避免与之合作。为了更好的理解未来趋势,李老师介绍了通用人工智能的原理,并对AGI领军企业美国OpenAI的发展过程、商业模式和产品路线进行分析讲解。其产品ChatGPT是通用人工智能道路上阶段成功的典范,ChatGPT是生成式+预训练+Transformer自注意力神经网络架构的成功组合,通过在大规模语料库中进行无监督预训练,从而学习到语言的内在规律和模式,获得巨大的成功。与我们常见的程序员编程不同,AI的机器学习是让计算机通过算法,去识别模式、做出预测和决策。而机器学习又分为:有监督学习、无监督学习、强化学习:有监督学习算法会接受有标签的训练数据,算法的目标是学习输入和输出之间的映射关系,无监督学习的数据是没有标签的,算法的任务是自主发现数据里的模式和规律。强化学习则是模型在环境里采取行动获得结果反馈,从反馈里学习。就跟家长带小孩似的,刚开始的时候小孩子什么都不懂,会随心所欲做出很多举动,但随着家长和小孩的教育和互动,小孩会发现某些好的举动能够获得奖励或零食,有些不礼貌的动作会遭受惩罚,通过观察动作和奖惩之间的联系,小孩的行为会逐渐接近期望。深度学习是后面发展出来的,它使用人工神经网络模仿人脑处理信息的方式,通过层次化的方法提取和表示数据的特征。生成式AI或AIGC就是深度学习的一种应用,它利用神经网络来识别现有内容的模式和结构,学习生成新的内容,可分为DNN、CNN、RNN等(略)。大脑神经元与学习成长AI获得如今的成功,在于模仿人类大脑的神经网络。脑科学发现,人的大脑是由近千亿个神经元组成,主要用来储存信息、整合信息。小朋友在学习的时候,大脑是将看到或听到的信息,通过某一个神经元,把信息传递给另一个神经元,然后再接着传递给下一个,就像是接力赛一样。传的时候也不是一条路走到底,而是在不同神经元间不断传递。每一段神经元只走自己那一段,就形成特别复杂的神经网络。所以,人类学习过程很复杂,早期的婴儿是需要手把手教的,像监督学习一样,要指着物体告诉他这是爸爸,这是妈妈。这是猫,这是狗。当看到足够多的猫和狗后,小孩才会分类和识别。然后就是家庭和老师不断监督学习和强化学习,以训练和培养小孩的智能。当学习复杂的知识或者问题时,小孩用到大脑神经元就越多,这样信息传递的时候,通路就越复杂,而且刚刚走通的连接,再走一遍的话,神经元连接的位置又会变掉,这就是小朋友刚刚记住的东西老会忘掉,前面学过的东西,现在又回忆不起来原因。这个神经元到那个神经元传递的路线发生变化了,化学信息传不过去了。这时候我们就利用重复强化,要求小朋友重复再来一遍、紧接再来一遍,多次重复以后,相当于告诉大脑,这个知识不是一次性,下次还要再走的,这时候大脑就开始重型结构性的调整,把这几个神经元连接起来,形成一条专线给小孩。拉通专线后就快多了,下次遇到这个问题的时候,大脑就直接反应过来。就像我们问3X7得多少?答案21不是算出来的,而是大脑直接在一条专线上回答了这个问题,这也是学习大量刷题有效的原因。通过重复和刻意练习可以改善神经元之间的连接,对成年人来说,当我们反复练习某项任务时,大脑的神经元会更有效地传递信息,这并不是肌肉记忆,而是形成神经元连接专线。这样,通过刻意练习,成年人可以更快、更准确地执行任务,并提高技能水平。小孩子到3岁开始自我意识萌芽,6-12岁性格发育开始成熟,初中、高中、大学都可以看作是有标注数据的预训练,帮助孩子形成足够的神经元连接专线,成为小镇作题家。而孩子的社会交往、阅读与上网等无监督学习,则形成他们自己的独特看法和三观,这是多样性和差异来源。关于人类的深度学习,李老师认为,可能是通过写论文搞研究或深度思考,在复杂的理论框架下,不断扩展我们思考的层次,从而对复杂事物进行分析、演算、推理、预测,最终才生成创新想法或结论。人工智能的神经网络,也是由许多基本的计算和存储单元组成,这些单元被称为神经元,这些神经元通过层层连接来处理数据,深度学习模型通常有很多层,GPT3有96层,GPT4就达到120层。算力的硬件投入更是巨大。以早期GPT3.0为例,3.0就用28万5千个CPU、1万个GPU和400Gbps的网络连接组成的Al超级计算机,而要训练这个超级大脑中的神经元连接,则需要预训练海量的数据内容,比如GPT3.0就将大量书籍、全部的维基百科、新闻、论坛及社交媒体内容等等总计3000亿文本单位,经过大量训练,确定适当1750亿参数,神经元和权重偏制,从而学习到语言的内在规律和特征,海量的人类数据喂养了ChatGPT,它学习到人类语言的内在规律和模式。ChatGPT 生成与输出原理大致是这样,通过预训练,GPT3.0有了各种参数与权重,就可以根据用户输入的上下文信息,尽可能地预测出下一个词的正确值。GPT预测出的下一个词主要是依据预训练得到的概率分布。它可以选择概率最高的词,也可以根据概率分布进行随机选择,选择出下一个词后,GPT将这个词添加到用户输入信息的末尾,然后重复上述过程,直到生成一个完整的句子或一段话。GPT3.0由于数据来源和数据量的原因,还只是人类普遍的看法,生成文本质量就有点象刚毕业大学生,生成内容有点用但比较空泛。由于ChatGPT4.0预训练数据更大,参数更多,通过预训练,就能获得社会各种类型人群的看法、语言特征和概率分布,ChatGPT4.0学会角色扮演,学会了人类根据不同场景、不同对象和不同诉求,“见人说人话,见鬼说鬼话”, 它可以心理医生、面试官、人生导师、专业顾问等等角色出现,并展开高层次高质量对话。通用人工智能将弥补人类智能,比如目前企业遇到的经营问题,首先是老板的算力不够了,就像老板要制定今年的销售增长目标,既要考虑市场容量、行业平均增长率、又要考虑竞争对手的增长速度、还要考虑本企业前几年的历史增长,还有团队成长潜力、公司资源财力等等,很多假设条件不能确定,能定准目标的老板极少,多数想破头最后还是拍脑袋。其次是以前的成功经验失效了,面对复杂的经济环境,原来老板认知的规律和模式发生了巨大的变化,用户需求、政府政策、供应链到底发生了什么变化?而认识人类的内在规律和模式,恰恰是通用人工智能的长项,只要有最新的数据,它就能识别出这种变化。通用人工智能可以辅助公司的决策,还有公司的战略和商业模式创新等等。我们培养一批人类的孩子智力需要几十年,而AI训练一次仅仅需要几周或者几个月,目前的gpt4.0考试中表现已经超过了90%以上的人类,根据GPT已经探出的成功路径(生成式+预训练+Transformer自注意力神经网络架构),其他各大企业的通用人工智能大模型必然爆发起来,这才是AGI未来巨大的前景。由于通用人工智能与人类大脑原理相似,随着投入越大,神经元越多,这就有些让人担心了,AI进化的速度太快,会不会产生自我意识,会不会对人类构成威胁。有一种说法,人是碳基生命,而人工智能是硅基生命。人工智能一定会替代人类。对此,李老师的看法大可不必担心:AGI目前是没有威胁的,当达到一定的神经元连接以后,AI可能会产生自我意识,其可能像我们的孩子一样,有青春期叛逆期,但不一定会对人类敌意或伤害,也可能会形成一种有益的共生关系。其次,人类也有预防的方案,首先超级AGI需要巨大的算力与联接,其次需要巨大的能源,人类完全可以断电拔管。另外通用型人工智能本身有很大的数据量,本体也很难逃出人类硬件设施。其他措施也有,马斯克用AI对抗AI,也是一种有效的方法。李老师简要介绍了我国各大企业布局的各模态AI模型进展,以及华为盘古大模型架构,并对通用人工智能有以下几点推论:一、通用人工智能是超级武器,投入巨大,利用它来干什么,肯定不只是做聊天或生成视频,比如用它来赢得美国总统大选,操纵股市期货、在军事领域,建立天网、做无人驾驶之类。二、通用人工智能新的产品将很快应用于企业 ,形成降维打击的竞争力,需要企业做好大量数据准备。三、AIGC只是通用人工智能的一个应用分支,生成内容已经达到商用标准,企业要尽快拿到这部分红利。其后,李老师分析了AIGC产业图谱、AIGC商业落地机遇, AIGC在各行业的应用场景,并与管理团队探讨如何利用这些技术会对企业提效。李老师进一步分析通用人工智能、特别是AIGC会对哪些岗位造成冲击,认为AGI、AIGC等新一代数字技术会减少一些职位需求,而不是取代,本质上是掌握AI技术的人取代了没有掌握AI技术的人。所以应对AIGC的挑战,管理者要未雨绸缪,及早学习准备。如何利用AIGC、 RPA机器人流程自动化等新技术,帮助企业降本增效,提高自己职场竞争力,请参看下一章。
-
盘古大模型应该如何集成到应用中?
-
一月问题总结如下:【1】用华为atlas300-3010 用于训练失败cid:link_3【2】如何展示这些图片呢cid:link_4【3】云平台第一次用,求助怎么导入transformers库啊?cid:link_0【4】 atlas 200 DK 制卡完成后启动不了cid:link_1【5】请问下,新人申请预测大模型一般几天可以通过申请。cid:link_2
-
华为云盘古大模型的文生图功能是只能生成卡通的,还是能生成逼真的真人画面?
-
华为云的盘古大模型 NL2SQL的能力如何?是否支持多表连接 和 窗口函数这种复杂的操作
-
华为云的盘古大模型,你们申请通过了吗?对话效果和ChatGPT3.5相比怎么样
-
大家在做《百模千态》项目的时候,有什么意见和建议,或者问题,欢迎在这里进行讨论
推荐直播
-
DTT年度收官盛典:华为开发者空间大咖汇,共探云端开发创新
2025/01/08 周三 16:30-18:00
Yawei 华为云开发工具和效率首席专家 Edwin 华为开发者空间产品总监
数字化转型进程持续加速,驱动着技术革新发展,华为开发者空间如何巧妙整合鸿蒙、昇腾、鲲鹏等核心资源,打破平台间的壁垒,实现跨平台协同?在科技迅猛发展的今天,开发者们如何迅速把握机遇,实现高效、创新的技术突破?DTT 年度收官盛典,将与大家共同探索华为开发者空间的创新奥秘。
去报名 -
GaussDB应用实战:手把手带你写SQL
2025/01/09 周四 16:00-18:00
Steven 华为云学堂技术讲师
本期直播将围绕数据库中常用的数据类型、数据库对象、系统函数及操作符等内容展开介绍,帮助初学者掌握SQL入门级的基础语法。同时在线手把手教你写好SQL。
去报名
热门标签