国内外大模型和AI应用梳理.pptx
- 文档编号:30785506
- 上传时间:2023-09-14
- 格式:PPTX
- 页数:36
- 大小:2.11MB
国内外大模型和AI应用梳理.pptx
《国内外大模型和AI应用梳理.pptx》由会员分享,可在线阅读,更多相关《国内外大模型和AI应用梳理.pptx(36页珍藏版)》请在冰豆网上搜索。
投资要点:
关注大模型迭代带来的应用端投资机会谷歌I/O上发布一系列生成式AI新进展,科技大厂竞争激烈。
5月10日,谷歌I/O开发者大会上发布了包括:
新一代语言模型PaLM2、升级AI,聊天机器人Bard、生成式AI实验版搜索引擎、DuetAIforWorkspace等。
AI艺人迅速出圈,多模态应用充分释放AI潜力,进一步推动商业化落地。
1)AI歌手:
截至5月14日,“AI孙燕姿”翻唱的发如雪已有超过150万点击量。
2)AI网红CarynMarjorie通过出售AI版本的Caryn,在过去一周的beta阶段创收7.16万美元,99%的用户是男性。
从应用端看,昆仑万维,汤姆猫,中文在线,万兴科技,美图公司等同时兼具跨模态属性和海外业务的公司有望率先实现应用场景落地。
昆仑万维:
2023年02月公司宣布将与奇点智源合作,在今年内发布中国版类ChatGPT代码开源。
旗下Opera浏览器计划接入ChatGPT,截至2022H1,Opera全球平均MAU达3.3亿,美洲市场Q2活跃用户规模同比增长22%;2022年,OperaGX的MAU已超过2000万。
汤姆猫:
汤姆猫家族IP的交互属性与ChatGPT有着较高的契合度。
公司团队已尝试应用ChatGPT模型进行AI交互产品开发的初步测试,测试的模型目前通过ChatGPT海外接口接入。
中文在线:
海量优质数据资产为核心优势;与澜舟科技合力探索AIGC在内容生产方面的技术应用;AI技术已在内容创作、游戏元宇宙等领域落地。
海外产品Chapters和MyEscape已在做接入ChatGPT测试,应用在故事创作生成、剧本生成及改编、用户与AI交互聊天等方面。
万兴科技:
视频创意软件WondershareFilmora接入OpenAI,WondershareFilmora12新增功能包括AI抠图、AI音频拉伸和AI音频降噪。
软件拥有超过1亿用户,覆盖超过150个国家及地区。
3月31日正式面向出海营销领域全球首发AIGC“真人”短视频出海营销神器“万兴播爆”(英文名:
WondershareVirbo),并宣布开启移动端公测。
美图公司:
AI绘画功能在旗下部分产品中上线,推动产品全球业绩增长。
商业化探索包括,1)“AI绘画”免费生成3张绘画,支付2元可解锁五张新效果;2)“百变AI头像”,6.6元50张(5种风格10张);9.9元100张(10种风格10张),12.9元200张(20种风格10张)。
随着技术的更新迭代,以及在应用端的持续探索,有望进一步创造新的消费和需求,有利于文娱内容和互联网行业。
重点关注:
万兴科技、昆仑万维、汤姆猫、中文在线、思美传媒、美图公司、百度集团-SW、商汤-W、腾讯控股、阅文集团;皖新传媒、南方传媒、焦点科技、风语筑、利欧股份、神州泰岳、联络互动、捷成股份、掌阅科技、立方数科、元隆雅图等。
风险提示:
技术发展不及预期、监管政策变化、知识产权等相关问题。
1,2,海外大模型发展国内大模型布局AI探索领先者投资建议&风险提示,目录,CONTENTS,3,01,海外大模型发展,4,1.1微软:
投资OpenAI;将AI融入旗下应用,模型,NLP模型,CV模型,多模态模型,Megatron-TuringNLGTransformer-Based参数量530B,BEiT-3,完成预测,阅读理解,常识推理,自然语言推理,词义消歧,SwinTransformerv2.0Transformer-Based参数量3B,Kosmos-1,MLLM参数量1.6B,自研,OpenAI,GPT-4,ImageGPT,CLIP,DALLE2,应用,办公软件Microsoft365Copilot,浏览器Bing,安全软件MicrosoftSecurityCopilot,虚拟人小冰,营销MicrosoftVivaSales,AI编程GitHubCopilot,医疗临床笔记DAXExpress,数据处理PowerBI,AzureAI,AI应用服务,API服务,基础设施,机器学习,资料来源:
MicrosoftAI,MicrosoftAzure,MicrosoftResearch,OpenAI官网等,德邦研究所,5,1.2谷歌:
大模型基础Transformer的研发者,模型,PaLM,对话模型LaMDA,应用,参数量137B训练数据1.56T,参数量最高22B将Transformer创新性地用于CV领域,训练方法类似BERT,ViViT,多模态模型PaLM-EPaLM-540B+ViT-22B=PaLM-E562B横跨语言、视觉和机器人领域,GmailNLP模型,照片广告,搜索,地图助手,Pixel,YouTube云CV模型ViT,Bard基于LaMDA的对话机器人模型,底座,深度学习框架TensorFlow,构建机器学习模型,准备数据部署模型实现MLOps,通用AI架构Pathways,一个模型做多件事,多模态,稀疏且高效,2017-06Transformer问世,2022-01LaMDA模型推出,2020-10将Transformer运用到CV领域(ViT),2015-11开源了第二代机器学习平台TensorFlow,2022-04提出PaLM2023-02对话机器人Bard发布2023-03提出多模态模型PaLM-E,2018-10Transformer的衍生模型BERT发布,资料来源:
TensorFlow,GitHub,RomalThoppilanetal.LaMDA:
LanguageModels,forDialogApplications等模型相关论文,机器之心公众号等,德邦研究所,6,1.3Meta:
大模型有望助力公司元宇宙发展,模型,NLP模型LLaMa,CV模型SEER,多模态模型data2vec,基础大模型,应,用模型,以较小参数量获得与GPT-3等模型相匹敌的效果LLaMa参数量最大65B,用更大量优质训练数据获得更小模型参数训练数据约1.4TTokens,自监督学习模型参数量最高10B,充分考虑上下文的自监督学习可以在文本、语音或图像上单独训练,底座,深度学习框架Pytorch,Make-A-Video,Visual,AcousticMatching,资料来源:
PyTorch,Make-a-VideoStudio,HugoTouvronetal.LLaMA:
OpenandEfficient,FoundationLanguageModels等模型相关论文,机器之心公众号等,德邦研究所,7,02,国内大模型布局,8,2.1百度:
文心大模型,应用,模型,文心大模型,产品工具,面向开发者,面向用户,飞桨,支撑优化,2019-03,ERNIE1.0中文效果超越BERTERNIE2.0中英文公开数据集全面领先竞品ERNIE3.0首个百亿大模型解决语义与生成问题,2019-07,2021-07,2021-12,鹏程-百度文心全球首个知识增强千亿大模型,2022-05,VIMER系列文心行业大模型基于行业数据知识提升行业适配性,平均分文心大模型,基础大模型,NLP大模型语言理解和创作CV大模型图文OCR,视觉处理,任务大模型,UnifiedTransformer,ERNIE,搜索,信息抽取代码生成,PLATO对话,多模态大模型视觉、语音、地理语言生物计算,行业大模型,通用文,大模型,行业,数,挖掘,心据,行业数据挖掘,面向下游应用服务平台ERNIE-API大模型API服务,一站式调用平台面向初级&专家,百度飞桨(Paddle-Paddle)开源开放产业级市场份额国内第一-深度学习平台资料来源:
AIGC专题三:
国内大模型概览,德邦研究所,9,应用,模型,太极平台,混元大模型,-机器学习生态服务平台,VCR排行榜第一,跨模态文字-视频检索AI大模型,领域/任务/行业大模型CV大模型(HunYuan-VCR),NLP大模型(HunYuan-NLP)万亿级中文NLP模型CLUE1.1总排行榜第一,多模态大模型(HunYuan-tvr),模型训练AngelPTMGPU训练加速/4D并行/上线腾讯云,模型推理及压缩HCFToolkit轻量化/蒸馏/推理服务,研发管线数据&模型管理,全流程,游戏搜索翻译广告推荐对话,数据,底层,微信,QQ,游戏,腾讯云,腾讯广告,产品业务多,商业化潜力,降本增效,广告内容理解,行业特征挖掘,文案创意生成,2022.04首次披露,深入产业落地,多元训练数据脱敏/清洗/平台化,评测数据和标准共建,产品套件,一站式,迭代更快效果更好成本更低,腾讯云智能数智人,客服,主播助手,教师导游,2.2腾讯:
混元大模型,资料来源:
AIGC专题三:
国内大模型概览,德邦研究所,10,统一底座,多模态统一,极致通用性,统一学习范式OFA,单模型可处理10余项任务,升级,可处理30余项跨模态任务,多架构统一,高效高性能,模块化设计层次化结构模块可拆拔,多任务统一易于迭代部署,2021-01,2020-01,M6-OFA,2020-06,2021-03,2021-10,2022-01,正式启动项目基础模型三亿参数预训练模型百亿参数KDD2021千亿参数训练损失37%效率90%通义-AliceMind正式发布全球最大的预训练模型10万亿参数训练速度提升7倍,通用模型,开源深度语言模型CLUE1.1总排行榜第二,NLP大模型(通义-AliceMind),多模态大模型(通义M6-OFA),业界首个通用统一大模型,CV大模型(通义-视觉),上层产业应用,中层通用算法,底层统一算法架构,应用,领先的跨模态能力,提质增效,AI医疗,工业视觉,智能农业,城市大脑,手机拍照,AIOT,3%-5%的应用效果提升,电子商务图像搜索万物识别,以文生图跨模态搜索,交通自动驾驶,文生视频VideoFusion17亿参数,2.3阿里:
通义大模型,资料来源:
AIGC专题三:
国内大模型概览,德邦研究所,11,L0基础大模型,-业界首个千亿中文大模型-最大中文语音模型之一,数据处理,行业数据预训练,底开发座平台,模型,L1行业大模型,ModelArtsStudio全周期AI工作流,算法开发,AI应用管理和部署,模型训练,创建,部署,频,文本,语义,盘古语音语义大模型,语音识别音(ASR),语音合成(TTS),文本理解,文本生成,科学计算大模型,大体量高维度数据处理,盘古气象大模型,低成本高效率秒级天气预报,图网络大模型MaaS,无监督训练,赋能产业,提质增效,高可解释性终身学习高精度高泛化冷启动,盘古工作流(快速交付:
工作流,增量学习,小样本标注),L0基础大模型使用授权费,L1行业大模型定制费,应用,L2细分场景模型,语音语义,智能客服,舆情分析企业运营,视觉,智能巡检,智能物流,盘古视觉大模型最大拥有30亿参数判别+生成能力小样本学习性能领先,盘古多模态大模型双塔结构独立性强,训练效率高下游任务中更好的精度,自动生成,2.4华为:
盘古大模型,资料来源:
AIGC专题三:
国内大模型概览,德邦研究所,2018-11智源研究院成立,2020-05智源创新中心成立,2020-08智源算力大平台上线,2020-10悟道大模型启动,2021-09建立10个AI开放实验室,2021-06“悟道2.0”发布,2.5智源&智谱:
悟道大模型,数据,语料库,FlagData,WuDaoCorpora200GB训练数据+72B汉字,ArabicText,悟道模2.0型,NLP大模型悟道文源,多模态大模型悟道文澜,参数量1.75万亿(10xGPT3),生物大模型悟道溯,认知大模型悟道汇,训练数据中英双语共4.9T,FlagBootAI应用微服务框架,应用,底座,文生图,FastMoE万亿模型的基石,易用性强,灵活性好,训练速度快,预训练框架GLM参数量最高10B,合作,联合,FlagStudio,Stablediffusion,CogVideo,以CogView2为基础参数量94亿,天演生命模型,天道分子FlagEval物理模拟模型大模型自动模型等评测技术,资料来源:
智源研究院官网,新智元公众号,GitHub,ZhengxiaoDuetal.GLM:
GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling等,德邦研究所12,13,应用,讯飞开放平台,下游应用为上游开发提供数据支撑,数据,50TB行业语料,10亿+人次/天用户交互的活跃应用,框架,X-Reasoner,知识检索依据问题和选项从科学知识库中找到最相关的知识索,阅读理解结合检索出的知识、问题和选项进行推理,给出最终答案,OpenBookQATOP2,弥补大模型记忆模糊,模型,基础大模型,通用认知智能大模型算法研发及高效训练底座平台,“1”,NLP模型,NLU任务为主,多为BERT-based模型,图像识别,CV模型,文字识别,人脸识别,语音模型,软硬件开,发为一体,语音识别语音合成语音扩展,2.6科大讯飞:
通用认知智能大模型赋能产业,资料来源:
科大讯飞公告,讯飞开放平台官网,科大讯飞集团公众号等,德邦研究所,商汤AI大装置,OpenMMLab人工智能算法开源体系,OpenDILab开源决策智能平台,应用,AlforScience,日日新大模型,自动驾驶智慧城市与商业,元宇宙CV(320参数),2.7商汤:
SenseCore商汤大装置&日日新大模型,资料来源:
OpenMMLab官网,OpenGVLab官网,OpenDILab官网,商汤科技SenseTime公众号,商汤智能产业研究院公众号,商汤科技技术交流日等,德邦研究所,大算力5000+P,商汤人工智能计算中心(AIDC)国产化算力500+P,当前算力可支持20个千亿参数模型同时训练14,自动化数据标注智能标注效率提升百倍,大模型推理部署大模型推理效率提升100%,OpenGVLab通用视觉开源平台MaaS大模型并行训练单集群4000卡-5000亿稠密参数模型,大模型增量训练增量微调成本降低90%,开发效率开放模型及AI开发工具链,NLP-商量(1800亿参数)“大医”支持导诊、问诊、健康咨询、辅助决策等多场景多轮会话AI代码助手“提升编程效率,简化开发流程。
超十亿参数文生图模型+LoRA,基于NeRF的3D内容生成平台琼宇:
偏向室外场景格物:
偏向室内场景,多模态-书生2.5(30亿参数)以数字人物生成技术为核心,基于商汤多种AI生成能力打造的应用平台,包括文本生成、语音生成、动作生成、图片生成、NeRF等。
15,03,AI探索领先者,16,基础模型,GPT-3,SkyText,SkyCode,应用Sky模Chat型,文章续写,对话,风格生成,中英翻译,推理,诗词对联,聊天机器人,问答,第三人称转述,中英Sky双语Paint文生图,StableDiffusion,CLIP,SkyMusic,3.1昆仑万维:
致力研究国产开源大模型,奇点智源奇点智源致力于实现通用人工智能,目前聚焦于大规模预训练语言模型及开发者API的研发工作1、自然语言大型预训练模型:
目前完成千亿级参数的模型训练2、开发者API:
开放了百亿级参数模型的API供申请使用模型特色:
1、小样本学习。
语言模型具备小样本学习的能力,可以通过提示工程实现小样本学习,避免繁琐的微调的工作2、知识问答。
模型从海量的公开数据中获取了大量的知识,具备出色回答问题的能力3、文本生成。
模型从海量文本中学习到了语言生成的规律,可以根据提示进行文本的生成,2020.10开始布局AIGC领域,发起昆仑天工项目,组建了近百人的研发团队,研究通用人工智能(AGI)。
2021.08昆仑天工开始研发基于自有大文本模型的对话机器人,并且迅速刷新国内技术指标。
2022.12正式发布开源项目昆仑天工,获得了大量的好评,目前已经有中国移动咪咕等公司的测试使用。
2023.02昆仑万维宣布,将与奇点智源合作,在今年内发布中国版类ChatGPT代码开源,防止大公司技术垄断。
2022.11公司与奇点智源就ChatGPT、图像视频生成等AIGC技术领域达成全面技术战略合作,启动ChatGPT的联合开发。
资料来源:
昆仑万维官网,昆仑万维公告,奇点智源官网,财联社,36氪,IT之家等,德邦研究所,17,3.1昆仑万维:
Opera接入ChatGPT,StarMaker探索AI作曲,2016年收购Opera浏览器业务,2018年Opera在美国纳斯达克挂牌上市,2023年2月Opera浏览器与OpenAI团队达成合作,正式接入ChatGPT功能。
2022年StarXMusicXLab完成首批五首完全由AI作曲的歌曲发布,2021年全资子公司昆仑集团购买StarGroup的60.65%股权,2022年9月StarMakerVR正式上线OculusAPPLab和Steam等平台,游,戏,业,务,广告平台,游戏开发,即时通讯,新闻推送,视频平台,Opera:
以浏览器业务为基础的海外信息分发及元宇宙平台,浏览器,Rev.2023年目标为3.73-3.9亿MAU3.19亿,Rev.$5千万MAU2.17千万最高ARPU值,累计游玩2,500万次,上线游戏4000款注册账号60万+,平均游戏时间30+min峰值MAU1.9千万,ARPU12+元,元宇宙平台,搜索业务收入YoY+18%,2023Q1,广告业务收入YoY+26%,SkyMusic,StarX:
以音频社交为主的海外社交娱乐平台,旗下MusicXLab致力于打造领先的人工智能音乐生成技术,曲库数据,模型支持,行业的合作生态,歌曲代销车机音源公播音乐,AI音乐品牌联名有声书及辅学主题曲视频配乐,全链路音乐制作和全球音乐发行,StarMakerVR是2022年9月上线的音乐游戏,歌曲库中有超过200万首歌,玩法包括1SingStar:
卡拉OK室,听其他玩家的作品,在虚拟环境中举办音乐会等。
2ShootingStar:
找到音乐节奏的强度,选择远程战斗或近战来攻击恶魔3TaikoStar:
节奏打击类音乐游戏4BladeStar:
跟随音乐和说明将方块切成小块,资料来源:
昆仑万维官网,昆仑万维公告,36氪,Steam等,德邦研究所,18,0%,20%,40%,0,50,100,150,200,2022年公司总资产达到175.6亿元,资产负债率为17%60%,2022资产负债率(%),20182019资产总计(亿元),20202021负债合计(亿元),0%,5%,10%,15%,20%,0,2,4,6,8,2018,2020,2019研发支出(亿元),20212022研发支出/营业总收入(%),2018社交网络产品,2019网络广告服务,2020搜索引擎收入,20212022增值服务其他,2022年营业总收入为47.4亿元,同比下降2.33%,降幅收窄营收主要贡献来自社交网络产品与广告,合计超60%100%80%60%40%20%0%,3.1昆仑万维:
研发投入上升;资产负债率降低,2021年起公司研发投入及其营收占比显著上升,资料来源:
昆仑万维公告,Wind,德邦研究所,2022营业总收入同比(%),20182019营业总收入(亿元),20202021归母净利润(亿元),线上移动应用,3.2汤姆猫:
产品形式与AIGC高度契合,动漫影视,IP衍生及授权,200+国家地区,32种语言,880亿+播放量,亲子乐园19,累计下载量200亿+,线上移动应用是核心业务,知名IP“会说话的汤姆猫家族”,全球MAU4亿+,系列APP20+,智能交互玩法与ChatGPT契合,虚拟宠物养成类,模拟经营类,跑酷类,换装养成类,丰富可延伸的应用场景,全球化的一流团队,发展AIGC的核心优势,2013年,2018年,2015年,2016年,图:
部分“会说话的汤姆猫家族”系列App,2020年,2021年,3,4,5,6,7,MAU:
千万人次8,下亲子群体,45%,25-44岁,25%,其他年龄,30%,主要面向13岁以下亲子群体13岁以,资料来源:
汤姆猫公告,金科汤姆猫官方公众号,会说话的汤姆猫家族微博等,德邦研究所,2022年境外业务占营收79%,20151050,20182019202020212022境外境内,20,3.2汤姆猫:
计划发布定增,投入AIGC应用研发,变现模式,线上,广告+新型流量变现&充值收费模式,用户粘性在线时长,AI深化交互性,线下,IP授权衍生品,亲子乐园,车载设备等,预训练大模型,定增,GPT-3.5模型,汤姆猫IP形象,应用,模型,语音识别,语音合成,语音交互,性格设定,内容过滤,连续对话,测试,27人,300万元,外接通识大模型,AI交互终端产品,应用,算力,模型,自建情感教育等模型,IDC互联网数据中心,算力支持,降本增效,快速响应,信息分类,用户习惯数据缓存通识大模型调度,拓展使用维度,增加用户粘性,主题乐园:
“自营+城市合伙人”的双轮驱动,目前已有十余家乐园门店开放运营;寒假及春节期间,多家乐园各项经营指标超过预期。
2023年预期将陆续在全国多地开启新店。
目前公司已完成对包括浙江、江苏、安徽、江西、湖南、福建、重庆、山东等区域市场的考察。
2022.11ChatGPT发布,2023.03ChatGPT开放API,2022.12接入ChatGPT,文本交互测试,2023.02产品功能原型接入ChatGPT的API,文字互动测试,资料来源:
汤姆猫公告,金科汤姆猫官方公众号等,德邦研究所,21,0%,20%,40%,0,50,100,20222023Q1资产负债率(%),20182019资产总计(亿元),20202021负债合计(亿元),25%20%15%10%5%0%,0,1,2,3,4,2018,20192020研发支出(亿元),20212022,2023Q1,研发支出/营业总收入(%),3.2汤姆猫:
以广告收入为主,AIGC有望带动其降本增效,2022年,营业总收入为16.3亿元,同比下降16%广告业务为营业总收入的主要部分,2022占比75%,资料来源:
汤姆猫公告,Wind,德邦研究所,4020,100%50%,0,0%,2018,2019,2020,2021,2022,2023Q1,-20-40,-50%-100%营业总收入,营业总收入(亿元)同比(%),归母净利润(亿元),2022年,公司研发支出占营业总收入的16%,100%80%60%40%20%0%,2019,20182广告业务游戏发行业务其他,20202021新商业服务业务授权业务,202媒体影视,2022年,公司资产总额为62.4亿元,资产负债率进一步降低,150,80%60%,22,3.3中文在线:
数据资产为公司核心优势资源,网络原创驻站作者440万名签约知名作家、畅销书作者2,000+位版权机构合作600+家,“先授权、后传播”,技术,数据海数字内容资源中文文字与510万+种万亿字量音频资源音频资源+45万小时45万小时澜高舟质科技正合版作,NLP包括但不限于AIGC辅助创作、文本自动生成等,多模态AIGC技术实现漫画、动画等可视化作品的创作或辅助创作业务,,文心一言公司将把百度领先外的智能对话技术成果应用在文字创作接领域、虚拟人实时对话、IP元宇宙空间、教育业务以及其他AIGC技术的应用场景。
ChatGPT公司海外产品Chapters和MyEscape已在做接入ChatGPT测试,应用在故事创作生成、剧本生成及改编、用户与AI交互聊天等方面,自有用户1亿+,生,态合作用户数以亿计,AI绘画Chapters引入文生图Chapters是一款互动式阅读类游戏,玩家主要以对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国内外 模型 AI 应用 梳理