7月2日,由国家发展和改革委员会、工业和信息化部、科技部、国家网信办、商务部、中国科协联合北京市人民政府共同主办的“2023全球数字经济大会——人工智能高峰论坛”在北京举办。
昆仑万维(300418)CEO方汉受邀在论坛上发表了《AI大模型之路及商业化探索》的主题演讲。方汉详细介绍了昆仑万维六大AI业务布局。
(资料图)
以下为演讲精华观点:
大模型的商业化探索
目前国内发展前景是To B和To C战略并重,大模型在B端发力必须有非常高质量的行业数据。中国在线教育发展时间和历史比较久,有全世界最大的中小学生做题集,中文数据题集1.6亿条,经过筛选以后有2000万条高质量数据,但用于大模型训练还是比较有难度,因为中国中小学的题集是以图片形式存在,没有中间的解题步骤,所以大模型很难理解解题过程,我们需要把2000万条数据进行转化便于大模型理解。如果行业具有高质量、数据化的文本,那么大模型落地后就能够产生特别大的价值。
我们不能只把大模型当作Office助手,那只会对公文流转和行政系统起到作用,真正对生产起作用的还是生产数据,通过大模型将其转变为高质量的、可以处理的预训练数据,用大模型生成行业模型,再用行业模型推动生产力的进展,这是非常重要的一点。
坦白地讲,我们通过最近三年大模型训练过程,积累了丰富的预训练数据的深度加工能力。我们去看OpenAI所有公开的论文和讲演,其训练过程和训练算法都是非常公开的,但从不公开的是模型结构以及对数据的处理。目前全世界大模型预训练团队都试图复现OpenAI在模型架构的动作以及预训练数据的动作,任何一家企业的预训练数据加工能力是至关重要的。只有拥有底座大模型的公司和预训练大数据处理的公司才能快速定制行业模型,目前国内定制大模型企业将快速向头部汇聚。
B端碎片化,C端免费化
我们观察中国的B端服务企业,可以看到很难有一家企业能够垄断整个B端服务。由于大模型对行业数据的需求,B端必然会出现每个大模型企业都能够在一两个行业中取得先发成功,没有一家企业能够在所有行业取得成功。原因很简单,因为数据已经被分割在B端的不同碎片,很难有一家企业能够拿到全行业的数据,所以导致B端必然碎片化。
由于中国市场的付费习惯与海外有非常大的差别。可以看到,在海外杀毒软件是经典的收费项目,中国用户的免费习惯是非常明显的,所有给C端用户提供服务的企业必然是以免费模式为主,VIP模式为辅。
在国内,C端需要抢占的是大模型的服务入口。目前看来,办公软件、即时通讯、浏览器会成为主要的C端大模型服务入口。理解起来也比较简单,我们每天上班打开电脑以后,需要打开Office、浏览器,需要靠这几个入口完成日常工作。大模型在C端也会针对这些入口提供个人信息助理服务,所以我们在C端是免费为王、VIP模式为辅。
昆仑万维对国外市场是非常熟悉的,战略就是瞄准To C市场,目前我们在海外有4亿用户,出海经验非常丰富。我们在海外获取大量的经验在于,由于文化差异,中国企业第一批是以工具出海为主,但工具门槛是非常低的。目前在海外取得最大成功的企业就是Tiktok,打造一个UGC平台,让海外用户在这个平台创造内容,企业只需要提供最基础的平台服务即可。中国企业在海外商业模式逐渐进化到以平台为主,我们旗下StarMaker是海外最大的K歌平台,每天近千万用户在上面唱歌,创作自己的音频,社交平台的天花板上限更高。
简言之,我们认为在海外做To C市场有两种做法。用一个不太恰当的比喻,如果在海外做工具,就是AI赋能的Photoshop,天花板比较低;如果在海外用技术做产品,去做UGC平台,我们认为这样的天花板更高。
目前我们在海外的策略非常明确,基于天工大模型提供端到端的内容生成工具。目前AIGC的使用门槛是非常高的,相信只有有一定技术背景的人,才可以使用目前的ChatGPT和Stable Diffusion,甚至MidJourney对大多数用户来说也不是即开即用的内容生成平台。我们把所有AI技术都包装起来,让用户只是通过最简单的文本输入、语音输入甚至图片输入的入口,最终生成需要的内容。
我们即将推出音乐生成工具。举个例子,太太今天过生日,喜欢文学,希望写一首歌纪念结婚纪念日,如果通过AI音乐可以生成几百首词让用户挑选,用户选择一首词以后,音乐生成引擎马上自动做曲、自动编曲、自动演奏,根据语音输入的音色复制,通过VITS技术进行演唱,再进行合成。用户只要输入前面的文字以后,得到的就是一个完整的MP3,我们可以定义为端到端内容生成工具,所以这些是用户真正需要的AIGC产品。Stable Diffusion和MidJourney生成的图片对普通用户没有消费价值,仍然需要美术和市场人员加上文字和文案,最后送给用户才有消费价值。
我们认为,只有端到端的内容生成工具,基于这些工具制作UGC平台才会形成垂直领域的内容社区。
昆仑万维六大AI业务矩阵
只有业务基石天工大模型的能力不断提高,才能赋能其它所有方向。昆仑万维六大AI业务矩阵包括:
AI搜索,是为了解决大模型的时效性和准确性,空间还是非常大的,因为目前很多行业方向的知识都没有完全被电子化,我们认为AI搜索领域能够给到用户相对更可靠的信息助理;
AI音乐,是公司传统技术优势的方向。目前,全世界能够同我们的音乐生成技术相当的只有Google和微软这样的巨头,我们将提供端到端的音乐生成工具,从而形成新的音乐UGC社区;
AI动漫,是基于和音乐相通的生成逻辑,用户只要输入简单的对话文本就能够不断生成漫画。AIGC仍然有一颗璀璨明珠——视频生成,尚有技术难题未被攻克,就是视频生成的一致性问题。目前学术界研究非常多,我们也投入大量科研人员,预计明年或者后年视频生成技术就将完备,AI动漫生成就会顺理成章地过渡到AI动画生成和影视剧生成。所有用户都能够自制漫画、动画、电影和电视;
AI社交,本质上就是有丰富的社交经验储备,今年也会推出基于AI的社交产品,本质上就是解决人类的情感供给问题。海外很多社交产品只有付费用户才能获得比较好的社交体验,大多数免费用户没有办法获得,现在可以为所有免费用户提供社交上的情感体验,这些对全世界的消费者都非常有吸引力;
AI游戏方面,我们是中国比较有名的头部企业之一,我们一直在研究如何用AI赋能游戏设计。由于AI绘画、AI文本生成和AI编程,现在游戏制作流程效率有了很大的提升,但仍然远远不够。我们本质上是要思考如何用大模型驱动产生更新的游戏机制、更新的游戏类型,这些才是AI游戏的正确发展方向,而不是简单地说游戏研发人员制作质量更高的游戏,应该是如何利用AI生成新的游戏范式,其实我们花了很多时间思考和探索的,今年下半年也会有对应的产品出现。
以上就是昆仑万维在AI大模型商业化的思考和探索。大潮将起,落地为王,我们希望这一波通用人工智能的创业浪潮、投资浪潮能够和上一波不太一样,可以更快地落地、产生用户和收入。
标签: