距离首次推出多模态大模型刚一个月有余,科大讯飞又马不停蹄对其“星火认知大模型”升级。
【资料图】
6月9日,科大讯飞公布其通用大模型新进展,发布“星火认知大模型”V1.5版,该版本在开放式问答方面取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力也得到提升。此外,科大讯飞此次还将“星火认知大模型”搬上移动端,发布其星火APP。
早在一个月最初发布时,科大讯飞曾计划10 月24日前实现对ChatGPT的能力对标。据科大讯飞方面透露,下一步将在8月15日开放“星火认知大模型”的多模态交互升级。
瞄准待攻克的“三大缺陷”
在5月6日,科大讯飞首次公布“星火认知大模型”,当时科大讯飞董事长刘庆峰即为其立下目标:争取今年10月24日在中文方面超越GPT,在英文达到相当水平。
而34天后,科大讯飞对其进行了升级,公布了“星火认知大模型”V1.5版本。刘庆峰介绍,该版本在开放式问答方面取得突破,在多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升。
尤其在泛领域开放式问答方面,“星火认知大模型”V1.5版本瞄准了纯大模型技术有待攻克的“三大缺陷”:新知识难以更新、事实类问答容易“张冠李戴”、史实传统典籍等容易“编造情节”。
同时,多轮对话能力的跃迁,让讯飞星火的对话体验更加贴合真人。多轮对话是大模型的传统难题,简单来说即为“没记性”。
在会上,科大讯飞也对“星火认知大模型”进行现场演示。在谈及“中国关于人工智能有何新动向”这一问题时。“星火认知大模型”提及今年6月3日,长三角企业家联盟产业数字化峰会发布了《通用人工智能长三角(合肥)宣言》和《通用认知智能大模型评测体系》。
实际上,星火大模型在5月已经定型,而“星火认知大模型”给出的答案,已经包括6月相关政策动向,也表明大模型已处于实时更新学习状态。值得注意的是,“星火认知大模型”还在答案中进一步给出了当下国内人工智能所面临的差距。
“大模型与搜索给出一样的答案没有意义,而是要通过专业知识、推理能力给出具有建设性的方案,”科大讯飞研究院院长刘聪也在会上直言。此外,“星火认知大模型”在会上还对今年高考的数学题和语文题作出准确作答。
下一节点:多模态交互再升级
按照计划,科大讯飞今年之内将进行三轮迭代升级,目标是在10月24日对标ChatGPT。6月9日之外,下一个升级节点是在8月15日,主要是突破代码能力和多模态交互再升级。在多模态方面,具体包括虚拟人合成、图文理解等,也将届时开放给客户使用。
科大讯飞董事长刘庆峰此前表示,目前科大讯飞的代码能力重点针对工业互联网,针对企业内部的很多应用,将来目标是不需要程序员,让大模型生成各种代码。但刘庆峰也坦言,星火大模型的这一功能和ChatGPT相比,还有很大差距,下一步升级的重点功能也是这一领域。
而刘庆峰在会上透露,在更为前沿的领域,科大讯飞方面还将探索更多潜在人工智能技术路线,如博弈智能、类脑智能和神经网络模型。
除了大模型自身能力进一步提升外,科大讯飞此次还发布了“星火认知大模型”在学习、医疗、工业、办公等领域进一步的商业落地进展,包括推出星火APP和星火语伴APP。
同时,科大讯飞还进一步瞄准了细分领域,推出星火认知大模型+医疗诊后管理平台、星火认知大模型+工业互联网平台、星火认知大模型+讯飞听见智慧屏产品。在业内人士看来,此举意在推动其在细分领域的商业化,有望率先突破的场景即为上述医疗、工业制造以及办公领域。
同时,除了面向不同应用场景开发示范性应用产品外,科大讯飞面向AI开发者、大模型上下游企业、创业团队的星火生态,也在同步招募生态合作伙伴。
实际上,参考OpenAI的发展史,大模型研发的前提是对小模型的研发、训练、应用等已经足够成熟,OpenAI创立之初的产品也仅为游戏领域的垂直小模型,在完全摸透小模型的研发、落地后才不断扩大参数量最终形成1750亿参数的大模型GPT3。
国内大模型开启“百模大战”
自今年3月以来,国内的通用大模型如雨后春笋般陆续发布。其中,百度率先发布文心一言,阿里紧跟其后官宣通义千问,甚至清华大学、北京智源人工智能研究院、上海人工智能实验室等科研院所也发布了各自的AI大模型成果。
根据民生证券相关研报的统计,目前国内至少已经有30多家大模型亮相,出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司,有的大模型的参数规模已经接近,甚至超越ChatGPT的规模(上千亿条)。
IDC预测数据显示,中国人工智能市场支出规模将在2023年增至147.5亿美元,约占全球总规模十分之一。长远来看,AI技术的创新迭代驱动了应用场景的进一步落地,以AIGC、数字人、多模态、AI 大模型、智能决策为代表的热点为市场带来了更多想象力和可能性。
IDC预计,2026年中国AI市场将实现264.4亿美元市场规模,2021-2026五年复合增长率(CAGR) 将超20%。中信建投认为,国内大模型研发应用热潮持续高涨,大模型发展全面加速,但当前全球大模型产业落地仍然处于早期探索的阶段,需要与下游的场景企业合作来建立大模型的商业模式。
标签: