《科创板日报》7月10日讯(记者 李明明)本次2023世界人工智能大会上,汇聚了30多个大模型。科大讯飞的讯飞星火认知大模型、百度文心、华为云盘古大模型、阿里云通义千问等齐聚世博展览馆,成为本届大会上的亮点。
如此多的科技企业、单位争相涌入大模型赛道,其商业化落地方向如何?百花齐放下,一个好的大模型有哪些标准?金融行业的个人隐私数据和大模型如何融合?就上述问题等,大会期间,《科创板日报》记者采访了科大讯飞总裁吴晓如。
将对开发者和中小用户开放平台应用
(资料图片)
5月6日,科大讯飞发布了讯飞星火认知大模型,具备了文本生成、语言理解、知识问答、逻辑推理等七大能力。6月9日发布的V1.5版本,在开放式知识问答、多轮对话、逻辑和数学能力方面取得进步,并在教育、办公、汽车、数字员工等行业实现应用。
讯飞星火具有比较完备的行业生态,就下一步实现商业化落地方面,吴晓如对《科创板日报》记者表示,首先大模型基础的一些能力已经可以开始使用,其理解能力和逻辑推理能力,可以解决很多行业中的问题,比如客服、营销、文案的书写等,但也存在一些问题,比如其提供的知识不够专业、数据过时,这就需要和一些行业知识库做紧密融合,让机器能更好地对接行业知识库。
同时,大模型除了学习大量的文本之外,还要针对行业知识进行精细调整,调整后专业机构都可以参与进来。吴晓如说,科大讯飞近期刚刚在金融领域,比如和人保、交行等都建立了联合的创新机构。昨天和交行建立了人工智能创新实验室,就是把科大讯飞的大模型能力和交行的行业知识库、行业应用能力结合起来,很快会有应用推出。在有应用推出的基础上,来反向牵引,然后再做进一步融合和深化,这是一个层面。
第二个层面就是在平台方面,虽然目前公开的开放平台还需要监管机构发牌以后才能正式运作,但现在已有很多的开发者通过预体验的形式,把应用和科大讯飞的系统做了一些对接,包含企业的应用助手,通过写一些提示词就可以创作出各种各样的新应用。
他指出,这两种模式已经都在推进,其一是现有的APP如何接进来,其二是如何基于现在的大模型产生一些新的应用。一旦等到监管机构发牌后,就会在讯飞开放平台上向开发者和中小用户开放,这两条线都在同时进行中。
此外,吴晓如表示,大模型在产业端的落地,仍需要一个过程。在一些数字化程度高的行业,大模型将率先落地应用,比如金融行业、汽车行业。在教育和医疗行业,大模型产生的效果也非常直接。然而,在传统制造行业,则需要循序渐进。
未来大模型基础算力平台领域或大企业领先
截至6月份,国内企业已经发布了约80个基础大模型,打着AI旗号的产品更数不胜数。众多大模型里,符合好的大模型有哪些标准?
吴晓如对记者指出,现在是一个大模型满天飞的时代,有些是自主研发,有些是开源,但是未来想让大模型更加有价值的话,还是要让其产生应用价值,以及让应用端来了解大数据,在这里就有一系列对大模型的评估评测。
“这种评测既有基础能力的评测,比如语言理解、逻辑推理、文本生成等,以上这些都要一系列的评价标准。讯飞属于比较学院派的做法,在5月6号发布时,就已经同步了约480多项的评测指标,这些评价标准也被一些友商和合作伙伴拿去引用了。为了大模型能更加健康推进,行业内需要制定未来的标准,这也是为什么工信部牵头成立了一个标准工作组,本身这个行业刚刚开始,其实是属于非常早期的阶段,需要健康引导来协同发展”。吴晓如说。
谈及“百模大战”中的优势,吴晓如表示,科大讯飞此前长期聚焦做大模型,拥有经验丰富强大的团队,同时,大模型未来会形成有深度有价值的应用,所以B端的牵引对大模型下一步成熟是非常重要的。
在他看来,关于大模型竞争格局未来的趋势,“现在还不好说。到底未来是3~5家,还是6~7家不好讲。”以后的竞争更多是巨头之间的较量吗?吴晓如认为,在基础算力平台方面可能会是大企业,但还有很多垂直行业,可能也有一些具备优势的企业可以做得很好。
他指出,此外,行业内这些合作伙伴的协同关系是非常强的,华为拥有强大的底层算力平台,腾讯有非常成熟的应用生态,应该说主要玩家中协同合作大于竞争。
讯飞与金融机构对行业知识进行精细化调整
当下,ChatGPT主导的对话式AI开始渗透到各行各业,金融行业作为数字化的先行者,也是大模型技术落地的最佳领域。
谈及切入金融行业的情况,吴晓如认为,金融是一个很大的行业,此前科大讯飞一些应用的需求就已经存在。比如通过线上营销,来自动捕捉符合客户满意度与产品满意度的需求,或在风控审核方面提供流程辅助。只是此前由于技术尚不成熟,做的相对还比较浅层,如今大模型的理解能力和推理能力使很多问题可以解决。同时,行业大规模的经验需求知识库,以及科大讯飞相关的模型技术,两者融合一起的需求迫切度非常高。
针对目前金融行业的数据开放不足问题,如何通过算法在垂直领域模型完善方面,吴晓如表示,首先金融企业有很多数据非常敏感,但也有一些数据不敏感,比如政策法规。金融机构会提供一些开放的不敏感的数据,科大讯飞会把其用到模型训练上,一般分成两步,第一步是无监督训练,即把大量的各种素材放进来,帮助训练基础模型。
第二步,要针对行业做有监督的精细化调整。训练需要的算力不是很大,科大讯飞会在合作伙伴的实验室中,提供金融机构工具,让对方做进一步的调试优化。
在今年的世界人工智能大会上,吴晓如在致辞中表示,将与头部企业深度合作,打造行业大模型,加快赋能重点行业。在探索金融大模型行业落地的过程上,将继续坚持“技术+场景”双轮驱动的战略,助力金融服务创新升级。在金融行业,大模型技术将革新营销获客、风险防控、智慧运营、客户服务等场景。