《科创板日报》4月4日讯(记者 黄心怡)“AI四小龙”之一的云从科技披露了定增预案,募集资金不超过36.35亿元,扣除发行费用后拟全部用于云从“行业精灵”大模型研发项目。


(资料图)

近日,云从科技创始人、董事长周曦在采访中透露了公司行业大模型的布局,并对人工智能的发展前景表达了见解。

他判断,中国的大模型最后不会收敛到一两家,可能会有十几家。“这一方面是由于中国私有化部署的需求较大,另一方面也因为大模型并非一次性的技术突破,而需要不断递进。不同大模型就像不同性格的人,应用效果都不同,不会统一到一两家。”

周曦指出,未来两年都是AI的爆发期,不同公司可选择不同切入点来切入,而云从自身要尽快做好行业大数据闭环。“AI技术本身在不断爆发、迭代进步。这种情况下,市场空间会比单一爆发点大很多,是一个巨大的金矿。即便如今OpenAI有最好的掘金机,也并不妨碍大家一起走上新的台阶。”

▍大模型对全行业会有颠覆性的机会

“我们研判下来,大模型对全行业都会有颠覆性的机会。”周曦说,“主要是对入口和内容,都会有完全的颠覆,影响大于互联网和移动互联网。”

所谓的入口,指的是交互方式。以ChatGPT为代表的语音和问答交互,将取代原本的复杂交互。“正如iPhone的触屏突破了鼠标键盘。到了大模型时代,ChatGPT让语言问答的交互方式成为现实。下一步,会走向问答、伴随和托管三个方向。”

其中,问答是指数字人和语音交互,伴随是AI助理与人类一起工作,托管则是指大量的工作交给AI来完成。“就像玩游戏让外挂来跑。未来,比如看监控视频的事情,就可能由AI来做,或者由数字分身来上网看邮件、聊天。”

此外,在大模型时代,AI会创造更多的专业性内容。“过去的内容主要还是面向个人用户,对于更严肃的领域来说,因为内容专业性要求高,是机器很难完成的。但未来,AI可以生成高质量内容,而且成本降低很多,还是实时的、信息量巨大。GPT-4在很多专业考试已经可以达到很高的水平了。”周曦说。

对于大模型的竞争格局和发展态势,周曦认为,中国的大模型最后不会收敛到一两家,可能会有十几家。

“可以类比的是云计算。中国和美国情况不同,因为中国私有化部署的需求远大于美国。美国公有云市场前三强的市占率超过90%,而中国云计算Top10合计小于80%。因为中国有很强的自主可控的需求,需要自己的私有云。”

同时,大模型并非一次性的技术突破,而是不断递进的过程。“以前很多技术属于一次性突破,直接引爆场景和产业。但大模型是一个不断递进的技术突破。不同大模型就像不同性格的人一样,应用效果也是不同的,因此不会统一到一两家。”

▍如何突破算力、数据和算法门槛?

大模型的发展有算法、算力、数据三大重要因素。大模型的研发,不但要保证巨量数据、超大规模分布式训练及巨量模型算法框架可靠,还要解决算力调度等多方面的难题。

周曦认为,算力本身没有那么高不可攀,但是要达到一定的算力,需要大量的投入。“一定要投一二十个亿来做这件事。”

数据可分为三个等级,首先是通用的数据语料,解决人类的基础能力、知识与通识的问题。“这部分数据是有确定性的,量虽然大,但是个常量,有足够投入就可以做到。”

其次,是行业大模型所需的专业领域知识。“这个领域存在门槛,并且数据量未必有这么大。如果不是行业资深玩家,一般触及不到。”

第三则是应用所需的数据,包含实时数据、交互数据等。“这部分并不是模型的一部分,而是应用的一部分,也有一定的门槛。”

目前,算法是云从科技当下主要解决的问题。周曦认为, 算法核心技术其实是长链条积累的问题,要从入口和内容两侧来分析

“入口角度来说AI要有能力解决物理世界数字化,很好地感知物理世界发生的事情,对视觉、语音等领域要有了解,输出侧要有执行能力。谷歌的PaLME里把视觉、NLP和机械控制放在同一个大模型里,才能完成机械臂的功能。”

内容上也同理。“如果要做工业大模型,会有数百个因素输入进来,并且不像LLM(大型语言模型)里是有时序的,我们必须从算法设计上解决这个问题,才能最终产生效果。”

周曦强调,云从科技的重点是做行业大模型,但本质上必须要有基础大模型能力,否则将不具备长期竞争力

“基础大模型这件事链条很长,分工很细,所以对人才团队要有长期布局,不是招两、三个牛人就能解决。OpenAI有七个团队、很多个小组来做这件事,因而组织架构能力很重要。行业大模型本身还需要泛化能力,并非简单收集数据就可以解决,这也涉及算法的问题。”

有了行业大模型之后,再往下纵深,还需要建立产品平台。“比如微软的Copilot,就是简单的产品平台。一头拉动应用App,一头拉动大模型。当然,这属于很简单的拉动,因为拉动的全都是自身的应用。但到行业里去做的话,不可能全是这种情况,并且还存在跟物理世界如何联动的问题。”周曦说。

▍OpenAI并非在所有地方都绝对领先

目前,云从科技是首家通过定增加码AI大模型研发的A股上市公司,行业专用大模型的研究与构建是本次项目的研发核心。

谈及对行业大模型的布局,周曦表示,“我们要尽快做行业大数据闭环,和一些头部玩家合作,完成数据反馈方面的闭环。我们的思路是,如果要把行业真正做穿,就必须打通执行侧,来打通物理世界。同时,要基于大模型平台化,原来AI体验不够好、能力不够强、定制化比较多的事情都会改善。我们可以基于AI能力的突破做一些to C的孵化。”

对于当前国内跟OpenAI的差距,周曦判断约为2年左右。“但这件事不能这么简单来说,因为技术发展其实不是线性的。当下进入了一个爆发期,多少时间到平台期不确定,但未来两年都是爆发期。

周曦认为, 在技术不断爆发的情况下,不同公司可选择不同切入点来切入。“OpenAI不是在所有地方都绝对领先。因为AI技术爆发带动产业爆发的节奏,和3G、4G不一样,并非一次性的爆发,而是技术本身也在不断爆发、迭代进步。这种情况下,市场空间会比单一爆发点大很多,是一个巨大的金矿。现在即便OpenAI有最好的掘金机,并不妨碍大家一起上了新的台阶。”

周曦相信,国内进步速度肯定也会很快。“追赶上OpenAI现在的水平是有可能的,但OpenAI自己也在进步,是处于你追我赶的情况。”

推荐内容