《科创板日报》7月29日讯(编辑 郑远方)AI热潮下,数据重要性与稀缺性日益高涨,坐拥“数据金山”的传媒公司自然不会放过这个“财富密码”。
OpenAI、谷歌、微软等公司的AIGC工具的训练基于大量互联网数据,其中便包含新闻文章,而媒体公司目前正处于评估这些工具的早期阶段,并计划为自家内容寻求收费。但由于业内并无这类收费先例,因此若想要确定这些新闻产品的公允价值,实际上并不简单。
美联社在本月已与OpenAI签订合作协议,授权OpenAI使用部分美联社的文本档案,同时美联社也将利用OpenAI的技术和产品专业知识。
【资料图】
据外媒报道,美联社是第一家与主要人工智能平台达成(收费)协议的主要媒体,但美联社也存在一定犹豫:如果日后另一家媒体公司出现,并获得了更优惠的条款怎么办?
据知情人士透露,美联社已建立先发保障机制,即“最惠国”条款——若另一家公司从OpenAI处获得更有利的协议,则美联社有权重置条款。
正如前文所说,“如何为内容定价”的答案依旧不甚明晰,美联社的这一“最惠国”条款实际上也反映了业内对于AI机器人(所使用)的新闻内容价值的不确定。
美联社并没有透露具体的交易条款细节,OpenAI则拒绝置评。
▌区块链技术有望帮助内容标记
长久以来,媒体公司的收入很大程度上都依赖于广告与用户订阅,而聊天机器人引发的AIGC浪潮,极有可能改变新闻媒体的商业模式。
之前谷歌与微软的AIGC工具便可以直接为用户提供从多种来源获取的详细答案,媒体也担心此举会降低自家网站点击量,影响流量与广告收入。因此,如果能通过人工智能公司获得报酬,便能在一定程度上抵消这种负面影响。
另有知情人士透露,《华尔街日报》母公司News Corp已开始与内外部顾问合作,评估自家内容对AI训练的价值,评估结果或将影响到未来与谷歌、微软等公司的谈判。News Corp旗下还包括《伦敦时报》与《纽约邮报》。
据悉,News Corp已在尝试利用区块链技术保护自己的知识产权。其将通过区块链技术对单个内容进行标记,以检测AI公司是否在未经允许的情况下,使用News Corp的内容,并可能计划收入许可费用。
与此同时,欧洲最大数字出版公司之一的Axel Springer集团、国际期刊出版集团Condé Nast、《纽约时报》、数字媒体Dotdash Meredith母公司IAC、美国知名媒体集团Penske Media等公司正在计划组建联盟,以解决人工智能相关问题。
▌大模型或成数据要素变现第一场景
AI三大核心要素包括算力、算法和数据,数据是AI算法模型的“饲料”。AI技术的训练需要巨大数据量的大规模数据集投喂,在这种情况下,AI技术及应用不仅会存在不当使用导致的数据泄露,还面临着提示语注入攻击等数据安全风险。
如今,我国生成式AI监管,特别是数据使用规则也逐渐清晰。
国家政策层面上,国家网信办等七部委日前已发布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。该文件对生成式人工智能研发、落地、训练语料使用等提出规范。券商认为,前期研发积累的AI应用有望从Q3开始进入上线周期,训练语料价值或迎重估。同时,其将训练数据的来源纳入监管,有望加速数据版权在AI模型领域的变现。
地方政策层面上,长沙发布《长沙市政务数据运营暂行管理办法(征求意见稿)》,强调“通过合理规划政务数据运营管理来增加财政收入”;北京的《北京市公共数据专区授权运营管理办法(征求意见稿)》“鼓励公共数据专区探索市场自主定价模式,探索产业发展及行业发展相关应用场景按需有条件有偿使用”;《广州市数据条例(征求意见稿)》则“推动数据要素纳入国民经济和社会发展的统计核算体系”,“鼓励企业将数据资源纳入企业财务报表”。
兴业证券指出,AI大模型有望成为数据要素变现第一场景。受制于算力成本、商业模式等原因,国内市场针对2B垂直领域、基于大模型精调之后的小模型有望率先商业化落地。只有掌握核心行业数据,才能训练出适用于行业的垂直行业大模型。AI投资除了算力和算法,更要重视数据。
此外,对于国家数据局的组建,分析师认为,这将从数据源头加快重要政务部门、重点关键行业的数据分类、确权、进程,加快统筹数据资源整合共享和开发利用。同时,未来国内重点行业、关键领域的核心政务、企业数据进行AI赋能,将大概率运行于国资云的私有云上。