我国数字经济发展进入数据驱动新阶段******
1月4日,中国信息通信研究院在“第五届数据资产管理大会”发布的《大数据白皮书》(以下简称《白皮书》)显示,我国大数据技术产业整体水平大幅提升,已形成数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域。
从《白皮书》披露的数据看,我国大数据发展环境持续向好,创新能力不断增强,生态体系持续优化,市场前景广受认可。
从创新能力看,2021年我国发表大数据领域论文量占全球31%,大数据相关专利受理总数占全球超50%,均位居第一;从生态体系看,2021年我国大数据市场主体总量超18万家,形成了大企业引领、中小企业协同、创新企业不断涌现的发展格局;从市场前景看,2021年我国大数据相关企业获投总金额超过800亿元,创历史新高。
“2022年,我国在政策、人才、资金等方面持续加码,为大数据后续发展注入强劲动力。”中国信息通信研究院院长余晓晖特别指出,《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)的印发,是我国探索数据要素价值释放、做强做优做大数字经济迈出重要一步。
尽管我国数据生产要素制度建设再获关键政策支撑,但未来发展,还要看大数据技术产业,即五大核心领域如何应对挑战。
针对《白皮书》罗列的各项挑战,中国信息通信研究院云计算与大数据研究所所长何宝宏以数据流通领域为例指出,数据流通技术提供了“数据可用不可见”“数据可控可计量”的数据服务新范式,数据流通市场逐渐从“以数据产品为主”向市场驱动的“以数据需求为主”转变,挑战也越发凸显,比如,数据权属界定的场景与问题复杂,对参与数据流通的主体权利关系,理论、制度和产业实践层面均尚未形成共识;数据的估值定价尚缺乏科学、标准的评价方法;数据流通的准入、竞争等行为约束没有清晰的法律界定,配套规则不完善;隐私计算等数据流通关键技术应用不成熟。
谈及被列为首位挑战的数据权属界定,北京大成律师事务所合伙人张建民说:“从土地到石油,生产要素的产权界定是牵一发而动全身的大事,数据确权也是数据基础制度体系最为核心的问题,是数据要素市场化的逻辑起点和法律前提。《数据二十条》将弥合此前关于数据确权的各种分歧,引导各方将力量集中到更为细致的制度研究和设计上。”
数据流通的重要前提是数据开放,它所带来的安全挑战来自何处首先需要廓清,《白皮书》给予明确:数据安全责任体系构建尚不成熟,数据安全的主体责任边界模糊;具体业务场景下的技术落地仍然缺乏实践指引,数据安全管理与技术易脱钩;传统网络安全防护思路与措施无法满足当下的数据安全防护需求。
“对数据开放中的安全性、合规性、权益分配等方面的考量,在一定程度上阻碍了数据的互联互通与价值实现,市场因而呈现‘数据需要开放,却又难以开放’的困境。”中国电子数据治理工程指挥部技术部主任国丽认为,解决这一矛盾需要扎实的安全技术支撑,需建立覆盖产权、流通、分配、治理的一体化的数据安全与数据要素化工程体系。
以《数据二十条》出台为标志,我国数字经济发展从技术引领进入到数据驱动的新阶段,中国电子信息行业联合会秘书长高素梅强调,目前我国数据管理的水平仍然处于初步发展阶段,数据管理的科学性、规范性、实用性仍然影响数据要素市场的进一步培育与开拓。(刘艳)
ChatGPT搞钱行不行******
一系列的试探之后,AI聊天机器人ChatGPT的收费计划浮出水面。当地时间2月1日,人工智能实验室Open AI在其官网宣布将推出“ChatGPT Plus”付费订阅版本,每月收取20美元。免费了两个月,月活用户却达1亿的ChatGPT,终于踏上了自己的“赚钱路”,由此,AIGC商业化落地的探讨也陡然升温。不少人迫切地想知道,ChatGPT Plus会不会是AIGC从烧钱到赚钱的关键转折。
免费服务仍将继续
“新晋顶流”ChatGPT用收费计划再次搅动了AI圈的一池春水。根据Open AI的公告,订阅ChatGPT Plus服务的用户,即使在高峰时段,也可获得该聊天机器人更快速的回应,而且可以提前体验新功能和改进。
去年11月,ChatGPT横空出世,不仅能够通过学习和理解人类的语言与用户进行对话,还能根据上下文互动,甚至能够完成撰写文案、翻译等工作。得益于这种突破性的使用体验,ChatGPT迅速蹿红。
当地时间2月1日,瑞银发布研究报告称,截至今年1月,近期爆火的ChatGPT在推出仅两个月后,其月活跃用户估计已达1亿,成为历史上用户增长最快的消费应用。同样的成绩,海外版抖音TikTok在全球发布后,花了大约9个月的时间,Instagram则花了两年半的时间。
但大量用户涌入的同时,也导致ChatGPT经常在流量压力之下无法提供及时的回应,此次收费版的ChatGPT Plus针对的便是这一痛点。
据悉,付费计划将在未来几周内首先在美国推出,然后扩展到其他国家。但ChatGPT Plus的推出并不意味着取代免费版的ChatGPT,Open AI表示,将继续为ChatGPT提供免费访问。
烧不起的模型成本
尽管只推出了两个月,但Open AI对于ChatGPT的收费计划却已经暗示了有一阵子。早在1月初,Open AI就曾提出过专业版ChatGPT的计划,宣布“开始考虑如何使ChatGPT货币化”,并公布了一项调查。什么价格以上会无法接受?什么价格以下会觉得太便宜?诸如此类关于定价的问题皆在其中。
有用户曾在社交媒体上提问ChatGPT是否会永久免费,对此,Open AI首席执行官Sam Altman回应称:“我们将不得不在某个时间点,以某种方式将其商业化,因为运算成本令人瞠目结舌。”Sam Altman曾透露,ChatGPT平均每次的聊天成本为“个位数美分”。
“这类大模型训练成本非常高。”在接受北京商报记者采访时,瑞莱智慧高级产品经理张旭东表示。
但相对训练来说,模型推理,也就是用户提交输入模型输出结果的过程,这一成本会更高。“据说ChatGPT在开放测试阶段每天要花掉200万美元的服务器费用,所以前段时间免费的公测也停止了,如何降低模型推理的消耗也是目前的一个重要研究问题。”张旭东称。
“钱景”在哪
长久以来,广阔的市场前景和难以盈利的现状几乎成为了AI领域难以平衡的理想和现实,对ChatGPT或者说是以ChatGPT为代表的AIGC也是一样。
洛克资本副总裁史松坡对北京商报记者分析称,ChatGPT受到广泛认可的重要原因是引入新技术RLHF,即基于人类反馈的强化学习。在史松坡看来,ChatGPT是一个高效的信息整合助手,可以取代大量人类中初级助理的角色。
但他同时提到,目前ChatGPT在海外英文环境中已经能胜任图画创作、音乐创作、文字整理、信息搜集综合、基础编程和金融分析,但还不能胜任高频度的人类主观决策,比如大型投资决策、政治战略决策等。
天使投资人、知名互联网专家郭涛认为,ChatGPT在重塑众多行业或场景的同时也孕育着巨大的商机,将推动众多行业快速变革,有望在AIGC、传媒、娱乐、教育、客户服务、医疗健康、元宇宙等领域快速落地,具有万亿级市场规模。
张旭东认为,AIGC商业化落地还需要结合应用场景,目前基于生成式大模型的商业应用案例还比较少,就以当下的技术水平看,一两年内达到很好的AGI(通用人工智能)水平还是不太现实的,所以一定需要有垂直领域的创新公司来基于OpenAI等公司的工作来寻找合适的场景落地。
AIGC商业化,侵权与被侵权
AIGC要想商业化,场景只是其一。伴随着ChatGPT的爆火,争议始终并行,比如AI绘画面临的版权探讨。学术界也已针对ChatGPT做出了反应,权威学术出版机构Nature规定,ChatGPT等大模型不能被列为作者。纽约市教育部门曾表示,纽约公立学校的所有设备和网络上将禁止使用ChatGPT。
张旭东认为,目前AIGC最为成熟的应用在内容作品创作上,但从专业角度看,AIGC属于模仿创新,并不具备真正的创造力,AIGC的作品可能对一些艺术家、创作家的风格题材造成侵权;另一方面,AIGC作品也存在被他人侵权的风险。
此外,就安全性问题而言,AIGC这种深度生成能力很可能被滥用于伪造虚假信息,比如生成一些敏感性的有害信息,甚至伪造新闻信息恶意引导社会舆论,而且这些生成式内容难以分辨追踪,大幅增加对信息治理的挑战难度。信息获取也是AIGC需要解决的问题之一。
郭涛则提到,当前AIGC赛道尚处于孕育探索阶段,存在关键核心技术不成熟、免费素材资源较少、内容堆砌且质量参差不齐、成熟的商业应用场景较少、相关法律法规不健全及技术伦理挑战等突出问题,短期内还难以实现大规模商业化应用。
北京商报记者 杨月涵
(文图:赵筱尘 巫邓炎)