王琤:当数据治理遇上ChatGPT

以为代表的人工智能等技术正在“狂飙”,为全球带来一场翻天覆地的变革 。4月27日在2023数据治理新实践峰会上,数语科技创始人&CEO王琤先生以《数据治理新实践与人工智能》为主题进行了分享,与参会同仁共同探索当数据治理遇上,这一轮AI技术浪潮将会与数据治理发生哪些“化学反应” 。
以下为王琤先生的演讲实录,为了方便阅读,小编做了一些字句修改和文本优化 。
大家好,首先我先代表数语感谢各位莅临2023年数据治理新实践峰会!今天的主要话题是围绕,是人类历史的一个拐点 。
数据要素为什么会成为新型生产要素?
首先我们先看看数据要素这个事,目前在国内认为它是新型生产要素,这是为什么?我更多的是从经济发展的三阶段来解读,第一个阶段是农业经济,核心要素是劳动力和土地;第二个阶段是工业经济,核心要素是资金、技术等,第三个阶段也就是咱们说的数字经济,核心的变化在于前两个阶段侧重于“供需方”,也就是企业、顾客双方进行资源配置和价值交换,但当数据融入以后就会生成更多内容,就出现了AIGC(AI),这意味着更多的企业、顾客、利益相关者共创价值 。
从企业场景的角度来说,也就是数字孪生,就是把内容信息进行数字化,进而去做一些数字孪生和预测推演,进而产生对应的价值,数字孪生的1.0版本我们叫角色最优化,2.0版本叫平行世界,也就是将数字化完全做一个数字孪生提前来Run,来预测现实世界有可能会发生什么,反馈给现实世界来提前进行优化,我认为这才是数据作为生产要素被引进来的真正价值 。
技术驱动数字化发展带了什么影响?
接下来我将引用几张最近很火的陆奇博士的课件 。从劳动力的角度来讲,在农业社会,农民和地是关联在一起的,是强耦合关系;之后的工业社会,劳动力开始流动,生产的产品也是流动的;到现阶段在数字化进程中,其实更多是服务经济,里面的核心角色是程序员、设计师、分析师等;从数字信息无处不在到数字化模型无处不在,这是个大拐点 。所以大家都在预测说,可能模型会把程序员、设计师、分析师等都替换掉,这个是当前社会比较焦虑的一件事 。等模型更加成熟后,主要的工作可能是去做创业者或者高端科学家 。
陆奇博士将人类环境分为三个体系 。第一个是感知-信息系统,也就是信息无处不在;第二是思考-模型系统,其实就是我们的知识模型,第三个是实现-行动系统 。信息系统早期像IBM、微软等都是在感知和采集信息,可以看到其中的拐点是将人类获取信息的成本基本拉为0,当然信息系统未来会长期存在 。当前我们正处于第二个思考-模型系统 Open AI拐点处,3.5带来了质变,我们称之为新范式,它将我们获取知识(思考)的成本拉得很低,其本质就是把数据转化为知识表达,通过推理和归纳来实现预期记忆和泛化 。最后的行动系统更多讲的是人跟物理世界的转换 。
关于把数据转化为知识表达,通过推理和归纳来实现预期记忆和泛化,这两天有个真实发生的例子 。在开源模型社区的群里,有人发起针对LD-FSM模型中当事人的关联关系设计的讨论 。

王琤:当数据治理遇上ChatGPT

文章插图
大家的回复七嘴八舌,各种角度都有,但始终没有一语道破天机的感觉 。这时有人开始把的回应贴了上来 。
首先,给了一个上下文,“你是一个资深的数据建模专家”,但这版回复感觉还是不太对路子 。
于是,要求再次回答 。这次的回答已经相当靠谱了 。基本可以达到行业专家的水准 。