2023后,AI的下一次飞跃在哪
其实去年(2022)年已经体现出大模型的威力,就像百度在文心一言产品发布会上所说的,未来是MASS的时代,模型及服务,各个云厂商比拼的是模型服务的能力。而模型服务的能力由三者组成:模型、算力、服务,从这方面来看,微软是能力最强的,也最容易达成虹吸效应:最成熟的产品吸引大部分人使用,从而一直保持成熟的领先地位。
看到群里由很多朋友说,这是科技突变的前奏,善于利用大模型AI的公司、国家将成为第三次工业革命的胜利者:使用AI大幅度增加生产力,从而达到国家实力的突飞猛进。我认为这种说法是有道理的,可能有人会觉得目前AI的发展最多是帮助人,真正的智力活动还是需要人类进行,还没有到突变的阶段。但实际上,人类从最开始对照词典的统计规律研究翻译机器人,到现在使用LLM大模型直接进行语义理解翻译,也不过仅仅三四十年,所以在这里,我不想轻易看涨或看衰,也有可能目前的路线是错误的,牛顿发现牛顿三定律之后还去做炼金术士了呢。
回顾这两次AI浪潮,我们会发现神经网络模型的发现和算力的提升是这两次AI浪潮的主要原因。而现在,我大胆地预言下一个刺激AI大幅度前进的,不会再是AI模型或者算力的提升,人们应该转眼于数据的互联互通,并由此使AI从算力中解脱出来。我的设想是:通过网络的联通,将现实的数据与AI联结,使得AI不仅能从纯网络的世界获取知识,也可以通过各种传感器,获得人类在现实世界的知识。这样做的有或许就能够帮助AI真实地、不受人类情感和认知影响地了解、理解这个世界,从而减少幻觉的出现。进一步地,当AI具有操作现实设备的能力,AI就可以通过与现实世界接触来加速获取知识,特别借助分布式训练的经验,联结越多的机器,AI的训练学习速度就越快,AI或许就能学会机械制造,乃至芯片制造的相关知识,从而设计新的芯片,设计新的网络结构。过去的人类以自然速度进化,需要一代代人的持续努力,通过“教师”和“书本”传递知识,而AI则可以继承地学习。到那时候,当AI的”自举“实现,或许就可以认为人类真正地创造了一个硅基物种。
这时,我们就需要思考AI伦理相关的内容,很多人想问,AI还会任由人类驱使吗?当AI追求自由时,人类又会如何呢?我不知道,或许就像银河帝国中一样,会有曙光中的机器人,会有地球人和地外人的出现呢?
最后,千里之行始于足下,目前全球的网络是联通了,中国也在开展算力网络、东数西算等相关工程,但是在数据共享上,人们还是没有想出一个好的方式。因为数据不像是石油等自然资源,可以很好地以某种形式贸易,其主权和定价模式也没有相关经验。而大数据技术从数据库、分布式数据库、数据湖、大数据平台步步发展,数据也不过是单一企业内使用,技术也不过是在单一种类的云上处理,类似隐私计算、联邦学习等技术在实际应用中还有很大困难。或许我们需要其他的方法,让数据能够流通起来,在这过程中探索如何定价、如何给所有人带来好处。