ChatGPT到底是如何做到那么“聪明”的?“它不管是训练的参数量级,还是训练的样本量级都是非常庞大的,相对在传统认知当中的深度学习模型要大出非常多的数量级。”维智科技CTO刘泉8日接受中新社记者采访时表示,以训练样本为例,ChatGPT对应到了千亿级的词语量,覆盖范围极广。
如此庞大的训练量,真正的研发难点在于硬件算力要求以及资金需求。上海交通大学计算机系副教授严骏驰估算,GPT模型训练除了要一次性投入上亿美元的算力硬件设备,每做一次训练还需要承担数百万美元的电力、人力等常规成本。
此外,几乎所有受访人士都提到了OpenAI这家企业所体现的纯粹创新精神和长期主义。“其实从技术路径和原理来看,我们都非常熟悉和了解,但过去业内几乎所有人都认为他们走的这条路是一条崎岖艰难,并且可能走不通的路。”陈运文表示,OpenAI在过去五年中,投入大量的力量和资金“一条路走到黑”,“事实证明这条路走通了,而且效果那么好,超出想象。”
ChatGPT的成功给人工智能产业界同时带来了机遇。刘泉表示,ChatGPT在很大程度上让人工智能相关的底层技术、应用和影响得到了更广泛的关注度。“ChatGPT如何与商业形成闭环,目前还不宜过早下定论,我们公司内部也在做很多这方面的尝试。”在他看来,ChatGPT在一定程度上加速了智能时代的到来是“毋庸置疑”的。
此外,ChatGPT的出现也同样给业内带来了挑战。陈运文认为,以搜索引擎为主要商业模式的企业将迎来巨大挑战。“ChatGPT将海量的文档与网页进行归纳分析,这对于靠点击量赚钱的搜索引擎来说是致命的。所以为什么这件事谷歌和百度那么重视。”
当地时间2月6日,谷歌母公司Alphabet宣布将推出名为“Bard”的人工智能聊天机器人服务以及更多的人工智能项目。2月7日,百度宣布推出类ChatGPT项目,名字确定为“文心一言”,英文名ERNIE Bot,三月份将完成内测,面向公众开放。
放眼世界,人工智能渐入崛起期,新兴市场等待开拓,中国扮演着怎样的角色?刘泉坦言,在算力层面,也就是基础设施建设上,中国还是处在追赶西方的阶段。“然而在AI应用领域,我认为中国还是走在前列的。”
以上海为例,刘泉所在的维智科技就坐落于上海张江,在他看来,上海在人工智能领域培育出了一个广泛且丰富的生态环境,“如智能制造、智能驾驶、政府与企业机构的数智化转型方面,上海都是走得比较靠前的。”刘泉说。
严骏驰也持有相同观点,得益于上海科创中心建设以及大力发展集成电路、生物医药、人工智能三大先导产业,目前多个前沿领域的产业集群已逐步形成,为上海研发更实用、更面向行业的人工智能工具提供了“沃土”。
面向未来,严骏驰认为:“我觉得需要开发一个AI云计算服务平台,降低高校或者垂直行业领域的研究人员二次开发人工智能模型的门槛。”
“以ChatGPT依托的模型GPT-3.5为例,训练数据量达45TB,总训练成本超过1200万美元。算力贵向来是数据智能创新企业的难点。”陈运文建议,在基础设施层面,希望国内能进一步布局国际领先水平数据算力基地建设,并向数据处理企业开放一部分能力,这对于技术研发突破和产品的研发都将具有重要推动作用。(完)