在直播演示中,谷歌演示向巴德询问有关购买电动汽车的利弊的问题。图片来源:谷歌
在巴黎发布会上,谷歌宣布在用户超10亿的谷歌翻译上已经实现了翻译功能与AI技术的进一步整合。比如,英语、法语、德语、日语和西班牙语中具有多种含义的单词和短语,可以根据输入的上下文得到更准确的翻译。
除此之外,谷歌宣布之前推出的谷歌地图“沉浸式视图(ImmersiveView)”开始在伦敦、洛杉矶、纽约、旧金山和东京推出。该功能融合了数十亿张街景和航拍图像,打造了全世界的数字模型。通过AI技术神经辐射场(NeRF),它可以将普通图片转化为3D视图。用户能够查看天气、一天中不同时间的交通和车流等信息。
混乱且充满风险的竞争
在最近几周大科技公司裁员数万人并且承诺削减“登月项目”(指具有“登月”意义、造福人类社会的项目类别)后,ChatGPT似乎为科技业重新注入了活力。路透社发现,人工智能已经成为科技高管们的关注对象,他们在最近的财报电话会议上提到它的频率是前几个季度的六倍。
彭博社专栏作家ParmyOlson指出,对谷歌而言,推出类ChatGPT服务可能是它多年来最冒险的战略举措,就像从沙发上一跃而起,该公司已经在沙发上放松了太久。但谷歌和微软这两家一向行动迟缓的科技巨头间的这场争夺,将是混乱且充满风险的。
AI驱动的搜索的吸引力在于它可以用通俗易懂的语言显示结果,而不是列出大量令人眼花缭乱的链接,这可以使浏览速度更快、效率更高。但是,AI聊天机器人也给企业带来了一定风险,因为用于训练这些工具的数据中存在人类的固有偏见和虚假信息。尽管有严格的过滤器阻止机器人发表政治声明或仇恨言论,但社交媒体Reddit的用户已经想出了如何“越狱”迫使ChatGPT绕过安全规则发表违禁言论。
乍一看,谷歌似乎在如何使用新技术方面更加大胆。在微软发布的新版必应的示例中,聊天机器人的答案似乎将被降级到页面的一侧,而不是通常搜索结果的前面和中心,同时AI聊天机器人的回答还包括脚注和来源材料的链接,这使得该工具看起来更值得信赖。新必应的界面还包括对用户的警告:“让我们一起学习。必应由人工智能驱动,因此惊喜和错误是可能的。确保检查事实,并分享反馈,以便我们学习和改进!”
根据必应分享的一个例子,它的新聊天引擎答案出现在搜索页面的右侧。图片来源:微软
相比之下,谷歌的巴德示例在页面中间、搜索结果上方显示了单一的摘要答案,并且没有脚注,这意味着用户不可能识别来源。为什么?这也许是因为谷歌面临着迅速行动的压力。根据《时代》杂志最近对DeepMind首席执行官DemisHassabis的采访,该机构目前正在开发一个名为Sparrow的聊天机器人,将在其对查询的回答中引用消息来源,但谷歌的新工具并没有使用DeepMind的技术,至少现在还没有。DeepMind是谷歌母公司Alphabet旗下的研究实验室。
巴德的页面截图,在中间显示了它的合成答案,在其他来源的搜索结果之上,并且没有引用链接。图片来源:谷歌
“大型科技公司被迫采取行动,但技术还没有成熟。”以色列初创公司AI21Labs的联合创始人OriGoshen表示,“这项技术比一年前成熟得多,但还远未强大到足以跻身最前沿。”AI21Labs运营与OpenAI的GPT-3.5相互竞争的大语言模型。
OpenAI等公司试图通过增加参数和用于帮助预测单词的设置,来提高其语言模型的准确性,但把模型做大很多并不意味着它们会变得更准确,一些研究人员怀疑,随着模型的增长,准确性的回报会递减。对微软和谷歌来说,消除那些持续存在的少数错误可能会成为一项长期挑战,就像自动驾驶技术迄今为止“即将实现”一样。
谷歌还有可能破坏其与网络出版商的关系,这些出版商依赖谷歌的搜索页面为它们的网站带来点击。谷歌长期以来一直拥有相关技术,可以在多年前引入人工智能驱动的搜索查询答案,甚至早在2011年就谈到这样做,但从未这样做过,因为这会破坏其价值1500亿美元的业务。现在它被迫采取行动,可能会激起出版商的愤怒,尽管出版商也终将直面不可避免的技术进步。