OpenAI 发布 ChatGPT Search 与谷歌竞争,用户体验后为何仍选择谷歌?
鞭牛士报道,11月4日消息,据报道,上周, 发布了备受期待的搜索产品 ,与谷歌一较高下。业界已经为这一刻准备了好几个月,促使谷歌在今年早些时候将人工智能生成的答案注入其核心产品,并在此过程中产生了一些令人尴尬的幻觉。这一失误让许多人相信 的搜索引擎将真正成为谷歌杀手。
但使用 作为我的默认搜索引擎(你也可以使用 的扩展程序)大约一天后,我很快又切换回了 。 的搜索产品在某些方面令人印象深刻,并让我们看到了未来 AI 搜索界面会是什么样子。但就目前而言,它仍然太不实用,不适合用作我的日常驱动程序。
偶尔会很有用,因为它可以实时显示问题的答案,否则我就不得不翻遍许多广告和 SEO 优化的文章才能找到答案。最终,它以一种不错的格式呈现了简明扼要的答案:您可以在右侧获得信息来源的链接,并附有标题和简短的片段,以确认您刚刚阅读的 AI 生成的文本是正确的。
这是 对谷歌搜索的回答。(图片来源: ZEFF/)
然而,它常常感觉不太实用,不适合日常使用。
目前, 搜索对于人们最常使用 的用途并不可靠:简短的导航查询。少于四个字的查询代表了 上的大部分搜索;这些通常只是一些可以带您进入正确网页的关键字。大多数人几乎意识不到自己整天都在进行这类搜索,而这正是 往往做得非常好的。
我指的是“凯尔特人队比分”、“棉袜”、“图书馆开放时间”、“旧金山天气”、“我附近的咖啡馆”以及其他让谷歌成为数十亿人进入互联网的大门的查询。
我试用 搜索时有时会感到相当沮丧,这让我意识到自己一天要进行多少次关键字搜索。我无法使用简短的查询来可靠地找到信息,多年来我第一次真正渴望使用 搜索。
别误会,谷歌的质量在过去十年左右有所下降,主要是因为它充斥着广告和搜索引擎优化。尽管如此,我在测试期间一直在单独的窗口中打开谷歌,因为 搜索无法为我提供正确的答案或网页。
谁会获胜: 搜索还是简短查询?
我输入“掘金队比分”来查看丹佛掘金队和明尼苏达森林狼队之间的 NBA 比赛直播情况。 告诉我掘金队正在获胜,尽管他们实际上正在输球,并且根据谷歌同时显示的结果,森林狼队的得分比实际得分低 10 分。
搜索(左)与 搜索(右)对 NBA 实时比分的比较。(图片来源: ZEFF/)
还有一次,我尝试了“今日收益”,以查看哪些公司将在周五公布可能影响股价的季度业绩。 告诉我,苹果和亚马逊将在周五公布业绩,尽管这两家公司在前一天已经公布了业绩。换句话说,它产生了幻觉并编造了信息。
在另一项测试中,我输入了一位技术高管的姓名来查找他们的联系信息。 向我展示了此人 个人资料的摘要,并幻觉出了一个指向其 页面的链接,当我点击该链接时,出现了一条错误消息。
还有一次,我输入了“宽松牛仔裤”,希望可以买到。 首先向我描述了什么是宽松牛仔裤(我不需要这个定义),并建议我去 买一条不错的牛仔裤。
搜索“宽松牛仔裤”。(图片来源: ZEFF/)
我可以继续说下去,但你明白我的意思了。使用 的第一天,我遇到的就是无效链接、幻觉和随机答案。
也许有一天会成为“谷歌杀手”,但不是今天
对于 来说,这次发布意义重大。Sam 称赞这项功能“非常好”,尽管他以淡化其初创公司的人工智能能力而闻名。这次的不同之处可能与搜索是互联网上最大的业务之一有关,而 的版本可能对其最大竞争对手谷歌构成真正的威胁。
公平地说, 搜索是一款已有 25 年历史的产品,而 搜索则是全新的。 在一篇博客文章中表示,它计划在未来几个月内根据用户反馈改进该功能,而且这很可能是这家初创公司的一个重要投资领域。
非常适合较长的问题。(图片来源: ZEFF/)
值得称赞的是, 在回答长篇大论的研究问题方面相当出色。像“哪个美国职业体育联盟的多样性最强?”这样的问题,你无法用谷歌轻松回答,但 非常擅长抓取多个网站,并在几秒钟内为你提供不错的答案。( 在这些问题上也相当出色,其搜索产品已经存在一年多了。)
与已经具备网络访问权限的传统版 相比,搜索功能感觉像是浏览网络的更好界面。现在 获取信息的来源有了更清晰的链接 - 对于新闻报道, 将利用与其达成所有许可协议的媒体公司。
搜索利用 的新闻合作伙伴(图片来源: ZEFF/)
问题是,谷歌上的大多数搜索都不是那么长的问题。为了真正取代谷歌, 需要改进人们在日常生活中已经进行的这些更实用、更简短的搜索。
并不羞于承认 在处理短查询时遇到困难。
发言人 Niko Felix 在发给 的电子邮件声明中表示:“通过 搜索,我们观察到用户开始以比过去使用其他搜索工具更自然的方式提问。”“与此同时,网页导航查询往往很短,也很常见。我们计划随着时间的推移改善这些类型查询的体验。”
话虽如此,这些简短的关键字查询已经让谷歌变得不可或缺,而且在 解决这些问题之前,谷歌仍然会成为许多人的主流。
可能难以处理这些简短的查询,原因有几个。首先, 依赖于 Bing,而后者被广泛认为是比 更差的引擎。第二个原因是,大型语言模型可能不太适合这些简短的提示。LLM 通常需要完全写出的问题才能产生有效的答案。在 能够很好地进行此类搜索之前,可能需要进行一些重新提示——将简短的查询作为较长的问题通过 LLM 运行。
尽管 刚刚发布其搜索产品,但 自己的 AI 搜索工具每周已经处理 1 亿次搜索查询。 也被称为“谷歌杀手”,但它在短查询方面也遇到了同样的问题。
首席执行官 本周早些时候在 大会上讨论了人们使用其产品与使用 搜索的不同之处:“ 查询的平均字数在 2 到 3 个之间。在 中,平均字数在 10 到 11 个之间。因此,显然, 更多的用途是人们可以直接提出问题。而在 上,你只需输入几个关键词即可立即获得某个链接。”
我认为,人们不使用这些产品进行网页导航这一事实比 或 承认的更严重。这意味着 和 不会取代 最擅长的任务:网页导航。
相反,这些人工智能产品填补了一个新的空白,让传统搜索中被埋没的信息浮出水面。别误会我的意思,这本身就很有价值。
和 都声称他们将努力提高这些简短查询的效率。在此之前,我认为这两种产品都无法完全取代谷歌。如果 想要取代互联网的门槛,它必须创造一个更好的门槛。