1. 首页
  2. 问答百科
  3. 正文

什么是语义搜索?

  语义搜索是现代搜索引擎用来返回最相关搜索结果的一种信息检索过程。它侧重于搜索查询背后的意图,而不是传统的关键词匹配。该术语来自语言学的一个分支,称为语义学,它涉及对意图的研究。

  尽管有无数的变量在起作用,但是语义搜索的原理,为什么需要它,以及它如何被影响,是很容易理解的。

  ◆用户使用的语言往往与所需内容不一样

  ◆很多搜索都在无意中产生歧义

  ◆了解词汇层级和实体关系的需要

  ◆反映个人兴趣和趋势的需要

  用户使用的语言往往与所需内容不一样

  更糟糕的是,我们有时甚至不知道如何正确表达我们想搜索的是什么。比方说,您听到了一首陌生的歌曲,您喜欢它,于是开始在Google上随机搜索歌词,直到您终于找到它为止。

  表达同一个想法的方式太多了,搜索引擎需要处理所有这些方式。搜索引擎需要能够根据两者的意义,将其索引中的内容与您的搜索查询进行匹配。

  无论这听起来多么具有挑战性,这仅仅是个开始。

  很多搜索都在无意中产生歧义

  大约40%的英语单词是多义词——它们有两个或更多的含义。这可以说是语义搜索要解决的最重大的挑战。例如,仅在美国,关键词 “python “的月搜索量就有53.3万次。“python"可能指的是编程语言, 但科技行业以外的人很可能会想到真正的蟒蛇,或者是传奇的英国喜剧团。

  这里的问题是,如果没有上下文,单词很少有明确的含义。在多义词的基础上,有无数的名词也可以同时是形容词,动词,或者两者兼而有之。而且我们还只是在谈论字面意思的范畴。如果我们深入研究其推论的话(譬如讽刺的时候),就会变得更加有趣。

  在语义学中,语境就是一切,这将为我们引出了接下来的两点。

  了解词汇层级和实体关系的需要

  词汇层级说明了单词之间的关系。比如伴侣这个词对妻子,男友,配偶等词来说是上一级的(上位词)。

  如前所述,我们的查询通常与所需内容的确切词组不匹配。 知道“负担得起”是介于便宜,中档和合理价格之间的任何事物,这一点至关重要。

  如果所有的这些语言的复杂性还不够的话,我们还必须再深入一些。

  反映个人兴趣和趋势的需要

  无论我们多么不喜欢任何使用我们个人数据的方式,至少这对搜索引擎来说是有用的。Google结合了有限的数据和您的搜索历史,以提供更准确和个性化的搜索结果。

  我们都知道这一点。只要在搜索栏中输入任何类型的服务,您就会得到本地化的结果。但更吸引人的是,谷歌能够根据动态变化的搜索意图临时调整搜索结果。

  哪些Google技术在语义搜索的工作方式中发挥了作用?

  Google不断推出算法更新和新技术,以进一步提高其理解自然语言和搜索意图的能力。

  语义搜索发展到今天的成果,一共经历了四个重要的里程碑。

  ◆知识图谱

  ◆蜂鸟算法

  ◆RankBrain算法

  ◆BERT模型

  知识图谱

  Google的知识图谱于2012年发布,是实体及实体之间关系的知识库。简而言之,这是一项启动并实现了从关键字匹配到语义匹配转变的技术。

  向知识图谱提供信息的方法主要有两种:

  ◆结构化数据

  ◆从文本中提取实体

  对于第二点,搜索引擎需要理解自然语言。这时候,下面三个算法的更新就会发挥作用。

  蜂鸟算法

  早在2013年,Google推出了一个名为Hummingbird(蜂鸟)的搜索算法,以返回更好的搜索结果。这个算法尤其有助于应对复杂的搜索查询。

  蜂鸟算法是第一个重大更新,它更加强调搜索请求背后的意图,而非单个关键词。它极速催化了“为话题而创作内容”的热潮,而不是“为单个关键词而写作”。

  RankBrain算法

  如果您曾经遇到过“潜在语义索引”或LSI关键词这一短语,可以忽略这个了。Google用RankBrain算法解决了LSI产生的问题。而我们前面已经讨论过这个问题。是关于搜索请求中所使用的语言和所需内容之间的不匹配。

  Google的RankBrain采用了优于LSI的技术。通俗地说,通过使用复杂的机器学习算法,RankBrain甚至可以理解不熟悉的单词和短语的含义。而考虑到15%的搜索请求都是新的,这可是一项巨大的工程。

  我们可以认为RankBrain是蜂鸟算法的升级版,而不是一个独立的搜索算法。它是最强的排名信号之一,但您能主动为其做出的优化,也就只有满足搜索意图了。

  BERT模型

  基于Transformer的双向编码器表示(BERT)这一自然语言表示模型,是对语义搜索运作方式的最新的重大升级。自2019年底以来,它影响了大约10%的查询。

  BERT可以提高对长而复杂的句子以及查询的理解。它是一种处理歧义和细微差别的解决方案,因为它力图更好地理解单词的上下文。

  虽然您并不能做什么事情来优化BERT本身,但简单地了解下它的含义和作用总是好的。

    延伸阅读

  • 小程序名字修改的技巧规则

    我们都知道名字的意义,名称作为陌生人最先的认知,在物质喧嚣的时代,如何从众多名称中脱颖而出给陌人生留下一个良好且深刻的印象,这至关重要。随着小程序开发越来越多,运营者在给小程序...

  • 小程序商城怎么运营?

    小程序商城在当今电商领域日益受到瞩目,成功运营这样一个平台对于每个经营者而言都至关重要。那么,我们该如何着手呢?一、确立品牌方向首先,我们要清晰地定义自己的品牌在市场中的位置。...

  • 自建商城运营秘籍,吸引顾客有妙招!

    新建网站的运营与维护之道一、明确核心产品的市场定位要让新建的商城网站在竞争激烈的市场中脱颖而出,关键在于精准地定位核心产品。选择具有市场潜力的热销产品,并突出其独特之处,是吸引...

  • 小程序商城推广完全指南

    随着小程序商城的日益兴起,如何在竞争激烈的市场中脱颖而出成为了关键。小程序商城的推广方式多种多样,以下是一些有效的策略:1.公众号与小程序的结合:商家可以将小程序与公众号绑定,...

  • 推广引流方法有哪些,裂变营销什么意思

    推广引流方法有哪些,裂变营销什么意思除了各公域平台,另一个比较重要的引流场景,就是在微信中。一方面做信社交性强,对于身边用友的链接更紧密,微信上也会以群、公众号的形式聚集一群有...

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.lnbdc.com/article/11133.html

(function(){ var src = (document.location.protocol == "http:") ? "http://js.passport.qihucdn.com/11.0.1.js?1d7dde81dc0903e04d3ac0b9599444f6":"https://jspassport.ssl.qhimg.com/11.0.1.js?1d7dde81dc0903e04d3ac0b9599444f6"; document.write('<\/mip-script>'); })(); (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();