• 开始网
数字标本奖

你真的会使用搜索引擎吗?

媒体:小米运维  作者:SRE
专业号:Cary   2018/10/14 22:33:13

前言

信息化时代,搜索引擎辅助搜索已成为生活中不可分割的一个组成部分。有了搜索引擎,就不必劳心费力的考虑在哪里找到某个信息,自己想要的资料,只要一搜索,马上就会出现。我们可能会觉得使用搜索引擎是再简单不过的事情。不过,搜索实际上是一种技能,掌握越多的技巧,在除去次要信息、抓住关键问题方面做的就越好。有助于最快的速度找到自己需要的信息。

Google 搜索和大多数搜索引擎使用的是一种称为 “爬虫” 的技术,爬虫程序会频繁地访问各个网络站点,读取并捕获网页上的大部分文本信息,同时也会跟踪进入该网站的其他页面。爬虫程序在一个网站上搜集到的信息会添加到搜索引擎的网页索引中。当我们搜索的时候,搜索引擎会快速分析网页索引中的相关信息,以便找出匹配内容。搜索结果按照相关性排序,相关程度最高的网页排在最前面(主要指搜索的自然结果,而非付费结果)。搜索结果的相关性和排序有着极其复杂的算法,搜索引擎使用很多不同的相关因子来决定查询要求相关性最高的结果是什么。Google 使用的相关因子有近 300 个。复杂的算法不在本文讨论范围内,本文以 Google 搜索引擎为主,介绍一些实用技巧,帮助大家快速找到期望的资料,提升效率。

举个例子

首先举一个例子,我们在搜索引擎中检索关键字 “苹果”,检索结果 7900 万条。无论是在 Google 还是 Baidu,绝大部分结果都是和苹果公司有关的。但我们可能想要的结果只是 “水果”。

事实上,我们可以给搜索的关键字限制很多条件或分类,将检索结果控制在我们期望的范围内。例如我们将搜索关键字由 “苹果” 换为“苹果 ~ 水果”

可以看到,检索结果 200 万条,比起 7900 万条,少了很多。而且排在前面的检索结果完全是我们期望的。

波浪号是一个通配符,意思是告诉搜索引擎去检索与水果有关的页面。利用 “~” 给检索关键字限定分类或形容词的方法同样也可以用在 baidu 或 taobao 中。

下面会针对多种技巧举例说明,大家可以根据实际情况举一反三。特别注意,本文出现在检索中用的标点符号,特殊字符,均为英文格式符号,中文格式的符号无效。

1

排除不想要的结果

例如搜索 “运动相机”,但只想看 GoPro 品牌以外的产品

运动相机 -GoPro

减号 “-“可以排除我们不想要的结果

排除特定条件的格式是,关键字 - 排查条件

2

搜索特定网站的内容

例如我们想搜索清华大学发表的和关键字 “load balance“有关的论文

load balance site:lib.tsinghua.edu.cn

site: 网址,可以搜索特定网站的内容。

搜索特定网站的内容格式是,关键字 site: 网址

3

搜索特定类型的文件

例如搜索 “人类简史”pdf 格式的电子书

人类简史 filetype:pdf

filetype 可以搜索特定类型的文件,指定文件的扩展名,有助于我们快速找到想要的结果

采用这种方法可以轻松找到 word,ppt,excel 文件,甚至指定 mkv,mp4,用来快速找到想要的视频

搜索特定类型文件的格式是,关键字 filetype: 扩展名

4

限制搜索的关键字出现在网页标题中

例如搜索 “反向代理 “,期望结果是网页标题中包含关键字

intitle: 反向代理

类似的方法,可以用 intext: 关键字 搜索关键字出现在网页内容中的结果,还可以使用 allintitle 或 allintext 指定多个关键字。

例如检索网页标题中包含华为和小米 2 个关键字的页面

allintitle: 小米 华为

5

双引号的用处

搜索引擎为了提升检索速度,会将包括 “and”、“the,”、“where”、“how”、“what”、“or”,或一些单独的字母,数字忽略掉。如果想让搜索结果包含这些被忽略的部分,需要将关键字字符串放到双引号内

例如:"how to write a code" 如果没有引号,搜索的大部分结果是以 write code 为关键字。包含引号后,会确保将完整的字符串做为期望的检索结果提交给搜索引擎。

总结

类似的技巧还有很多,大家有兴趣可以自行扩展,本文介绍的是几个非常常用且核心的技巧,熟练掌握可以帮助我们除去次要信息,快速找到期望的信息,节省时间和精力。

阅读 2158
我也说两句
E-File帐号:用户名: 密码: [注册]
评论:(内容不能超过500字。)

*评论内容将在30分钟以后显示!
版权声明:
1.依据《服务条款》,本网页发布的原创作品,版权归发布者(即注册用户)所有;本网页发布的转载作品,由发布者按照互联网精神进行分享,遵守相关法律法规,无商业获利行为,无版权纠纷。
2.本网页是第三方信息存储空间,阿酷公司是网络服务提供者,服务对象为注册用户。该项服务免费,阿酷公司不向注册用户收取任何费用。
  名称:阿酷(北京)科技发展有限公司
  联系人:李女士,QQ468780427
  网络地址:www.arkoo.com
3.本网页参与各方的所有行为,完全遵守《信息网络传播权保护条例》。如有侵权行为,请权利人通知阿酷公司,阿酷公司将根据本条例第二十二条规定删除侵权作品。

 

焦点关注

© 2008-2018   开始网

基于 E-file 技术构建