Google搜索高级语法之Footprints

By | November 26, 2012

Footprints可以翻译为足迹,就是对同一套网站程序总结出一两条命令,从而能在Google中搜索到相关程序的网站资源。Google的命令很多,以下只是列出跟搜刮有关的命令和详解。最后将会有一个例子,讲解Footprints的获取过程。

命令 详解
allinanchor anchor是一处说明性的文字,它标注说明了这个链接可能跳转到其它的网页或跳转到当前网页的不同地方。当我们用allinanchor提交查询的时候,Google会限制搜索结果必须是那些在anchor文字里包含了我们所有查询关键词的网页。例[allinanchor: best museums Sydney],提交这个查询,Google仅仅会返回在网页anchor说明文字里边包含了关键词“best” “museums” 和“Sydney”的网面。
allintext 当我们用allintext提交查询的时候,Google会限制搜索结果仅仅是在网页正文里边包含了我们所有查询关键词的网页。例[allintext: travel packing list],提交这个查询,Google仅仅会返回在一个网页包含了三个关键词“travel” “packing”和“list”的网页。
allintitle 当我们用allintitle提交查询的时候,Google会限制搜索结果仅是那些在网页标题里边包含了我们所有查询关键词的网页。例[allintitle: detect plagiarism],提交这个查询,Google仅会返回在网页标题里边包含了“detect”和“plagiarism”这两个关键词的网页。
allinurl 当我们用allinurl提交查询的时候,Google会限制搜索结果仅是那些在URL(网址)里边包含了我们所有查询关键词的网页。例[allinurl: google faq],提交这个查询,Google仅会返回在URL里边包含了关键词“google”和“faq”的网页,象www.google.com/help /faq.html等的网页。
author 当我们用author进行查询的时候,Google会限制返回结果仅仅是那些在Google论坛里边,包含了特定作者的新闻文章。在这里,作者名可以是全名,也可以是一部分或邮件地址。例[children author:john author:doe]或[children author:[email protected]]返回结果将是作者John Doe 或是 [email protected]写的,关于包含关键词children的文章。
filetype 当我们在查询里边包含filetype:扩展名的时候,Google会限制查询结果仅返回特定文件类型的网页。例[资产评估 filetype:pdf],这个查询将会返回所有文件类型为pdf的资产评估信息。其它可用的特定文件类型格式查询还有doc,txt,ppt,xls.rtf,swf,ps等。
inanchor 当我们用inanchor提交查询的时候,Google会限制结果是那些在网页anchor链接里边包含了查询关键词的网页。例[restaurants inanchor:gourmet],提交这个查询,Google会查询那些在anchor信息里包含了关键词“restaurants”和关键词·“gourmet”的网页。
intext 当我们用intext进行查询的时候,Google会返回那些在文本正文里边包含了我们查询关键词的网页。[Hamish Reid intext:pandemonia],提交这个查询的时候,Google会返回在文本正文包含查询关键字pandemonia,在其它任何地方包含关键词“Hamish”和”Reid”的网页。例如在google里输入:intext:动网。将返回所有在网页正文部分包含”动网”的网页。allintext:使用方法和intext类似。(intext:后面直接跟查询关键字,不能有空格)
intitle 当我们用intitle进行查询的时候,Google会返回那些在网页标题里边包含了我们查询关键词的网页。例[flu shot intitle:help],提交这个查询,Google会返回在网页标题包含了查询关键字“help”,而在其它任何地文包含了查询关键字“flu” 和“shot”的网页。(intitle:后面也不能有空格)
inurl 当我们用inurl进行查询的时候,Google会返回那些在URL(网址)里边包含了我们查询关键词的网页。例[inurl:print site:www.ssoooo.com],提交这个查询,Google会查找www.ssoooo.com这个网站下面网址里边包含了查询关键词“print”的网页。
link 当我们使用link:URL提交查询的时候,Google会返回跟此URL做了链接的网站。例[link:www.ssoooo.com],提交这个查询,我们将得到所有跟www.ssooo.com这个网站做了链接的网站。(link是个单独的语法,只能单独使用,且后面不能跟查询关键词,只能跟 URL)
location 当我们提交location进行Google新闻查询的时候,Google仅会返回你当前指定区的跟查询关键词相关的网页。例[ queen location:canada ],提交这个查询,Google会返回加拿大的跟查询关键词“queen”相匹配的网站。
related 用related提交查询,Google会返回跟我们要查询的网站结构内容相似的一些其它网站。例[ related:www.consumerreports.org ],提交这个查询,Google会返回所有跟网站www.consumerreports.org结构内容相似的网站。我们也可以通过点击搜索结果后面的相似网页,来查询跟当前网页类似的网页。(related:后面不能跟空格)
safesearch 用safesearch提交查询的时候,Google会过滤你搜索的结果,其中过滤的内容可能包括一些色情的,暴力,赌博性质的,还有传染病毒的网页。但是它不是百分之百确保安全的。例,[safesearch:breasts]。
site 当我们用site提交查询的时候,Google会限制查询仅在某个网站,或是某个域下面进行。例[admissions site:www.lse.ac.uk],提交这个查询仅仅会搜索网站www.lse.ac.uk下面关于admissions的信息。我们还可以限制搜索仅在域下面进行,例[javascript site:edu.cn],提交这个查询,仅仅在教育网查询关于javascript的信息。(site:后面不能跟空格,且site命令可以配合其它命令进行)

还有一些Google的操作符也是很有用:

• + 把google可能忽略的字列如查询范围

•  – 把某个字忽略

• ~ 同义词

• . 单一的通配符

• * 通配符,可代表多个字母

•  “” 精确查询

实例讲解一个Footprints的分析过程。

目标:获取到能够发布的匿名Discuz论坛资源

步骤:

1、  开始,有几个实例页面;

2、  总结页面相似点,并形成Google命令;

我们发发现页面中存在着“匿名 发表于”这样的字符,还有这些页面都有“Powered by Discuz!”,当然细心的童鞋还会发现他们的url也有相似的,就是“/thread-xx-1.html”之内的,熟悉Footprints的童鞋就会加上一条inurl:” /thread-xx-1.html”。

3、  测试,并优化;

4、  重复第2、第3步。

5、  最后形成的Footprints是匿名  发表于” “Powered by Discuz!” -“您需要登录后才可以回帖” -“验证码” -” 换一个” -“验证问答”。为什么不要inurl,因为Discuz那种url形式只是其中一种,然后再利用“-”符号去除需要登录或者填写验证码的页面。

资料来源于GScraper手册,但是并不只是说搜刮使用!平时使用Goolge搜索熟悉这些命令会有很大帮助!

Leave a Reply