大昭Graham

Home Essays About


学英文,懂点搜索

2019-03-20

0.

写作翻译,出问题的往往不只单词,更是搭配。凡有不懂,求诸词典是个好办法,但词典所收词、句、搭配都颇为有限,词典所不及,就要仰仗搜索引擎了。

这一篇约两年前写过,旧文新改,主要是两部分:删简措辞、补充执行细节,如怎样一键在桌面启动 Google 搜索,无法使用 Google 时的最佳替代产品等。

1.

用好「*」指令。

比如要写「狂暴的台风」,你的第一反应可能就是:a violent typhoon。但如果你对简明英文有所了解,你可能会犹疑不定:typhoon 已经包含了来势剧烈的意思,再加个 violent,会不会有重复之嫌?

于是理当查一查词典。发现,柯林斯高阶定义:a typhoon is a very violent tropical storm;朗文高阶定义:a very violent tropical storm。却都没有给出其余例句了。

violent 到底能加不能加?仍难释疑。

这时最便捷的办法当然是去看搭配词典,比如牛津英语搭配词典,但这一本,同样只列了台风的动词、介词搭配,并没有形容词。

词典无解时,最轻快的解决方式便是:直接 Google,一键解决。在搜索栏键入:

a * typhoon site:economist.com

其中,* 代表任意字符,比如搜索 b*s ,结果会包括 bus,boss,bourgeois 等;site 限定搜索站点范围,这里限定为经济学人。加起来这句话的意思就是告诉搜索引擎:

只在经济学人全站搜索包含「XXX 的台风」的句子。

Google 得到结果后,再使用 Control+F 在当前页面搜索 typhoon,所搜关键词会进一步高亮,以方便你查看结果。

可以看到,结果有 devastating/disastrous/nasty 等,可依语境备选。

为什么要加上 site 等限定语法呢?

因为不加限制时,搜索引擎拉取的结果海量庞杂,泥沙俱下,不加甄别直接先搜再选,费时费力;而搜索语法,能让你在开始搜索之前,便把「我不需要的结果」全部排除。

2.

用好「site」指令。

site 是个简单而强力的指令,用途很多,其中三种,对写作翻译大有助力。

第一,site+域名 = 在线语料库。

比如你要搜中特相关表达,便可键入:

site:language.chinadaily.com.cn

同拉取经济学人语料库类似,这个式子会帮你拉取中国日报英语点津双语资料库。中国日报的中特语料可谓土豪:历年政工报告、总理记者会、一众政府官方文件,应有尽有,还是双语对照。

另外,英语点津旗下几个栏目,如新闻热词、流行热词等,时下新词也收集不少,像「扫码打赏」「多证合一」,甚至「刷脸出厕纸」等等,雅俗共赏,童叟无欺。

搜点正经的,比如:

site:language.chinadaily.com.cn 夸夸群

从图中可以看到,中英文对应说法,已经直接筛选出来了。

另外,如果是需要关键词连在一块儿出现,还可以给关键词加个双引号框起来。

第二,打造自定义搜索引擎。

site 一次只能搜索一个网站,那搜多个时往往就要一个个网站换着来,不方便。解决这个麻烦,便可利用自定义搜索引擎,即 Google Custom Search Engine(CSE)。

CSE 本质就是一次 site 多个网站。你提前把要搜的网站确定好,生成一个 CSE,它便一次把这些站点搜全,省去手动逐个更换。

比如我自己做了一个 搜新闻期刊的 CSE,集合了几个主流新闻网站,如经济学人、纽约时报、路透社、BBC、CNN 等。同搜索 Google 主站是一样的,键入关键词直接回车即可,效果如图:

可以看到,前几条结果便来自 CNN、BBC 等预先限定的站点。这样的好处是确保搜索结果足够精确,质量不高的语料直接一开始便滤去了。

第三,利用「site+域名后缀」批量获取结果。

域名后缀往往自带含义,比如 gov 是政府网站常用域名,org 是各类组织常用域名(如联合国),edu 则是学校常用。

我们便可利用这一特点来搜索,比如,要了解各部委、省市政府对比特币的态度,可以用 比特币 site:.gov.cn ,了解各大院校的党建活动,可以用 抄党章 site:.edu.cn ,了解英国关于移民的风向,可以用 immigration site:.uk

3.

多个指令并用,精准定位文本。

写作、翻译,甚至雅思、托福备考,往往需要阅读大量某个主题的平行文本,但怎样找到高质量平行文本,是个值得考究的问题。比如了解「极端天气」主题,你想搜到「联合国关于极端天气的官方文件」,应该怎么办呢?

直接搜索「联合国」「极端天气」也不是不行,只不过无关条目多,筛选成本多,也不怎么搜得到英文文件,不佳。还是要从搜索语法入手,可先定思路,将搜索目标处理成:

找到标题含有「极端天气」文字的联合国官方 PDF 文件。

为什么?

标题含有关键词的文件,同我们要搜的内容更紧密相关;官方定档文件,PDF 格式居多,也更正式,并且可直接下载。

思路明确,式子就简单了:

intitle:extreme weather site:un.org filetype:pdf

intitle 指关键字包含在标题,filetype 指定所需格式,如搜索 Word 文档可加 pdf 换成 doc。结果如下:

只有三条,似乎不够用。是搜索限定过于精确了吗?

并不是。

我们要查的是极端天气,直接去 UN 官网找,资料自然不多,应当去的是联合国底下的世界气象组织。于是式子换成:

allintitle:extreme weather site:wmo.int filetype:pdf

allintitle 就是字面意思:all-in-title,进一步限定搜索,指明后面接的所有关键词都必须包含在标题,类似给标题加双引号,再将域名换为世界气象组织网站,看结果:

总共 32 条结果,质量不错,无需二次筛选,直接点开阅读即可。

4.

补充三点执行细节。

1)Yandex.com

如果你无法使用 Google,推荐替代产品:Yandex.com。

Yandex 是俄罗斯最大搜索引擎,世界排名第五,搜索结果比较接近 Google,搜索语法也与 Google 大致相同。并且,如不习惯写搜索式子,还可直接在搜索页面点击高级搜索选项(右上角「设置」图标),即可添加时间、语言、日期等搜索条件。

2)高频输入交给机器

site 语法实用,但每次都要带上域名,次次输入如果都要靠人力重复,还是蛮费事的,可以通过软件设置来解决。

比如,macOS 有 aText、Alfred、Keyboard Maestro 等应用,可以制作快捷输入词条,比如我设定当我键入;se 时,电脑便自动将这几个字母自动替换为 site:economist.com

Windows 系统下,可以下载 PhraseExpress 实现类似效果,不过 PhraseExpress 功能较多,如果你只需要简单快捷输入,也可直接在搜狗输入法等应用中设置个性短语,一样可以实现网站域名快捷输入。

3)桌面一键直达 Google

搜索是高频操作,但通常却要经过:「打开浏览器,打开搜索引擎网站,等待加载完毕,键入关键词,回车搜索」等数个步骤,才能得到结果。虽然也不那么费事,但作为高频操作,值得优化。

比如 macOS 中,可以通过 Alfred、LaunchBar 等应用在桌面便调出搜索栏,键入关键词,直接搜索即可:

Windows 系统下也有 Listary、Wox 等应用可实现同样效果,如下图为 Wox 截图:

一键呼出 Wox,输入指令 g (表示 Google),再键入搜索关键词,回车即可。其中关键词、网站等都可自定义,比如你可以添加 Yandex 搜索并将指令设为 y

5.

虽然用怎样的搜索技巧,并不像用哪个搜索引擎一样,可能事关性命,但查词、搜索的每个步骤每个细节,优化后节省下来的都是工作时间,纯粹而宝贵。

对待这样的事,不如就宁愿偏执一点?