这个世界还需要另外一个搜索引擎吗?十年前如果问自己,这个问题可能有点无厘头。百分之九十九的情况下,在搜索栏中打入关键字,google或者百度 几乎有求必应,而且准确无比,这些没有什么进一步苛责的。不过今天看来,这个问题越来越实际。
使用者多少也许都有感觉,Google 的搜索结果不再那么令人惊叹。关键字广告、Google 号称“投其所好”为使用者挑出的新闻摘要、人物介绍、知识图卡等等占据半个版面,滑到第后半时,看到的可能是一整排伪装成实用信息的商品推荐文章、条列式文章跟内容农场,五花八门的建议每个似乎都在声称“选我、选我”;而点击之后,结果往往令人失望,必须再度返回上一页重新选择搜索。于是,我们学习更多精准搜索的技巧,或者安装浏览器外挂设定黑名单,把搜索变得直接一点。
从使用者、新闻媒体到 seo 专家,都有同样的困扰。Dmitri Brereton 任职于人才招募软件公司 Gem,擅长信息检索与组织。2022 年 2 月他发表文章,指称“Google 搜索正在死亡”,搜索食谱或商品时,如果不加上如“site:reddit.com”限缩范围,只会得到一堆无法信任的无效信息。文中引述了 Y Combinator 合伙人 Michael Seibel 今年初在 Twitter 上公开抱怨:医疗信息、产品信息或食谱在 Google 上的搜索结果简直一团混乱,甚至说“是时候轮到 Google 被挑战了”。
确实,有些新兴搜索引擎正在诞生,但事实上多数搜索引擎并未意图“挑战”市场份额 85% 的 Google,而是提供人们一个回归信息搜索本质的选择:让人们找到实用或感兴趣的信息。
本文介绍的五个搜索引擎,虽然索引来源多数仍建立在科技巨头 Google、微软 Bing 和百度的搜索技术之上,但都强调隐私至上,不追踪使用者资料。DuckDuckGo 倡议隐私 14 年,Neeva 个人信息与网络空间并行搜索,you.com 把细碎的网络以网站为单位让使用者建立合辑,Kagi 则将“少即是多”的概念用在搜索结果上,最后一个介绍的 Marginalia 则是特立独行,要让被主流搜索引擎排挤的内容重新浮现。
这些搜索引擎结果排序与信息呈现、以及高度客制化功能,既实用也很有特色,让我相信自己不一定非得依靠“Google 或者百度”的庇护,而是可以让自己的网络探索之旅更安全、更有效,而且更好玩。
DuckDuckGo:不储存、不分析,从十年前就知道与使用者保持距离
曾经主动找寻 Google 替代品的读者,对 DuckDuckGo(DDG) 肯定不陌生,或许此刻它就是你的预设搜索引擎。早在 2008 年,在使用者们授权各种个人信息给 Google,以换取快速精准的搜索便利性时,DDG 以“绝不搜集使用者信息”的宗旨而问世。今年使用者已突破一亿大关,而且持续成长中。
历经十几年进化,DDG 而且从未打破“不储存搜索记录、不分析使用者”的承诺,无论是谁,只要搜索相同的字词,内容跟排序都是一致的。当然,使用者可以根据国家、语言等条件缩小搜索结果,也有图片、新闻等过滤选项。DDG 跟 Google 的排版类似,搜索结果列表一目了然,也有类似知识面板、快速解答的内容,但喧嚣程度或者噪音程度相对较低。
除了隐私至上,DDG 也陆续推出许多新颖的搜索模式,像是如任意门般的“!bang”语法,汇集了一万多个搜索引擎,亚马逊、IMDb 或食谱,在搜索框中输入特定符号与网站简写,就能越过 DDG 的搜索结果页面,直接进到该网站的搜索结果或结果列表。例如,在 DDG 搜索框中输入“!w”后面接上关键字,就会直接引导到维基百科的搜索结果页面。
DDG 的营收以广告为主,但广告内容跟随搜索字词的相关性变动,而不是使用者的浏览足迹,像是搜索 “俄乌冲突” ,出现的就是战争的相关信息,不会莫名跑出几天前浏览的跑车或洗碗机购物信息。如果完全不想看到广告,还可以在设定页面里面全面禁止显示(但帮忙传播出去,让越多人使用,结果也会越准确。)
Neeva:生产力至上,一键搜索网络信息与个人云端文件夹、通讯软件内容
“搜索”这个动作其实无所不在,除了在网络上搜索,我们也经常在通讯软件找信息、在云端文件夹里面找文件,Neeva 是一个整合个人与网络空间的搜索引擎。它整合个人 App 与网络,输入关键字后,不但有网络搜索结果,还有一个 “个人(personal)” 标签,显示相关的云端文件、文件如 PDF 内容、工作信息,不必再分别到各自的 app 搜索。
Neeva 也让使用者设定让人信赖网站来源,在搜索结果列表中,就会优先呈现这些网站的内容;另外,Neeva 还替使用者规划了一个 “个人空间(Spaces)” ,提供类似 Google 简讯关键字通知、同时也能储存搜索词组,并且能够分组、公开分享列表,对于经常需要吸收特定消息的使用者,应该颇为实用,而且可以弥补有些网站不提供 RSS 的遗憾和不足。
Neeva 强调“隐私至上”,保证不卖广告、不卖资料,但依然会储存使用者的搜索纪录,以作为最佳化搜索结果的材料。Neeva 的网站说明中坦率说道“对使用者一无所知的搜索引擎,也就无法进步” 。 不过使用者的搜索资料预设 90 天删除,如果完全不想留下纪录,Neeva 也提供无痕模式操作。
Neeva 是由 “看不下去了” 的 Google 元老级员工所成立,共同创办人 Sridhar Ramaswamy 在 Google 价值千亿美元的广告部门待过十几年时间,看尽 Google 走向 “获利是唯一目标” 的不归路,在给出更多广告、还是更正确的搜索结果之间挣扎,他有一种万劫不复的感觉。Neevs 可以做到科技巨头不见得不想尝试,但在成长规模优先的思维下,他们就是难以做到的尝试。如同 Hey 将 EmAIl 服务彻底改头换面,他们相信,自己也能在搜索这个领域提供崭新体验,而且使用者会为其买单。
目前 Neeva 提供免费版,个人搜索范围支支持Google、Dropbox 与 office 365,付费版则可以串接 Slack、Notion、Figma 等等软件。月费 4.95 美元(35元人民币左右)、年费 49.95 美元(347 元人民币左右)。
这个时代不缺信息,缺的可能是为为信息分门别类的功夫。
You.com 采用微软搜索引擎 Bing 的 API,但以个别网站为单位,为信息预先分类。使用者可以设定信任或常用的网站来源,或在搜索过程中对网站投下 “赞成票” 或 “反对票” ,下次搜索时便会优先显示从这些网站提取的信息,即便使用者没有做出反应、投下反对票的网站,也不会完全隔离,只是排序往后,相较 Google 黑魔法般为使用者挑出最具代表性、最正确的搜索解答,you.com 手动模式自助挑选网站来源,反而比较令人安心。
网络新闻编辑也许维基百科、Hacker News、Reddit 和科技部落格、新闻网站搜索资料 ,软件工程师也许会想在 Stack Overflow、Github 以及网站文件找答案,运动竞技粉丝则可以选择 ESPN、Bleacher Repost 等专业网站。
you.com 的介面设计十分华丽,网站首页 “You” 色彩斑斓,搜索结果列表刻意突显网站来源,各个网站 logo 交互并行显示,加上每个搜索结果都格状设计为主,并且显示标题与长达 4、50 字的摘要,还以不同样式区分,对于已经习惯搜索结果 10 则一页、表列式呈现的使用者来说,刚开始可能有点无法适应。
与 Neeva 一样,you.com 幕后开发者也很有来头,共同创办人 Richard Socher 学术背景深厚,过去在 Salesforce 担任首席科学家,并曾于美国斯坦福大学担任计算机科学部主任兼任教授。you.com 去年获得老板 Marc Benioff 2000 万美元注资。目前 you.com 没有广告、也不收费,但未来不排除以非追踪型广告作为获利模式。
Kagi:一次只显示 30 个最佳结果、功能高度客制化
Kagi 是另外一个备受瞩目的搜索引擎,融合了传统搜索引擎 Google、Bing,也索引维基百科、DeepL 等等垂直网站的信息,来源丰富多元、且信任度高。搜索结果大致分成三个区域,除了搜索结果之外,还有从 Inte.NET Archive 网页时光机服务(Wayback machine)选出的网页,将可能已消失的信息重新曝光;也有如 Quick Answers 跟 Interesting Finds 的内容。搜索结果数量重质不重复,通常限制在 30 个以内,大概两页就能浏览完,不用担心被广告转移焦点。
在搜索引擎上,选择戴上 Lenses(透镜)检视资料。例如输入近来讨论度极高的知识管理管理软件“logseq”,选择以论坛(Discussion)滤镜检视,Reddit、Hacker News 上的相关心得,甚至另外一个经常被拿来比较的个人知识管理 Obsidian 的使用者论坛,都会显示在搜索结果上。人们对社群讨论的内容信任度,比名人加持、专家背书来得高,就像从前在网络上搜索商品评论时,我们会在商品后面加上个人常规关键字,寻找真实的使用心得一样。
在搜索结果旁边,有一个图像提示,标注这个网站的流量排名、分类属性、语言、速度、埋了多少广告追踪器等等信息,怀疑网站来源有问题时,点击前可以先三思。使用者还能选择直接在搜索结果中显示的频率,封锁该网络,或者优先收藏,主动客制化自己的搜索结果页面。
除此之外,在个人页面设定中,Kagi 可以设定网站黑名单,还提供可以干脆地排除所有影片媒体、维基百科或清单式文章等等选项,不需要额外安装外挂,就能把搜索引擎捏塑成自己心中的模样。
另外一个在个人设定页面中,格外有趣的信息是,有个名为 Consumption(消费)的标签,使用者可以查看自己每日搜索总量,以及为了执行这些搜索花掉的成本。提供这个信息的目的,让使用者作为未来是否付费支持 Kagi 的决策考量更实际,同时也提醒了我们,快速的搜索是有代价的,包含人力、机器使用、运算等等成本,毫秒间获取的信息,都来之不易。
Kagi 的创办人 Vladimir Prelovac 在软件公司工作 15 年,曾在 GoDaddy 担任产品副总裁。在成立 Kagi 以及浏览器 Orion 之前,他已经有开发非商业性的搜索引擎 Teclis、非商业新闻搜索引擎 TinyGem、书籍管理工具等等业余爱好,这些个人探索都成了供给 Kagi 精良搜索结果的贡献。目的都是希望为他的三个“孩子”带来“更人性、更友善的网络环境”。
目前 Kagi 搜索引擎正在进行 beta 测试,填写问卷、收到邀请函,就能体验这个让你回到最初使用 Google 那种信息尚未爆炸、搜索结果量小而美的感觉。待正式版推出后,预计单月价格大概会分成入门版 10 美元与进阶版 20-30 美元。
“边角料”搜索引擎:找到那些没被 SEO 驯服的有趣内容
前面分享的搜索引擎,大致上都还是以提供准确的搜索结果为卖点;但也有一些人偏偏就是好奇聚光灯以外的内容。Marginalia 就是为这些杳无人迹的网站而生的搜索引擎,这个词的意思是“人们在书本或文件上用来注记的空白边距地带”。在这个搜索引擎里,主流搜索引擎偏好的图文并茂、影音丰富、迎合行动装置体验的内容,会受到降级惩罚,网站内容越纯越好,纯文字是它最满意的格式。在这些搜索引擎里面找资料,不但可以免除所有对多媒体广告的恐惧心理,更有许多意想不到的搜索结果,因为这些网站内容通常不太在乎搜索引擎的喜好,在主流的搜索状态下,自然没有优势。
站长写道,打造这个搜索引擎,并未试图成为一个不偏不倚、呈现正确信息的网站,反而就是要让“边角料”浮出水面,为寻找边缘内容的浏览者跟信息建造者创造连结。就如 90 年代那时,网络上遍布趣味十足、为了个人嗜好架设的小型网站散布各处,2022 年奇趣的网站可能没有比较少,这个网站反而让我们发现网络的多样面貌。
以 Marginalia 搜索时以单字组成词组,比输入「问句」准确。可惜的是中文支援程度不佳,但若善用英文关键字,很容易发现有意思的文章或网站(试试 time management,这个搜索引擎会召唤出许多被主流搜索引擎掩埋或忽视的观点)。搜索结果也能以尽可能优先显示冷门中的热门网站、或是冷门优先,也能选择实验中的演算法,把自己抛进网络的魔幻荒野。
此外,站主还设置了“Random”页面,随机展示纯文字为主的网站,大脑枯竭连搜索词汇都想不出来的时候,到这个页面晃晃肯定有新的收获。纯文字网页不只白底、黑字与深蓝色连结,许多网页光使用文字、排版、色彩,完全不需华丽的动态效果,就能在第一眼展现出生动的个性,对已看腻套版网站的人来说,又可能会突破自己对网站设计的想像。
类似的搜索引擎还有 Millions Shorts,让使用者设定筛除 Google 前一千个或前一百个搜索结果,发现那些零优化、但也许信息依然独特、丰富的网站。
站在巨人肩膀上,搜索引擎把搜索结果决定权交给使用者
本文介绍的搜索引擎都很尊重个人隐私,也不靠出售个人隐私获得商业利益。在功能上各有特色,但共通点都是重新诠释了“个人化”的定义:个人化不一定得如 Google 扮演上帝迎合每个人、想方设法训练程式投其所好,这些搜索引擎把偏好交给使用者决定,把搜索引擎变成自己能够掌握的工具。
有强烈信息整合检索需求的情境不妨尝试 Neeva,注重搜索合理性与效率、以及高度客制化需求,Kagi 值得一试。当然,若要看到各种事件最新发展,Google 敏捷的爬虫还是最能满足当下渴望。正如有些使用者对万能的东西过敏,偏爱目的单一的工具,使用搜索引擎时,也能创造属于自己的组合技。