你可知道互联网99%的内容,你无法直接搜索到
世界上至少有45亿个网站可以被搜索引擎索引,我们将其称为表网,这个数字听起来确实很庞大。相比于表网数量,虽然深网无法与其相比,但是,深网所包含的信息确是表网无法比拟的。
深网
深网,即深层网络,又称:不可见网、隐藏网,是指不能被标准搜索引擎索引的万维网内容,只可使用有Tor(洋葱路由)技术的浏览器进入。深网的内容隐藏在HTTP窗体后面,包括许多非常常见的用途,如网络邮件、网络银行,以及用户必须付费并受到付费墙保护的服务,如视频点播、一些网络杂志和报纸等,您需要知道URL或具有访问权限才能查看深层网站。
计算机科学家迈克尔·伯格曼将当今万维网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索,巨量的表面信息固然可以通过这种方式被查找得到,可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉。绝大部分这些隐藏的信息是须通过动态请求产生的网页信息,而标准的搜索引擎却无法对其进行查找。传统的搜索引擎“看”不到,也获取不了这些存在于深网的内容,除非通过特定的搜查这些页面才会动态产生。于是相对的,深网就隐藏了起来。
深网表网信息量对比
深网上的公共信息是通常定义的万维网的400到550倍
深网包含7500兆字节的信息,相比之下,表网只有19兆字节的信息
深网包含将近5500亿个文档,而表网只有10亿个
60个最大的深网站点总共包含约750兆字节的信息,这些信息大约是表网的40倍
平均而言,深网每月的流量比表网高出50%,并且与表网网站的关联度也高于表网网站;然而,典型的深度网站并不为互联网搜索公众所熟知
深网是互联网上增长最快的,其往往比传统的表层网站更窄,内容更深
深网的总质量内容是表网的1000到2000倍,内容与每一个信息需求、市场和领域都高度相关
超过一半的深网内容位于特定主题的数据库中
欢迎来到暗网
看到这,有的人是不是认为深网就是暗网?其实暗网和深网不是同义词。暗网是由加密站点组成的深层网络的一小部分,在这里,几乎完全匿名。加密的网站缺少通常使网站可识别的DNS和IP地址。更令人困惑的是:要访问它们,用户必须使用加密软件来屏蔽他们的IP地址,这也使得用户很难识别。当然,这样一种网站从事非法商品和服务再适合不过了。
例如,已经不复存在的“丝绸之路”虽然表面上是一家在线药店,但是实际上,网站销售从大麻到海洛因各种毒品,并且还为杀手、恐怖分子和其他罪犯提供各种资源。仅仅访问该网站就会被联邦调查局视为威胁。“丝绸之路”仅仅是这种类型暗网之一,当然还有许多。
Tor技术
该技术可以被视为暗网的核心技术。但是极为讽刺的是该技术最初是由美国海军研发出来的,更为确切的说是由两位麻省理工的学生加入该项目搞出来的,其旨在保护人们在互联网的行踪隐私,此隐私可不是人们认为的那种“隐私”,而是让情报人员的网上活动不被他国监控。直到今天,此技术也助长了各种暗网以及网上非法活动的崛起。
Tor是一个三重代理,Tor 客户端先与目录服务器通信获得全球活动中继节点信息,然后再随机选择三个节点组成电路(入口节点、中间节点和出口节点),用户流量跳跃这三个节点之后最终到达目标网站服务器,在这种设计下,电路中没有任何一个节点知道用户完整的信息,因此实现了匿名通信。为了加强安全性,Tor 每隔十分钟就会再重新选择三个节点以规避流量分析和蜜罐节点。那么它真的安全吗?首先,Tor 是开源的,任何人都可以去验证 Tor 中是否存在着后门,而至今没有后门被发现的报道,但这只能说明 Tor 并没有“故意的不安全”,世界绝不存在绝对安全的系统!要不然“丝绸之路”的创始人是如何被抓的。
不论是表网,深网还是甚至是暗网,对于我们来说,要做的就是远离黑暗网络。