DMOZ

2025年3月17日 | 阅读 8 分钟

什么是 DMOZ

DMOZ 是“Directory Mozilla”的缩写。DMOZ 的官方名称是““Open Directory Project”(开放目录项目)”,ODP,它是主要的网络目录之一。AOL 曾拥有 DMOZ,并且由志愿者编辑组成的社区构建和维护。

DMOZ

DMOZ 使用分层本体模型来组织网站列表。相似主题的列表被归类到类别中,然后进一步细分为更小的类别。

2017 年 3 月 17 日,DMOZ 关闭,因为 AOL 不再支持该项目。在那一天,网站变成了一个单一的登陆页面,其中包含指向 DMOZ 静态存档和 DMOZ 讨论论坛的链接,并在那里决定重新启动并重新命名该目录。一个不可编辑的镜像截至 2017 年 9 月仍可在 dmoztools.net 访问。据宣布,如果 DMOZ 的 URL 未返回,将提供该目录的后继版本,名为Curlie。截至 2020 年,Curlie.org 仍然在线,履行这一职责。

换句话说,我们可以将 DMOZ 定义为一个手动分类的页面和网站目录,在添加之前会由志愿者工作人员进行审查;所有 DMOZ 列表都是免费的。

DMOZ 通常不用于搜索(如 Bing 或 Yahoo),但它对 Google 用户执行一项重要功能,因为它将 DMOZ 列表纳入了自己的目录中。这意味着 DMOZ 可能会更好地对列出的网站进行排名,因为 DMOZ 拥有很高的 PageRank。

正如我们所知,Google 排名算法的很大一部分是PageRank;因此,DMOZ 列表会提高我们网站的 PageRank,因为我们从 DMOZ 和 Google 目录中获得了链接。我们还可以从我们下载目录的网站上获得各种链接,只需将其列入 DMOZ 即可。

时间标签是列入 DMOZ 的主要问题。该网站似乎表示他们拥有近60,000 名编辑(分类和审查网站的志愿者),但实际上,这个数字反映了自网站成立以来每位编辑的数量,其中大多数已经不再参与该项目。这意味着每天都有数百或数千个提交,并且一些编辑会审查它们。每个编辑也可以在其自己定义的类别中进行审查,这意味着积压可能会经常发生。

尽管这不是延迟的唯一原因——DMOZ 经常被误认为是开始渲染。一旦您进入了错误的类别,可能需要很长时间,因为它是在队列中工作的;只有第二个编辑被拒绝并开始在堆栈底部。如果该类别仍然不正确,则可以重新开始该过程。这意味着研究并确保您提交到适当的类别至关重要。

如果您有多个网站,这会花费更多时间;因此,DMOZ 提交服务可能是一个明智的选择。它可以确保您的网站被发送到正确的类别和编辑,并防止您在等待时被困在巨大的交通拥堵中,而等待的时间却是在错误的收费站。

有时他们找不到/没有独特的内容;因此,他们会拒绝。SEO 会检查您的内容,并告诉您它是否对 DMOZ 独特。由于许多重复内容,联盟营销网站最常被拒绝。网站也可能被终止,因为提交的内容关于描述或标题不正确——这些必须遵循指南,否则编辑会拒绝请求。

DMOZ 的优点

DMOZ 有许多优点

  • 不优化、排名或推广网站,只是提供信息。
  • 比非人工编辑的目录和搜索引擎更具相关性。

DMOZ 的缺点

DMOZ 的缺点是

  • 不要花太多时间审查您的网站。

关于 DMOZ 的一些事实

关于 DMOZ 的一些事实是

  • DMOZ 与 AOL 合作。
  • 为 Google 提供搜索引擎结果。
  • 由 Netscape Communication Corporation 管理和托管。
  • 自我管理的社区。
  • 截至 2010 年 7 月 12 日,有 85,756 名编辑,4,533,456 个网站,超过 590,000 个类别。

为什么 DMOZ 对 SEO 重要

1998 年 Google 推出时,每个搜索引擎都面临一些问题:如何区分高质量内容和低质量内容?

出现了一些解决方案(这意味着将解决方案应用于数百万页面的增量成本几乎为零),但这些解决方案很容易被**操纵**。有一个例子是计算页面上特定关键字的密度,将关键字“like”密度较高的文章排名高于“Unlike”关键字密度的页面。

其他方法或解决方案提供了出色的结果,并且难以破解,但根本无法扩展。另一个例子是付钱让人阅读所有针对特定关键字的文章,并对结果进行排名。

在关键字密度方面,计算机计算能力很强,但关键字密度与内容质量的相关性很差。人类在识别高质量内容方面很出色,但与计算机的计算能力和成本相比,成本很高。Google 需要一个窍门,使其能够利用人类的能力,而无需付费。

毫无疑问,Google 的解决方案很巧妙,但是当网站管理员选择链接到 Web 上的另一个资源时,为什么该链接不被视为对其页面质量的投票?一个特定网站获得的投票越多,它在支持其他页面时放置的投票价值就越高。显然,只要这个见解应用得当,就能让 Google 在搜索引擎的竞赛中占据领先地位。

然而,在 1998 年,当时可用的计算机和算法比人类更能解决各种其他问题。例如

  • 最佳页面的摘要是什么?(这是每个精明的网站管理员都会优化的元描述)
  • 应该将特定网站放置在哪个主题类别下?
  • 谁可以信任您根据网站的价值链接到其他网站,而不是根据谁愿意支付最多的费用?

对 Google 而言,DMOZ 至关重要,因为它使他们能够回答这些问题,而这些问题是人类无法完成的。由于这对 Google 来说是必需的,因此 DMOZ.org 对 SEO 也很重要。

DMOZ,Web 目录,已死的理由

DMOZ

DMOZ,Web 目录,已死的理由有很多

1. 一条虚拟的巨蟒慢慢切断了 DMOZ 的血液供应

DMOZ 受限于主机或基础级别的分类——这从未解决过路径级别的内容。

2. 一分钱一分货

拥有免费的开源并不总是好事。历史上称为 ODP(开放目录项目),DMOZ 由全球志愿者编辑社区维护。找不到合适的激励措施来促使无偿劳动者做好工作。

3. 你睡着了就输了

DMOZ 的更新不够频繁。

4. 工业革命之于制造,正如人工智能和机器学习之于自动化

DMOZ 是一个人工编辑的网络目录,对于当今互联网的规模来说,它不是一个可扩展的商业模式。最新技术,如人工智能和机器学习,实际上可以加速数据分析。

5. 被远远甩在后面

DMOZ 未能跟上时代,仍然不准确,并报告了许多误报。更简单地说,DMOZ 变得越来越不重要。

6. 没有带来它的猎犬来嗅出坏人

DMOZ 没有提供识别恶意 URL 的级别——网络上的坏东西。恶意网页可能是网络钓鱼网页,可能会诱骗下载恶意软件和机密信息。

DMOZ 的争议和批评

一直有人声称,DMOZ 的志愿者编辑会优待自己的网站,同时又恶意打击竞争对手的良好努力。ODP 工作人员和元数据编辑(有权审查涉嫌从事不当编辑行为的志愿者编辑)提出了这些指控。

DMOZ 于 2003 年推出了一项新的公共滥用报告系统,该系统允许公众成员通过在线表格监控和报告滥用编辑行为的指控。在主流讨论论坛上对 DMOZ 涉嫌缺陷的无拘束讨论变得更加普遍。

然而,截至 2007 年 10 月,该网站的政策建议,每个站点只应提交一个类别;然而,有一个聚合网站 Topix.com,由 DMOZ 创始人 Rich Skrenta 运营,列出了超过 17,000 个条目。

在 DMOZ 的早期历史中,其员工向 CNN 或 Rolling Stone 等精选公司的代表提供了编辑访问权限,以允许他们列出自己网站上的特定页面。

直到 2004 年,CNN 文章的链接都被添加了,但在 2008 年 1 月,它们被完全从目录中移除,因为陈旧和维护工作不值得。从那时起,在编辑政策方面没有进行类似的实验。

1. 黑名单指控

DMOZ 的高级编辑能够为不同的域名添加“警告”或“不要列出”的注释,但任何编辑都不能单方面阻止某些网站的列表。带有这些注释的网站仍可能被列出并被注意,有时会在一些辩论后被删除。

2. 层级结构

到 2005 年左右,对 DMOZ 的层级结构提出了批评。许多人认为层级目录过于复杂。

3. 编辑移除程序

DMOZ 的员工和元数据编辑监督了 DMOZ 的编辑移除程序。根据 DMOZ 的官方编辑指南,编辑因不文明行为或滥用编辑实践而被删除。可能导致对志愿者编辑采取纪律处分的讨论发生在仅对元数据编辑和 DMOZ 员工开放的私人论坛中。正在接受讨论的志愿者编辑没有被告知正在采取此类行动。很少有人认为这个系统不够有趣,而是希望能够进一步加强类似于美国司法系统所进行的讨论。

4. 所有权和管理

围绕 DMOZ 的一些争议基于其所有权和管理。GnuHoo 的一些早期志愿者认为他们被欺骗加入了商业冒险。这些抱怨在不同程度上一直持续到现在。在 DMOZ 成立之初,很少考虑 DMOZ 应该如何处理,也没有官方论坛、常见问题解答或指南。总之,DMOZ 最初是一个自由竞争的平台。

随着时间的推移,ODP 的编辑论坛成为了 DMOZ 的议会。当 DMOZ 的工作人员在论坛上发表意见时,将被视为官方决定。

即便如此,DMOZ 的员工开始为信任的资深编辑提供额外的编辑权限,这些编辑能够批准新编辑的申请,这最终导致 DMOZ 编辑之间职责和特权的层级化,而 DMOZ 的付费员工对 DMOZ 的程序和政策拥有最终决定权。


下一个主题什么是 Jump Server