如何获得英文单词数据库?

我需要一个英文单词的数据库。 我检查了/usr/share/dict/words文件,它包含不到100k字。 维基百科说英文有475k字。 我在哪里得到完整的列表(美国拼写)?

另外,是否有一个单独的网站也提供其他语言的文字,包括亚洲和欧洲的文字呢?

编辑:忘了添加,我不需要名称等,只是有效的英文单词。

WordNet数据库可能会有所帮助。 我曾经使用过一个Firefox插件,它处理文字和各种简单到复杂的关联。 看起来像WordNet将会对你非常有用。

这里是MySQL格式 。 而这个使用Wordnet v3.0数据 ,而不是旧的Wordnet 2.0数据:

你可以在infochimps.orgfind你需要的。

他们有一个350,000简单(即非复合)的单词免费下载的名单。

单词列表 – 350,000多个简单的英语单词

关于其他语言,您可能想要抨击维基文库。 这里是所有数据库备份的链接 – 这些信息没有组织起来,但如果他们有一种语言,你可以下载SQL格式的数据。

我没有看到这里提到的http://wordlist.sourceforge.net/ ,但如果我正在寻找这样的东西,那么我就会开始这样做(当我偶然发现这个问题时)。

如果你找不到你想要的东西,你想要的是一个英文单词列表,那么你应该花一些额外的时间来描述如何识别你想要的东西。

没有“完整”的列表。 不同的人有不同的测量方式 – 例如,可能包括俚语,新词,多词短语,冒犯性词语,外来词,动词变形等等。 有些人甚至算了一百万字 ! 所以你必须在单词列表中决定你想要什么。

你可以检查*spell Mozilla,OpenOffice,其他许多软件使用的*spell en-GB字典 。

你没有说你需要这个清单。 如果用作密码检查黑名单的东西已经足够, cracklib可能对你有好处。 它包含超过150万字。