[database] 영어 단어 데이터베이스를 얻는 방법? [닫은]

영어로 된 모든 유효한 단어의 데이터베이스가 필요합니다. /usr/share/dict/words파일을 확인 했는데 100k 미만의 단어가 포함되어 있습니다. Wikipedia에 따르면 영어에는 475k 단어가 있습니다. 전체 목록 (미국 철자법)은 어디서 구할 수 있습니까?

또한 아시아 및 유럽 언어를 포함한 다른 언어로 된 단어를 제공하는 단일 웹 사이트가 있습니까?

편집 : 추가하는 것을 잊었습니다. 이름 등이 필요하지 않으며 유효한 영어 단어 만 있습니다.



답변

WordNet 데이터베이스가 도움이 될 수 있습니다. 나는 한때 단어와 단어와 단어 사이의 단순하고 복잡한 연관을 다루는 Firefox 애드온에서 일했습니다. WordNet이 매우 유용 할 것 같습니다.

여기는 MySQL 형식 입니다. 그리고이 하나 (웹 아카이브 링크)는 이전 Wordnet 2.0 데이터 대신 Wordnet v3.0 데이터를 사용합니다.


답변

infochimps.org에서 필요한 것을 찾을 수 있습니다 .

무료로 다운로드 할 수있는 간단한 350,000 개의 단어 (예 : 비화합물) 목록이 있습니다.

단어 목록-350,000 개 이상의 간단한 영어 단어

다른 언어와 관련하여 위키 낱말 사전을 둘러보고 싶을 수도 있습니다. 다음은 모든 데이터베이스 백업에 대한 링크입니다 . 정보가 구성되지 않았지만 언어가있는 경우 SQL 형식으로 데이터를 다운로드 할 수 있습니다.


답변

나는 여기에 언급 된 http://wordlist.sourceforge.net/을 보지 못했지만 , 나는 이런 것을 찾고 있다면 시작할 것입니다 (그리고이 질문을 우연히 만났을 때였습니다).

원하는 것을 찾을 수없고 원하는 단어가 영어 단어 목록 인 경우 원하는 단어를 인식하는 방법을 설명하는 데 시간을 더 투자해야합니다.


답변

“완전한”목록은 없습니다. 사람들마다 다른 측정 방법이 있습니다. 예를 들어 속어, 신학, 여러 단어 구, 불쾌감을주는 용어, 외국어, 동사 활용 등이 있습니다. 어떤 사람들은 심지어 백만 단어를 세었 습니다 ! 따라서 단어 목록에서 원하는 것을 결정해야합니다.


답변

Mozilla, OpenOffice 및 기타 여러 소프트웨어에서 사용하는 *spell en-GB 사전을 확인할 수 있습니다 .


답변

이 목록에 필요한 것을 말하지 않았습니다. 비밀번호 확인을위한 블랙리스트로 사용 된 것이 충분하다면 cracklib 이 적합 할 수 있습니다. 150 만 단어 이상이 포함되어 있습니다.


답변