и вот что получилось: из тех 3000 слов 710 отсутствует в первых 10к. это более 23% на секундочку!!!
У Пола Нэйшена списки word families. Также он дает списки headwords - корневых слов. Если просматривать эти последние то многих слов не встретишь:
basewrd3.txt:
ABANDON 0
ABANDONED 0
ABANDONING 0
ABANDONMENT 0
ABANDONS 0
ABORT 0
ABORTED 0
ABORTING 0
ABORTION 0
ABORTIONS 0
ABORTIVE 0
ABORTIVELY 0
ABORTS 0
ABROAD 0
ABSENCE 0
ABSENCES 0
ABSORB 0
ABSORBANCE 0
ABSORBED 0
ABSORBENCY 0
ABSORBENT 0
ABSORBER 0
ABSORBERS 0
ABSORBING 0
ABSORBS 0
ABSORPTION 0
ABSORPTIONS 0
ABSORPTIVE 0
В списке headwords перечислены только выделенные слова.
К тому же многие составные слова выделены в отдельный список:
basewrd33.txt
ABSENTMINDED 0
ABSENTMINDEDLY 0
ABSENTMINDEDNESS 0
ADMAN 0
ADMEN 0
AFORETHOUGHT 0
AFTERBIRTH 0
AFTERBURNER 0
AFTERBURNERS 0
absentminded достаточно частотное слово но его нет в 25 тысячах. Оно только в этом - 33 - списке.
Также в 25 тысячах не встретить названий стран, городов и национальностей. Они в отдельном списке:
basewrd31.txt
AFRICA 0
AFRICAN 0
AFRICANIST 0
AFRICANISTS 0
AFRICANS 0
AFRIQUE 0
AFRICANA 0
AFRIKANER 0
AFRIKAAN 0
AFRIKAANER 0
AFRIKAANERS 0
AFRIKAANS 0
AFRIKANERDOM 0
AFRIKANERS 0
И надо учесть что список EF не частотный так же как и The Oxford 3000. Они составляются не по частотности а по полезности.