если вы под эффективностью имеете в виду признанный в статистике термин то да можно построить эффективные оценки точного количества слов мало того они будут несмещенные и состоятельные
Я читал, что больше всего слов в английском языке- их там около миллиона. В русском, китайском, арабском, испанском, немецком, французском и в других европейских языках количество слов находится в пределах: 100000- 300000. Вероятно, во всех языках мира, в том числе в латинском, древнегреческом, арамейском и пр. мёртвых языках за всю историю человечества не наберётся и 10 миллионов слов.
Это в зависимости, что считать словом, которое следует или не следует учитывать. Например, ручка: рука ребенка, шариковая ручка, дверная ручка и пр. Это три слова "ручка" или одно? А склонения, а суфиксы и пр.? Одно и тоже слово можно учитывать или не учитывать неоднократно.
В любом языке количество слов бесконечно, потому что любой язык позволяет аналитически образовывать новые слова. Но кроме этого, существуют языки, где слова не похожи на то, к чему мы привыкли в русском или английском. И я не имею в виду немецкий. :)
Например, в языках американских индейцев слова являются предложениями (http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%BB%D0%B8%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA).
no subject
no subject
no subject
no subject
no subject
то да можно построить эффективные оценки точного количества слов
мало того они будут несмещенные и состоятельные
no subject
no subject
no subject
Например, ручка: рука ребенка, шариковая ручка, дверная ручка и пр. Это три слова "ручка" или одно? А склонения, а суфиксы и пр.? Одно и тоже слово можно учитывать или не учитывать неоднократно.
no subject
Но кроме этого, существуют языки, где слова не похожи на то, к чему мы привыкли в русском или английском. И я не имею в виду немецкий. :)
Например, в языках американских индейцев слова являются предложениями (http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%BB%D0%B8%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA).
no subject
Изолирующие языки возмущены.
no subject
Спасибо. Интересно :)
no subject
no subject
no subject
Это ведь не 10 тысяч полностью независимых языков.
Думаю, оценку надо уменьшить на один-два порядка.
no subject
no subject
no subject