http://dmitriy-sivak.livejournal.com/ ([identity profile] dmitriy-sivak.livejournal.com) wrote in [community profile] useless_faq2010-01-27 01:34 pm

Английский и русский. Длина слов.

Как известно, один и тот же текст на русском и английском языке будет иметь разную длину в написании, так как большинство английских слов короче. Чаще всего английский текст будет короче.
Влияет ли это на остальную жизнь англоязычного населения? Быстрее ли они заканчивают аналогичную беседу двух друзей в баре, к примеру, чем двое русскоязычных людей? Быстрее ли проходят презентации, речи и другие разговоры, чем точно такие же у нас или у народов, где слова еще длиннее?

Могло ли это в конце-концов повлиять на экономическое развитие? И у какого народа самые короткие слова?

[identity profile] tljustenkhabl.livejournal.com 2010-01-27 02:06 pm (UTC)(link)
Спициально проверял эту теорию на библейских книгах... русские переводы оказывались короче.
Я думаю из множества артиклей в английском тексте.
Короче русского оказались только переводы на языки, не использующие при письме буквы для огласовки - арабский, например.

[identity profile] tljustenkhabl.livejournal.com 2010-01-27 02:07 pm (UTC)(link)
очень короткие слова я скандинавов (опять же основываюсь на статистике библейских текстов и определением что слова разделяются пробелом и/или заком препинания)

[identity profile] tljustenkhabl.livejournal.com 2010-01-27 02:13 pm (UTC)(link)
в смысле еще короче, чем в английском.. это думаю из-за того, что у них есть специальные дикритические знаки, а не разного рода двухбуквия для передачи одного звука, как напрример th,ph, gh, ea, ee, oo и тому подобное

[identity profile] drauk.livejournal.com 2010-01-28 01:45 pm (UTC)(link)
Ммм, в скандинавских языках (датский, шведский и оба норвежских) нет диакритических знаков. Их "местные" буквы обозначают уникальные для этих языков звуки.

[identity profile] tljustenkhabl.livejournal.com 2010-01-28 01:56 pm (UTC)(link)
"в лингвистике — различные надстрочные, подстрочные, реже внутристрочные знаки, применяемые в буквенных (в том числе консонантных) и слоговых системах письма не как самостоятельные обозначения звуков, а для изменения или уточнения значения других знаков;"

http://ru.wikipedia.org/wiki/Диакритический_знак

диагональное перечёркивание
короткое: U+0337,
длинное: U+0338 ø в датском и норвежском ø означает то же, что в немецком ö

хотя да, их не много все-таки... Ну стало быть просто, безотносительно диакритиков норвежские слова короче.

[identity profile] drauk.livejournal.com 2010-01-28 02:01 pm (UTC)(link)
Слушайте, ну не надо мне цитировать РУССКУЮ википедию. å, ä, ö, ø - отдельные БУКВЫ соотвествующих языков, они входят в нормальный алфавит языка. В отличии от немецкого умляута, который есть истинный диакритический знак.

[identity profile] tljustenkhabl.livejournal.com 2010-01-28 02:03 pm (UTC)(link)
почему это не надо? надо.. Пусть входят, диакритчность ЗНАКа это не отменяет...

[identity profile] tljustenkhabl.livejournal.com 2010-01-28 02:07 pm (UTC)(link)
Но, впрочем ладно, давайте я процитирую английскую википедию:
http://en.wikipedia.org/wiki/Diacritic


Languages with letters containing diacritics

The following languages have letters that contain diacritics that are considered independent letters distinct from those without diacritics.
Germanic
Danish and Norwegian uses additional characters like the o-slash ø and the a-circle å. These letters are collated after z and æ, in the order ø, å.
Faroese uses acute accents and other special letters. All are considered separate letters and have their own place in the alphabet: á, í, ó, ú, ý, and ø.
Icelandic uses acute accents and other special letters. All are considered separate letters, and have their own place in the alphabet: á, é, í, ó, ú, ý, and ö.
Among the Scandinavian languages, Danish and Norwegian have long used o-slash (ø), but have more recently incorporated a-ring (å) after Swedish example. Historically the å has developed from a ligature by writing a small a on top of the letter a; if an å character is unavailable, some Scandinavian languages allow the substitution of a doubled a. The Scandinavian languages collate these letters after z, but have different collation standards.
Swedish uses characters identical to a-diaeresis (ä) and o-diaeresis (ö) in the place of ash and o-slash in addition to the a-circle (å). Historically the diaeresis for the Swedish letters ä and ö, like the German umlaut, has developed from a small gothic e written on top of the letters. These letters are collated after z, in the order å, ä, ö.

[identity profile] psilogic.livejournal.com 2010-01-27 02:59 pm (UTC)(link)
Посмотрел сейчас файлы компьютерных программ, где представлены одни и те же куски текстов на двух языках. Отмечу, что программисты в интерфейсе стараются выражать мысли максимально лаконично, но без потери важной информации. Программисты во всех примерах русские, т.е., по идее, должны более умело сжимать информацию на русском языке.

файл                размер
vpnagent_eng.ini.t  63337
vpnagent_rus.ini.t  81094
vpncli_eng.ini.t    25946
vpncli_rus.ini.t    33199
bard_loc.eng.loc    38709
bard_loc.rus.loc    43631
gwgui_loc.eng.loc   12599
gwgui_loc.rus.loc   13916
gwmm_loc.eng.loc    18815
gwmm_loc.rus.loc    20448


[identity profile] tljustenkhabl.livejournal.com 2010-01-27 03:04 pm (UTC)(link)
Могу предположить, что в данной сфере будут чаще использоваться заимствованные слова, кторые обычно длинее, чем такие core-слова как "свет", "хлеб", "рыба", "бог", "мать", "отец", "дух" и т.п., которые были использованы в библейских текстах...

[identity profile] psilogic.livejournal.com 2010-01-27 03:20 pm (UTC)(link)
Я согласен, что древние слова короче более поздних. Но насчет заимствования... сейчас погляжу...

0 class класс
0 object объект
0 dump дамп
-1 stack стек
-1 code код
+3 linker линковщик
+2 compiler компилятор
-1 certificate сертификат
-1 track трек
-1 option опция
0 amplitude амплитуда
0 auto авто
-1 echo эхо
0 filter фильтр
+1 harmonic гармоника
0 file файл
+1 license лицензия
0 marker маркер
-1 method метод
0 menu меню

Приблизительно 1 буква в 1 букву.

[identity profile] tljustenkhabl.livejournal.com 2010-01-28 11:02 am (UTC)(link)
вот моя статистика по какому-то из евангелий:
https://spreadsheets.google.com/ccc?key=0AujxtBB8IRaZcE9DZWxURHR2cnZodjJsUFdJSWh1SHc&hl=en

[identity profile] tyc-tyc.livejournal.com 2010-01-28 12:08 pm (UTC)(link)
Жалко, нельзя сделать сортировку по каждому столбцу в отдельности.
Помню, как-то вы уже показывали эту статистику, когда мы скорость чтения обсуждали.

[identity profile] tyc-tyc.livejournal.com 2010-01-28 12:10 pm (UTC)(link)
упс. простите, разобрался.

[identity profile] tljustenkhabl.livejournal.com 2010-01-27 03:09 pm (UTC)(link)
Собственно, можете сами проверить: http://bowfree.com/

[identity profile] aterentiev.livejournal.com 2010-01-27 10:09 pm (UTC)(link)
а не было желания проверить не длину слов в буквах латиницы/кириллицы даже с учетом диакритических знаков, а в виде звуков, например по международному фонетическому алфавиту?

[identity profile] tljustenkhabl.livejournal.com 2010-01-28 07:17 am (UTC)(link)
ну.. иногда мало желания, нужно еще вдохновение и время.. :)