http://plumbum210.livejournal.com/ ([identity profile] plumbum210.livejournal.com) wrote in [community profile] useless_faq2006-02-09 06:57 pm

Еще про клавиатуры

Как набирают всякие китайцы и японцы, уже давно разобрались. Но меня всегда больше интересовало, как набирают на многих восточно- и некоторых западноевропейских языках - там, где много диакритики. Немецкие клавиатуры я видел - но у них-то всего 3-4 буквы лишних. А как поступают те, у кого чуть не каждая вторая буква с диакритикой - чехи, например, или даже французы? Клавиш на все не напасешься, а набивать двумя символами как-то некузяво.

Более того, иногда бывает, что два вроде бы обычный символа представляют собой на самом деле одну букву (независимо входящую в алфавит, со всеми последствиями вроде сортировки): скажем, чешские ch или ť - они как-то автоматически объединяются в одну графему?

[identity profile] asder-k.livejournal.com 2006-02-09 08:05 am (UTC)(link)
у французов всего 8 букф таких

[identity profile] avoid-it.livejournal.com 2006-02-09 08:09 am (UTC)(link)
да-да, мне тоже интересно...Тайцы там какие-нибудь или соседи-грузинцы :)
Вот как?
alon_68: (Default)

[personal profile] alon_68 2006-02-09 08:18 am (UTC)(link)
При чем здесь грузины? С грузинами как раз проще всего - отдельный алфавит (тоже 33 буквы, без всякой диакритики), на таких же правах, как и кирилица.

[identity profile] homa.livejournal.com 2006-02-09 08:18 am (UTC)(link)
В комплекте клавиатурных раскладок, поставляемых с Windows, для некоторых языков есть две (или больше) раскладки: одна раскладка с так называемыми мертвыми символами (dead chars), которые набираются как префиксы и модифицируют следующую букву, другая раскладка с отдельными клавишами для модифицированных символов. Кодировка Unicode включает как символы-модификаторы, так и сами модифицированные символы, и в Unicode API есть возможность перекодировать текст с символами-модификаторами в текст с модифицированными символами и обратно. Поряд сортировки определяется специальной таблицей, которая входит в комплект языковых настроек, известный в Windows под названием locale.

[identity profile] wiggum-ralph.livejournal.com 2006-02-09 08:19 am (UTC)(link)
У них нет русских букв и с шифтом у них прибавляется еще около 25 знаков.

[identity profile] homa.livejournal.com 2006-02-09 08:22 am (UTC)(link)
Кстати, арабы по традиции используют скорописный алфавит, буквы которого меняют начертание в зависимости от положения слова (так же, как в русском рукописном тексте) и имеют до четырех вариантов написания (или пяти, если считать еще и лигатуры). Соответственно, такой текст может быть набран и закодирован двумя способами: конкретными вариантами начертания, либо базовыми символами (а системные процедуры, занимающиеся выводом текста выберут необходимый модифицированный символ на лету).

[identity profile] avoid-it.livejournal.com 2006-02-09 08:23 am (UTC)(link)
ок)
Ну а тайцы?

[identity profile] sni-ffy2.livejournal.com 2006-02-09 08:25 am (UTC)(link)
По диакритике чемпионы, видимо, все же вьетнамцы!

[identity profile] sni-ffy2.livejournal.com 2006-02-09 08:26 am (UTC)(link)
Тот же фиксированный набор козявочных букв с надстрочниками...

[identity profile] homa.livejournal.com 2006-02-09 08:28 am (UTC)(link)
Это и есть те самые мертвые символы. При нажатии клавиш, отвечающих за символы-модификаторы посылается системное сообщение WM_DEADCHAR. Будет ли его обрабатывать конкретное приложение, зависит только от него. Справка Windows рекомендует приложениям выводить в этот момент символ-модификатор, но не сдвигать каретку.

[identity profile] homa.livejournal.com 2006-02-09 08:28 am (UTC)(link)
Или лаосцы. У них еще и свой алфавит, и тоже мульон закорючек самой непредсказуемой формы.

[identity profile] avoid-it.livejournal.com 2006-02-09 08:29 am (UTC)(link)
трудно себе представить... я привезла оттуда футболку с тайским алфавитом..без ста грамм, как грится....)))

[identity profile] sni-ffy2.livejournal.com 2006-02-09 08:31 am (UTC)(link)
Я имел в виду именно на основе латиницы.
А так, да, конечно.
Лаосцы-тайцы и примкнувшие к ним кхмеры...

[identity profile] sni-ffy2.livejournal.com 2006-02-09 08:42 am (UTC)(link)
Дело лишь в желании выучить, а не в 100 граммах.
Алфавит хинди тоже замороченный, типа тайского, но я его захотел выучить и выучил :)

[identity profile] homa.livejournal.com 2006-02-09 08:45 am (UTC)(link)
Вся эта терминология появилась в докомпьютерную эру, так работали механические пишущие машинки для языков с большим количеством диакритик, например, французские. Акценты и цедили печатались отдельными клавишами, каретка при этом не сдвигалась. Программы, занимающиеся набором текста, по традиции эмулируют (в большей или меньшей степени) механические пишущие машинки и оперируют той же терминологией: отсюда табуляция, перевод каретки, даже звонок при печати в зоне переноса.

[identity profile] homa.livejournal.com 2006-02-09 09:51 am (UTC)(link)
Я же объясняю: в комплекте глифов (т.е., графических образов букв) есть как немодифицированные, так и модифицированные символы, а также сами модификаторы. Клавиатурные раскладки могут генерить как базовые символы плюс модификаторы, так и модифицированные символы. Обычно для одного языка есть несколько более-менее стандартных раскладок (и это я еще не рассматриваю нестандартные, такие как Dvorak для английского языка!), и одна из них обычно генерит модифицированные символы сразу, т.е., для символа с диакритикой выделяется отдельная клавиша, если размер клавиатуры позволяет, конечно.

[identity profile] vagulo.livejournal.com 2006-02-09 11:15 am (UTC)(link)
Опять же про любимый эсперанто.
Там 6 символов с диакритикой.
Есть драйвера (напр., Ek!), позволяющие перекодировать вводимые комбинации символов.
Напр., набираем cx, а получаем c^ (крышка над символом).
Как раз получается вариант с модификатором после символа.
Ещё варианты набора: c^, ch (но h в алфавите есть, а x отсутствует, так что удобнее x).
Там, где уникод не поддерживается, пишут просто cx (так называемая х-запись, "суррогатная").
Поддержка unicode или latin-3 проблему по большей части снимает.

[identity profile] http://users.livejournal.com/dina__/ 2006-02-09 11:24 am (UTC)(link)
На французской клавиатуре есть несколько самых используемых "заковыристых букв". А именно 5. Четыре из них расположены на цифрах. Сами цифры набираются с шифтом. К тому же есть несколько функциональных клавиш, например две точки над буквой, наживаешь на эти самые две точки, потом на букву и буква пишется с двумя точками.

Кстати, корявых букв гораздо больше восьми.

[identity profile] homa.livejournal.com 2006-02-09 11:26 am (UTC)(link)
Польская клавиатура 214 использует комплексный подход: буквы żśółą есть на клавиатуре (там же, где русские буквы хзщбю), но есть и мертвые символы: например, префиксная клавиша с тильдой позволяет набрать символы ąę. Чешская клавиатура из комплекта Windows содержит строчные символы с крючками в нижнем регистре цифровых клавиш. Как набираются заглавные варианты, не знаю. Может, просто не используются.

А Дворак — задумка была интересная, но я не видел ни одного профессионала, использующего эту раскладку.

[identity profile] vmel.livejournal.com 2006-02-09 11:29 am (UTC)(link)
Я себе в Ворде сделал макросы для ввода текста на эсперанто. Буквы с крышками получаю при одновременном нажатии с Alt. Ничуть не сложнее, чем с шифтом (а можно нажимать вместе Alt+shift+буква - получается заглавная с крышкой. Ко всему быстро привыкаешь.

А когда еще не было уникода, для эсперанто были шрифты с дополнительными буквами на месте букв, отсутствующих в эсперанто-алфавите (q,w,x,y), а также квадратных и фигурных скобок.

[identity profile] onodera.livejournal.com 2006-02-09 11:46 am (UTC)(link)
http://c2.com/cgi/wiki?DvorakKeyboard
Увидеть вы их не увидите, но почитаете.

Page 1 of 3