[identity profile] besus.livejournal.com posting in [community profile] useless_faq


Как в гугле и прочих местах организовывается проверка орфографии? Почему оно знает "хинуклидиловый" но не в курсе про "гидроксидифенилуксусной"? Второе ведь куда более понятно с точки зрения химии, ну и как-бы более логично с точки зрения химических названий. Как у них алгоритмы для таких ситуаций работают?

Date: 2016-03-31 07:43 am (UTC)
From: [identity profile] netp-npokon.livejournal.com
Это не в гугле проверка орфографии, а в вашем браузере.
В основном орфографию проверяют путем сравнения со словарем, точность же зависит от того, насколько словарь полон.
Можно предположить, что для редкоупотребимых слов в словарь попадает только начальная форма, а не все варианты в зависимости от рода, числа и падежа.
Вот, к примеру, на слово "гидроксидифенилуксусная" оно ругается?

Date: 2016-03-31 09:14 am (UTC)
From: [identity profile] chva.livejournal.com
Это только в Орфо такая навороченная система была (она в FineReader до 10-й вроде версии использовалась), что забивалась начальная форма, а остальные гетерировались на её базе. А сейчас пользовательский словарь это просто как текстовый файл и все формы слова по одной добавляются.

Date: 2016-03-31 09:37 am (UTC)
From: [identity profile] netp-npokon.livejournal.com
О том и речь. Только при этом учитывается частотность, и для редких слов многие формы не попадают.

Date: 2016-03-31 12:36 pm (UTC)
ext_1596743: (cygnus)
From: [identity profile] ez98.livejournal.com
Если оно знает слово "жид", значит это точно не гугл.

Date: 2016-03-31 08:39 am (UTC)
From: [identity profile] ooups-vl.livejournal.com
Плюсую за словарь в браузере. Фиксится это добавлением подкрашенных слов в ручную, если знаешь, что они написаны правильно.

Date: 2016-03-31 11:21 am (UTC)
From: [identity profile] sozdam-sustain.livejournal.com
Georges Bizet негодуэ. Какой такой гидроксидифенилуксусной? 2? 3? 4? или орто-?, мета-? пара-? или альфа-? Из названия не видно.Тогда хотя бы дифенилгидроксиуксусной, а лучше дифенилгликолевой, или чоужтам -прямо: бензиловой кислоты.

Date: 2016-03-31 01:04 pm (UTC)
From: [identity profile] sozdam-sustain.livejournal.com
Ага, жаль, что среди ОВ так мало забавных... У меня всякие проверки орфографии отключены раз и навсегда, так что проверять не буду. Но если хотите, введите дифенилгидроксиуксусную кислоту - это название бензиловой кислоты химически однозначное, но мало применяемое.

Date: 2016-03-31 04:05 pm (UTC)
From: [identity profile] http://users.livejournal.com/hayate_/
Это свойство программы-браузера или, скорее, операционной системы.
Стандартное поле ввода может проверять орфографию. Гугль тут должен быть ни при чем - отключите интернет и попробуйте ввести текст когда гугеля точно нету - результат должен быть такой же.

Date: 2016-03-31 04:39 pm (UTC)
ext_1775189: Bezenchuk (Bezenchuk)
From: [identity profile] spelller.livejournal.com
Ну операционка-то тут при чем...

Date: 2016-03-31 05:13 pm (UTC)
From: [identity profile] http://users.livejournal.com/hayate_/
Стандартный контрол "ввод текста" это часть операционки.

Date: 2016-03-31 05:36 pm (UTC)
ext_1775189: Bezenchuk (Bezenchuk)
From: [identity profile] spelller.livejournal.com
Common controls - это часть пользовательского интерфейса, application layer, извините. К операционке имее примерно такое же отношение, какое дизайн "торпеды" автомобиля имеет к конструкции его двигателя.
Edited Date: 2016-03-31 05:36 pm (UTC)

Date: 2016-03-31 06:51 pm (UTC)
From: [identity profile] http://users.livejournal.com/hayate_/
А какая разница, какой это layer?

Если этот функционал этот поставляется с операционкой, конечно, и если программа-браузер не использует сильно кастомизированный контрол

Date: 2016-03-31 06:58 pm (UTC)
ext_1775189: Bezenchuk (Bezenchuk)
From: [identity profile] spelller.livejournal.com
С операционкой могут поставляться игрушки типа пасьянс-косынка, солитер и майнсвиппер. А тако ж редакторы пайнт и ноутпад. Это тоже компоненты ОС, да?

Date: 2016-03-31 07:08 pm (UTC)
From: [identity profile] http://users.livejournal.com/hayate_/
Можете не напрягать свое красноречие, пытаясь подколоть - я не пользователь винды :)

Я понял и принял вашу терминологическую поправку, спасибо.

Date: 2016-03-31 07:30 pm (UTC)
ext_1775189: Bezenchuk (Bezenchuk)
From: [identity profile] spelller.livejournal.com
Да какие там подколы. Я пользователь (и даже местами администратор) Винды, СанОС/Соляриса, QNX, OS-9, AIX, Data ONTAP (более древние ОС я просто стесняюсь озвучивать)- ну и еще немного - и ни в какой из архитектур пользовательский интерфейс, в каком бы виде он ни присутствовал, не являлся частью ОС. Это же основополагающее правило - морда отдельно, содержимое отдельно... Кнут еще говорил, да и Буч тоже... Да кто только не говорил.

Date: 2016-04-01 05:23 pm (UTC)
ext_1775189: Bezenchuk (Bezenchuk)
From: [identity profile] spelller.livejournal.com
Границы "это еще ОС, а это - уже нет", конечно, несколько размыты, но тем не менее ;)
Что касается конкретного вашего случая - организация хранения данных и управление доступом к ним - то, что не совсем корректно называется "файловой системой" - несомненно, одна из базовых функций ОС.

Date: 2016-03-31 06:58 pm (UTC)
From: [identity profile] http://users.livejournal.com/hayate_/
Да, спасибо, начинаю понимать что выше speller имеет в виду.

Я просто гляжу с точки зрения OS X, и называю "операционкой" GUI-библиотеки AppKit, который всегда де-факто устанавливается как часть операционки.

В линуксах, насколько я понимаю, операционкой называют некий минимальный набор ядро-сервисы-чтотоеще, который можно запустить и уже использовать.

Date: 2016-04-01 07:43 am (UTC)
From: [identity profile] vadiman.livejournal.com

У гугла есть пользовательский словарь - одному будет ставить "гавнопидарас", второму "говнопедорас" в правильные литературные. Только кликнуть по подчёркнутому пунктиром в предиктивной строке. Это проще, чем он "знает" какое пиво в каком магазине тебе надо купить.

Date: 2016-04-01 08:01 pm (UTC)
From: [identity profile] zhegloff.livejournal.com
Тройку впереди убери, он и хинуклидиловый подчеркнет. Это баги спелчекера... или фичи...