[identity profile] winzilla.livejournal.com posting in [community profile] useless_faq
Возможно ли теоретически создание алгоритма, определяющего основную мысль текста?

т.е. ту самую основную мысль, которую учителя русского языка и литературы заставляют искать детей во всем - от коротких стихов до безразмерной классической прозы

Date: 2006-08-16 04:12 pm (UTC)
From: [identity profile] backa.livejournal.com
У разных людей основная мысль может получиться разной, имхо. :/

Date: 2006-08-16 04:12 pm (UTC)
From: [identity profile] escritora.livejournal.com
Имхо если долго тренироваться, становишься в этом вопросе как фотоаппарат с автофокусом...
А алгоритм - вряд ли.

Date: 2006-08-16 04:43 pm (UTC)
From: [identity profile] -zerkalo-.livejournal.com
то есть постоянно промахиваешься? :)

Date: 2006-08-16 04:47 pm (UTC)
From: [identity profile] escritora.livejournal.com
То есть попадаешь!

Date: 2006-08-16 07:39 pm (UTC)
From: [identity profile] -zerkalo-.livejournal.com
Попадаешь, да не туда.
Ммм... Вы - оптимистка!
Это мне по нраву.

Date: 2006-08-16 07:46 pm (UTC)
From: [identity profile] escritora.livejournal.com
Спасибо:)
Туда.
Смотря в чем.

Date: 2006-08-16 08:04 pm (UTC)
From: [identity profile] -zerkalo-.livejournal.com
Да я про вашу метафору все. Она ярка и красива, но неверна.
Не видел и даже не слышал об автофокусе, надежном в любой ситуации.

Date: 2006-08-16 08:50 pm (UTC)
From: [identity profile] escritora.livejournal.com
в любой ситуации - оно конечно)

вот-вот

Date: 2006-08-16 08:58 pm (UTC)
From: [identity profile] -zerkalo-.livejournal.com
Думаю, что ваш мозг гораздо надежнее, как, впрочем, и мой.)

Date: 2006-08-16 04:24 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Алгоритмы автоматического аннотирования научных статей существуют, но к художественным текстам вряд ли применим: неизвестен набор слов, которые можно было бы считать терминами, присущими данной области знания.

Date: 2006-08-16 04:29 pm (UTC)
From: [identity profile] vnarod.livejournal.com
Конечно. Я ещё 10 лет назад работал на компанию, которая делала "search engine" и это было одной из фукций. Идея проста - точно так же как оцениваются тексты в базе данных, оцениваются предложения в тексте и находятся самые главные.

Date: 2006-08-16 05:04 pm (UTC)
From: [identity profile] xataltul.livejournal.com
Слышала краем уха, что вроде как Word это как-то делает...
Опирается на то, как часто встречаются определенные слова в тексте.

Date: 2006-08-16 05:45 pm (UTC)
From: [identity profile] alsterellie.livejournal.com
Теоретически?
Тезис Чёрча—Тьюринга (http://en.wikipedia.org/wiki/Church%E2%80%93Turing_thesis) гласит, что да.

Date: 2006-08-16 06:51 pm (UTC)
From: [identity profile] ex-frol-fred761.livejournal.com
Нет, не может. "Основная мысль" --- это не предложение, которое надо найти в тексте, а идея, которую автор закладывает в произведение. Идею можно понять, только вникнув в смысл, алгоритм же на это не способен, для этого нужен разум.

Date: 2006-08-16 07:08 pm (UTC)
From: [identity profile] alsterellie.livejournal.com
Дело в том, что алгоритму нужен доступ к схожим библиотекам знаний, значений слов, даже важнее — различнейших цепочек из ассоциаций вроде синонимов, родственных значений и так далее, какой имеет человеческий мозг, у которого на накопление этих знаний было не менее десятка лет. :) Если предположить, что такую библиотеку реально создать и предоставить в пользование машине, то возникает вероятность создания алгоритма, работающего наравне со среднеклассником.

Date: 2006-08-16 07:12 pm (UTC)
From: [identity profile] http://users.livejournal.com/_maxxx_/
да да, легче будет создать самообучающийся алгоритм, чем самим создать такие базы)

Date: 2006-08-16 08:29 pm (UTC)
From: [identity profile] octavarium.livejournal.com
а в чем проблема?

Date: 2006-08-16 09:52 pm (UTC)
From: [identity profile] http://users.livejournal.com/_maxxx_/
хм.. как можно создать подобные базы знаний, как вы считаете?

Date: 2006-08-16 10:02 pm (UTC)
From: [identity profile] octavarium.livejournal.com
"нейронная сеть"
поищите в гугле

Date: 2006-08-16 11:21 pm (UTC)
From: [identity profile] http://users.livejournal.com/_maxxx_/
да я знаю что это, в институт не просто так хожу))
Ладно, не получается разговор)

Date: 2006-08-16 07:08 pm (UTC)
From: [identity profile] http://users.livejournal.com/_maxxx_/
Ну, а почему бы не создать искусственный разум? :) Скажите это не возможно?

Date: 2006-08-16 07:29 pm (UTC)
From: [identity profile] amik0.livejournal.com
Это задача из области искуственного интеллекта. Прогресс в ней весьма скуден((

Date: 2006-08-16 08:31 pm (UTC)
From: [identity profile] octavarium.livejournal.com
принципиальных трудностей нет.
вопрос только в том, кто за такой алгоритм будет платить _такие_ деньги :)

Date: 2006-08-16 09:17 pm (UTC)
From: [identity profile] mikhail-zhilin.livejournal.com
Если в тексте - можно найти основную мысль, то имхо может стоит почитать ещё и другие тексты:):):)

Помню - ещё было такое: а кто положительный герой? а кто - отрицательный?

ps возле положительного - лучше ставить плюс, возле отрицательного - минус:)

с уважением
М.

Date: 2006-08-16 09:29 pm (UTC)
From: [identity profile] churochkin.livejournal.com
теоретически возможно всё, не правда ли?

Date: 2006-08-16 10:09 pm (UTC)
From: [identity profile] ethel-baird.livejournal.com
Не думаю.

В художественной литературе главная подлянка именно в том, что каждый писатель стремится оформить основную мысль по-новому. :)

А вообще говорят, что вся литература великолепно укладывается всего в несколько сюжетов. Ну, типа "Ромео и Джульетта", "Отцы и дети"... Подробнее не скажу. Сама хотела бы знать.

Date: 2006-08-16 11:18 pm (UTC)
From: [identity profile] zhilin-mikhail.livejournal.com
Говорят, что сюжетов всего 38 :) а некоторые утверждают - что 42 :)

с уважением
М.

Date: 2006-08-16 11:20 pm (UTC)
From: [identity profile] ethel-baird.livejournal.com
Так вот хотелось бы видеть список. :)

Date: 2006-08-17 06:02 am (UTC)
From: [identity profile] lorena-alla.livejournal.com
Думаю, такой алгоритм создать вполне можно ,ну скажем начав анализ с подлежащих и сказуемых (они несут основную смысловую нагрузку),опять же проанализировав соотношение частоты повторения наиболее употребляемых в тексте слов,с среднестатистическим и т д .В технической литературе думаю полученный смысл будет близок к тому, что увидит человек,в художественной-вряд ли.Но вот в чем вопрос ,если сравнить восприятие текста одним человеком,с восприятием другим ,не будут ли они (при том что люди очень разные)столь же различаться?

Date: 2006-08-17 07:44 am (UTC)
From: [identity profile] nyurka.livejournal.com
Разумеется можно, вопрос: а на хрена?

Date: 2006-08-17 08:40 am (UTC)
From: [identity profile] meeshootkin.livejournal.com
Можно-можно. Вопрос в сложности системы и объемах финансирования.