http://winzilla.livejournal.com/ ([identity profile] winzilla.livejournal.com) wrote in [community profile] useless_faq2006-08-16 02:43 pm

(no subject)

Возможно ли теоретически создание алгоритма, определяющего основную мысль текста?

т.е. ту самую основную мысль, которую учителя русского языка и литературы заставляют искать детей во всем - от коротких стихов до безразмерной классической прозы

[identity profile] backa.livejournal.com 2006-08-16 04:12 pm (UTC)(link)
У разных людей основная мысль может получиться разной, имхо. :/

[identity profile] escritora.livejournal.com 2006-08-16 04:12 pm (UTC)(link)
Имхо если долго тренироваться, становишься в этом вопросе как фотоаппарат с автофокусом...
А алгоритм - вряд ли.

[identity profile] spamsink.livejournal.com 2006-08-16 04:24 pm (UTC)(link)
Алгоритмы автоматического аннотирования научных статей существуют, но к художественным текстам вряд ли применим: неизвестен набор слов, которые можно было бы считать терминами, присущими данной области знания.

[identity profile] vnarod.livejournal.com 2006-08-16 04:29 pm (UTC)(link)
Конечно. Я ещё 10 лет назад работал на компанию, которая делала "search engine" и это было одной из фукций. Идея проста - точно так же как оцениваются тексты в базе данных, оцениваются предложения в тексте и находятся самые главные.

[identity profile] xataltul.livejournal.com 2006-08-16 05:04 pm (UTC)(link)
Слышала краем уха, что вроде как Word это как-то делает...
Опирается на то, как часто встречаются определенные слова в тексте.

[identity profile] alsterellie.livejournal.com 2006-08-16 05:45 pm (UTC)(link)
Теоретически?
Тезис Чёрча—Тьюринга (http://en.wikipedia.org/wiki/Church%E2%80%93Turing_thesis) гласит, что да.

[identity profile] ex-frol-fred761.livejournal.com 2006-08-16 06:51 pm (UTC)(link)
Нет, не может. "Основная мысль" --- это не предложение, которое надо найти в тексте, а идея, которую автор закладывает в произведение. Идею можно понять, только вникнув в смысл, алгоритм же на это не способен, для этого нужен разум.

[identity profile] amik0.livejournal.com 2006-08-16 07:29 pm (UTC)(link)
Это задача из области искуственного интеллекта. Прогресс в ней весьма скуден((

[identity profile] octavarium.livejournal.com 2006-08-16 08:31 pm (UTC)(link)
принципиальных трудностей нет.
вопрос только в том, кто за такой алгоритм будет платить _такие_ деньги :)

[identity profile] mikhail-zhilin.livejournal.com 2006-08-16 09:17 pm (UTC)(link)
Если в тексте - можно найти основную мысль, то имхо может стоит почитать ещё и другие тексты:):):)

Помню - ещё было такое: а кто положительный герой? а кто - отрицательный?

ps возле положительного - лучше ставить плюс, возле отрицательного - минус:)

с уважением
М.

[identity profile] churochkin.livejournal.com 2006-08-16 09:29 pm (UTC)(link)
теоретически возможно всё, не правда ли?

[identity profile] ethel-baird.livejournal.com 2006-08-16 10:09 pm (UTC)(link)
Не думаю.

В художественной литературе главная подлянка именно в том, что каждый писатель стремится оформить основную мысль по-новому. :)

А вообще говорят, что вся литература великолепно укладывается всего в несколько сюжетов. Ну, типа "Ромео и Джульетта", "Отцы и дети"... Подробнее не скажу. Сама хотела бы знать.

[identity profile] lorena-alla.livejournal.com 2006-08-17 06:02 am (UTC)(link)
Думаю, такой алгоритм создать вполне можно ,ну скажем начав анализ с подлежащих и сказуемых (они несут основную смысловую нагрузку),опять же проанализировав соотношение частоты повторения наиболее употребляемых в тексте слов,с среднестатистическим и т д .В технической литературе думаю полученный смысл будет близок к тому, что увидит человек,в художественной-вряд ли.Но вот в чем вопрос ,если сравнить восприятие текста одним человеком,с восприятием другим ,не будут ли они (при том что люди очень разные)столь же различаться?

[identity profile] nyurka.livejournal.com 2006-08-17 07:44 am (UTC)(link)
Разумеется можно, вопрос: а на хрена?

[identity profile] meeshootkin.livejournal.com 2006-08-17 08:40 am (UTC)(link)
Можно-можно. Вопрос в сложности системы и объемах финансирования.