txori: (Default)
[personal profile] txori
А почему Яндекс на запрос "полкизация" находит вхождения слова "поляризация"? Хоть в кавычках, хоть с плюсиком, хоть с восклицательным знаком...

Date: 2007-12-26 12:47 pm (UTC)
From: [identity profile] thunderburst.livejournal.com
а что это?.. :)

Date: 2007-12-27 10:14 am (UTC)
From: [identity profile] txori.livejournal.com
Ну вот есть же английское to shelve the books, в смысле поставить на полку:-)
На самом деле, мне надо было слово на -ция без аналога на -tion в других языках.

Date: 2007-12-26 01:08 pm (UTC)
From: [identity profile] iad.livejournal.com
А потому что ну ее, эту полкизацию.

(А если серьезно — ни разу не найдя того, что Вы задали, он решает, что надо поискать что-то похожее.)

Date: 2007-12-27 10:15 am (UTC)
From: [identity profile] txori.livejournal.com
На чашкизацию и ложкизацию он честно ничего не выдавал!
Впрочем, если интересно, вот тут ниже в комментах появился инсайдер и всё объяснил.

Date: 2007-12-27 01:15 pm (UTC)
From: [identity profile] iad.livejournal.com
Объяснить-то он все объяснил, но мне от этого стало грустно. Я думал, что если в ответ на полкизацию выдается поляризация, это наверняка значит, что полкизации нигде нет (во всяком случае, он ее не нашел). А из сказанного ниже следует, что такой вывод неверен: может, Яndex где-то и нашел страницу с полкизацией, но поскольку в его понятиях это та же поляризация, он сперва выдаст несколько десятков других страниц, более понравившихся ему, а ту потом. Или все же не так?

Гм. «поисковики делают не для нужд лингвистов, а для тех, кто ищет информацию» … А лингвисты разве не информацию ищут?

Date: 2007-12-27 01:21 pm (UTC)
From: [identity profile] txori.livejournal.com
Да, как тут тоже уже заметили, хотелось бы иметь возможность отключать эту функцию, как есть возможность отключать использование морфологии, искать стоп-слова и т.п.
Лингвисты ищут специфическую информацию, тут я неточно выразилась, конечно:-) Поисковики для тех, кто ищет, что написано, ане как написано.

Date: 2007-12-26 01:49 pm (UTC)
From: [identity profile] bdag-med.livejournal.com
клево - гугл находит только твой пост, настоящее новое слово :)

Date: 2007-12-27 10:25 am (UTC)
From: [identity profile] txori.livejournal.com
Ну вот блин, я тут писала длинный коммент про флешмоб по распространению слова "полкизация" и шустрость индексирования Гугла, но ЖЖ его съел:-(

А в Яндексе мой пост можно увидеть только в Блогах.

Date: 2007-12-27 10:30 am (UTC)
From: [identity profile] bdag-med.livejournal.com
Это Дух русского языка действует так.

Date: 2007-12-26 03:25 pm (UTC)
From: [identity profile] fbmk.livejournal.com
А зачем тебе слово "полкизация"?
Но забавно оно, конечно. [profile] iseg о таком не предупреждал...

Date: 2007-12-27 10:26 am (UTC)
From: [identity profile] txori.livejournal.com
Мне надо было слово на -ция без аналога на -tion в других языках. Я доказывала, что в русском есть суффикс -ция как самостоятельный суфффикс, а не как только средство калькирования.

Про то, почему такой эффект получается, комментом ниже объяснил инсайдер.

Date: 2007-12-27 10:27 am (UTC)
From: [identity profile] fbmk.livejournal.com
да, я уже видел, не вчитался тогда в ультракороткую запись iseg, хотя видел в ленте

Date: 2007-12-26 04:26 pm (UTC)
From: (Anonymous)
Привет, это maksa, мне не хочется логиниться. windysmile попросил помочь.

Думаю, это результат введения новой версии исправления опечаток. Пресс-релиза и записи в корпоративном блоге об этом я не нашёл, так что только тут — http://iseg.livejournal.com/98253.html. Как я понимаю, одним из побочных эффектов стала жёсткая привязка некоторых словоформ, например, приведённых в записи. Я посмотрел, ещё и «полнизация», например, связана с «полонизацией».

Вообще новый алгоритм исправления опечаток сильно лучше старого, он правильно определяет гораздо больше опечаток (по ощущениям, 80-90 % вместо 30-40 раньше), но отдельных вещей я понять не могу. Почему привязали к словарным словам формы, которые вообще не встречаются или встречаются предельно редко, как в этом примере? И почему не привязали друг к другу очевидные синонимы, например, «бренд» и «брэнд», «Фудзияма» и «Фуджияма», «придти» и «прийти»… Вот Гугл, например, считает, что одними и теми же словами являются «Юля» и «Юлия», «Наталья» и «Наталия», «IE7» и «Internet Explorer 7». Иногда в этом виден перебор, но логика понятна. А тут — ни полноты, ни точности.

Date: 2007-12-26 06:33 pm (UTC)
From: [identity profile] nevmenandr.livejournal.com
Да, алгоритм этот действительно очень хорош, но как-то всё-таки хотелось иногда быть и свободным от него. Мне всегда казалось, что таким способом освободиться от машинной логики в пользу решения какой-то нетривиальной задачи в данном случае будут кавычки. Вот то, что Яндекс не слушается кавычек и всё равно не ищет "полкизацию" меня искренне и не скажу, что приятно, удивило.

Это всё перекликается и с сегодняшним случаем на зачёте, когда студентка говоря об авторе "Слова о полку Игореве" назвала его "автором полка".

Date: 2007-12-27 10:31 am (UTC)
From: [identity profile] txori.livejournal.com
Поисковики делают не для лигнвистов, а для людей, окторые ищут информацию и товары, как неоднократно при мне напоминали лингвистам те, кто имеет отношение к поиску в Интернете.

Date: 2007-12-27 10:32 am (UTC)
From: [identity profile] txori.livejournal.com
Про полк забавно:)
Хотя в данном случае это были не полкИ, а пОлки

Date: 2007-12-27 10:30 am (UTC)
From: [identity profile] txori.livejournal.com
Да, понятно, спасибо.
Ясно, что такая система требует некоторого времени на настройку и отладку, брэ/енды, наверное, тоже когда-то приведут к соответствию.
Я уже не первый раз напоминаю себе, что поисковики делают не для нужд лингвистов, а для тех, кто ищет информацию и товары:-) Потому что такая функция без возможности отключения приведёт к полной невозможности использования Яндекса при выяснении, как же всё-таки больше народу пишет, брэнл или бренд.

А Гугл, кстати, не отсекает просто все окончания начисто вместо проверки парадигмы? Это объяснило бы, почему Юля и Юлия, Наталья и Наталия одно слово.

Date: 2007-12-26 08:05 pm (UTC)
From: [identity profile] petrark.livejournal.com
Аня, с Рождеством!
А что такое полкизация?

Date: 2007-12-27 10:13 am (UTC)
From: [identity profile] txori.livejournal.com
Спасибо, и тебя тоже:-)
Под полкизацией я имела в виду какой-то аналог shelving the books, но в принципе искала слова на -ция без иностранных источников на -tion.

Date: 2007-12-27 10:14 am (UTC)
From: [identity profile] petrark.livejournal.com
Ого. Ошкафливание и ополчение :-)

Date: 2007-12-27 10:15 am (UTC)
From: [identity profile] petrark.livejournal.com
А когда будет фсимовский cfp?

Date: 2007-12-27 10:32 am (UTC)
From: [identity profile] txori.livejournal.com
OMG!
Игорь его так и не отправил что ли?!

Date: 2007-12-27 12:30 pm (UTC)
From: [identity profile] petrark.livejournal.com
Я не видел. По крайней мере, в mosling не было. И с нами не обсуждалось - хотя по-моему, обсуждать тут нечего. Я его вчера видел (Игоря), но поговорить об этом мы не успели. Кажется, ты можешь его контактно каузировать, сделай это, если можно :-)

Date: 2007-12-27 12:45 pm (UTC)
From: [identity profile] txori.livejournal.com
Мне он пару дней назад показывал (по причине как раз контактности), я сказала, что всё ОК и срочно в номер. Непонятно, почему этого не произошло.
И сейчас контактно не могу, Игоря нет

Date: 2007-12-27 12:52 pm (UTC)
From: [identity profile] txori.livejournal.com
А, вот, он говорит, в Лингвист уже запустил. Могу отправить в мослинг, или лучше сначала на русский перевести?

Date: 2007-12-27 02:50 pm (UTC)
From: [identity profile] petrark.livejournal.com
Если можно, переведите. В Лингвистлисте не пропустили ли - у них каникулы...

Date: 2007-12-29 03:49 pm (UTC)
From: [identity profile] iseg.livejournal.com
1. ничего не нашли, поэтому заменили.
2. то что не сказали про п.1 - наша ошибка, будем говорить очень скоро
3. ваш журнал тоже найдем (уже находим в ППБ а будем выдавать и в общем поиске)

с уважением

Date: 2007-12-29 03:52 pm (UTC)
From: [identity profile] txori.livejournal.com
А отключать, отключать эту замену можно будет?

Спасибо за ответ, польщена

Profile

txori: (Default)
Anna

April 2021

S M T W T F S
    123
45678910
111213141516 17
18192021222324
252627282930 

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 27th, 2026 03:38 pm
Powered by Dreamwidth Studios