Про капчи и гениальные идеи
Sep. 30th, 2008 05:01 pmКогда случайно видишь простые и гениальные идеи, пройти мимо них просто не получается. Так и тянет написать.
Вот одна из таких идей: http://recaptcha.net
Если кто не знает, что такое captcha, то это такая штука с размазанными буквами-цифрами, которые обычно надо вводить при регистрации на какой-либо сайт. Это на самом деле маленький тест Тьюринга, который позволяет определить, где человек, а где компьютер. Сама по себе задача придумать идеальную капчу очень интересна, и есть очень даже неплохие идеи - но это отдельная тема.
Так вот, что придумали в проекте reCaptcha. Подсчитано, что каждый день люди решают примерно 60 миллионов капчей. И вот они решили поставить это бессмысленное занятие на службу распознавания просканированных книг.
Идея такова: несколько OCR программ распознают один и тот же текст. Если они не могут согласиться насчёт какого-либо слова, это слово поступает в качестве задания для капчи и даётся людям при регистрации на какой-нибудь сайт, участвующий в проекте. Проблема тут в том, что значение этого слова пока что никому не известно, а поэтому для распознавания даётся ещё и контрольное слово. Если человек распознал контрольное слово, то его ответ на слово под вопросом принимается в качестве кандидата. Потом это же слово даётся для распознавания ещё нескольким людям, и если они все распознали его одинаково, слово утверждается, и само становится контрольным.
Таким образом, люди, сами того не подозревая, помогают OCR-программам в распознавании книг. Польза выходит всем: бессмысленное действие поставлено на службу благому делу. Ни одно усилие в этой цепочке действий не пропадает зря. По-моему, это гениально.
no subject
Date: 2008-09-30 09:32 am (UTC)no subject
Date: 2008-10-01 01:43 am (UTC)no subject
Date: 2008-10-01 02:04 am (UTC)no subject
Date: 2008-10-01 02:10 am (UTC)2. Что значит "ничего не стоит"? Подсовывают какой-то размытый текст, который надо, напрягая глаза, расшифровывать. Я что-то упускаю?
no subject
Date: 2008-10-01 02:25 am (UTC)http://spamfizzle.com/CAPTCHA.aspx
Это совершенно другая идея.
no subject
Date: 2008-10-01 03:49 pm (UTC)no subject
Date: 2008-10-02 12:42 am (UTC)И что по-вашему может быть принципиальным решением проблемы ? Что есть единственный и неопровержимый способ отличить человека от робота ?
no subject
Date: 2008-10-02 01:13 am (UTC)Утомнительные. Я ж выше писал.
> Что-то я не вижу здесь логики,
Потому что ее здесь нет :-)
> почему именно эта идея вызывает протест.
Вы, судя по всему, исходите из предпосылки, что протест вызывает эта и только эта идея. Это не совсем верно. Протест вызывает любая утомительная работа по доказательству, что я не верблюд. В том числе разбор смазаных текстов.
> И что по-вашему может быть принципиальным решением проблемы ?
Если б я знал, я б, наверное, уже делал деньги на этой идее :-)
> Что есть единственный и неопровержимый способ отличить
> человека от робота ?
Единственный и неопровержимый? Нет такого, наверное.
Способ не обязан быть единственным и неопровержимым. Но он должен быть достаточно точным и ненапряжным для пользователя. Скажем, какой-нибудь цифровой сертификат за подписью Большого Брата, который установлен в браузере и говорит "мамой клянусь, это человек" - абсолютно ненапряжен. Но он создаст новые проблемы - во-первых, надо найти правильного Большого Брата, во-вторых проверка на человечность требует усилий, и Большой Брат вряд ли согласится бесплатно раздавать сертификаты, в-третьих начнутся проблемы privacy, в-четвертых надо будет как-то отличать пользователя от вируса-скрипта, и в-пятых надо будет вести списки украденых сертификатов. В общем, сертификат - плохая, негодная идея. Но зато относительно ненапряжная для пользователя. :-)
no subject
Date: 2008-10-01 08:03 am (UTC)no subject
Date: 2008-10-01 03:41 pm (UTC)no subject
Date: 2008-10-02 07:34 am (UTC)