catpad: (Default)
[personal profile] catpad

Когда случайно видишь простые и гениальные идеи, пройти мимо них просто не получается. Так и тянет написать.
Вот одна из таких идей: http://recaptcha.net

Если кто не знает, что такое captcha, то это такая штука с размазанными буквами-цифрами, которые обычно надо вводить при регистрации на какой-либо сайт. Это на самом деле маленький тест Тьюринга, который позволяет определить, где человек, а где компьютер. Сама по себе задача придумать идеальную капчу очень интересна, и есть очень даже неплохие идеи - но это отдельная тема.

Так вот, что придумали в проекте reCaptcha. Подсчитано, что каждый день люди решают примерно 60 миллионов капчей. И вот они решили поставить это бессмысленное занятие на службу распознавания просканированных книг.
Идея такова: несколько OCR программ распознают один и тот же текст. Если они не могут согласиться насчёт какого-либо слова, это слово поступает в качестве задания для капчи и даётся людям при регистрации на какой-нибудь сайт, участвующий в проекте. Проблема тут в том, что значение этого слова пока что никому не известно, а поэтому для распознавания даётся ещё и контрольное слово. Если человек распознал контрольное слово, то его ответ на слово под вопросом принимается в качестве кандидата. Потом это же слово даётся для распознавания ещё нескольким людям, и если они все распознали его одинаково, слово утверждается, и само становится контрольным.

Таким образом, люди, сами того не подозревая, помогают OCR-программам в распознавании книг. Польза выходит всем: бессмысленное действие поставлено на службу благому делу. Ни одно усилие в этой цепочке действий не пропадает зря. По-моему, это гениально.

Date: 2008-10-02 01:13 am (UTC)
From: [identity profile] yatur.livejournal.com
> А разбор смазанных текстов - это не утомительные шарады

Утомнительные. Я ж выше писал.

> Что-то я не вижу здесь логики,

Потому что ее здесь нет :-)

> почему именно эта идея вызывает протест.

Вы, судя по всему, исходите из предпосылки, что протест вызывает эта и только эта идея. Это не совсем верно. Протест вызывает любая утомительная работа по доказательству, что я не верблюд. В том числе разбор смазаных текстов.

> И что по-вашему может быть принципиальным решением проблемы ?

Если б я знал, я б, наверное, уже делал деньги на этой идее :-)

> Что есть единственный и неопровержимый способ отличить
> человека от робота ?

Единственный и неопровержимый? Нет такого, наверное.

Способ не обязан быть единственным и неопровержимым. Но он должен быть достаточно точным и ненапряжным для пользователя. Скажем, какой-нибудь цифровой сертификат за подписью Большого Брата, который установлен в браузере и говорит "мамой клянусь, это человек" - абсолютно ненапряжен. Но он создаст новые проблемы - во-первых, надо найти правильного Большого Брата, во-вторых проверка на человечность требует усилий, и Большой Брат вряд ли согласится бесплатно раздавать сертификаты, в-третьих начнутся проблемы privacy, в-четвертых надо будет как-то отличать пользователя от вируса-скрипта, и в-пятых надо будет вести списки украденых сертификатов. В общем, сертификат - плохая, негодная идея. Но зато относительно ненапряжная для пользователя. :-)
Page generated Feb. 6th, 2026 08:48 am
Powered by Dreamwidth Studios