catpad: (Default)
[personal profile] catpad

Когда случайно видишь простые и гениальные идеи, пройти мимо них просто не получается. Так и тянет написать.
Вот одна из таких идей: http://recaptcha.net

Если кто не знает, что такое captcha, то это такая штука с размазанными буквами-цифрами, которые обычно надо вводить при регистрации на какой-либо сайт. Это на самом деле маленький тест Тьюринга, который позволяет определить, где человек, а где компьютер. Сама по себе задача придумать идеальную капчу очень интересна, и есть очень даже неплохие идеи - но это отдельная тема.

Так вот, что придумали в проекте reCaptcha. Подсчитано, что каждый день люди решают примерно 60 миллионов капчей. И вот они решили поставить это бессмысленное занятие на службу распознавания просканированных книг.
Идея такова: несколько OCR программ распознают один и тот же текст. Если они не могут согласиться насчёт какого-либо слова, это слово поступает в качестве задания для капчи и даётся людям при регистрации на какой-нибудь сайт, участвующий в проекте. Проблема тут в том, что значение этого слова пока что никому не известно, а поэтому для распознавания даётся ещё и контрольное слово. Если человек распознал контрольное слово, то его ответ на слово под вопросом принимается в качестве кандидата. Потом это же слово даётся для распознавания ещё нескольким людям, и если они все распознали его одинаково, слово утверждается, и само становится контрольным.

Таким образом, люди, сами того не подозревая, помогают OCR-программам в распознавании книг. Польза выходит всем: бессмысленное действие поставлено на службу благому делу. Ни одно усилие в этой цепочке действий не пропадает зря. По-моему, это гениально.

Date: 2008-09-30 09:01 am (UTC)
From: [identity profile] n0xi0uzz.livejournal.com
Да, действительно гениальная и красивая идея.

Date: 2008-09-30 09:32 am (UTC)
From: [identity profile] dixi.livejournal.com
вот только очень уж она неудобна для распознаания человеком, буквы очень сильно слипаются, растискиваются и иногда успешно проходишь раза только с третьего.

Date: 2008-09-30 11:38 am (UTC)
From: [identity profile] iime.livejournal.com
Феерически, да.

Date: 2008-09-30 01:49 pm (UTC)
From: [identity profile] softmaster.livejournal.com
вариант применения - на безобидном сервисе давать людям каптчу от другого сервиса, для использования ботами %)

Date: 2008-09-30 02:22 pm (UTC)
From: [identity profile] dzigoro.livejournal.com
очень нра. спасибо за инфу

Date: 2008-09-30 10:42 pm (UTC)
From: [identity profile] zhenyach.livejournal.com
Такое давно существует.

Date: 2008-10-01 01:37 am (UTC)
From: [identity profile] yatur.livejournal.com
Как-то к Эдисону пришел гость и за разговором пожаловался
- вот скажите: вы такой знаменитый физик, а не можете отрегулировать пружину на калитке. Она у вас очень тугая, что ее очень трудно открыть
- вы ошибаетесь - ответил Эдисон. С пружиной все в порядке. Открывая калитку,
вы накачали в мой резервуар 10 литров воды.

:-)

Date: 2008-10-01 01:43 am (UTC)
From: [identity profile] yatur.livejournal.com
Это точно. Капчи, ИМХО, обречены на вымирание в течении нескольких лет. Если раньше было довольно легко создать капчу, легко проходимую для людей и непреодлимую для роботов, то сегодня ситуация изменилась. Капчи, которые не по зубам роботам все чаще не по зубам и людям. Когда роботы начнут отгадывать капчи лучше, чем, скажем 20% людей, тест потеряет всякий смысл.

Date: 2008-10-01 02:04 am (UTC)
From: [identity profile] catpad.livejournal.com
Посмотрите на ссылку, которую я привёл в качестве новой идеи для капчи. Никакой робот это не угадает, а для людей это ничего не стоит.

Date: 2008-10-01 02:10 am (UTC)
From: [identity profile] yatur.livejournal.com
1. Почему робот не угадает?

2. Что значит "ничего не стоит"? Подсовывают какой-то размытый текст, который надо, напрягая глаза, расшифровывать. Я что-то упускаю?

Date: 2008-10-01 02:25 am (UTC)
From: [identity profile] catpad.livejournal.com
Вот ссылка:
http://spamfizzle.com/CAPTCHA.aspx

Это совершенно другая идея.

Date: 2008-10-01 08:03 am (UTC)
From: [identity profile] green-fr.livejournal.com
Так идея, которую [livejournal.com profile] catpad тут озвучил и состоит в автоматическом отборе капч, которые оказались не по зубам роботам :-) Не надо ничего генерить, потёртые книги сами дадут достаточное количество плохих картинок!

Date: 2008-10-01 03:41 pm (UTC)
From: [identity profile] yatur.livejournal.com
Отобрать капчи, которые не по зубам роботам - это только половина задачи. Надо еще, чтобы они были по зубам людям. Причем, желательно, 99% или больше. А вот этого как раз никто не гарантирует.

Date: 2008-10-01 03:49 pm (UTC)
From: [identity profile] yatur.livejournal.com
Эта идея вызывает у меня внутренний протест. Почему я должен доказывать кому-то, что я не робот, разгадывая какие-то утомительные шарады? Плюс, я уверен, что в итоге 3Д шарады постигнет та же гонка вооружений, что и 2Д. Переход в 3Д - это всего лишь технический шаг в этой гонке. Он не решает принципиальную проблему.

Date: 2008-10-02 12:42 am (UTC)
From: [identity profile] catpad.livejournal.com
А разбор смазанных текстов - это не утомительные шарады с целью доказать, что вы не робот ? Что-то я не вижу здесь логики, почему именно эта идея вызывает протест.

И что по-вашему может быть принципиальным решением проблемы ? Что есть единственный и неопровержимый способ отличить человека от робота ?

Date: 2008-10-02 01:13 am (UTC)
From: [identity profile] yatur.livejournal.com
> А разбор смазанных текстов - это не утомительные шарады

Утомнительные. Я ж выше писал.

> Что-то я не вижу здесь логики,

Потому что ее здесь нет :-)

> почему именно эта идея вызывает протест.

Вы, судя по всему, исходите из предпосылки, что протест вызывает эта и только эта идея. Это не совсем верно. Протест вызывает любая утомительная работа по доказательству, что я не верблюд. В том числе разбор смазаных текстов.

> И что по-вашему может быть принципиальным решением проблемы ?

Если б я знал, я б, наверное, уже делал деньги на этой идее :-)

> Что есть единственный и неопровержимый способ отличить
> человека от робота ?

Единственный и неопровержимый? Нет такого, наверное.

Способ не обязан быть единственным и неопровержимым. Но он должен быть достаточно точным и ненапряжным для пользователя. Скажем, какой-нибудь цифровой сертификат за подписью Большого Брата, который установлен в браузере и говорит "мамой клянусь, это человек" - абсолютно ненапряжен. Но он создаст новые проблемы - во-первых, надо найти правильного Большого Брата, во-вторых проверка на человечность требует усилий, и Большой Брат вряд ли согласится бесплатно раздавать сертификаты, в-третьих начнутся проблемы privacy, в-четвертых надо будет как-то отличать пользователя от вируса-скрипта, и в-пятых надо будет вести списки украденых сертификатов. В общем, сертификат - плохая, негодная идея. Но зато относительно ненапряжная для пользователя. :-)

Date: 2008-10-02 07:34 am (UTC)
From: [identity profile] green-fr.livejournal.com
Мне кажется, тут как раз проблем не должно быть, это же то же самое, что читать отсканированную книгу - лично у меня ни разу проблем не возникало :-)
Page generated Feb. 6th, 2026 09:47 am
Powered by Dreamwidth Studios