catpad

Когда случайно видишь простые и гениальные идеи, пройти мимо них просто не получается. Так и тянет написать.
Вот одна из таких идей: http://recaptcha.net

Если кто не знает, что такое captcha, то это такая штука с размазанными буквами-цифрами, которые обычно надо вводить при регистрации на какой-либо сайт. Это на самом деле маленький тест Тьюринга, который позволяет определить, где человек, а где компьютер. Сама по себе задача придумать идеальную капчу очень интересна, и есть очень даже неплохие идеи - но это отдельная тема.

Так вот, что придумали в проекте reCaptcha. Подсчитано, что каждый день люди решают примерно 60 миллионов капчей. И вот они решили поставить это бессмысленное занятие на службу распознавания просканированных книг.
Идея такова: несколько OCR программ распознают один и тот же текст. Если они не могут согласиться насчёт какого-либо слова, это слово поступает в качестве задания для капчи и даётся людям при регистрации на какой-нибудь сайт, участвующий в проекте. Проблема тут в том, что значение этого слова пока что никому не известно, а поэтому для распознавания даётся ещё и контрольное слово. Если человек распознал контрольное слово, то его ответ на слово под вопросом принимается в качестве кандидата. Потом это же слово даётся для распознавания ещё нескольким людям, и если они все распознали его одинаково, слово утверждается, и само становится контрольным.

Таким образом, люди, сами того не подозревая, помогают OCR-программам в распознавании книг. Польза выходит всем: бессмысленное действие поставлено на службу благому делу. Ни одно усилие в этой цепочке действий не пропадает зря. По-моему, это гениально.

Threaded | Top-Level Comments Only

From:

n0xi0uzz.livejournal.com

Да, действительно гениальная и красивая идея.

From:

dixi.livejournal.com

вот только очень уж она неудобна для распознаания человеком, буквы очень сильно слипаются, растискиваются и иногда успешно проходишь раза только с третьего.

From:

iime.livejournal.com

Феерически, да.

From:

softmaster.livejournal.com

вариант применения - на безобидном сервисе давать людям каптчу от другого сервиса, для использования ботами %)

From:

dzigoro.livejournal.com

очень нра. спасибо за инфу

From:

zhenyach.livejournal.com

Такое давно существует.

From:

yatur.livejournal.com

Как-то к Эдисону пришел гость и за разговором пожаловался
- вот скажите: вы такой знаменитый физик, а не можете отрегулировать пружину на калитке. Она у вас очень тугая, что ее очень трудно открыть
- вы ошибаетесь - ответил Эдисон. С пружиной все в порядке. Открывая калитку,
вы накачали в мой резервуар 10 литров воды.

:-)

From:

yatur.livejournal.com

Это точно. Капчи, ИМХО, обречены на вымирание в течении нескольких лет. Если раньше было довольно легко создать капчу, легко проходимую для людей и непреодлимую для роботов, то сегодня ситуация изменилась. Капчи, которые не по зубам роботам все чаще не по зубам и людям. Когда роботы начнут отгадывать капчи лучше, чем, скажем 20% людей, тест потеряет всякий смысл.

From:

catpad.livejournal.com

Посмотрите на ссылку, которую я привёл в качестве новой идеи для капчи. Никакой робот это не угадает, а для людей это ничего не стоит.

From:

yatur.livejournal.com

1. Почему робот не угадает?

2. Что значит "ничего не стоит"? Подсовывают какой-то размытый текст, который надо, напрягая глаза, расшифровывать. Я что-то упускаю?

From:

catpad.livejournal.com

Вот ссылка:
http://spamfizzle.com/CAPTCHA.aspx

Это совершенно другая идея.

From:

green-fr.livejournal.com

Так идея, которую

catpad тут озвучил и состоит в автоматическом отборе капч, которые оказались не по зубам роботам :-) Не надо ничего генерить, потёртые книги сами дадут достаточное количество плохих картинок!

From:

yatur.livejournal.com

Отобрать капчи, которые не по зубам роботам - это только половина задачи. Надо еще, чтобы они были по зубам людям. Причем, желательно, 99% или больше. А вот этого как раз никто не гарантирует.

From:

yatur.livejournal.com

Эта идея вызывает у меня внутренний протест. Почему я должен доказывать кому-то, что я не робот, разгадывая какие-то утомительные шарады? Плюс, я уверен, что в итоге 3Д шарады постигнет та же гонка вооружений, что и 2Д. Переход в 3Д - это всего лишь технический шаг в этой гонке. Он не решает принципиальную проблему.

From:

catpad.livejournal.com

А разбор смазанных текстов - это не утомительные шарады с целью доказать, что вы не робот ? Что-то я не вижу здесь логики, почему именно эта идея вызывает протест.

И что по-вашему может быть принципиальным решением проблемы ? Что есть единственный и неопровержимый способ отличить человека от робота ?

From:

yatur.livejournal.com

> А разбор смазанных текстов - это не утомительные шарады

Утомнительные. Я ж выше писал.

> Что-то я не вижу здесь логики,

Потому что ее здесь нет :-)

> почему именно эта идея вызывает протест.

Вы, судя по всему, исходите из предпосылки, что протест вызывает эта и только эта идея. Это не совсем верно. Протест вызывает любая утомительная работа по доказательству, что я не верблюд. В том числе разбор смазаных текстов.

> И что по-вашему может быть принципиальным решением проблемы ?

Если б я знал, я б, наверное, уже делал деньги на этой идее :-)

> Что есть единственный и неопровержимый способ отличить
> человека от робота ?

Единственный и неопровержимый? Нет такого, наверное.

Способ не обязан быть единственным и неопровержимым. Но он должен быть достаточно точным и ненапряжным для пользователя. Скажем, какой-нибудь цифровой сертификат за подписью Большого Брата, который установлен в браузере и говорит "мамой клянусь, это человек" - абсолютно ненапряжен. Но он создаст новые проблемы - во-первых, надо найти правильного Большого Брата, во-вторых проверка на человечность требует усилий, и Большой Брат вряд ли согласится бесплатно раздавать сертификаты, в-третьих начнутся проблемы privacy, в-четвертых надо будет как-то отличать пользователя от вируса-скрипта, и в-пятых надо будет вести списки украденых сертификатов. В общем, сертификат - плохая, негодная идея. Но зато относительно ненапряжная для пользователя. :-)

From:

green-fr.livejournal.com

Мне кажется, тут как раз проблем не должно быть, это же то же самое, что читать отсканированную книгу - лично у меня ни разу проблем не возникало :-)

Threaded | Top-Level Comments Only

Profile

catpad

February 2026

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Page Summary

Style Credit

Style: Cloudy Days for Ciel by carisma_sensei

Expand Cut Tags

No cut tags

Page generated Feb. 6th, 2026 09:47 am

Про капчи и гениальные идеи

Про капчи и гениальные идеи

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

February 2026

Links

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags