FreeBase

Aug. 23rd, 2007 03:40 pm
catpad: (Default)
[personal profile] catpad

Давно уже хотел написать, но сегодня как раз пришло время. Появился сайт по названием FreeBase.com. Сначала он был открыт только для альфа-тестеров (я там давно уже зарегистрировался), но сегодня его открыли на всеобщее обозрение.
FreeBase - это такая всеобьемлющая википодобная энициклопедия, которая даёт пользователям возможность создавать настоящую семантическую сеть, в отличие от Википедии, которая есть просто гипертекстовая энциклопедия.
Дело в том, что во FreeBase, пользователи могут создавать и редактировать не только статьи, но и типы данных. Типы составляют иерархию (на верхнем уровне они собраны в domains), могут наследовать друг от друга и состоят из произвольного числа properties, которые в свою очередь являются типами. Собственно статьи энциклопедии - это как бы "объекты", созданные с помощью какого-либо типа; статьи здесь называют topics.

Самое интересное состоит в том, что типы и их properties - всё это "wiki-editable", то есть пользователи могут изменять метаданные (и сами данные, конечно, тоже) так же легко, как в Википедии редактируются тексты. (Правда, насколько я понял, некоторые типы доступны для редактирования только избранным пользователям).

Например,
возьмём тип Book. Он находится в иерархии "Domains & Types > Publishing > Book > Book Type Definition".
У него есть такие properties как: Author, Genre, Subjects, Language, etc. Кроме того, тип Book наследует (здесь это называется include) от типа Topic, который самый верхний в иерархии, и поэтому у него есть properties типа Topic: name, image, web links, etc.
Теперь если нажать на property Author, то увидим, что его expected type - это Author, который в свою очередь тип, наследующий от Person (и поэтому у автора есть все те же properties, что и у любого человека, а кроме того properties, присущие только авторам книг, например "Books written" - которые, как можно догадаться, снова типа "Book").
Таким образом, получается иерархия типов, которую создают сами пользователи.
Эта иерархия позволяет путешествовать по топикам, следуя от одних properties к другим.

Очень важно, что они сразу же предоставляют API для программного доступа ко всей этой сети. Если эта штука достигнет размеров Википедии, то здесь откроются реальные возможности для создания (наконец-то) "общественного разума" (о котором так долго говорили большевики все).

А вот статья Тима О'Рейлли про FreeBase.

Date: 2007-08-23 07:38 am (UTC)
From: [identity profile] dimrub.livejournal.com
Думаю, нет шансов, чтобы она достигла размеров Википедии. Поскольку концепции наследования и типов, увы, доступны немногим вне программистского ремесла (разве что, некоторым биологам?)

Date: 2007-08-23 07:48 am (UTC)
From: [identity profile] mopexod.livejournal.com
Думаю я, что не "общественный разум" получится, а "общественная помойка".
"Очистки от морковки", expected type "очистки", как и у "яблочных шкурок"...

Date: 2007-08-23 07:49 am (UTC)
From: [identity profile] catpad.livejournal.com
Я как раз думаю, что в этом нет ничего страшного, потому что набор типов очень мал по сравнению с содержанием. Так что даже очень немногих хватит для создания солидной иерархии. А содержание можно брать из той же Википедии (они уже сейчас дают на неё ссылки). Просто нужно создать достаточное количество топиков.

Date: 2007-08-23 07:50 am (UTC)
From: [identity profile] catpad.livejournal.com
Ну знаешь, из Википедии же не получилось общественной помойки, хотя никто не верил.

Date: 2007-08-23 08:09 am (UTC)
From: [identity profile] mopexod.livejournal.com
Да, пожалуй, ты прав. К тому же, как справедливо отметил выше Дима, концепция наследования типов мало кому близка.

Date: 2007-08-23 08:17 am (UTC)
From: [identity profile] gianthare.livejournal.com
Пока тяжело понять и насколько это пойдет и насколько это полезно.

Date: 2007-08-23 08:23 am (UTC)
From: [identity profile] catpad.livejournal.com
То, что это полезно, сомнений никаких нет - это практически безграничные возможности data mining, или как там это называется, причём с математической точностью - то, что ни одна поисковая машина не может сделать.
Насколько это пойдёт - вопрос другой. Возможно, никуда не пойдёт, потому что не совсем "для народа", в отличие от Википедии.

Date: 2007-08-23 08:32 am (UTC)
From: [identity profile] kmmbvnr.livejournal.com
а разве все можно уложить в древовидную структуру?

Date: 2007-08-23 08:33 am (UTC)
From: [identity profile] gianthare.livejournal.com
А она не древовидная - это обычный граф.

Date: 2007-08-23 09:01 am (UTC)
From: [identity profile] shmel39.livejournal.com
Классная штука. Хотя сложностей здесь я думаю не избежать. Что не очень понравилось, это обилие JavaScript. У меня даже притормаживает немного :-( Но типизация занятная. В порядке шутки: type inference есть?

Date: 2007-08-23 09:05 am (UTC)
From: [identity profile] green-fr.livejournal.com
Мне вот чем не нравится этот wiki-подход, это аксиомой, что есть единственно верное описание чего-то. Ладно, проблему многозначных слов кое-как в википедии разрулили, но для каждого слова (я наткнулся на это на примере слова Глаз") ведь можно написать множество абсолютно верных статей: одну для детской энциклопедии, одну для биологов, одну для оптиков, одну общую.

Так и здесь: в какой-то версии мне интересно разделение концептов и их взаимосвязь, а в какой-то мне достаточно очень грубого приближения, говорящего, что это всё - примерно одно и то же. Как классический Pet Store - там какое-то безумное количество деталей, никому не нужных в реальной жизни. Но у каждого эти ненужности разные. Использовать всем неподъёмные, зато стандартные вещи?

Date: 2007-08-23 09:26 am (UTC)
From: [identity profile] catpad.livejournal.com
Есть простое решение этого вопроса. Для каждого понятия можно использовать множество специальных properties:
short description, beginner's description, intermediate description, advanced description, for professionals, for children - и так далее, сколько угодно.
Так что проблема легко решается (на словах ;)

Date: 2007-08-23 09:58 am (UTC)
From: [identity profile] green-fr.livejournal.com
С избыточностью и, как следствие, возможной противоречивостью... Т.е. если это действительно программерская абстракция - всё ОК. Пишем метод getBeginnersDescription(), который на основании "правильного" описания генерит "чайниковое" (класс URL, который подавляющему количеству пользователей нужен исключительно в виде строки). Т.е. с понятиями, может и пойдёт... С википедией пока тяжко. Надо думать :-)

Date: 2007-08-23 01:22 pm (UTC)
From: [identity profile] zanuda.livejournal.com
В обычном викисинтакисе вставляем инфобоксы как темплэйты с параметрами и имеем все тоже самое. Если есть желание получить наследование - имеем метатемплейты. Другое дело, что в таком коллективном проекте как вики метатеплейты - обычно вредны. Испортил вандал метатеплейт в середине иерархии, на исправление минуты, а разбираться - очень непросто.

А что в этом Фрибэйс викилинков и картинок в тексте принципиально нету? Любая статья жутко убого выглядит.

Date: 2007-08-23 04:12 pm (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Видал я во второй половине 80-х что-то наподобие этого на СМ ЭВМ. Помнится, там можно было просматривать все использования типа: в данном случае было бы упомянуто "Person входит в Book как Author". А запомнил я это оттого, что в демонстрационную базу было забито что-то кладбищенское, в результате чего оказалось: "Ящик входит в Труп как Гроб".

Date: 2007-08-24 03:39 am (UTC)
From: [identity profile] e2pii1.livejournal.com
Т.е. с точки зрения "чайника" это как wiki, только текст статьи должен быть написан по некоему шаблону, это как-бы анкета, а не просто свободный текст на бумаге: ФИО, год рождения ... books written - а у книг свои анкеты.

Date: 2007-08-24 03:51 am (UTC)
From: [identity profile] catpad.livejournal.com
Всё верно. И эти шаблоны позволяют очень точно классифицировать информацию.

Date: 2007-08-24 02:51 pm (UTC)
From: [identity profile] lelit.livejournal.com
Да... Ужас-ужас... Все-таки наглая (и совершенно лживая) пропаганда ООП как "парадигмы, которая лучше всех, потому что именно так устроено наше мышление" набрала себе сторонников... :)
Ничего хорошего из этой затеи не выйдет. Язык в основном работает по совершенно другим принципам, а иерархическая классификация позволяет решать лишь очень узкий круг задач (в основном тех, которые изначально под нее и были сделаны :) ) Например, если речь идет о классификации фотоаппаратов, автомобилей или компьютеров для интернет-магазина - то отлично, полезная вещь, если хорошо сделать - пригодится. Пытаться строить по этому принципу нечто, не нацеленное на решение конкретных задач - получится, как точно было отмечено, "ящик, входящий в труп как гроб".
Странно. Вроде бы давно не новость, что нельзя онтологизировать объекты, атрибуты, наследования и т.п. Что все это - не более чем инструмент для решения той или иной задачи. Так ведь нет :)

Profile

catpad: (Default)
catpad

February 2026

S M T W T F S
12 3 4 567
891011121314
15161718192021
22232425262728

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 6th, 2026 07:17 am
Powered by Dreamwidth Studios