catpad: (Default)
[personal profile] catpad







Сегодня я вас порадую.
Сделал новый сайт — BookerMocker, который «читает» книги с помощью NLP и рисует красивые картинки: он определяет, сколько и какие в тексте есть существительные, глаголы и т. д., кто главные герои, какие там упоминаются животные, напитки, еда и тому подобное. В конце он даже пытается нарисовать некий «сюжет», в смысле, где и когда появляются главные герои.

Иногда открываются довольно неожиданные и забавные вещи (например, он заспойлерил преступника в «Собаке Баскервилей»).

В общем, получилось забавно.
Одна проблема, вычисления очень тяжелые, а квота там очень маленькая (Heroku). Так что, боюсь, когда сразу несколько человек туда зайдут, сайт упадёт. Ну ладно, хотя бы будете знать, почему он упал :)
Будем считать это alpha version.  


 

Date: 2021-12-01 11:10 am (UTC)
From: [identity profile] catpad.livejournal.com
Plot работает так: книга делится на 10 частей (цифра, добытая опытным путём), и в каждой части подсчитываются упоминания всех героев. Потом в каждой части отбираются трое тех, которые упоминаются наиболее часто, и для каждого строится график. Получается что-то вроде линий важности героя в тот или иной момент, а отсюда и их пересечения.
Интересный график получился для Little Women:
https://bookermocker.herokuapp.com/book/?book_id=514
Прямо-таки видно как они все там присутствуют, и кто важней.

Date: 2021-12-02 09:50 am (UTC)
From: [identity profile] reineke.livejournal.com
местоимения не считаются?

А интерес в том, чтоб приблизиться к нейросети, или, наоборот, обойтись без приближения к ней?

Date: 2021-12-02 10:20 am (UTC)
From: [identity profile] catpad.livejournal.com
Местоимения не считаются, это слишком сложно. Думаю, даже для нейросети.
А вообще на нейросеть у меня просто знаний не хватает.
Page generated Feb. 7th, 2026 08:22 pm
Powered by Dreamwidth Studios