Библиотека палийских текстов и база данных переводов

Опубликовано khantibalo от

Адрес библиотеки: tipitaka.theravada.su

Комментарии

Закладки хранятся в памяти сервера пока действует сессия работы пользователя (не закрыто окно браузера). А ссылка никак от памяти сервера не зависит - вся информация что показать находится в самой ссылке, поэтому она действует вечно.
Закладки используются прежде всего для поиска - можно выбрать набор текстов и потом в них искать.

По-моему в собрании отсутствуют сутты Самбодхивагги AН9

https://tipitaka.theravada.su/index.php?NodeID=5008
https://tipitaka.theravada.su/view.php?NodeID=5010

И если можно высказать пожелание, то было бы здорово, если бы

1. сквозная навигация по страницам сутт была непрерывной, то есть не ограничивалась рамками одной вагги или самьютты, иначе, чтобы попасть в другой раздел нужно снова подниматься к древу

2. в древе можно было разворачивать сколько угодно уровней никай и вагг сразу, т.е. чтобы они не были взаимоисключающими

Самбодхивагга не пропала, она ошибочно приклеилась к 1. Paṭhamapaṇṇāsakaṃ
Я переименовал Paṭhamapaṇṇāsakaṃ в самбодхиваггу, а старую пустую самбодхиваггу удалил.

С деревом согласен, надо делать дерево на javascript с подгрузкой узлов по требованию. Правда, сейчас статическое дерево позволяет также сохранять прямые ссылки. Хотя может прямые ссылки на само дерево не очень нужны.
Или нынешнее дерево сохранить по отдельной ссылке, если на каких-то устройствах типа мобильных javascript дерево не сработает или будет работать плохо.

Сквозная навигация - это ссылки Back Next? Я их совсем недавно придумал :)

Оказалось, что в дереве были ошибки, аналогичные той, что с Самбодхиваггой. Такие же ошибки были во всех остальных нипатах АН, комментариях и подкомментариях к ним. Все исправил аналогичным образом.

В верхнем меню сделан дополнительный пункт New TOC, в котором посажено дерево, позволяющее разворачивать иерархию одновременно в нескольких местах. Узлы подгружаются с сервера по требованию пользователя.

У этого дерева следующие ограничения:
1. нет возможности поставить закладку
2. нет перехода к PTS страницам
3. страницы по ссылкам из дерева всегда открываются в новом окне

На страницах просмотра сутт и прочего теперь также работают ссылки back-next как и на страницах просмотра абзацев.

В старом дереве при выборе узлов под деревом появляется возможность быстрого перехода к нужной PTS странице - можно выбрать том и ввести номер страницы (например если выбрать Дигха Никаю). Система по нажатии кнопки GO откроет эту страницу.
В новом дереве такой функции нет.

Ещё одна проблема: при поиске в каноне из-за бинарного сравнения он различает большие и маленькие буквы, из-за этого при поиске aggato не находит Aggato. Но если это отключить, тогда он не будет различать диакритику...

а нужна ли диакритика для поиска? пусть бы движок находил слова без неё, а пользователь выбирал результаты с нужной ему орфографией, по-моему омонимичных вариантов без диакритики довольно мало

нужна, потому что поиск может идти по части слова (поддерживается звёздочка в конце) и этим часто приходится пользоваться для поиска всех словоформ.
Я пробовал поиск без диакритики - он выдаёт очень много ненужного, по крайней мере по тем запросам, что я посылал

придумал хранить всё в виде строчных букв и просто отдельно запомнить позиции заглавных. при выводе для пользователя делать нужные буквы заглавными, а поскольку в базе всё будет строчными - этой проблемы с поиском не будет.
осталось сделать.

Сделал это - теперь в базе данных все тексты хранятся маленькими буквами и также искомая фраза перед поиском переводится в нижний регистр. При этом при выводе на экран система восстанавливает заглавные буквы - пользователь ничего не заметит.
Благодаря этому при поиске больше нет регистрозависимости, при этом диакритика как и раньше учитывается.

Для этого есть поиск по закладкам. Сначала нужно добавить в закладки нужный раздел (мулу например) и при поиске выбрать позицию переключателя bookmarks. Так будут исключены комментарии, тики и постканонические работы.

А нет ли возможности в поиске по словарю отключить распознавание диакритики? Так гораздо удобней искать, пусть даже если результатов будет чуть больше, чем нужно

Всё не так просто.
Чтобы быстро искать в таком объёме текста, приходится использовать полнотекстовый поиск. Насколько я понял, он позволяет быстро искать именно благодаря поиску точных совпадений (в т.ч. с использованием подстановочных символов типа звёздочки).
Это значит, что для столь же быстрого поиска без диакритики нужно весь текст хранить также и в форме без диакритики и на нём также построить полнотекстовый индекс, по которому оно будет искать.
Если это сделать, сильно увеличится размер базы данных, не факт, что сервер в нынешней конфигурации потянет его. Там вроде как уже превышение...