Библиотека палийских текстов и база данных переводов

Опубликовано khantibalo от 15 мая, 2017 - 20:02

Адрес библиотеки: tipitaka.theravada.su

Мини-инструкция

Раздел "Что нового"

Показывает 20 последних абзацев, в которых были правки и также 10 последних комментариев.

Раздел "Оглавление"

Подраздел "Только переведённые" - показывает дерево текстов с узлами, в которых есть хотя бы один текст с хотя бы одним переведённым предложением на любой язык. Ссылка "(Перевод)" позволяет увидеть перевод текста на русский язык, обычно это означает, что текст переведён на русский и достаточно хорошо выверен. Ссылка "(Таблица)" позволяет увидеть все переводы и палийский оригинал в табличном виде.

Подраздел "Метки" - показывает дерево меток, назначенных материалам с указанием количества материалов с каждой конкретной меткой. Для некоторых меток указано палийское название.

Подраздел "Подборки" - содержит подборки материалов, входящих в книги, сборники текстов для декламации и проч.

Можно увидеть весь текст подборки на одной странице. Для этого нужно нажать на одну из трёх кнопок:

  • "Таблица" - показывает весь текст в виде таблицы пали-русский со ссылками для быстрого перехода к нужному разделу. Оптимизировано для экрана ПК и планшетов.
  • "Подстрочник" - показывает весь текст в 2 этажа: пали крупно, русский мелко под ним. Оптимизировано для печати и просмотра на планшетах, телефонах.
  • "Перевод" - показывает только перевод на русский, оформленный максимально близко к книжному виду. Оптимизировано для печати и чтения.

Подраздел "Все тексты" - показывает дерево всех имеющихся в базе данных текстов. Помимо ссылок "Перевод" и "Таблица" здесь доступна ссылка "Закладка", которая позволяет добавить в закладки любой раздел канона и затем использовать его для поиска.

На страницах дерева для некоторых разделов Канона доступен быстрый переход к нужной странице в PTS издании. В этом случае отображается приглашение "Перейти к PTS тому" и можно указать номер тома и номер страницы в PTS издании. Система выведет на искомую страницу.

Кроме того, здесь можно быстро перейти к абзацу по его номеру. Нужно ввести номер абзаца в поле с приглашением "Перейти к абзацу". Для Ангуттара Никаи номер абзаца соответствует номеру сутты.

Раздел "Поиск"

Раздел позволяет производить поиск в палийских текстах и переводах на другие языки.

Переключатель "где" позволяет выбрать место поиска:

  • "Оглавление" - поиск будет производиться в дереве всех текстов, с учётом перевода заголовков на том языке, который указан в поле "Язык". Таким образом, можно искать текст не только по палийскому, но и по русскому или английскому названию (если оно внесено в систему).
  • "Текст" - поиск будет производиться только по тексту, без учёта заголовков.
  • "Закладки" - поиск будет проводиться только по тексту тех разделов, которые занесены в закладки, без учёта заголовков. Становится активным при наличии хотя бы одной закладки.

Поле "поиск" принимает текст для поиска. При поиске на языке пали поддерживаются следующие операторы:

* - любой набор символов слова, например buddh* найдёт buddho, buddhe и т.п.

" - точное совпадение, полезно для поиска фразы целиком. "Buddhaṃ saraṇaṃ" найдёт только фрагменты со словами в таком порядке

+ - слово обязательно должно присутствовать, например +buddho

-  - слово должно отсутствовать, например -dhammo

Поиск на языке пали осуществляется в абзацах (а не в предложениях, на которых они могут быть разбиты). Результаты поиска выводятся в виде абзацев. При поиске на языке пали доступен флаг "Искать в переведённом (для пали)", при выборе которого поиск будет осуществляться только в тех абзацах, где есть перевод хотя бы одного предложения хотя бы на один язык.

При поиске на других языках операторы не поддерживаются и поиск всегда осуществляется по совпадению с любой частью слова. Поиск на других языках осуществляется в предложениях. Результаты поиска выводятся в виде предложений.

Раздел "Закладки"

Отображает разделы и абзацы, добавленные в закладки. Закладки хранятся ограниченное время в рамках работы с системой и при закрытии окна браузера  стираются.

Ссылка "ссылка на этот набор закладок" указывает на постоянный адрес этого набора закладок, которым вы можете поделиться на форумах, соцсетях и мессенджерах.

Раздел "Словарь"

Раздел позволяет искать и просматривать пали-английские словари и пали-русский словарь.

Поле "Поиск" предназначено для ввода ключевого слова или его части.

Список "Словарь" позволяет выбрать в каком словаре искать (по умолчанию ищет во всех словарях).

Список "Тип поиска" позволяет выбрать вид поиска

  • авто - при отсутствии совпадений при поиске с начала слова отнимает по одной букве с конца пока хотя бы одно совпадение не будет найдено
  • начинается с - искать совпадения с начала слова
  • содержит - искать совпадения с любой частью слова

Флаг "Игнорировать диакритику" позволяет при поиске по словам считать ṃ=m, ā=a и т.п.

Список "Где" позволяет выбрать где искать - по умолчанию ищет по "названиям терминов" и выводит их. Можно выбрать поиск по "содержимому статей", тогда будет искать и выводить словарные статьи.

Поиск осуществляется при нажатии кнопки "Искать".

Помимо поиска доступен отбор терминов по палийской букве, а также по меткам.

Страница просмотра текста

Текст может отображаться в трёх режимах: "Палийский оригинал", "Таблица" и "Перевод". Переход между режимами отображения осуществляется по ссылкам справа от заголовка текста.

Режим "палийский оригинал" показывает палийский текст по абзацам, соответствующим оригинальном изданию.

Строка "Адрес" позволяет перейти к просмотру палийского текста более высоких уровней иерархии.

Переключатель "номера страниц" позволяет включить показ номеров страниц в разных изданиях, наиболее важным их них является PTS издание.

Переключатель "примечания" позволяет включить показ примечаний издания Типитаки Шестого собора.

Ссылка "смотреть" позволяет перейти к просмотру конкретного абзаца.

Ссылка "закладка" добавляет абзац в закладки.

Буква Т между "смотреть" и "закладка" показывает, что у данного абзаца есть хотя бы один перевод хотя бы одного предложения хотя бы на один язык.

Режим "таблица" показывает палийский текст в режиме таблицы с переводами и комментариями.

Переключатель "отображение колонок" позволяет выбирать какие колонки показывать - можно отобразить или скрыть палийский оригинал, любой из переводов и столбец комментариев. Изменение представления таблицы происходит после нажатия кнопки "обновить".

Режим "перевод" показывает только один перевод на русский язык, разбитый на абзацы аналогично палийскому оригиналу. Режим доступен только для некоторых текстов, чей перевод является полным и считается достаточно выверенным.

Комментарии

Закладки хранятся в памяти сервера пока действует сессия работы пользователя (не закрыто окно браузера). А ссылка никак от памяти сервера не зависит - вся информация что показать находится в самой ссылке, поэтому она действует вечно.
Закладки используются прежде всего для поиска - можно выбрать набор текстов и потом в них искать.

По-моему в собрании отсутствуют сутты Самбодхивагги AН9

https://tipitaka.theravada.su/index.php?NodeID=5008
https://tipitaka.theravada.su/view.php?NodeID=5010

И если можно высказать пожелание, то было бы здорово, если бы

1. сквозная навигация по страницам сутт была непрерывной, то есть не ограничивалась рамками одной вагги или самьютты, иначе, чтобы попасть в другой раздел нужно снова подниматься к древу

2. в древе можно было разворачивать сколько угодно уровней никай и вагг сразу, т.е. чтобы они не были взаимоисключающими

Самбодхивагга не пропала, она ошибочно приклеилась к 1. Paṭhamapaṇṇāsakaṃ
Я переименовал Paṭhamapaṇṇāsakaṃ в самбодхиваггу, а старую пустую самбодхиваггу удалил.

С деревом согласен, надо делать дерево на javascript с подгрузкой узлов по требованию. Правда, сейчас статическое дерево позволяет также сохранять прямые ссылки. Хотя может прямые ссылки на само дерево не очень нужны.
Или нынешнее дерево сохранить по отдельной ссылке, если на каких-то устройствах типа мобильных javascript дерево не сработает или будет работать плохо.

Сквозная навигация - это ссылки Back Next? Я их совсем недавно придумал :)

Оказалось, что в дереве были ошибки, аналогичные той, что с Самбодхиваггой. Такие же ошибки были во всех остальных нипатах АН, комментариях и подкомментариях к ним. Все исправил аналогичным образом.

В верхнем меню сделан дополнительный пункт New TOC, в котором посажено дерево, позволяющее разворачивать иерархию одновременно в нескольких местах. Узлы подгружаются с сервера по требованию пользователя.

У этого дерева следующие ограничения:
1. нет возможности поставить закладку
2. нет перехода к PTS страницам
3. страницы по ссылкам из дерева всегда открываются в новом окне

На страницах просмотра сутт и прочего теперь также работают ссылки back-next как и на страницах просмотра абзацев.

В старом дереве при выборе узлов под деревом появляется возможность быстрого перехода к нужной PTS странице - можно выбрать том и ввести номер страницы (например если выбрать Дигха Никаю). Система по нажатии кнопки GO откроет эту страницу.
В новом дереве такой функции нет.

Ещё одна проблема: при поиске в каноне из-за бинарного сравнения он различает большие и маленькие буквы, из-за этого при поиске aggato не находит Aggato. Но если это отключить, тогда он не будет различать диакритику...

а нужна ли диакритика для поиска? пусть бы движок находил слова без неё, а пользователь выбирал результаты с нужной ему орфографией, по-моему омонимичных вариантов без диакритики довольно мало

нужна, потому что поиск может идти по части слова (поддерживается звёздочка в конце) и этим часто приходится пользоваться для поиска всех словоформ.
Я пробовал поиск без диакритики - он выдаёт очень много ненужного, по крайней мере по тем запросам, что я посылал

придумал хранить всё в виде строчных букв и просто отдельно запомнить позиции заглавных. при выводе для пользователя делать нужные буквы заглавными, а поскольку в базе всё будет строчными - этой проблемы с поиском не будет.
осталось сделать.

Сделал это - теперь в базе данных все тексты хранятся маленькими буквами и также искомая фраза перед поиском переводится в нижний регистр. При этом при выводе на экран система восстанавливает заглавные буквы - пользователь ничего не заметит.
Благодаря этому при поиске больше нет регистрозависимости, при этом диакритика как и раньше учитывается.

Для этого есть поиск по закладкам. Сначала нужно добавить в закладки нужный раздел (мулу например) и при поиске выбрать позицию переключателя bookmarks. Так будут исключены комментарии, тики и постканонические работы.

А нет ли возможности в поиске по словарю отключить распознавание диакритики? Так гораздо удобней искать, пусть даже если результатов будет чуть больше, чем нужно

Всё не так просто.
Чтобы быстро искать в таком объёме текста, приходится использовать полнотекстовый поиск. Насколько я понял, он позволяет быстро искать именно благодаря поиску точных совпадений (в т.ч. с использованием подстановочных символов типа звёздочки).
Это значит, что для столь же быстрого поиска без диакритики нужно весь текст хранить также и в форме без диакритики и на нём также построить полнотекстовый индекс, по которому оно будет искать.
Если это сделать, сильно увеличится размер базы данных, не факт, что сервер в нынешней конфигурации потянет его. Там вроде как уже превышение...