Программа TomeRaiderАвтор: De’Revo sidur@mail.ru
Вступление
Никогда бы не взялся за статью, если бы:
меня не "свалил" грипп,
под рукой не было бы Psion (Revo),
не было бы желания иметь в кармане действительно полноценный мобильный офис.
Введение
Под именем TomeRaider (TR) создана целая серия программ для различных платформ (PC-Win 9.*, PDA-EPOC-Palm), предназначенных для просмотра форматированных и структуированных текстов.
Формат TR-текстов есть ни что иное, как удачный синтез простейших баз данных и гипертекста. Соответственно, в нем легко читаются массивные мегабайтные тексты с заголовками, которые можно вывести в режиме списка (содержания).
Данный формат наиболее удобен для работы с электронными словорями, тезарусами, справочниками, учебниками, энциклопедиями и другими реферативными материалами.
Текст разбивается на законченные в смысловом отношении части (темы, страницы, блоки), каждая из которых имеет свой заголовок.
Соответственно, существуют 2 режима просмотра:
1-й - выводит только заголовки и через разделительную линию - первые строки темы,
2-й - показывает саму текстовку блока (темы, страницы).
Для PDA, впрочем как и для PC-компьютеров, несомненным преимуществом является сжатая форма TR-файлов, которые позволяют уменьшить размеры TR-файлов на 40-55 % от исходного (в TXT-формате). Так, энциклопедия Вебстера (Websters Encyclopedia) была "ужата" с 45 мегабайт до 12, т.е. с общей компрессией в 75%.
В Интернете есть достаточно много программ, которые позволяют уже имеющиеся базы данных перевести в формат TR. К примеру, большинство присланых на данный сайт баз данных, таких как "толкователь" мужских и женских имен, а также привязка АТС к районам Москвы по первым трем цифрам телефонных номеров в формате TR смотрелись бы куда как привлекательнее, да и размер их был бы поменьше.
TomeRaider для EPOC-PDA (V 2.08)
Вне зависимости от размера читаемого файла программа TR в устройствах Psion и Revo использует не более 120K.
Загрузка программы и файлов - практически моментальная.
В TR отсутствует проблема русских шрифтов.
Последняя версия TR по выбору пользователя загружает шрифты, которыми отображается текст, поддерживает значительное количество элементов форматирования, включая bold, italic, подчеркивание (а также их комбинацию), надстрочные и подстрочные символы. Имеется возможность центрирования строк, создание и просмотр нумерованных и простых списков (перечислений). Помимо обычного абзацного разрыва имеются еще 2 вида, предусматривающие более широкие межстрочные отступы и т.д.
Для работы со сложноструктуированными документами существует возможность использовать перекрестные ссылки и закладки. Ссылки могут "привязывать" выделенные слова или группу слов к отдельным темам (страницам, блокам), но не к другим словам внутри темы или другим файлам.
TR снабжен системой поиска как по заголовкам, так и по всему тексту. Излишне говорить, что интерфейс программы имеет линейку прокрутки и другие "навигационные" элементы.
Режим просмотра списка названия тем (содержание) разделен вертикальной линией, где в левой части вынесены заголовки, а справа - первые строки основного текста темы (страницы).
Вертикальная разделительная линия "перетаскивается вправо-влево" пером (стилом), что создает дополнительные удобства для навигации по документам.
Как и у большинства "продвинутых" вьюеров TR автоматически запоминает место в тексте, где была завершена работа программы.
К недостаткам TR-вьюера можно отнести отсутствие возможности переноса просматриваемого текста через буфер обмена в другой текстовый редактор.
Хорошо это или плохо, но TR не предусматривает размещения текста на экране в вертикальной плоскости. Тут известные всем программы eBook и Vreader5 - бесспорные фавориты. Но что-то я не припомню, чтобы мне захотелось хотя бы один раз прочесть электронный текст в "вертикальном исполнении".
Создание TR-файлов
Исходные (до преобразования и сжатия) TR файлы напоминают HTML-страницы, только с более "примитивной" разметкой. Те же или почти те же управляющие коды (теги). Только их, конечно, значительно меньше.
Вначале любой электронный текст доводят (к примеру, в Ворде) до формата "только текст", естественно, с расширением *.txt (Тексты на ASCI-кодах не подходят для перевода их в формат TomeRaider. Безупречно подходят файлы в кодировке Win 1251). Затем в любом простейшем текстовом редакторе делают разметку, расставляя где надо соответствующие "теги".
Например, заголовки выделяются тегом <new>.
Кстати, разметку текста можно произвести в "походных" или удобных (лежа) условиях с помощью "штатного" PDA, имеющегося в наличии. В конечном итоге, подготовленный таким образом текст импортируется программой TomeRaider for Windows и транслируется в сжатый (за счет встроенной программы компрессии) формат TR, который одинаково легко читается как на PC, так и на Psion.
К сожалению, сведений о возможности декомпрессии и восстановления исходного текстового файла с разметкой в Интернете нет. Но, видимо, это все же "дело техники".
Степень компрессии TR
По утверждению Адриана Грэхма (Adrian Graham), исследовавшего степень компрессии различных текстовых форматов и программ, бесспорным лидером среди них является TomeRaider. Так, на примере текста, содержащего 52000 слов (без иллюстраций, форматирования и прочих "довесок"), им было установлено, что:
файл в формате TXT занимает - 300 kb
EPOC Word файл - 297 kb
RTF файл - 314 kb
Microsoft Word файл - 456 kb
Palm DOC файл - 174 kb
TCR файл - 174 kb
TR файл, разбитый на 30 блоков - 165 kb
Программное обеспечение
Все необходимые программы для создания TR файлов можно скачать с сайта http://www.tomeraider.com/
Полный набор элементов разметки TR-файлов имеется в Help-е Win-версии TomeRaider.
Если не задаваться целью создать специальный редактор TR-файлов наподобии многочисленых HTML-редакторов, то при расстановке разметки в текстовом файле можно отказаться от написания "тегов", а воспользоваться функцией глобальной замены, предварительно расставив в нужных местах условные значки. Например, перед каждым заголовком выставить n*, а потом путем глобальной замены поменять этот значок на <new>.
Конечно, если кто возьмется подработать простенький HTML редактор для нужд TR-текстов, или "сваяет" собственный - будет много лучше.
"Растаможка"
Было бы смешно, если такой "ценный импортный продукт" раздавался бесплатно. Спасибо участникам конференции, которые помогли "растаможить" TR for EPOC.
Вот как изящно выглядит "растаможка" в исполнении Робина Гуда TR версии 2.09:
1. Меняем в файле tr2.app по смещению 0x1E2С байт 0x4C на 0x48.
2. Запускаем TR2 и в меню Tools - Unlock - Tome Key получаем рег.ключ. Записываем его.
3. Восстанавливаем tr2.app в исходном виде, запускаем его и регистрируем с помощью полученного ключа.
Для нормального "ламерного" юзера замену байта в tr2.app лучше произвести на стационарном компе, а потом перебросить его на Psion, так как инсталлированные туда же программы-редакторы файлов "сжирают" много места и конфликтуют за приоритет отображать текстовые и иные файлы с другими программами, включая TomeRaider. Потом приходится переинсталлировать многие "обиженные" ими программы.
Шароварная триал-версия TR for Win пока еще исправно транслирует и сжимает размеченные мною тексты. Глядишь, а там наши умельцы - участники конференции - помогут и ее "растаможить".
Библиотеки TR-текстов
В настоящее время на различных сайтах в Интернете выложено для всеобщего пользования сотни мегабайт TR-текстов на десятках языках. Естественно, русский - отсутствует.
Одних только словарей: англо-французских, немецко-итальянских и т.д. - несколько десятков. Я так понимаю, что эти словари ничуть не хуже "Словоеда", в них и транскрипция может присутствовать, что "чайникам" от лингвистики совсем не лишним будет.
Да, повторяюсь, русски духом там не пахнет. А ведь при корпоративном подходе (псионистов 5 - 10 на шару) можно такие классные словари сваять, что "Словоед" станет всего лишь удобным дополнением к самодельным "дикшинарям". При этом следует учесть, что каждую словарную статью можно снабдить перекрестными ссылками, что сделает доморощенный продукт еще более привлекательным.
Да мало ли что еще можно сделать в приличном обществе.
Элементы разметки TR
Примечание
Нижеследующее подробное описание элементов разметки "заготовок" TR-текстов предназначено отнюдь не для веб-дизайнеров, а для простых юзеров и "псовых" чайников, которым эта "жвачка" поможет сразу же после ее прочтения начать конструировать собственные сложноструктуированные и высокоэстетичные тексты.
Итак...
Авторы программы TomeRaider назвали систему разметок своих текстов TRML (видимо, по аналогии с HTML). Полное название аббревиатуры TRML выглядит так: TomeRaider Mark-up Language.
В данной статье описывается язык TRML v1.02.
Вы можете скачать исходник этой статьи в данном формате, а также переведенный в формат TR документ в архивном файле.
Базовый элемент языка TRML
"Фирменным" тегом языка TRML v1.02. является тег <new>. Достаточно поставить его в начало любого TXT-документа, как этот текст тут же будет опознан программой TomeRaider for Win, которая сможет его импортировать и затем преобразовать в TR-формат. Правда получится простой TR-документ всего лишь с одним блоком и одним заголовком к нему, но уже можно будет наслаждаться его чтением на устройствах Psion 5* (Revo).
Чтобы разбить текст на смысловые составляющие и озаглавить их, достаточно найти эти составляющие и перед каждой поставить <new>.
Например так:
<new>Вступление
Вначале было слово .... и далее по тексту (Библии)
Или так:
<new>
Вступление
Вначале было слово .... и далее по тексту (Библии)
Результат будет одинаковым. При просмотре на Psion слева от разделительной черты будет заголовок "Вступление", справа - первые слова фразы "Вначале было слово .... и далее по тексту (Библии)".
Теперь текст можно "разукрашивать" и вводить перекрестные ссылки.
Создание системы ссылок
Для этого используется тег <a...>. Формат его применения выглядит следующим образом:
<a:заголовок блока, на который указывает ссылка>элемент текста, с которого производится ссылка</a>
В программе TomeRaider ссылки могут производиться только на целые блоки, при этом программа "перескакивает" именно на целый раскрытый блок, а не на отдельное слово или заголовок.
Пример:
"Цыпленок жареный, цыпленок пареный, цыпленок тоже хочет жить ..."
Расставим ссылки:
"Цыпленок <a:жареный>Поварская книга</a>, цыпленок <a:пареный>С легким паром!</a>, цыпленок тоже хочет <a:жить>Жизнь после смерти</a> ..."
Вроде все понятно - где мы очутимся, нажав стилом на ссылку.
"Разукрасим" шрифты
Жирно (Bold), криво (Italic) да с подчеркиванием (Underline)
Возьмем предложение:
Автор статьи>"Юзверь - агрессивное, тупое и наиболее распространенное животное в дебрях российского Инета".
Красим!
"<b>Юзверь</b> - агрессивное, <u>тупое</u> и <i>наиболее распространенное</i> животное в дебрях <b><i>российского Инета</b></i>".
Все предельно просто. А "российский Инет" - элементарно "закрашен" жирным курсивом.
Примечание: Особняком стоит подчеркивание текста, которое создается по аналогии с вышеописанными шрифтами с помощью тега <u> и </u>. Лучше его вообще не использовать, так как ссылки тоже маркируются подчеркиванием, а бесполезно "тыкать" пером в подчеркнутый текст в надежде, то он выведет на нужную ссылку - дело неблагодарное.
Списки
В TomeRaider предусмотрены списки простые (unordered - тег <ul>) и нумерованные (ordered - тег <ol>). Перед каждой строкой простого списка будет "на уровне талии" стоять жирная точка, нумерованного - соответствующая цифра.
Сразу пример:
"Обычно утреннее похмелье снимается:
<ul>
<li> рассолом
<li> холодным сладким чаем
<li> двумя таблетками аспирина
<li> препаратом "Алкозельцер"
<li> отечественным препаратом "Бизон"
<li> обильной рвотой вперемежку с частым потреблением теплой воды
</ul>
В данном примере перед каждой новой строчкой будет стоять жирная точка, а в случае замены тега <ul> и </ul> на <ol> и </ol> соответственно, все строки будут пронумерованы.
Разбиение смыслового блока на подблоки
Иногда даже в законченном смысловом блоке необходимо разделить отдельные мысли, логические субблоки или вообще выделить ключевой абзац (вверху и внизу) горизонтальными линиями. В этом случае пригодятся следующие теги, выставляемые в конце фразы, предложения или субблока:
<br> - от слова Break,
<p> - от слова Paragraph
Они отличаются только размером межстрочного интервала, который образуется между концом текста, заканчивающегося одной из этих разметок и следующей строкой(<p> генерирует больший интервал по сравнению с <br>).
Тег <br> неплохо было бы применять в конце каждого абзаца, в противном случае они просто сливаются. А если не хочется утяжелять файл за счет этого тега, то утяжеляйте его с помощью "красной строки", которая потребует как минимум 5 пробелов.
Если надо разделить субблоки горизонтальной чертой - используется тег <hr> (от слов Horizontal Rule).
Центровка строк
Формат центровки строк легко понять из примера:
<centre>Не каждый ПИСЕЦ пойдет на шубу</centre>
Question
Нигде не нашел - каким образом можно писать надстрочными и подстрочными буквами. А ведь TR-текстах этакая манера письма довольно часто встречается.
Предложения
Создать собственную (EPOCальную) библиотеку электронных текстов в формате TR. Для максимального ее наполнения привлечь наших союзверников из PALMовой ветви у PDA-шного пути развития карманных компьютеров, которые отличаются завидной массовостью, агрессисностью и предприимчивостью. TR-тексты в равной мере подходят и к бесклавиатурным КПК.
Сообща решить - какие справочники и другие книги реферативного характера можно было бы в первую очередь корпоративными усилиями подготовить к изданию в сети (при наличии согласия у десятка энтузиастов можно создать электронные версии любой энциклопедии или словаря).
Повернуться лицом к мировому сообществу, т.е. вскладчину закупить у буржуев парочку программ TomeRaider, официально зарегистрировав интерес отечественных пользователей к их продукции. Подобный протокольный реверанс позволит нам претендовать на русифицированные версии этих полезных программ.
Создать простенький редактор (или найти уже готовый) для автоматической разметки подготавливаемых к опубликованию текстовых файлов.
Что хотелось бы сейчас
Для полного счастья, как всегда, не хватает самой малости - "растаможенной" программы TomeRaider for Win второй версии. Зарубежные умельцы уже "сделали" вторую версию этой программы, но скупой разработчик тут же выставил на своем сайте http://www.tomeraider.com/ ее модификацию, не поддающуюся регистрации при помощи старого key-генератора.
Программу-крэкалку (tno_tr21.zip) для предыдущей модификации TR for Win можно скачать с FTP-серверов или зайти по адресу http://idt.net/~jusric19/crack.html и в его поисковой системе заказать TomeRaider.
Если уж не удается найти к программе кряк, так, может быть, кто-то найдет к этому кряку предыдущую версию программы.
Автор статьи
De’Revo, по мылу sidur@mail.ru ;o)
Дата статьи: | 11 января 2001 г |
« Назад в каталог | Обсудить в конференции »
|