Принципы и методы цифровой лексикографии

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Статья описывает принципы и методы цифровой лексикографии, а также то, как они встраиваются в четыре основных этапа создания словарей: подготовку текста, редакционно-издательскую работу, публикацию и постпубликационный период. Обсуждаются преимущества онлайн-систем подготовки словарей (таких, как платформа OnLex), которые значительно упрощают все упомянутые этапы. Вводится классификация подходов к написанию текста словаря (файловый, табличный, основанный на TEI-разметке или базе данных). В заключение подчеркивается важность применения методов цифровой лексикографии, особенно в российской традиции, часто ограничивающейся малофункциональным файловым подходом.

Полный текст

Доступ закрыт

Об авторах

Ю. Ю. Макаров

Институт русского языка им. В.В. Виноградова РАН; Институт языкознания РАН; НИУ ВШЭ

Автор, ответственный за переписку.
Email: yurmak@iling-ran.ru

Научный сотрудник Института русского языка им. В.В. Виноградова РАН, Россия, младший научный сотрудник Института языкознания РАН, приглашенный исследователь НИУ ВШЭ

Россия, Москва; Москва; Москва

Список литературы

  1. Беляев О.И., Макаров Ю.Ю., Новокшанов Д.А., Синицына Ю.В., Хомченкова И.А. Онлайн-словари иранских языков // 1-ая Международная научно-образовательная конференция «Пейсиковские чтения: проблемы современного академического востоковедения»: материалы конференции / ред. А. А. Маслов. М.: ИСАА МГУ имени М.В. Ломоносова, 2023. С. 7–11. [Электронный ресурс]: https://elibrary.ru/item.asp?id=58073241&pff=1
  2. Беляев О.И., Хомченкова И.А., Синицына Ю.В., Дьячков В.В., Бызова А.А., Бадеев А.О., Алексеев Д.А., Макаров Ю.Ю. Историко-этимологический словарь осетинского языка В.И. Абаева: проблемы создания цифровой двуязычной версии // Вестн. Моск. ун-та. Серия 9. Филология. 2024. Вып. 2. С. 75–86. http://dx.doi.org/10.55959/MSU0130-0075-9-2024-47-02-4
  3. Dragićević R., Makarov Y., Ryzhova D., Shapich Y., Yakushkina E. A new bilingual Serbian–Russian dictionary // Lexicography and Semantics: Proceedings of the XXI EURALEX International Congress / ред. K. Despot, I. Brač, A. Ostroški Anić. Zagreb: Institute for the Croatian Language, 2024. Pp. 93–100.
  4. Плунгян В.А. Корпус как инструмент и как идеология: о некоторых уроках современной корпусной лингвистики // Русский язык в научном освещении. 2008. Т. 16. Вып. 2. С. 7–20.
  5. Беликов В.И., Копылов Н.Ю., Пиперски А.Ч., Селегей В.П., Шаров С.А. Корпус как язык: от масштабируемости к дифференциальной полноте // Компьютерная лингвистика и интеллектуальные технологии. 2013. Т. 1. Вып. 12. С. 19.
  6. Piperski A., Belikov V., Kopylov N., Morozov E., Selegey V., Monakhov S. Big and diverse is beautiful: A large corpus of Russian to study linguistic variation // Proceedings of the 8th Web as Corpus Workshop (WAC-8) @ Corpus Linguistics 2013 / ред. S. Evert, E. Stemle, P. Rayson. 2013. С. 24–28.
  7. Magomedgazhieva P., Daniel M. Dictionary of Tukita (v2.0.0). Linguistic Convergence Laboratory, HSE University, Moscow, 2023. https://doi.org/10.5281/zenodo.7803955
  8. Belyaev O., Khomchenkova I., Sinitsyna J., Dyachkov V. Digitizing print dictionaries using TEI: The Abaev Dictionary Project // Proceedings of the Seventh International Workshop on Computational Linguistics of Uralic Languages, Syktyvkar, Russia (Online): Association for Computational Linguistics. Сен. 2021. С. 57–64. [Электронный ресурс]: https://aclanthology.org/2021.iwclul-1.7
  9. Иванов В.Б. Большой персидско-русский словарь. Т. 1. М.: Наука, 2020.
  10. Abel A. Dictionary writing systems and beyond // Electronic Lexicography / ред. S. Granger, M. Paquot. Oxford University Press, 2012. С. 83–106. https://doi.org/10.1093/acprof:oso/9780199654864.003.0005
  11. Makarov Y., Melenchenko M., Novokshanov D. Digital Resources for the Shughni Language // Proceedings of The Workshop on Resources and Technologies for Indigenous, Endangered and Lesser-resourced Languages in Eurasia within the 13th Language Resources and Evaluation Conference, Marseille, France: European Language Resources Association. Июнь 2022. С. 61–64. [Электронный ресурс]: https://aclanthology.org/2022.eurali-1.9
  12. Иванов В.Б. Большой персидско-русский словарь. Т. 2. М.: Фонд Ибн Сины, 2023.
  13. Иванов В.Б. Большой персидско-русский словарь. Т. 3. М.: ООО «Садра», 2024.
  14. Крысин Л.П. (отв. ред.) Академический толковый словарь русского языка. Т. 1: А – ВИЛЯТЬ. М.: Издательский дом ЯСК, 2016.
  15. Крысин Л.П. (отв. ред.) Академический толковый словарь русского языка. Т. 2: ВИНА – ГЯУР. М.: Издательский дом ЯСК, 2016.
  16. Цумарев А.Э., Шестакова Л.Л., Нечаева И.В., Кулева А.С., Грунченко О.М. «Академический толковый словарь русского языка»: традиционное и новое // Известия Российской академии наук. Серия литературы и языка. 2017. Т. 76. № 5. С. 5–21.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Словарь тукитинского диалекта каратинского языка (lingconlab.ru/TukitaDict/; [7])

Скачать (184KB)
3. Рис. 2. Примеры а) TEI-разметки (слева) и б) TEI-Lex-0-разметки (справа) фрагмента словарной статьи

Скачать (252KB)
4. Рис. 3. Снимок экрана СУБД SQLite, показывающий таблицу значений онлайн-словаря персидского языка iranic.space [1], [9]; meaning_id – ID значения, unit_id – ID заглавной лексемы, meaning – текст значения, pos_id и rank – технические индексы

Скачать (276KB)
5. Рис. 4. Фрагмент редакторского интерфейса платформы OnLex, пример с сайта pamiri.online [11]

Скачать (363KB)
6. Рис. 5. Статья dod из Шугнанско-русского словаря Д. Карамшоева, представленного на сайте pamiri.online [11]

Скачать (194KB)

© Российская академия наук, 2024