SlideShare a Scribd company logo
О возможностях использования
информационных технологий
для развития
функционирования коми языка
Центр инновационных языковых технологий
КРАГСиУ
В последние годы миноритарные языки столкнулись с
проблемой ограниченного доступа языковых сообществ к
современным средствам коммуникации на родном языке, что
приводит к ситуации «цифрового неравенства».
Цифровое неравенство
Сглаживанию этого неравенства в отношении
коми и родственных ему языков России
призвана способствовать Межрегиональная
лаборатория информационной поддержки
функционирования финно-угорских языков
создание базовой инфраструктуры информационного
общества на финно-угорских языках, компьютерного
программного инструментария для обеспечения их
полноценного функционирования в электронном
информационном пространстве
создание и развитие электронных сервисов в области
образования и науки
консолидация усилий, обобщение наработок и результатов
деятельности отдельных специалистов, энтузиастов, групп
учёных, заинтересованных в развитии финно-угорской семьи
языков
Цели и задачи лаборатории
свободная лицензия
кооперация с заинтересованными
сообществами
единые форматы и стандарты
Принципы работы
раскладки клавиатуры
электронные словари
системы проверки правописания
(проверка орфографии)
электронный корпус текстов
морфологический и синтаксический
анализаторы
машинный перевод на русский язык и с
русского языка на финно-угорские
языки
Базовые продукты
Предлагаем принять к использованию международный
стандарт кодирования символов Юникод в качестве
стандарта для коми языка
На основе Юникода уже созданы коми раскладки для
наиболее популярных операционных систем, в которых
единообразно установлены коды коми букв ӧ и і
Раскладки бесплатно устанавливаются, алгоритм их
установки расписан на блоге лаборатории www.komikyv.ru
Раскладка клавиатуры
Поскольку коми символов до недавнего времени не было
в Юникоде, для набора использовались самодельные коми
шрифты
Сейчас коми символы в Юникоде появились, но
полиграфистам не хватает специальных шрифтов
Необходимо рекомендовать Правительству РК
разместить заказ на закупку необходимого количества
лицензионных шрифтов, поддерживающих коми язык для
нужд полиграфии
Коми шрифты
Программа GoldenDict дает возможность
включать разные словари в единую оболочку
Электронные словари создаются на базе
словников существующих бумажных словарей
Обеспечивается доступность словарей
Автоматизируется поиск слова
Возможность создания многофункционального
словаря
Необходимо обеспечить передачу исходников
коми словарей для включения в словарную
программу
Электронные словари
Для коми языка спел-чекер в
настоящее время создаётся на базе
программы HunSpell
Встает вопрос об установлении
рекомендуемых, допустимых и
недопустимых написаний в коми
языке
В дальнейшем возможно создание
более сложной системы на базе HFST
Проверка орфографии
Возможность автоматической проверки правописания –
показатель уровня развития языка
Морфологический анализатор – программа анализа
морфологической структуры языка
Синтаксический анализатор – программа для анализа
синтаксиса
Автоматический анализ грамматики языка выведет
на новый уровень теоретические и прикладные
исследования
Будет дан толчок к дальнейшей стандартизации
языка
Грамматические анализаторы
Перевод текстов коми литературного языка в
электронный текстовой формат
В базе ок. 2 млн. словоупотреблений
Текстовая база – основа электронной
библиотеки и национального корпуса коми
языка
Необходимо приобретение бесконтактного
сканнера
Необходима передача исходников от
издательств, редакций и авторов.
База электронных текстов
На основе автоматического анализа
грамматики, электронных словарей и
корпуса текстов будут созданы
автоматические переводчики
Русско-коми переводчики необходимы
для облегчения перевода
законодательства РК на коми язык
Коми-русские переводчики – для
знакомства лиц, не владеющих языком, с
содержанием коми текстов
Электронные переводчики
Программы распознавания текста (OCR), синтеза и
распознавания речи
Поисковые системы на коми языке
Коми локализация ПО
Создание коми приложений для мобильных устройств
Дистанционное обучение языку
Планируемые направления
работы
Для полноценного использования коми
языка в современных информационных
технологиях необходимо проводить
системную работу с обязательной
государственной поддержкой
Республики Коми (включение и
финансирование проводимых работ
через госзадание, через РЦП,
нормативно-правовая поддержка и т.д.)
Необходимость поддержки
Аттьӧ! Спасибо!

More Related Content

PPT
Васильєеа "Обмін досвідом електронних бібліотек медичних ВНЗ"
PDF
Доклад Юрия Насретдинова на РИТ++ 2013. "Система перевода в Badoo".
PDF
Front End Best Practices
PPSX
_представление работы_улановао
PDF
Abbyy ls technologies_ru
PPTX
Docsvision Потоковый ввод - модуль потокового ввода документов в СЭД Docsvision
PPT
MachineTranslation
Васильєеа "Обмін досвідом електронних бібліотек медичних ВНЗ"
Доклад Юрия Насретдинова на РИТ++ 2013. "Система перевода в Badoo".
Front End Best Practices
_представление работы_улановао
Abbyy ls technologies_ru
Docsvision Потоковый ввод - модуль потокового ввода документов в СЭД Docsvision
MachineTranslation

Viewers also liked (20)

PPT
словари
PPTX
презентация система электронного перевода Soylem 3.
PPTX
интернет для моей специальности
PDF
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
PDF
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
PPT
Компьютерные словари и системы машинного перевода текстов
PPT
MT as a Translator's Tool (TFR_11) - in Russian
PPT
Использование систем распознавания текстов
PPT
PDF
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
PDF
Cредства автоматизированного перевода
PPTX
системы автоматизированного перевода
PPTX
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
PDF
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
POT
визуализация информации
PDF
Научные журналы: требования международных систем
PPT
системы распознавания речи в прикладных исследованиях
PPT
Системы автоматического распознавания речи
PPT
Promt
словари
презентация система электронного перевода Soylem 3.
интернет для моей специальности
«Облачная» автоматизация переводов: что нового для переводчика-профессионала?
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
Компьютерные словари и системы машинного перевода текстов
MT as a Translator's Tool (TFR_11) - in Russian
Использование систем распознавания текстов
Лекция 5. Инструментарий технического переводчика. Электронные словари, поис...
Cредства автоматизированного перевода
системы автоматизированного перевода
MПК3 - SDL - Опыт внедрения решений SDL Trados в российских переводческих ком...
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
визуализация информации
Научные журналы: требования международных систем
системы распознавания речи в прикладных исследованиях
Системы автоматического распознавания речи
Promt
Ad

Similar to FU-Lab (20)

PDF
Построение внутренней эбс вуза
PPTX
4 встреча — Компьютерная лингвистика (А. Катинская)
PPT
Obshstestvennie i kone 17 6 2013
PPT
Внутрений проект.Долгушин Мирослав
PPTX
ЭОР
PPTX
компьютер в рки
PPT
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
PDF
ТЗ на МИРО по РКИ от ММТ
PDF
лингвистическое обеспечение электронных_библиотек
PDF
Трансформации и тенденции в развитии операционных систем и программных платформ
PDF
Lande, Jigalo
PPT
Открытые электронные информационные ресурсы учреждений высшего образования Бе...
PPS
Elau librery ru_
PPTX
PPTX
презентация1
PPT
Электронные корпуса
PPT
Фундаментальная и прикладная лингвистика 2012-2013
PPTX
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
PDF
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Построение внутренней эбс вуза
4 встреча — Компьютерная лингвистика (А. Катинская)
Obshstestvennie i kone 17 6 2013
Внутрений проект.Долгушин Мирослав
ЭОР
компьютер в рки
The European Library and the Europeana Union. Olaf Janssen presenting in Russ...
ТЗ на МИРО по РКИ от ММТ
лингвистическое обеспечение электронных_библиотек
Трансформации и тенденции в развитии операционных систем и программных платформ
Lande, Jigalo
Открытые электронные информационные ресурсы учреждений высшего образования Бе...
Elau librery ru_
презентация1
Электронные корпуса
Фундаментальная и прикладная лингвистика 2012-2013
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Проблемы развития рынка ЭБС. Коллизии законодательства. Критерии оценки колич...
Ad

FU-Lab

  • 1. О возможностях использования информационных технологий для развития функционирования коми языка Центр инновационных языковых технологий КРАГСиУ
  • 2. В последние годы миноритарные языки столкнулись с проблемой ограниченного доступа языковых сообществ к современным средствам коммуникации на родном языке, что приводит к ситуации «цифрового неравенства». Цифровое неравенство Сглаживанию этого неравенства в отношении коми и родственных ему языков России призвана способствовать Межрегиональная лаборатория информационной поддержки функционирования финно-угорских языков
  • 3. создание базовой инфраструктуры информационного общества на финно-угорских языках, компьютерного программного инструментария для обеспечения их полноценного функционирования в электронном информационном пространстве создание и развитие электронных сервисов в области образования и науки консолидация усилий, обобщение наработок и результатов деятельности отдельных специалистов, энтузиастов, групп учёных, заинтересованных в развитии финно-угорской семьи языков Цели и задачи лаборатории
  • 4. свободная лицензия кооперация с заинтересованными сообществами единые форматы и стандарты Принципы работы
  • 5. раскладки клавиатуры электронные словари системы проверки правописания (проверка орфографии) электронный корпус текстов морфологический и синтаксический анализаторы машинный перевод на русский язык и с русского языка на финно-угорские языки Базовые продукты
  • 6. Предлагаем принять к использованию международный стандарт кодирования символов Юникод в качестве стандарта для коми языка На основе Юникода уже созданы коми раскладки для наиболее популярных операционных систем, в которых единообразно установлены коды коми букв ӧ и і Раскладки бесплатно устанавливаются, алгоритм их установки расписан на блоге лаборатории www.komikyv.ru Раскладка клавиатуры
  • 7. Поскольку коми символов до недавнего времени не было в Юникоде, для набора использовались самодельные коми шрифты Сейчас коми символы в Юникоде появились, но полиграфистам не хватает специальных шрифтов Необходимо рекомендовать Правительству РК разместить заказ на закупку необходимого количества лицензионных шрифтов, поддерживающих коми язык для нужд полиграфии Коми шрифты
  • 8. Программа GoldenDict дает возможность включать разные словари в единую оболочку Электронные словари создаются на базе словников существующих бумажных словарей Обеспечивается доступность словарей Автоматизируется поиск слова Возможность создания многофункционального словаря Необходимо обеспечить передачу исходников коми словарей для включения в словарную программу Электронные словари
  • 9. Для коми языка спел-чекер в настоящее время создаётся на базе программы HunSpell Встает вопрос об установлении рекомендуемых, допустимых и недопустимых написаний в коми языке В дальнейшем возможно создание более сложной системы на базе HFST Проверка орфографии Возможность автоматической проверки правописания – показатель уровня развития языка
  • 10. Морфологический анализатор – программа анализа морфологической структуры языка Синтаксический анализатор – программа для анализа синтаксиса Автоматический анализ грамматики языка выведет на новый уровень теоретические и прикладные исследования Будет дан толчок к дальнейшей стандартизации языка Грамматические анализаторы
  • 11. Перевод текстов коми литературного языка в электронный текстовой формат В базе ок. 2 млн. словоупотреблений Текстовая база – основа электронной библиотеки и национального корпуса коми языка Необходимо приобретение бесконтактного сканнера Необходима передача исходников от издательств, редакций и авторов. База электронных текстов
  • 12. На основе автоматического анализа грамматики, электронных словарей и корпуса текстов будут созданы автоматические переводчики Русско-коми переводчики необходимы для облегчения перевода законодательства РК на коми язык Коми-русские переводчики – для знакомства лиц, не владеющих языком, с содержанием коми текстов Электронные переводчики
  • 13. Программы распознавания текста (OCR), синтеза и распознавания речи Поисковые системы на коми языке Коми локализация ПО Создание коми приложений для мобильных устройств Дистанционное обучение языку Планируемые направления работы
  • 14. Для полноценного использования коми языка в современных информационных технологиях необходимо проводить системную работу с обязательной государственной поддержкой Республики Коми (включение и финансирование проводимых работ через госзадание, через РЦП, нормативно-правовая поддержка и т.д.) Необходимость поддержки