LINUX.ORG.RU

OCaml, Unicode и синтаксический разбор


0

0

От нечего делать изучаю окамл, а для практики переписываю на нём одну мелкую тулзу на питоне, которая парсит некоторые файлы, что-то с ними проделывает, потом выдаёт результат. Кодировка входных и выходных файлов, вообще говоря, может быть любая (обычно локальная). С прискорбием узнал, что в стандартной библиотеке камля нету никаких средств для работы с юникодными строками. И ocamllex/ocamlyacc о юникоде никакого понятия не имеют. Вопросы такие:

- Есть ли какой-то общепринятый способ работать с юникодом в окамле?

- Есть ли какие-то инструменты для лексического/синтаксического разбора, умеющие юникод?

anonymous
Ответ на: комментарий от anonymous

Спасибо, а что с парсерами и лексерами? Ну, кроме самому писать.

anonymous
()

Прозеваю, что ocamllex/ocamlyacc просто так заставить работать со строками из camomile не получится - отсутствие классов типов и нормального полиморфизма камлю здесь выходит боком, лол. Но можно взять сорцы и слегка пропатчить, если другого варианта не найдётся.

Ещё есть ulex, но опять же, у него свои юникодные строки, лол, полный зоопарк.

dark_mikhail
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.