LINUX.ORG.RU

GitHub открыл библиотеку «Linguist»

 , , ,


0

2

Данная библиотека используется хостингом исходного кода GitHub для работы с файлами исходного кода. Она позволяет:

  • определять язык программирования, на котором написан файл исходного кода по расширениям;
  • в случае проблем определения по расширению происходит определение по содержимому файла;
  • формировать статистику по языкам, в том числе в наглядных формах;
  • организовывать подсветку синтаксиса (используется обвязка вокруг Pygment);
  • распознавать файлы по MIME-типу, исключать из обработки некоторые типы файлов, которые являются результатом работы различных вспомогательных утилит.

Библиотека написана на Ruby. Распространяется на условиях new BSD.

Репозиторий проекта

>>> Подробности

★★★★★

Проверено: Shaman007 ()
Последнее исправление: Dendy (всего исправлений: 3)

>Определять язык программирования,на котором написан файл исходного кода по расширениям
круто

prizident ★★★★★
()
Ответ на: комментарий от d9d9

Ну так это написано в списке, где перечислено то что не баг, а фича!)

pylin ★★★★★
() автор топика
Ответ на: комментарий от xroff

спасибо,отписался про опечатку

pylin ★★★★★
() автор топика

На referat.ru выложили контрольную работу ПТУшника по программированию ?

vasya_pupkin ★★★★★
()

Ненужная либа на ненужном языке. Не могу поверить, что относительно шустрый жидхаб использует руби.

AVL2 ★★★★★
()
Ответ на: комментарий от zJes

> Тут я толком не понял для чего.

Ну в тексте новости написано же - для определения языка программирования по расширению файла.

anonymous
()

нет пути, почему еще не закидали какашками? Это даже на мини-новость не тянет. Да и в вообще без комментариев там не более 500 строк выйдет

frozenix ★★★
()
Ответ на: комментарий от zJes

С функционалом ошибся, неравнозначны при чем весьма ))

pylin ★★★★★
() автор топика
Ответ на: комментарий от anonymous

Тут важнее все же то, что умеет определять еще и по содержимому. А кстати, какие альтернативы есть сабжу?

pevzi ★★★★★
()

И да, после запятой идет пробел, перед открывающей скобкой тоже, в 4 строке пропущена закрывающая скобка, библиотека для подсветки синтаксиса зовется Pygments, кривая фраза «которые является», с точками и заглавными буквами безобразие. Исправь, глаза режет же. Чувствую себя прям как pep8 какой-то (:

pevzi ★★★★★
()
Ответ на: комментарий от provaton

> Ну собственно упомянутый в новости pygments

А зачем тогда гитхабу понадобился велосипед? Разве что статистику по языкам рисовать.

pevzi ★★★★★
()
Ответ на: комментарий от pevzi

Кинь сообщение в тему орг-разделе, ты прав, но я не могу править уже подтвержденные новости )

pylin ★★★★★
() автор топика

На самом гитхабе поиск по содержимому файлов работает через пень-колоду. Половину файлов не находит, хоть латиницей в ASCII искомое содержится в файле. Если это из-за этой либы, то нафиг она вообще нужна.

ЗЫЖ Может это у них там кеш глючит, но файлы, которые месяц как лежат, в поисковую выдачу не попадают.

pat_minus
()
Ответ на: комментарий от pevzi

Это не велосипед, это обертка пигментсов на руби. Гихат ведь на руби написан, вроде как.

provaton ★★★★★
()
Ответ на: комментарий от AVL2

Ненужный AVL2 обосрался, ты бы посмотрел на чем Github и что они за всё своё время существования промоутили, лошара.

anonymous
()

>определять язык программирования, на котором написан файл исходного кода по расширениям;

Вааау.

yoghurt ★★★★★
()

> определять язык программирования, на котором написан файл исходного кода по расширениям

Забавно.

exst ★★★★
()
Ответ на: комментарий от yoghurt

Было бы очень странно, если бы она это не умела. Вообще либа приличная.

tensai_cirno ★★★★★
()

Осталось только дописать к ней обёртку на питоне.

anonymous
()
Ответ на: комментарий от prizident

Дружище, сходи по ссылке. Для Ъ:

Most languages are detected by their file extension. This is the fastest and most common situation. For script files, which are usually extensionless, we do «deep content inspection»™ and check the shebang of the file. Checking the file's contents may also be used for disambiguating languages. C, C++ and Obj-C all use .h files. Looking for common keywords, we are usually able to guess the correct language.

anonymous
()

>определять язык программирования, на котором написан файл исходного кода по расширениям;

The maddest skills

используется обвязка вокруг Pygment

К Питону через руби?

Стильно, чо

Nicholass ★★★
()
Ответ на: комментарий от Nicklasos

Я в том смысле, что вы тут только сретесь друг с другом и все.

Поздравляю, ты понял суть ЛОРА.

Vovka-Korovka ★★★★★
()
Ответ на: комментарий от Nicklasos

> Ребята, а нахера вообще нужен этот ЛОР?

Я в том смысле, что вы тут только сретесь друг с другом и все.

Ты сам ответил на свой вопрос.

bloodredfrog ★★
()

> определять язык программирования, на котором написан файл исходного кода по расширениям;

Я бы постеснялся такое записывать в feature-list.

drull ★☆☆☆
()
Ответ на: комментарий от AVL2

Более того - он почти весь на нем написан. А ты - лопух.

anonymous
()

Да что ж вы все прикопались к этой супер-фиче? Разработчики нигде не выносили это отдельной фичей:

определять язык программирования, на котором написан файл исходного кода по расширениям;

Это уже чуваки, которые новости состряпали додумались. Читаем оригинальное описание: https://github.com/github/linguist

Nicklasos
()

Теперь-то линуксу точно капец.

vasilenko ★★
()
Ответ на: комментарий от frozenix

> нет пути, почему еще не закидали какашками?

главное, поставить какашкам правильное расширение

dilmah ★★★★★
()
Ответ на: комментарий от Aesthete

Блогосфера бестолковая. Писают кипятком от всяких мелочей.

yoghurt ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.