LINUX.ORG.RU

Зачем ученому сикель?


0

2

Навеяно http://scicomp.stackexchange.com/questions/1148/what-core-skills-should-every...

What it is reasonable to expect every working scientist to know about building and using software?

basic SQL (because let's face it, everything that isn't in a text file is in a database)

Где ученому это может пригодится? Из физических наук мне на ум приходит только хранение экспериментальных данных в БД. А теоретикам оно на что? Кроме как расширение кругозора за счет концепции реляционной БД.



Последнее исправление: vvff (всего исправлений: 1)

Сикель нужен всем, без сикеля тяжело. А вот про скуль можно подискутировать.

ollowtf ★★★
()

Чтобы рвать его, очевидно же.

aedeph
()

SQL - это «синтаксический сахар» для реляционной алгебры, алгебры работы с множествами. Из 3х основных операций две даже похоже называются: выбор (селект), и проекция, не говоря про полные джойны (картезианский продукт), хотя создатели SQLя немного запутали дело, поменяв select с project. Множества встречаются везде в науке и язык, наиболее компактный для работы с ним - это реляционная алгебра, или в видоизменённой форме - SQL. Считаю, что как и во многих универах - всем учёным прежде всего должна даваться реляционная алгебра, и только после понимания её, потом (на одной из последних пар) - SQL. И тогда всё встанет на свои места.

siberean
()

Хранение данных численного моделирования.

AIv ★★★★★
()

Кроме как расширение кругозора за счет концепции реляционной БД.

Для расширения кругозора в том числе. Потому что некоторые научные данные, например метаданные, отлично вписываются в реляционную модель.

yvv ★★☆
()
Ответ на: комментарий от siberean

Считаю, что как и во многих универах - всем учёным прежде всего должна даваться реляционная алгебра, и только после понимания её, потом (на одной из последних пар) - SQL.

Почти так, в общем-то, все и делают. У нас было несколько пар теории, реляционная алгебра, потом остаток семестра практические задачки с помощью SQL. Завершалось всё курсовым проектом, типа организовать какие-нибудь данные в виде реляционной модели и сделать веб-интерфейс. А потом ни один из моих одногрупников ни разу в жизни ничего из этого не использовал :)

yvv ★★☆
()
Ответ на: комментарий от yvv

Да вообще все виды данных вписываются в реляционную модель, вернее в модель множеств. Все данные, а не только некоторые - это какие-то setы. И реляционная алгебра - язык оперирования теми setами. Считаю, что всем учёным надо давать сначала основы теории множеств, диаграммы Вейна, логики первого порядка, кванторы (не в подразделе матанализа, а в подразделе теории множеств), логику предикатов - в одном большом курсе. И сначала научить оперировать множествами на языке алгебры (в терминах сигм, проекций, декартовых произведений) и только потом (как синтаксический сахар) давать SQL (кстати, кроме последнего - было много других попыток синтаксических сахаров типа куэлей, не помню как он там пишется, визуальных, табличных), но основной язык - это всё же реляционная алгебра. Если человек непонимает полного, левого, правого джойнов и не понимает что происходит с теми множествами в виде диаграмм Вейна - то ему очень будет трудно работать с данными (он будет терять данные, которые не «джойнятся», т.е. не имеют соответствующих данных в других наборах).

siberean
()
Ответ на: комментарий от yvv

Ну я не знаю специфику работы теоретиков. Я видел только экспериментальщиков, где данные сразу же надо хранить в реляционке. И данных обычно очень много и разных. Все изобретения велосипедов (построение своей ОО базы) - приводят позже к проблемам перформанса, либо потери данных, либо взрыва сложности. Ничего более простого, универсального и масштабируемого - чем хранение данных в множествах, тьюплах (т.е. таблицах) - не придумано.

siberean
()
Ответ на: комментарий от siberean

Ничего более простого, универсального и масштабируемого - чем хранение данных в множествах, тьюплах (т.е. таблицах) - не придумано.

Это смотря какие данные. Я видел только экспериментальщиков у которых все данные - это тупо многомерные наборы массивов чисел. Хранятся в бинарных файлах как наборы байтов. Никакая реляционная алгебра им нафиг не нужна, ибо единственная операция, которая нужна - взять срез массива. Потом с ним проводится всякий анализ.

Реляционные базы у этих экспериментальщиков используются только для хранения мета-данных. Там как раз нужны операции с множествами, чтоб можно было быстрее найти то что нужно.

yvv ★★☆
()
Ответ на: комментарий от yvv

Если массивы чисел - то часто будет лучше в файлах, согласен. Кстати, рано или поздно - те массивы оплывут массивами метаданных. Т.е. для каждой задачи - своё решение (что в файлах а что в базе).

Исходный вопрос ТСа расцениваю аналогичным следующему: нужен ли мощнейший инструмент работы с метаданными учёным-теоретикам? Или им можно будет всю жизнь обходится простыми массивами чисел?

siberean
()
Ответ на: комментарий от siberean

Исходный вопрос ТСа расцениваю аналогичным следующему: нужен ли мощнейший инструмент работы с метаданными учёным-теоретикам? Или им можно будет всю жизнь обходится простыми массивами чисел?

Многим, всю жизнь можно обходиться массивами чисел.

Если у тебя модель считает сотни экспериментов, но выдаёт данные примерно в одинаковом формате, данных может быть много, но различных типов мета-данных немного. Тогда никакой субд не нужно.

Если есть потребность объединить в одну базу, доступную широкому кругу учёных, результаты разных типов экспериментов, из разных институтов, тогда одним sql не отделаешься. На деле обычно разработкой субд для метаданных занимается одна группа, формата хранения массивов (типа hdf/netcdf) другая, сетевого протокола для доступа к массивам (типа opendap) третья, а собственно анализом данных четвёртая. У нас четвёртая группа - самая многочисленная.

yvv ★★☆
()

Без понятия. Разве что поднять базу данных с результатами и организовать веб-морду для доступа...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от yvv

Ну хорошо, пусть даже если и есть теоретики - которые не работают и не будут работать с субд.

Это не значит - что всем учёным не надо учить субд - для общей грамотности! Они сужают себе поле возможной деятельности, сущают кругозор.

90% того, что я учил - я не использую. Другой человек - не использует другие 90%. И эти множества могут вообще не пересекаться. Так рассуждая - можно вообще ничего не учить!

Посмотрим с другой стороны. Учёные, которые не учили SQL, начинают изобретать велосипеды и напарываются на неэффективность работы, а после покидания проектов - никто не может разгрести их наколенные базы данных (я это наблюдал). Это хорошо? А вот если бы учили - им бы самим было бы легче.

Я думаю, так с любой областью. И естественный язык работы со множествами (реляционная алгебра или SQL) - как минимум не более бесполезен чем те же кванторы или тензорное исчисление (которые дают всем). Что - все 100% учёных используют в своей работе кванторы или тензоры? Я знаю тех - кто не использует! (а реляционная алгебра по сложности освоения не сложнее: одна пара или две, ну с SQL, закреплением практикой в лабе и прочим - маленький семестровый курс).

siberean
()
Ответ на: комментарий от aedeph

ну это самим теоретикам судить (только тем - кто учил, заслуженным профессорам, а не тем, кто ещё не учил - так как с их перспективы может и не видно - нужно ли и полезно ли это. А обучение чему-то новому всегда требует энергии и потому болезненно, так что сопротивление понятно)

siberean
()
Ответ на: комментарий от siberean

Я ничего не понял, реляционной алгебры у меня не было, я изучал её самостоятельно.

Просто без кванторов и тензорного анализа большие массивы данных вообще не нужны.

aedeph
()
Ответ на: комментарий от siberean

Это не значит - что всем учёным не надо учить субд - для общей грамотности!

Кто же спорит.

Оно может быть и весьма редко нужно, но если вдруг будет нужно, то никуда не денешься. Пэтому иметь представление, о чём оно, полезно.

yvv ★★☆
()
Ответ на: комментарий от Eddy_Em

словом «сиквел», к сожалению, пользуются многие американские товарищи.

JFreeM ★★★☆
()
Ответ на: комментарий от Eddy_Em

А я-то думал, что оно «эскюэль» называется...

Ну да, грамотные товарищи называют его именно «эскьюэл» (однако по-любому порой приходится врубаться - что же хочет сказать какой-нибудь любитель сленга, нахватавшийся уличных терминов)

siberean
()
Ответ на: комментарий от siberean

Это не значит - что всем учёным не надо учить субд - для общей грамотности!

В этом смысле разницы между SQL и автоматом Калашникова нет.

Miguel ★★★★★
()

теоретикам оно на что

Теоретикам пека вообще не нужен.

buddhist ★★★★★
()

В биологии, микробиологии, фармацевтике создано множество баз данных. Их создают институты, частные конторы, журналы и т.д. и в какой-то момент наступает необходимость делать выборки из этих разрозненных баз по общим моментам - организму, коду белка или гена и т.д. тут то и нужен SQL. у нас он преподается в рамках курса по перлу или питону именно в контексте практической работы с БД.

silw ★★★★★
()

Где ученому это может пригодится?

чтобы считать статистику и отчёты же ну

anonymous
()
Ответ на: комментарий от siberean

А еще раньше «должно даваться» то, что картезианский продукт по русски называется декартовым произведением.

anonymous
()
Ответ на: комментарий от anonymous

то же самое хотел сказать, про «картезианский продукт» )))

я учился и там и там, и поэтому всё перепуталось. Да, из советского универа припоминаю «декартовое произведение», анонимусы правы.

siberean
()
Ответ на: комментарий от Miguel

В этом смысле разницы между SQL и автоматом Калашникова нет.

Есть. Учёный может пользоватся SQLем и всё ещё оставаться учёным (я знаю лабы где SQL пользуют, одновременно занимаясь наукой), но если этот учёный найдёт область деятельности, использующую автомат Калашникова - то очень скоро он учёным быть перестанет. Разве не так?

siberean
()
Ответ на: комментарий от anonymous

чтобы считать статистику и отчёты же ну

Тут совсем недавно на опеннете была новость, что Оракл скрестил свой Оракл и R. ;)

А вообще-то есть православный Datalog, но его нафиг зафейлили.

Macil ★★★★★
()
Ответ на: комментарий от Macil

Интересно, а есть ли бесплатная версия оракла для образовательных учреждений? У учёных же нет денег - чтобы ещё и жадных проприетарщиков кормить.

Насколько я знаю - R дают в универах (как часть курсов по статистике), как и матлаб (у которого лицензии для универов есть). А из матлаба - есть доступ к внешним реляционным базам. Т.е. можно таскать данные не выходя из привычного окружения. Но для этого опять же необходим SQL.

siberean
()
Ответ на: комментарий от siberean

но если этот учёный найдёт область деятельности, использующую автомат Калашникова - то очень скоро он учёным быть перестанет.

Какой-нибудь этнограф-экстремал, изучающий воинственные племена...

Miguel ★★★★★
()
Ответ на: комментарий от Miguel

Это скорее уже аутлаер. Подозреваю, что доля «этнографов, изучающих воинственные племена» (по отношению ко всем учёным) мала и уж несравнимо меньше (<<) чем доля учёных, которые пользуются в своей деятельности SQLем, т.е. первыми можно пренебречь.

siberean
()

Зачем ученому SQL? /fix/

Зачем учёному язык манипулирования большими объёмами данных?

anonymous
()
Ответ на: комментарий от siberean

Интересно, а есть ли бесплатная версия оракла

Есть Oracle Express... Но, ИМХО, с R там чуть менее чем никак.

А для образовательных учреждений конечно же есть. Только нужно договариваться.

Macil ★★★★★
()
Ответ на: комментарий от siberean

Не видел пока ни тех ни других, так что не знаю.

Miguel ★★★★★
()
Ответ на: комментарий от ollowtf

>> Кстати, а шо такое «сикель»?

Лурк в помощь ;)

Спасибо что объяснил, что эта тема про очередное словечко с мухоморья.

ZenitharChampion ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.