1 биллион челлендж

Ответ на: комментарий от Toxo2 15.01.24 16:44:20 MSK

dask_cudf.read_csv() - оно по сути ничем не отличается от clickhouse.read_csv() или duckdb.read_csv() или ДругаяЧорнаяКоробочка.read_csv(), плюс еще и спец.оборудование требует.

Да какое спецоборудование? CUDA ядра? есть во всех RTX картах. В моей карте просто памяти больше для создания и обучения больших нейронок. В данной задаче это вообще не важно, та же RTX 4090 будет чуть быстрее.

dask_cudf.read_csv() это просто обертка read_csv() для Pandas dataframes. За параллельность отвечает сам dask, за работу с видеокартой - libcudf.

Это не программирование, это пользование.

Покажите в условиях конкурса требование реализовать все алгоритмы самому, с нуля, по взрослому, стоя, голым и в гамаке? Или это просто негодование что питон макака обошла вас тремя строчками кода? :)

Тем не менее - по мотивам вашего кода, но без CUDA

Поймите меня правильно, я решил сделать пример на видеокарте т.к. все упоролись на проце оптимизировать. Понятно, что голый С с каким-нибудь SIMD запущенный в 128 потоках уделает всех и выйдет из 0.5 сек. Это скучно.

Python взял только потому что под него сразу были нужные биндинги по CUDA в виде cudf и можно было написать реализацию БЫСТРО, а не терять несколько вечеров на колупание в С. Мне было интересно посмотреть как на этой задаче покажут себя структуры данных от Apache Arrow которые и используются в dask, потому выбор пал на dask_cudf.

Говорит Total time: 111.76471519470215 sec, что точно лучше прошлых 13ти минут на Python

Попробуйте поиграться с blocksize=«64MB». Например, blocksize=«128MB» и увеличивайте пока ошибку сыпать не начнет. Возможно, сможете выйти из 100 сек.

Obezyan ☆
(15.01.24 17:12:02 MSK)

Ответ на: комментарий от Obezyan 15.01.24 17:12:02 MSK

Покажите в условиях конкурса требование реализовать все алгоритмы самому, с нуля

No external library dependencies may be used
Implementations must be provided as a single source file

Попробуйте поиграться с blocksize=«64MB»

Поставил 1GB - Питон мне сказал «Убито».

Ровно такое же «убито» у меня на Го в многопотоке вышло )

Так-то из всего этого веселья - интересно было посмотреть почему ClikHouse не подошёл, ну и посмотреть на финты ушами от серьезных PhD-дядек из любопытства.

Toxo2 ★★★★
(15.01.24 17:17:46 MSK)
Последнее исправление: Toxo2 15.01.24 17:20:22 MSK (всего исправлений: 2)

Ответ на: комментарий от Toxo2 15.01.24 17:17:46 MSK

No external library dependencies may be used Implementations must be provided as a single source file

А само решение должно быть на Java. Что не мешает нам пробовать свои варианты. То что вы называете «не программирование, а использование» во всем остальном мире называется Data Sсience.

Поставил 1GB - Питон мне сказал «Убито».

Вы не совсем понимаете суть параметра, сильно больше не значит сильно быстрее, попробуйте 128MB. Блоки по 1GB и у меня не запустятся.

Obezyan ☆
(15.01.24 17:27:16 MSK)

Ответ на: комментарий от Obezyan 15.01.24 17:27:16 MSK

Почему вам так важно быть всегда правым, а всем вокруг вас не понимать какую-нибудь суть? Вы тех.директор?

Да на здоровье - вы правы, я не прав.

Первое что в голову пришло самое простое:

time clickhouse-client --query "SELECT x.c1, min(x.c2), avg(x.c2), max(x.c2) FROM (SELECT c1, c2 FROM file('measurements.txt', CSV)) x GROUP BY x.c1 SETTINGS format_csv_delimiter = ';';"

real	0m20,175s

лично меня - точно бы устроило.

Toxo2 ★★★★
(15.01.24 17:37:44 MSK)

Ответ на: комментарий от Toxo2 15.01.24 17:37:44 MSK

Почему вам так важно быть всегда правым, а всем вокруг вас не понимать какую-нибудь суть? Вы тех.директор?

Хуже. Системный архитектор который в том числе и сам пишет код. Считайте это проф. деформацией. Только «не всегда быть правым» - это для синьоров, а «всегда дожимать до полного понимания собеседником обсуждаемого предмета». Это не попытка как-то принизить или указать на неправоту, просто рутинное исправление неверной инструкции, исправили и пошли дальше.

Ваш вариант на моем проце (Threadripper 3970X) выдал:

Total time: 94.62445759773254 sec

Obezyan ☆
(15.01.24 17:48:02 MSK)
Последнее исправление: Obezyan 15.01.24 17:50:33 MSK (всего исправлений: 1)

Ответ на: комментарий от sshestov 15.01.24 13:47:23 MSK

Неплохо. Ускорение больше, чем в 2 раза!

стандартная функция считывания строки в число жутко медленная

В Си то же самое. Вообще glibc отличается своей тормознутостью. Меняешь printf на ручное форматирование и сискол write - и твоя программа ускорилась в 10 раз, даже без буфера. А с буфером так вовсе вывод почти бесплатный получается.

anonymous
(15.01.24 17:49:55 MSK)

Ответ на: комментарий от Toxo2 15.01.24 17:37:44 MSK

даже унылый питон на порядок быстрее сам расчет сделал. мне про CUDA и Arrow было интересно, а ваша банальщина с кликом нафиг не интересна. если вам не понятна суть интереса, вы не в той области работу нашли.

iDesperado
(15.01.24 17:59:22 MSK)

Ответ на: комментарий от iDesperado 15.01.24 17:59:22 MSK

даже унылый питон на порядок быстрее сам расчет сделал

это шутка такая?

даже с Arrow Питон даёт 69 секунд против 20 секунд КХ.

Toxo2 ★★★★
(15.01.24 18:02:12 MSK)

Ответ на: комментарий от Toxo2 15.01.24 18:02:12 MSK

там чтение 90%, а КХ пока файл закачает, пока DDL выполнит - нафиг уже и не интересен. и не стоит оправдываться, все равно не интересна эта банальщина.

iDesperado
(15.01.24 18:06:54 MSK)

Ответ на: комментарий от iDesperado 15.01.24 18:06:54 MSK

я то на своих двоих раз-два, раз-два... а конь-то на своих четырех раз-два-три-четыре...

Ок. Интересы, наверное, бывают разными.

Toxo2 ★★★★
(15.01.24 18:11:29 MSK)

Ответ на: комментарий от anonymous 15.01.24 17:49:55 MSK

anonymous подсоби пожалуйста: я пытался твой хеш реализовать, и видимо коллизии (?так называется?). У тебя

/* hash compute, unroll part of the loop /* hash compute, unroll part of the loop */
    #define ROL(x, n)  (x<<n | x>>(16-n))     
    id = ROL(id, 2) ^ *p++;                   
    id = ROL(id, 2) ^ *p++;
    id = ROL(id, 2) ^ *p++;
    while (*p != ';') {
        id = ROL(id, 2) ^ *p++;    }

ты делаешь id для трех первых символов явно, и дальше в цикле. При этом id каждый раз сдвигается (не циклически) на 2 бита влево и на 14 вправо, между ними OR, а дальше XOR со следующим символом? Так?

Какие значения может принимать id? Я это всё попытался реализовать на фортране, в целом работает на были отрицательные числа. Я ему дополнительно 3-4 бита стирал слева (показалось замедление если массив имен большим делать).

Так то я уж из 3-х секунд выхожу. Раньше основной массив как char рассматривал. Оказалось что 8-ми битный int сильно быстрее.

sshestov ★★
(16.01.24 13:35:46 MSK)

Ответ на: комментарий от sshestov 16.01.24 13:35:46 MSK

id имеет тип uint16_t и операция ROL не сдвигает, а проворачивает 16 бит влево на 2 бита, то есть те биты, которые сдвинулись из 16 бит задвигаются обратно справа. Важно, чтобы размер регистра или переменной был 16 бит. Можно добавить & 0xffff после ROL. Я не знаю фортран, поэтому что-то конкретное не смогу подсказать. Ещё важно начальное значение id.

Какие значения может принимать id?

Вот скриптик на питоне, там внизу его вывод со всеми значениями для каждой станции.

Сейчас у меня хеш считается по первым буквам и длине строки, что ещё чуточку быстрее. Но надо понимать, что такие алгоритмы не пройдут тесты, так как они не разрешают коллизии, которые обязательно случатся на 10000 рандомных имён станций. То есть это работает только на конкретном наборе станций.

Так то я уж из 3-х секунд выхожу.

Догоняешь лидеров на Джаве, получается) Сейчас там 2.5 секунды на 8 ядрах.

Раньше основной массив как char рассматривал. Оказалось что 8-ми битный int сильно быстрее.

Посмотрел, пишут, что в фортране character - для строк, которые ещё содержат значение длины. То есть это не то же самое, что сишный char.

anonymous
(16.01.24 15:35:33 MSK)

Тем временем у нас есть победитель. Может и не самый быстры, зато самый православный ибо у нас тут линукс и в линуксе положено для таких задач использовать AWK

BEGIN {
    FS=";"
    ORS=""
    PROCINFO["sorted_in"] = "@ind_str_asc"
}
{
    name=$1
    temperature=$2
    if(db[name]["n"]) { # station exists
	min_t=db[name]["min"]
	max_t=db[name]["max"]
	n=db[name]["n"]
	avg=db[name]["avg"]
	db[name]["n"]=n+1
	if (min_t < temperature) { db[name]["min"]=min_t } else { db[name]["min"]=temperature }
	if (max_t > temperature) { db[name]["max"]=max_t } else { db[name]["max"]=temperature }
	db[name]["avg"]=avg + temperature
    } else { # new station
	db[name]["min"]=temperature
	db[name]["max"]=temperature
	db[name]["n"]=1
	db[name]["average"]=temperature
    }
}
END {
    print "{"
    for(station in db){
	min_t=db[station]["min"]
	max_t=db[name]["max"]
	avg=db[name]["avg"] / db[name]["n"]
	printf "%s=%s/%.1f/%s;", station,  min_t, avg, max_t
    }
    print "}\n"
}

отработало за 16 минут. Приемлимо.

957.19user 8.17system 16:05.43elapsed 99%CPU (0avgtext+0avgdata 3584maxresident)k
26044096inputs+0outputs (3major+360minor)pagefaults 0swaps

ugoday ★★★★★
(17.01.24 13:46:34 MSK)

Ответ на: комментарий от ugoday 17.01.24 13:46:34 MSK

Красота! 🔥

anonymous
(17.01.24 14:22:55 MSK)

«Челендж» был бы узнать дельту по времени на миллиард запросов между(libcurl, C) и (PyCurl, Python), а так…

anonymous
(17.01.24 15:09:53 MSK)

Ответ на: комментарий от anonymous 16.01.24 15:35:33 MSK

Спасибо, в результате удалось. Долго ковырялся с тем, что в фортране int - знаковые, а вычисление хэша предполагает беззнаковое. Конвертировать туда-сюда нетривиально оказалось (и возможно не универсально).

Что касается character, то просто массив character (это не строка, а именно массив) определяется как character, dimension(500) :: my_char_array и таки действительно является однобайтовым (уж я наконвертировался туда-сюда). А строка определяется как character(len=80) :: my_string и оно знает про длину. Я долго ковырял именно массив символов, который прямо конвертируется в массив 8bit int.

Мое заднее слово - 3.22 с

sshestov ★★
(17.01.24 15:23:36 MSK)

Ответ на: комментарий от alysnix 14.01.24 14:47:53 MSK

руст не пробегал?

Отличная статья про имплементацию на расте, 12 тредов (i7-10750H), 1.06 секунды: https://curiouscoding.nl/posts/1brc/

Рекомендую всем)

anonymous
(19.01.24 00:10:33 MSK)

Ответ на: комментарий от anonymous 19.01.24 00:10:33 MSK

я его, возможно, как-то неправильно собираю - там же какая-то отдельная морока с версиями, оказывается. Нужна именно nightly чтоб вообще собралось.
На моей машине получается

$ ./one-billion-row-challenge
total: 4.25s

пока ничего быстрее, чем тот С++ от LeHuyDuc'а не видел

real	0m1,523s

но вообще-то тот интересный кусок кода про парсинг float'ов - lehuyduc именно у этого Rust'а взял.

Toxo2 ★★★★
(19.01.24 02:28:42 MSK)

Ответ на: комментарий от Toxo2 19.01.24 02:28:42 MSK

real 0m1,523s

Забавно, что это ещё и от ядра Linux зависит похоже.

На одной и той же машине - две ОС: ArchLinux и VoidLinux(musl)
Собираю одним и тем же gcc12
Запускаю под одним и тем же 6.6

Под ArchLinux десять вызовов подряд ~1.5s все
Под VoidLinux(musl) стабильно ~1.7s

Причем даже если chroot из Arch в Void (т.е. от Arch остается только ядро, библиотеки-то Void'ские) - получаю «арчевские» 1.5 уже на бинарнике Void'а.

Пытался сравнивать config их ядер - ни бельмеса не понял в чем именно там разница. Она точно есть, но что конкретно? (с)

Интересная игра.

Toxo2 ★★★★
(19.01.24 18:12:23 MSK)

за минимальное время

t1 = gettime
решаем задачу …
settime(t1 - 1 sec)
t2 = gettime
t = t2 - t1 WIN !!!

x905 ★★★★★
(19.01.24 20:19:21 MSK)

Ответ на: комментарий от Toxo2 19.01.24 18:12:23 MSK

Под ArchLinux десять вызовов подряд ~1.5s все
Под VoidLinux(musl) стабильно ~1.7s

Кажется понял. В Arch ядро такое:

CONFIG_TRANSPARENT_HUGEPAGE_ALWAYS=y
# CONFIG_TRANSPARENT_HUGEPAGE_MADVISE is not set

А в Void наоборот.

Соответственно Void не использует Huge Page при mmap того файла на 13ГБ.

В Arch после каждого вызова увеличивается счётчик thp_file_mapped в /proc/vmstat, а в Void там всё по нулям.

Toxo2 ★★★★
(20.01.24 01:36:20 MSK)

Автор конкурса провёл дополнительные измерения на 10000 рандомных имён станций (в главном тесте всего 413 имён), время выполнения программ увеличилось в два раза.

Как считаете, из-за чего? Из-за более долгой сортировки?

anonymous
(21.01.24 13:40:23 MSK)

Без извращений получается достигнуть скорости в 72 секунды

(defpackage #:bcl
  (:use #:cl :lparallel :str)
  (:export #:main))

(in-package #:bcl)

;; Немножко оптимизации
(declaim (optimize (speed 3) (safety 0) (debug 0)))

(defun list-of-int-p (list)
  "Return t if LIST is non nil and contains only ints."
  (and (consp list)
       (every #'integerp list)))

(deftype name ()
  `(satisfies list-of-ints-p))

(defun measure-p (measure)
  "Return t if meausre is a pair (name . single-float)"
  (and (consp measure)
       (list-of-int-p (car measure))
       (floatp (cdr measure))))
(deftype measure ()
  `(satisfies measure-p))

;; станция и операции с нею

(defstruct station
  (min 0.0 :type single-float)
  (max 0.0 :type single-float)
  (n 1 :type fixnum)
  (avg 0.0 :type single-float))

(declaim (inline update-station))
(defun update-station (station temperature)
  (declare (type station station))
  (declare (type single-float temperature))
  (make-station :min (min temperature (station-min station))
		:max (max temperature (station-max station))
		:n (1+ (station-n station))
		:avg (+ (station-avg station) temperature)))

(declaim (inline add-measure))
(defun add-measure (stations measure)
  (declare (type hash-table stations))
  (declare (type measure measure))
  (let* ((name (car measure))
	 (temperature (cdr measure))
	 (old-station (gethash name stations)))
    (setf (gethash name stations)
	  (if old-station (update-station old-station temperature)
	      (make-station :min temperature
			    :max temperature
			    :n 1
			    :avg temperature)))))

(defun add-station (stations name new-station)
    (let ((old-station (gethash name stations)))
      (setf (gethash name stations)
	    (if (not old-station) new-station
		(make-station
		 :min (min (station-min new-station) (station-min old-station))
		 :max (max (station-max new-station) (station-max old-station))
		 :n (+ (station-n new-station) (station-n old-station))
		 :avg (+ (station-avg new-station) (station-avg old-station)))))))

(defun merge-two-stations (stations1 stations2)
  (maphash
   #'(lambda (name station)
       (add-station stations1 name station))
   stations2)
  stations1)

;; вспомогайки для mmap
(defun mmap-file (path)
  (let ((fd (osicat-posix:open path (logior osicat-posix:o-rdonly))))
    (unwind-protect
         (let* ((size (osicat-posix:stat-size (osicat-posix:fstat fd)))
                (addr (osicat-posix:mmap (cffi:null-pointer) size
                                         (logior osicat-posix:prot-read)
                                         (logior osicat-posix:map-private)
                                         fd 0)))
           (values addr size))
      (osicat-posix:close fd))))

(defun munmap-file (addr size)
  (osicat-posix:munmap addr size))

(defmacro with-mmapped-file ((file addr size) &body body)
  (let ((original-addr (gensym "ADDR-"))
        (original-size (gensym "SIZE-")))
    `(multiple-value-bind (,addr ,size)
         (mmap-file ,file)
       (let ((,original-addr ,addr)
             (,original-size ,size))
         (unwind-protect
              (progn ,@body)
           (munmap-file ,original-addr ,original-size))))))

;; читаем байты, обновляем словарь, когда встречаем конец строки
(defun parse-chunk (addr start end)
  (let ((stations (make-hash-table :test 'equal))
	(temperature 0)
	(sign 0.1)
	(is-name t)
	is-not-begin
	name)
    (loop for idx = start then (1+ idx)
	  while (<= idx end)
	  do (let ((c (cffi:mem-aref addr :char idx)))
	       (cond
		 ((= c (char-code #\Newline)) ; конец числа, время собирать камни
		  (when is-not-begin	      ; проверка, вдруг отрезок начинается с \n
		      (add-measure stations (cons name (* sign temperature))))
		  (setf is-name t name nil temperature 0 sign 0.1)) ; обнуленіе
		 ((= c (char-code #\;))	; конец имени, дальше число
		  (setf is-name nil))
		 (is-name (push c name)) ; имя — список байтов
		 ((= c (char-code #\-)) ; встретили минус
		  (setf sign -0.1))
		 ((= c (char-code #\.)) ; точку пропускаем
		  (setf is-not-begin t)) ; вот, теперь мы точно не в начале
		 (t (setf temperature (+ (* 10 temperature) (- c 48)))))))
    stations))

;; нарезаем файл на примерно равные части, чтобы конец отрезка совпадал с концом строки
(defun next-newline (addr size start-idx)
  (if (> start-idx size) size
      (loop for idx = start-idx then (1+ idx)
	when (or (= 10 (cffi:mem-aref addr :char idx))
		 (>= idx size))
	  return (min idx size))))

(defun marker-begins (addr size step)
  (loop for idx = 0 then (next-newline addr size (+ idx step))
	until (>= idx size)
	collect idx))

(defun marker (addr size step)
  (let* ((begins (marker-begins addr size step))
	 (ends (append (cdr begins) (list size))))
    (mapcar #'cons begins ends)))


;; один поток для отладки, получаем список ((начало . конец)) и обрабатываем его
(defun run-single (path &key (step 16384))
  (with-mmapped-file (path addr size)
    (let ((pos (marker addr size step)))
      (mapcar #'(lambda (beg-end)
		  (let ((begin (car beg-end))
			(end (cdr beg-end)))
		    (parse-chunk addr begin end)
		    ))
	      pos))))


;; вспомогайки для lparallel
(defun init ()
  (setf *kernel* (make-kernel 8 :name "channel-queue-kernel")))
(defun shutdown ()
  (end-kernel :wait t))

;; обрабатываем отрезки паралельно, потом объединяем
(defun run (path &key (step 16384))
  (with-mmapped-file (path addr size)
    (let ((pos (marker addr size step)))
      (pmap-reduce
       #'(lambda (beg-end)
	   (parse-chunk addr (car beg-end) (cdr beg-end)))
       #'merge-two-stations
       pos))))

;; побайтовое чтение портит юникод, для красивой печати приходится восстанавливать
(defun bytes2name (b-list)
  (fix-unicode-string
   (coerce
    (reverse (mapcar #'code-char b-list))
    'string)))

(defun print-stations (stations)
  (let* ((raw-keys (alexandria:hash-table-keys stations))
	 (keys (mapcar
		#'(lambda (seq)
		    (cons seq (flexi-streams:octets-to-string (reverse seq) :external-format :utf-8)))
		raw-keys))
	 (sorted-keys (sort keys #'(lambda (s1 s2) (string-lessp (cdr s1) (cdr s2))))))
    (format t "{")
    (mapcar #'(lambda (name)
		(let* ((key (car name))
		       (correct-name (cdr name))
		       (station (gethash key stations))
		       (min-t (station-min station))
		       (max-t (station-max station))
		       (avg-t (/ (station-avg station) (station-n station))))
		  (format t "~a=~,1F/~,1F/~,1F " correct-name min-t avg-t max-t)))
	    sorted-keys)
    (format t "}~%")))

;; майн он и есть майн
(defun main ()
  (init)
  (print-stations
   (run (cadr sb-ext:*posix-argv*)
	:step (parse-integer (caddr sb-ext:*posix-argv*))))
  (shutdown))

Чтобы как-то улучшить нужно вместо нормального hash-map какое-нибудь трюкачество придумать. Это можно, но уже в следующей серии.

ugoday ★★★★★
(22.01.24 23:20:27 MSK)

Официальная жабка уже меньше 2 секунд: https://github.com/gunnarmorling/1brc?tab=readme-ov-file#results

anonymous
(29.01.24 08:55:22 MSK)

Ответ на: комментарий от anonymous 29.01.24 08:55:22 MSK

Там внезапно другой лидер появился:
https://github.com/gunnarmorling/1brc/blob/main/src/main/java/dev/morling/one...

Вот его вариант, действительно, даже на моей слабенькой машинке 2 секунды делает.

Но внеконкурсный вариант С++:
https://github.com/lehuyduc/1brc-simd/blob/main/main.cpp

На этой же машинке всё равно в два раза быстрее. 1 секунда.

----

Крутые перцы. Вот те, кто такое может писать - те могут стоить >$10K в месяц. Те, кто хотя бы понимает всё, что там написано - >$1K в месяц. Остальным наблюдателям, как мне, просто не надо хотеть много денег. ИМХО.

Toxo2 ★★★★
(01.02.24 13:54:14 MSK)

Ответ на: комментарий от Toxo2 01.02.24 13:54:14 MSK

Вот те, кто такое может писать - те могут стоить >$10K в месяц.

Не только и не столько твои знания и умения влияют на твою цену. Без знаний, конечно, тяжело, но без софт скиллов ещё тяжелее найти своё место в жизни. И насколько ты сам себя оцениваешь и уверен в своих силах - тоже очень и очень важно. Твои уникальные знания и умения будут стоить ровно 0, если ты не сможешь их продать.

Status Feb 1: The challenge has been closed for new submissions … The final leader board will be published by Monday Feb 5.

Конкурс завершился, кстати. Результаты опубликуют 5 февраля, в понедельник.

anonymous
(01.02.24 20:23:41 MSK)

Ответ на: комментарий от Toxo2 15.01.24 16:44:20 MSK

import dask.dataframe as dd

Кстати, обнаружил тут давеча, что в nushell есть встроенная работа с dataframe. Так что в теории - можно даже без Питона. И на маленьком файле это даже работает в nu:

let df = (dfr open --type 'csv' --delimiter ';' --no-header --lazy /home/Sources/1brc/measurements_10K.txt)

$df
	| dfr into-lazy
	| dfr group-by column_1
	| dfr agg [
		(dfr col column_2 | dfr max | dfr as "max"),
		(dfr col column_2 | dfr min | dfr as "min"),
		(dfr col column_2 | dfr mean | dfr as "mean"),
	]
	| dfr collect

только вот настоящий, большой, 13ти гигабайтный файл с данными оно даже открыть не может, закрывается с «Убито».

Но всё равно забавно. Ни про nushell, ни про dataframe ничего не слышал до этой игры.

Toxo2 ★★★★
(05.02.24 12:22:41 MSK)

это ж сколько в народе дури, чтобы всем миром решать какую-то неинтересную фигню.

такое впечатление, что автор просто манипулирует публикой и берет ее «на слабо».

alysnix ★★★
(05.02.24 15:51:30 MSK)

Ответ на: комментарий от alysnix 05.02.24 15:51:30 MSK

Интересно, что ты тогда про такой конкурс скажешь.
https://ru.wikipedia.org/wiki/International_Obfuscated_C_Code_Contest

urxvt ★★★★★
(05.02.24 16:21:32 MSK)

Официальные результаты: https://www.morling.dev/blog/1brc-results-are-in/

А на ЛОРе победила дружба :)

anonymous
(05.02.24 18:26:35 MSK)

1 биллион

1 миллиард

Иначе это звучит как какой-то один Билли включился в испытание.

anonymous
(05.02.24 18:42:34 MSK)

Ответ на: комментарий от urxvt 05.02.24 16:21:32 MSK

если «один биллион челендж» похож на конкурс по поеданию на время земляных червяков, то этот конкурс похож на соревнование людей с «фефектом фикции» на самое непонятное предложение.

alysnix ★★★
(05.02.24 22:21:40 MSK)

Ответ на: комментарий от alysnix 05.02.24 22:21:40 MSK

Мне совершенно не понятно удивление по-поводу «на время». Учитывая то, что работать быстро одна из критических характеристик многих програм.

urxvt ★★★★★
(05.02.24 23:32:55 MSK)

Ответ на: комментарий от urxvt 05.02.24 23:32:55 MSK

Учитывая то, что работать быстро одна из критических характеристик многих програм.

мусоросборочные языки это очевидно не лучший выбор, если надо работать реально быстро и реально предсказуемо.

alysnix ★★★
(06.02.24 00:32:17 MSK)

Ответ на: комментарий от alysnix 06.02.24 00:32:17 MSK

Как видишь, они уже достаточно быстро работают, чтобы больше не огорчать Томми.

urxvt ★★★★★
(06.02.24 00:36:32 MSK)

Ответ на: комментарий от urxvt 06.02.24 00:36:32 MSK

это сборщик мусора пока что не запустился. и пока хватает памяти. любые тесты скорости для таких языков, без работы gc есть сущая пыль в глаза.

alysnix ★★★
(06.02.24 00:48:01 MSK)

Ответ на: комментарий от alysnix 06.02.24 00:48:01 MSK

Проснись Нео, в джаве давно используется гибридный подход работы с памятью. Там где тебе нужна предсказуемость делают off-heap аллокации и вручную следят за этой памятью. Вся остальная мелочь работает через GC. Конечно если ты нуб, то начнёшь аллоцировать терабайты на GC. Другой вопрос, что никто не будет пользоваться такой поделкой нуба… В идеальном мире.

foror ★★★★★
(06.02.24 15:48:17 MSK) автор топика

Ответ на: комментарий от foror 06.02.24 15:48:17 MSK

в джаве давно используется гибридный подход работы с памятью

неважно чем там пользуются в джаве. важно чем пользуются в коде, представленном на челендж… и поскольку там время идет на миллисекунды, то хорошо бы посмотреть, что там у них с GC… мне это лениво, потому я просто прокукарекал, а рассветет-ли - не мое дело. я на джаве не пишу.

alysnix ★★★
(06.02.24 15:54:49 MSK)

Ответ на: комментарий от alysnix 06.02.24 15:54:49 MSK

я на джаве не пишу

Ну, я так и понял: Не читал, но осуждаю! (с)

foror ★★★★★
(06.02.24 16:01:30 MSK) автор топика
Последнее исправление: foror 06.02.24 16:01:47 MSK (всего исправлений: 1)

Похожие темы