Есть код такого вида:
#include <stdatomic.h>
struct { long l; char s[8]; } queue[1024 * 1024];
_Atomic int qsize;
void process_queue() {
extern void process(typeof(*queue));
#ifdef X86
for (int i; (i = atomic_fetch_sub_explicit(&qsize, 1, memory_order_acq_rel)) > 0; process(queue[i - 1]));
#else
int i = atomic_fetch_sub_explicit(&qsize, 1, memory_order_acquire);
while (i > 0) { process(queue[i - 1]); i = atomic_fetch_sub_explicit(&qsize, 1, memory_order_relaxed); }
atomic_fetch_sub_explicit(&qsize, 1, memory_order_release);
#endif
}
void extra_thread() {
while (1) { while (atomic_load_explicit(&qsize, memory_order_relaxed) <= 0); process_queue(); }
}
void main_thread() {
while (1) {
extern int thread_count;
extern int get_data(typeof(queue), int);
atomic_store_explicit(&qsize, get_data(queue, sizeof(queue) / sizeof(*queue)), memory_order_release);
process_queue();
while (atomic_load_explicit(&qsize, memory_order_relaxed) !=
#ifdef X86
-thread_count + 1
#else
-thread_count + 1 << 1
#endif
);
}
}
С х86 вопросов нет. Хоть как пиши - оно будет работать/тормозить одинаково. С чем-то другим не совсем понятно. Можно ли сделать лучше, чем мой вариант под #else?
В get_data сисколы и в реальности можно просто писать relaxed везде и всё будет работать. Но интересно как сделать «по правилам»(из стандарта).