Мне за последнее время локально гоняемые LLM’ки (llama, deepseek-coder, mistral и другие) очень бустанули прогресс
Что для этого нужно? У меня, допустим, есть библиотека в Calibre из .pdf и djvu-файлов.
Я же не смогу их загнать в такую сеть, потому что распознавание у tesseract низкокачественное, высококачественное надо руками доделывать и это гигантская работа.
Как потом использовать это локально, какие процессоры (только CPU или GPU тоже) и сколько памяти нужно?
Как долго займёт тренировка и можно ли её выполнить на арендованных мащностях, чтобы после себе только модель скачать? Где делать, сколько это стоит?
Если всё сложно, то организовывают ли люди для этого потребкооперативы, или может коммерческие организации какие есть?
UPD: Ещё нужен учебник, потому что люди вокруг разговаривают непонятными словами.