Наверное, на текущий момент это наиболее полное из того, что мне попадалось из популярного объяснения внутренностей и работы языковых моделей и ChatGPT, с кратким описанием устройства нейронок.
- оригинал: What Is ChatGPT Doing … and Why Does It Work?
- перевод: Что делает ChatGPT… и почему это работает?
Букв много, местами надо вникать, местами философствовать, но даёт понимание, что нас объединяет с этими моделями, а что делает определённые задачи для моделей недостижимыми. Но, всё-таки, для полноты проникновения в текст требуется минимальное знание о нейронках.
Рекомендуется к прочтению.