Чтобы он пропустил через себя хотя бы 100500 исходников на C/C++ и результата их компиляции имеющимися компиляторами, а потом мог максимально корректно декомпилировать в С/C++ код.
Или задача посложнее: обучить его еще и шаблонам математических формул и во что они превращаются на Си и в ассемблере, так чтобы мог восстанавливать сразу, хотя бы наиболее распространенные штуки.
Могло бы пригодиться для ИБ и для извлечения алгоритмов обработки данных из закрытых проприетарных прог.