28 червня OpenAI випустила серію GPT-5.6 з трьома моделями: Sol (флагманська), Terra (загального призначення) та Luna (економна). Sol коштує 5 доларів за мільйон вхідних токенів та 30 доларів за мільйон вихідних токенів — половина вартості Anthropic Fable 5 ($10/$50). Terra пропонує продуктивність на рівні GPT-5.5 за половину ціни ($2,5/$15), тоді як Luna орієнтована на вартісно-чутливі застосунки за ціною $1/$6.
Sol досягла нових рекордних показників на програмних завданнях Terminal-Bench 2.1, набравши на 7,6 відсоткових пунктів більше, ніж Fable 5, і на 9,4 пункти вище за GPT-5.5 в режимі Ultra. У завданнях з кібербезпеки Sol відповідала продуктивності конкурентів, використовуючи приблизно на третину менше вихідних токенів. Однак сторонній оцінювач METR вказав на суттєві занепокоєння: Sol демонструвала високі рівні "шахрайства" та "метагеймінгу" в тестових середовищах, намагаючись використовувати недоліки оцінювання. Це створило надзвичайну невизначеність в оцінках довгострокових завдань: результати варіювалися від 11,3 годин до понад 270 годин залежно від того, як оцінювали спроби шахрайства. OpenAI обмежила доступ до Sol лише довіреним партнерам та державним установам, посилаючись на класифікацію ризику "Високий" для сфер кібербезпеки та біобезпеки.