Profil modelu

GPT-2 Medium (FlashAttention)

Stanford University,University at Buffalo·USA·V 2022·język

Indeks Świadomości

0,0001%

widełki: 4,7×10⁻⁵%–0,0002%

Moc diagnostyczna

1,1×10⁶ bitów

widełki: 5×10⁵–2,5×10⁶

Energia treningu

1 MWh

widełki: 1 MWh–2 MWhsprzęt: NVIDIA A100 SXM4 40 GB

Sprawność

1,4 bit/J

bitów wzorca z 1 dżula energii treningu

Ile drogi do mózgu?iSkala jest logarytmiczna: każdy równy odcinek paska oznacza ok. 10-krotny wzrost indeksu. Lewy kraniec to 10⁻⁷% (poniżej najsłabszego zmierzonego modelu), prawy — pełny parytet z mózgiem.

0,0001%

10⁻⁷%

Mózg (100%)

GPT-2 Medium (FlashAttention) osiąga 0,0001% potencjału mózgu — mózg ma ok. 940 000× więcej. Pasek jest logarytmiczny, więc każdy równy odcinek to ok. 10× wzrost.

Moment w historii

W dniu publikacji (V 2022) GPT-2 Medium (FlashAttention) wyprzedzało go 39 modeli — na czele z:

Megatron-Turing NLG 530B

X 2021

0,018%

W dniu premiery

#40

Do ówczesnego lidera

×299

Modeli przed premierą

Porównanie obejmuje 170 modeli ze zbioru — „#1” = najwyższy Indeks Świadomości wśród modeli opublikowanych przed premierą.

Pozycja w rankingu

#138 z 170

#136Noisy Student (L2)Carnegie Mellon University (CMU),Google0,0001%
#137ProtBERT-BFDTechnical University of Munich,NVIDIA,Seoul National University,Google,Oak Ridge National Laboratory,Med AI Technology0,0001%
#138GPT-2 Medium (FlashAttention)Stanford University,University at Buffalo0,0001%
#139ERNIE-GEN (large)Baidu0,0001%
#140BERT-LargeGoogle0,0001%

Rodzina GPT

12 wersji

Od GPT-1 (VI 2018) do gpt-oss-20b (VIII 2025) indeks linii urósł ×38,7. Punkty na wykresie są klikalne — każdy prowadzi do profilu wersji.

Kontekst czasu

Każdy szary punkt to jeden z 170 modeli; GPT-2 Medium (FlashAttention) wyróżniony kolorem. Oś pionowa jest logarytmiczna, a przerywana linia u góry to mózg (100%).