← Wszystkie modele

Profil modelu

BERT-Large

Google·USA·X 2018·język
Indeks Świadomości
0,0001%
widełki: 4,6×10⁻⁵%–0,0002%
Moc diagnostyczna
1,1×10⁶ bitów
widełki: 4,9×10⁵–2,4×10⁶
Energia treningu
2 MWh
widełki: 1 MWh–3 MWhsprzęt: Google TPU v2
Sprawność
0,9 bit/J
bitów wzorca z 1 dżula energii treningu

Ile drogi do mózgu?i

0,0001%
10⁻⁷%
Mózg (100%)

BERT-Large osiąga 0,0001% potencjału mózgu — mózg ma ok. 970 000× więcej. Pasek jest logarytmiczny, więc każdy równy odcinek to ok. 10× wzrost.

Moment w historii

W dniu publikacji (X 2018) BERT-Large wyprzedzało go 11 modeli — na czele z:

W dniu premiery
#12
Do ówczesnego lidera
×39,0
Modeli przed premierą
36

Porównanie obejmuje 170 modeli ze zbioru — „#1” = najwyższy Indeks Świadomości wśród modeli opublikowanych przed premierą.

Pozycja w rankingu

#140 z 170
  1. #138GPT-2 Medium (FlashAttention)0,0001%
  2. #139ERNIE-GEN (large)0,0001%
  3. #140BERT-Large0,0001%
  4. #141DDPM-IP (CelebA)9,3×10⁻⁵%
  5. #142GNMT8,9×10⁻⁵%

Kontekst czasu

Każdy szary punkt to jeden z 170 modeli; BERT-Large wyróżniony kolorem. Oś pionowa jest logarytmiczna, a przerywana linia u góry to mózg (100%).